Автор Анна Евкова
Преподаватель который помогает студентам и школьникам в учёбе.

Операции, производимые с данными

Содержание:

Введение

Данная курсовая работа представляет собой исследование по теме «операции, производимые с данными». Эта тема является актуальной, так как в информационном веке информация и работа с данными стали неотъемлемой частью жизни каждого современного человека. Однако не все знают и умеют правильно работать с данными и грамотно их использовать в своих целях.

Было поставлено несколько задач:

  1. Разобрать основные понятия об информации и данных
  2. Классифицировать понятия об информации и данных
  3. Разобрать свойства данных и информации
  4. Изучить методы хранения данных
  5. Рассмотреть основные операции, производимые с данными

Объектом для исследования была выбрана сеть интернет, так как это огромная база данных, с практически неограниченным к ней доступом.

В работе использовались учебные пособия по информатике различных авторов, а так же данные, предоставленные в свободном доступе. Отдельно можно выделить Луковкина С.Б, который в своей работе очень подробно разобрал тему данных, методы их хранения и операции, производимые с ними.

Данные собирались, хранились и передавались людьми на протяжении всего их существования.

  • Наскальные рисунки своего рода тоже данные. Структурированная информация, которая по замыслу наших предков должна передать какие-то сведения предыдущим поколениям. Отсюда следует вывод, что актуальность хранения, передачи и прочих операций с данными существовала с самого начала появления нашего вида. Поэтому этот вопрос исследовался на протяжении веков и выявить основоположника термина «данные» не представляется реальным.

Наиболее интересным на мой взгляд является исследование Клиффорда Линча, редактора журнала Nature, подготовившего специальный выпуск с темой «Как могут повлиять на будущее науки технологии, открывающие возможности работы с большими объёмами

данных?», благодаря которой термин «большие данные» стал широко известен общественности. В выпуске были собраны материалы о феномене взрывного роста объёмов и многообразия обрабатываемых данных и технологических перспективах в парадигме вероятного скачка «от количества к качеству»; термин был предложен по аналогии с расхожими в деловой англоязычной среде метафорами «большая нефть», «большая руда».

Несмотря на то, что термин вводился в академической среде и прежде всего разбиралась проблема роста и многообразия научных данных, начиная с 2009 года термин широко распространился в деловой прессе, а к 2010 году относят появление первых продуктов и решений, относящихся исключительно и непосредственно к проблеме обработки больших данных. К 2011 году большинство крупнейших поставщиков информационных технологий для организаций в своих деловых стратегиях используют понятие о больших данных, в том числе IBM, Oracle, Microsoft, Hewlett-Packard, EMC, а основные аналитики рынка информационных технологий посвящают концепции выделенные исследования.

Глава 1. Информация и данные

Определений информации существует множество, причём академик Н. Н. Моисеев даже полагал, что в силу широты этого понятия нет и не может быть строгого и достаточно универсального определения информации.[1]

В своей книге «Синергетика и информация» Д.С. Чернавский приводит обширную коллекцию неудовлетворительных, по его мнению, тавтологических определений информации. Большое число похожих и непохожих друг на друга определений понятия «информация» означает, что общепринятого определения информации ещё нет. Более того, отмечает Д.С. Чернавский, нет даже четкого понимания сути этого явления, хотя потребность в нем давно уже назрела.

Существует подход, в котором вводится понятие информации как отраженного разнообразия. Источником разнообразия, по мнению В.М. Глушкова, является неоднородность распределения материи и энергии в пространстве и во времени. Отсюда и определение, данное В.М. Глушковым: информация – это мера неоднородности распределения материи и энергии в пространстве и во времени, показатель изменений, которыми сопровождаются все происходящие в мире процессы.

Трудность в построении общего определения информации состоит в том, что существуют разные типы информации. Например, социальная информация, информация биологическая, информация в экономике, научная информация. В самом простом случае мы говорим об информации, которая введена в компьютер для решения задачи, или об информации, передаваемой по проводам и радиоканалам. В этом случае можно определить количество информации, указать носитель информации, память, оценить качество информации. Отметим, что здесь мы имеем дело скорее с данными, чем с информацией. В общем случае, когда мы говорим об информации при изучении окружающего мира, возникают только вопросы, на которые пока нет ответов.

В международных и российских стандартах даются следующие определения:

1. знания о предметах, фактах, идеях и т. д., которыми могут обмениваться люди в рамках конкретного контекста (ISO/IEC 10746-2:1996)[2];

2. знания относительно фактов, событий, вещей, идей и понятий, которые в определённом контексте имеют конкретный смысл (ISO/IEC 2382:2015)[3];

3. сведения, воспринимаемые человеком и (или) специальными устройствами как отражение фактов материального или духовного мира в процессе коммуникации[4]

Информацию можно разделить на виды по различным критериям:

По способу восприятия:

Визуальная — воспринимаемая органами зрения.

Звуковая — воспринимаемая органами слуха.

Тактильная — воспринимаемая тактильными рецепторами.

Обонятельная — воспринимаемая обонятельными рецепторами.

Вкусовая — воспринимаемая вкусовыми рецепторами.

По форме представления:

Текстовая — передаваемая в виде символов, предназначенных обозначать лексемы языка.

Числовая — в виде цифр и знаков, обозначающих математические действия.

Графическая — в виде изображений, предметов, графиков.

Звуковая — устная или в виде записи и передачи лексем языка аудиальным путём.

Видеоинформация — передаваемая в виде видеозаписи.

По назначению:

Массовая — содержит тривиальные сведения и оперирует набором понятий, понятным большей части социума.

Специальная — содержит специфический набор понятий, при использовании происходит передача сведений, которые могут быть не понятны основной массе социума, но необходимы и понятны в рамках узкой социальной группы, где используется данная информация.

Секретная — передаваемая узкому кругу лиц и по закрытым (защищённым) каналам.

Личная (приватная) — набор сведений о какой-либо личности, определяющий социальное положение и типы социальных взаимодействий внутри популяции.

По значению:

Актуальная — информация, ценная в данный момент времени.

Достоверная — информация, полученная без искажений с надежных источников.

Понятная — информация, выраженная на языке, понятном тому, кому она предназначена.

Полная — информация, достаточная для принятия правильного решения или понимания.

Полезная — полезность информации определяется субъектом, получившим информацию в зависимости от объёма возможностей её использования.

По истинности:

Истинная.

Ложная.

В основу классификации положено пять общих признаков:

Место возникновения.

Стадия обработки.

Способ отображения.

Стабильность.

Функция управления.

С точки зрения информатики наиболее важными представляются следующие общие качественные свойства: достоверность, полнота, точность, актуальность, полезность, ценность, своевременность, понятность, доступность, краткость и пр.

Систематизация существующих подходов к выделению свойств информации позволяет говорить о том, что информации присущи следующие свойства [5]:

Атрибутивные свойства включают в свой состав такие свойства, как:

    • неотрывность информации от физического носителя и языковая природа информации. Информация не связана жестко ни с конкретным языком, ни с конкретным носителем;
    • дискретность. Информацию характеризуют отдельные фактические данные, закономерности и свойства изучаемых объектов, которые распространяются в виде различных сообщений, состоящих из линии, составного цвета, буквы, цифры, символа, знака;
    • непрерывность. Информация имеет свойство сливаться с уже зафиксированной и накопленной ранее, тем самым способствуя поступательному развитию и накоплению информации.
  1. Прагматические свойства включают в свой состав такие свойства, как:
    • смысл и новизна. Информация перемещается в социальных коммуникациях (взаимодействиях потребителей), и выделяется та ее часть, которая нова для потребителя;
    • полезность. Уменьшение неопределенности сведений об объекте. Дезинформация расценивается как отрицательные значения полезной информации;
    • ценность. Ценность информации различна для различных потребителей и пользователей;
    • кумулятивность. Характеризует накопление и хранение информации;
    • полнота. Характеризует качество информации и определяет достаточность данных для принятия решений или для создания новых данных на основе имеющихся;
    • достоверность. Данные возникают в момент регистрации сигналов, но не все сигналы являются «полезными» — всегда присутствует какой-то уровень посторонних сигналов, в результате чего полезные данные сопровождаются определенным уровнем «информационного шума»;
    • адекватность — это степень соответствия реальному объективному состоянию дела. Неадекватная информация может образовываться при создании новой информации на основе неполных или недостоверных данных. Однако и полные, и достоверные данные могут приводить к созданию неадекватной информации в случае применения к ним неадекватных методов;
    • доступность (мера возможности получить ту или иную информацию). Отсутствие доступа к данным или отсутствие соответствующих методов обработки данных приводят к одинаковому результату: информация оказывается недоступной;
    • актуальность (степень соответствия информации текущему моменту времени);
    • объективность и субъективность. Понятие объективности информации является относительным, т.к. методы являются субъективными. Более объективной принято считать ту информацию, в которую методы вносят меньший субъективный элемент. В ходе информационного процесса степень объективности информации всегда понижается. Это свойство учитывают, например, в правовых дисциплинах, где по-разному обрабатываются показания лиц, непосредственно наблюдавших события или получивших информацию косвенным путем (посредством умозаключений или со слов третьих лиц).
  2. Динамические свойства — это те свойства, которые характеризуют изменение информации во времени:
    • рост информации. Хотя информация и зависима от конкретного языка и конкретного носителя, она не связана жестко ни с конкретным языком, ни с конкретным носителем. Благодаря этому информация может быть получена и использована несколькими потребителями. Это свойство многократной используемости и проявление свойства рассеивания информации по различным источникам;
    • старение информации. Информация подвержена влиянию времени.

С течением времени количество информации растет, информация накапливается, происходит ее систематизация, оценка и обобщение. Это свойство назвали ростом и кумулированием информации. (Кумуляция — от лат. cumulatio — увеличение, скопление). Старение информации заключается в уменьшении ее ценности с течением времени. Старит информацию не само время, а появление новой информации, которая уточняет, дополняет или отвергает полностью или частично более раннюю. Научно-техническая информация стареет быстрее, эстетическая (произведения искусства) — медленнее.

Логичность, компактность, удобная форма представления облегчает понимание и усвоение информации.

Другое важное понятие информатики — данные. Этот термин встречается не менее часто, чем информация и также является основным в информатике, но не вызывает таких затруднений при определении. Есть несколько различных по форме, но эквивалентных по сути определений того, что такое «данные». Наиболее часто встречаются следующие определения:

  1. Данные - это зарегистрированные сигналы.
  2. Данные - это информация, представленная в виде, позволяющем запоминать, хранить, передавать или обрабатывать её с помощью технических средств.
  3. Данные – это информация об объекте или отношениях объектов, выраженная в знаковой форме.

Понятия «данные» и «информация» близки, но не тождественны. Эти понятия часто смешивают и, как отмечалось выше, делаются попытки определить одно через другое. Данные и информация взаимосвязаны. Информация не может существовать без данных, без какого-либо носителя: она как-то должна быть представлена с помощью данных. Именно этот факт и пытались подчеркнуть авторы второго определения данных. С другой стороны, любые данные всегда несут в себе какую-то информацию.[6]

Это понятие уже, чем информация, т.к. Представляет отрывочные, не связанные между собой сведения. Однако в работе с компьютерными программами чаще употребляется термин «данные».

Простейшая модель информационного обмена:

Информация – Данные – Сигналы – Данные – Информация

1. Источник представляет информацию в виде данных;

2. На основе данных формируется последовательность энергетических сигналов;

3. Сигналы взаимодействуют с материей и регистрируются. При этом образуются данные;

4. Получатель интерпретирует данные и воспроизводит их. При этом образуется информация.

Свойства данных:

1. Данные всегда объективны, даже если информация, заключенная в них, субъективна.

2. Неразрывная связь с носителем – основное свойство данных. Оно обуславливает их объективность и определяет большинство прочих свойств (долговечность хранения, скорость перемещения, плотность размещения).

Для автоматизации работы с данными, относящимися к различным типам, очень важно унифицировать их форму представления. Для этого используется прием кодирования, т.е. выражение данных одного типа через данные другого типа.

По аналогии с математикой, типы данных делят на скалярные (примитивные) и нескалярные (агрегатные). Значение нескалярного типа (нескалярное значение) имеет множество видимых пользователю компонентов, а значение скалярного типа (скалярное значение) не имеет такового.[7] Примерами нескалярного типа являются массивы, списки и т. д.; примеры скалярного типа — «целое», «логическое» и т. д.

По другой классификации типы делятся на самостоятельные и зависимые. Важными разновидностями последних являются ссылочные типы, частным случаем которых, в свою очередь, являются указатели. Ссылки (в том числе и указатели) представляют собой несоставной зависимый тип, значения которого являются адресом в памяти ЭВМ другого значения. .

Также типы делятся на мономорфные и полиморфные.

Данные — диалектическая составная часть информации. Они представляют собой зарегистрированные сигналы. При этом физический метод регистрации может быть любым: механическое перемещение физических тел, изменение их формы или параметров качества поверхности, изменение электрических, магнитных, оптических характеристик, химического состава и (или) характера химических связей, изменение состояния электронной системы и многое другое. В соответствии с методом регистрации данные могут храниться и транспортироваться на носителях различных видов.

Самым распространенным носителем данных, хотя и не самым экономичным, по-видимому, является бумага. На бумаге данные регистрируются путем изменения оптических характеристик ее поверхности. Изменение оптических свойств (изменение коэффициента отражения поверхности в определенном диапазоне длин волн) используется также в устройствах, осуществляющих запись лазерным лучом на пластмассовых носителях с отражающим покрытием ( CDROM ). В качестве носителей, использующих изменение магнитных свойств, можно назвать магнитные ленты и диски. Регистрация данных путем изменения химического состава поверхностных веществ носителя широко используется в фотографии. На биохимическом уровне происходит накопление и передача данных в живой природе.

Носители данных интересуют нас не сами по себе, а постольку, поскольку свойства информации весьма тесно связаны со свойствами ее носителей. Любой носитель можно характеризовать параметром разрешающей способности (количеством данных, записанных в принятой для носителя единице измерения) и динамическим диапазоном (логарифмическим отношением интенсивности амплитуд максимального и минимального регистрируемого сигналов). От этих свойств носителя нередко зависят такие свойства информации, как полнота, доступность и достоверность. Так, например, мы можем рассчитывать на то, что в базе данных, размещаемой на компакт-диске, проще обеспечить полноту информации, чем в аналогичной по назначению базе данных, размещенной на гибком магнитном диске, поскольку в первом случае плотность записи данных на единице длины дорожки намного выше. Для обычного потребителя доступность информации в книге заметно выше, чем той же информации на компакт-диске, поскольку не все потребители обладают необходимым оборудованием. И, наконец, известно, что визуальный эффект от просмотра слайдов проекторе намного больше, чем от просмотра аналогичной иллюстрации, напечатанной на бумаге, поскольку диапазон яркостных сигналов в проходящем свете на два три порядка больше, чем в отраженном.

Задача преобразования данных с целью смены носителя относится к одной из важнейших задач информатики. В структуре стоимости вычислительных систем устройства для ввода и вывода данных, работающие с носителями информации, составляют до половины стоимости аппаратных средств.

Замечательным запоминающим устройством и носителем данных является человеческий мозг, содержащий около (10—15)–109 нейронов — ячеек, совмещающих функции памяти и логической обработки информации.

Объём мозга в среднем 1,5 дм3, масса 1,2 кг, потребляемая мощность около 2,5 вт. Лучшие современные электронные запоминающие устройства при такой же ёмкости занимают объём в несколько м3 при массе в десятки и сотни кг, а потребляемая мощность достигает несколько квт.

Научно обоснованные прогнозы утверждают, что совершенствование электронной техники и применение новых высокоэффективных накопительных сред в сочетании с широким использованием методов бионики при решении проблем, связанных с синтезом запоминающих устройств, позволят создавать запоминающие устройства, близкие по параметрам памяти человека.

Глава 2. Операции, производимые с данными

Технологический процесс (ТП) обработки информации представляет собой комплекс взаимосвязанных операций по преобразованию информации в соответствии с поставленной целью с момента ее возникновения (входа в информационную систему) до момента ее потребления пользователями. Сложность и многообразие вариантов технологических процессов обусловливают необходимость их деления на этапы и операции.

Этапы технологического процесса – это его укрупненные части: относительно самостоятельные, характеризующиеся логической законченностью, пространственной или временной обособленностью. Этапы делятся на технологические операции, различаются их составом и последовательностью выполнения. Технологическая операция – это взаимосвязанная совокупность действий, выполняемых над информацией на одном рабочем месте в процессе ее преобразования для достижения общей цели технологического процесса. При этом важными являются время преобразования и качество результатной информации. Технологические операции обычно выполняются целыми совокупностями, образуя этапы.

Технологический процесс принято делить на этапы: первичный, подготовительный и основной. На первичном этапе обеспечивается сбор первичной информации, ее регистрация и передача на обработку. На подготовительном этапе осуществляется перенос первичной информации на машинные носители для автоматизации ее последующего ввода в технические средства. Реализация основного этапа позволяет выполнять обработку информации и получать необходимые результаты. На всех этапах выполняется максимум контрольных операций для достижения достоверности и полноты преобразования информации.

По содержанию и последовательности преобразования информации различают следующие технологические операции: сбор и регистрация информации, ее передача, прием, запись на машинные носители, арифметическая и логическая обработка, получение результатной информации, выпуск выходных документов, передача их пользователям.

Сбор информации – обеспечение системы управления таким объемом сведений, который позволяет выполнить поставленные задачи. Сбор и регистрация информации происходят по-разному в различных экономических объектах. Наиболее сложна эта процедура в автомати­зированных управленческих процессах промышленных предприятий, фирм и т.п., где производится сбор и регистрация первичной учетной информации, отражающей производственно-хозяйственную деятельность объекта. Не менее сложна эта процедура и в финансовых органах, где происходит оформление движения денежных ресурсов.

Особое значение при этом придается достоверности, полноте и своевременности первичной информации. На предприятии сбор и регистрация информации происходят при выполнении различных хозяйственных операций (прием готовой продукции, получение и отпуск материалов и т.п.), в банках – при совершении финансово-кредитных операций с юридическими и физическими лицами. Учетные данные могут возникать на рабочих местах в результате подсчета количества обработанных деталей, прошедших сборку узлов, изделий, выявления брака и т.д.

В процессе сбора фактической информации производятся измерение, подсчет, взвешивание материальных объектов, подсчет денежных купюр, получение временных и количественных характеристик работы отдельных исполнителей. Сбор информации, как правило, регистрируется, т.е. информация фиксируется на материальном носителе (документе, машинном носителе) вводом в ПЭВМ. Запись в первичные документы в основном осуществляется вручную, поэтому процедуры сбора и регистрации остаются пока наиболее трудоемкими, а процесс автоматизации документооборота – по-прежнему актуальным.

В условиях автоматизации управления предприятием особое внимание придается использованию технических средств сбора и регистрации информации, совмещающих операции количественного измерения, регистрации, накопления и передачи информации по каналам связи, ввод ее непосредственно в ЭВМ для формирования нужных документов или накопления полученных данных в системе.

Передача информации – функция обмена данными, перенос информации в пространстве. Передача информации осуществляется различными способами: с помощью курьера, пересылки по почте, доставки транспортными средствами, дистанционной передачи по каналам связи, с использованием других средств коммуникаций. Дистанционная передача данных по каналам связи сокращает время их движения, однако это удорожает процесс из-за необходимости применения специальных технических средств. Предпочтительным является использование технических средств сбора и регистрации, которые, автоматически собирая информацию с установленных на рабочих местах датчиков, передают ее в ЭВМ для последующей обработки, что повышает ее достоверность и снижает трудоемкость.

Дистанционно может передаваться как первичная информация с мест ее возникновения, так и результатная – в обратном направлении. Последняя фиксируется дисплеями, табло, печатающими устройствами. Поступление информации по каналам связи в центр обработки в основном осуществляется двумя способами: на машинном носителе или непосредственно вводом в ЭВМ при помощи специальных программных и аппаратных средств.

Дистанционная передача информации с помощью современных коммуникационных средств постоянно развивается и совершенствуется. Особое значение этот способ приобретает в многоуровневых межотраслевых системах, где применение дистанционной передачи значительно ускоряет прохождение информации с одного уровня управления на другой и сокращает общее время обработки данных.

Машинное кодирование – процедура машинного представления (записи) информации на машинных носителях с помощью кодов, принятых в компьютере. Кодирование информации производится путем переноса данных первичных документов на магнитные диски, информация с которых затем вводится в компьютер для обработки. Запись информации на машинные носители осуществляется на компьютере как самостоятельная процедура или как результат обработки.

Хранение информации – перенос информации во времени. Обеспечивает накопление опыта, запоминание информации о ходе развития процессов. Хранение и накопление экономической информации вызвано многократным ее использованием, применением условно-постоянной, справочной и других видов информации, необходимостью комплектации первичных данных до их обработки. Информация хранится и накапливается в информационных базах, на машинных носителях в виде информационных массивов, где данные располагаются по установленному в процессе проектирования поименованному порядку.

С хранением и накоплением непосредственно связан поиск данных, т.е. выборка нужных данных из хранимой информации, включая поиск информации, подлежащей корректировке либо замене. Процедура поиска выполняется автоматически на основе составленного пользователем или компьютером запроса на нужную информацию.

Обработка информации – выработанная последовательность действий оформляется в виде документов: конструктивных программ и управленческих технологий. Выполняется для обоснования решений и целесообразных способов действий.

Доведение информации до пользователя – преобразование сведений в течение процесса производства и сведений, влияющих на ход этого производства, в форму, обеспечивающую оперативное и безошибочное восприятие их пользователем.

В ходе решения задач на ЭВМ в соответствии с машинной программой формируются результатные сводки, которые печатаются машиной или отображаются на экране. Печать сводок может сопровождаться процедурой тиражирования, если документ с результатной информацией необходимо предоставить нескольким пользователям.

Принятие решения в автоматизированной системе организационного управления, как правило, осуществляется специалистом с применением или без применения технических средств, но в последнем случае – на основе тщательного анализа результатной информации, полученной на компьютере. Задача принятия решений осложняется тем, что специалисту приходится выбирать из множества допустимых решений наиболее приемлемое, сводящее к минимуму потери ресурсов (временных, трудовых, материальных и т.д.). Благодаря применению персональных компьютеров и терминальных устройств повышается аналитичность обрабатываемых сведений, а также обеспечивается постепенный переход к автоматизации выработки оптимальных решений в процессе диалога пользователя с вычислительной системой. Этому способствует использование новых технологий экспертных систем поддержки принятия решений[8].

По степени механизации и автоматизации операции бывают ручные (выписка первичного документа), механизированные (используются технические средства, но преимущественно выполняются человеком например регистрация на пишущей машинке), автоматизированные – в большей степени выполняются техническими средствами, но предполагается и участие человека (запись данных на магнитные носители с помощью средств, в которых автоматизирован контроль), автоматические – без участия человека (передача информации по линиям связи).

По роли в технологическом процессе различают рабочие и контрольные операции. Рабочие операции обеспечивают получение конечного результата, а контрольные – надежность рабочих операций.[9]

В ходе информационного процесса данные преобразуются из одного вида в другой с помощью методов. Обработка данных включает в себя множество различных операций. По мере развития научно-технического прогресса и общего усложнения связей в человеческом обществе трудозатраты на обработку данных неуклонно возрастают. Прежде всего, это связано с постоянным усложнением условий управления производством и обществом. Второй фактор, также вызывающий общее увеличение объемов обрабатываемых данных, тоже связан с научно-техническим прогрессом, а именно с быстрыми темпами появления и внедрения новых носителей данных, средств хранения и доставки данных. В структуре возможных операций с данными можно выделить следующие основные:

1. Сбор данных – накопление данных с целью обеспечения достаточной полноты информации для принятия решения;

2. Формализация данных – приведение данных, поступающих из разных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, то есть повысить их уровень доступности;

3. Фильтрация данных – отсеивание «лишних» данных, в которых нет необходимости для принятия решений; при этом должен уменьшаться уровень «шума», а достоверность и адекватность данных должны возрастать;

4. Сортировка данных – упорядочение данных по заданному признаку с целью удобства использования; повышает доступность информации;

5. Группировка данных – объединение данных по заданному признаку с целью повышения удобства использования; повышает доступность информации;

6. Архивация данных – организация хранения данных в удобной и легкодоступной форме; служит для снижения экономических затрат на хранение данных и повышает общую надежность информационного процесса в целом;

7. Защита данных – комплекс мер, направленных на предотвращение утраты, воспроизведение и модификации данных;

8. Транспортировка данных – прием и передача (доставка и поставка) данных между удаленными участниками информационного процесса; при этом источник данных в информатике принято называть сервером, а потребителя – клиентом;

9. Преобразование данных – перевод данных из одной формы в другую или из одной структуры в другую. Преобразование данных часто связано с изменением типа носителя, например книги можно хранить в обычной бумажной форме, но можно использовать для этого и электронную форму, и микрофотопленку. Необходимость в многократном преобразовании данных возникает также при их транспортировке, особенно если она осуществляется средствами, не предназначенными для транспортировки данного вида данных. В качестве примера можно упомянуть, что для транспортировки цифровых потоков данных по каналам телефонных сетей (которые изначально были ориентированны только на передачу аналоговых сигналов в узком диапазоне частот) необходимо преобразование цифровых данных в некое подобие звуковых сигналов, чем и занимаются специальные устройства – телефонные модемы[10].

Приведенный здесь список типовых операций с данными далеко не полон. Миллионы людей во всем мире занимаются созданием, обработкой, преобразованием транспортировкой данных, и на каждом рабочем месте выполняются свои специфические операции, необходимые для управления социальными, экономическими, промышленными, научными и культурными процессами. Полный список возможных операций составить невозможно, да и не нужно. Сейчас нам важен другой вывод: работа с информацией может иметь огромную трудоемкость, и ее надо автоматизировать.

Основные структуры данных:

Работа с большими наборами данных автоматизируется проще, когда данные упорядочены, то есть образуют заданную структуру. Существует три основных типа структур данных: линейная, иерархическая и табличная.

Линейные структуры – это хорошо знакомые нам списки. Список – это простейшая структура данных, отличающаяся тем, что адрес каждого элемента данных однозначно определяется его номером. Проставляя на отдельных страницах рассыпанной книги, мы создаем структуру списка, поскольку все студенты группы зарегистрированы в нем под своими уникальными номерами. Мы называем номера уникальными потому, что в одной группе не могут быть зарегистрированы два студента с одним и тем же номером[11].

Линейные структуры данных (списки) – это упорядоченные структуры, в которых адрес элемента однозначно определяется его номером.

С таблицами данных мы тоже хорошо знакомы, достаточно вспомнить всем известную таблицу умножения. Табличные структуры отличаются от списочных тем, что элементы данных определяются адресом ячейки, который состоит не из одного параметра, как в списках, а из нескольких. Для таблицы умножения, например, адрес ячейки определяется номерами строки и столбца. Нужная ячейка находится на их пересечении, а элемент выбирается из ячейки.

Табличные структуры данных (матрицы) – это упорядоченные структуры, в которых адрес элемента определяется номером строки и номером столбца, на пересечении которых находится ячейка, содержащая искомый элемент.

Нерегулярные данные, которые трудно представить в виде списка или таблицы, часто представляют в виде иерархических структур. С подобными структурами мы очень хорошо знакомы по обыденной жизни. Иерархическую структуру имеет система почтовых адресов. Подобные структуры также широко применяются в научных систематизациях и всевозможных классификациях.

В иерархической структуре адрес элемента определяется путем доступа (маршрутом), ведущим от вершины структуры к данному элементу. Вот, например, как выглядит путь доступа к команде, запускающей программу Калькулятор (стандартная программа компьютеров, работающих в операционной системе Windows 98)[12].

Данные характеризуются своим типом и множеством операций над ними. Данные в компьютере условно делятся на простые и сложные. К сложным данным относятся: массивы и списки (однотипные), структуры, записи, таблицы (разнотипные). В ходе информационного процесса данные преобразуются из одного вида в другой с помощью методов. Обработка данных включает в себя множество различных операций. По мере развития научно-технического прогресса и общего усложнения связей в человеческом обществе трудозатраты на обработку данных неуклонно возрастают. Прежде всего, это связано с постоянным усложнением условий управления производством и обществом. Вторвй фактор, также вызывающий общее увеличение объемов обрабатываемых данных, тоже связан с научно-техническим прогрессом, а именно с быстрыми темпами появления и внедрения новых носителей данных, средств их хранения и доставки.

В структуре возможных операций с данными можно выделить следующие основные:

• сбор данных—накопление информации с целью обеспечения достаточной полноты для принятия решений;

• формализация данных — приведение данных, поступающих из разных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, то есть повысить их уровень доступности;

• фильтрация данных — отсеивание «лишних» данных, в которых нет необходимости для принятия решений; при этом должен уменьшаться уровень «шума», а достоверность и адекватность данных должны возрастать;

• сортировка данных — упорядочение данных по заданному признаку с целью

удобства использования; повышает доступность информации;

• архивация данных — организация хранения данных в удобной и легкодоступной форме; служит для снижения экономических затрат по хранению данных и повышает общую надежность информационного процесса в целом;[13]

• защита данных—комплекс мер, направленных на предотвращение утраты, воспроизведения и модификации данных;

• транспортировка данных—прием и передача (доставка и поставка) данных между удаленными участниками информационного процесса; при этом источник данных в информатике принято называть сервером, а потребителя — клиентом;

• преобразование данных — перевод данных из одной формы в другую или из одной структуры в другую. Преобразование данных часто связано с изменением типа носителя, например книги можно хранить в обычной бумажной форме, но можно использовать для этого и электронную форму, и микрофотопленку. Необходимость в многократном преобразовании данных возникает также при их транспортировке, особенно если она осуществляется средствами, не предназначенными для транспортировки данного вида данных. В качестве примера можно упомянуть, что для транспортировки цифровых потоков данных по каналам телефонных сетей (которые изначально были ориентированы только на передачу аналоговых сигналов в узком диапазоне частот) необходимо преобразование цифровых данных в некое подобие звуковых сигналов, чем и занимаются специальные устройства — телефонные модемы.

Заключение

Была произведена исследовательская работа на тему «Операции, производимые с данными». Поставленные задачи были выполнены. Основные понятия информации изучены, разобраны отличия понятия «информация» и понятия «данные». Была разобрана классификация информации и данных. А так же разобраны их свойства и методы хранения. Были рассмотрены основные операции, производимые с данными.

На работе с данными держится вся человеческая цивилизация. Вопрос о хранении как можно больших объемов данных будет актуален на протяжении всего существования человечества, как и был актуален в начале нашего существования. Огромный потенциал культурного развития человечества строится на операциях, производимых с данными. Основная цель человечества научиться обрабатывать как можно большие объемы данных за как можно меньший промежуток времени.

Библиография:

  1. Алехина Г.В., Годин И.М., Пронкин П.Г. Основы информатики: учеб. пособие. — М.: МФПА, 2009. — С. 4—16
  2. Давыдов И.С. Информатика: Учебное пос. для вузов
  3. Данчула А. Н. Информатика: Учебник
  4. ГОСТ 7.0-99 Информационно-библиотечная деятельность, библиография. Термины и определения
  5. Дейт К. Дж. Введение в системы баз данных
  6. Луковкин С.Б., Учебное пособие по информатике
  7. Моисеенко Е.В., Лаврушина Е. Г., Информационные технологии в экономике

Степанов А.Н. Информатика: Учебник

Соболь Б.В. Информатика: Учебник

Хубаев Г.Н. Информатика: Учебник

  1. Хургин В., 2007.
  2. ISO/IEC 10746-2:1996, Information technology — Open Distributed Processing — Reference Model: Foundations.3.2.5: knowledge that is exchangeable amongst users about things, facts, concepts, and so on, in a universe of discourse
  3. ISO/IEC 2382:2015 Information technology — Vocabulary: knowledge concerning objects, such as facts, events, things, processes, or ideas, including concepts, that within a certain context has a particular meaning
    1. Хургин, 2007.

    1. ISO/IEC 10746-2:1996, Information technology — Open Distributed Processing — Reference Model: Foundations.3.2.5: knowledge that is exchangeable amongst users about things, facts, concepts, and so on, in a universe of discourse

    1. ISO/IEC 2382:2015 Information technology — Vocabulary: knowledge concerning objects, such as facts, events, things, processes, or ideas, including concepts, that within a certain context has a particular meaning

  1. ГОСТ 7.0-99 Информационно-библиотечная деятельность, библиография. Термины и определения

  2. . Алехина Г.В., Годин И.М., Пронкин П.Г. Основы информатики: учеб. пособие. — М.: МФПА, 2009. — С. 4—16

  3. Учебное пособие по информатике, Луковкин С.Б.

  4. Дейт К. Дж. Введение в системы баз данных

  5. Хубаев Г.Н. Информатика: Учебник

  6. Информационные технологии в экономике, Моисеенко Е.В., Лаврушина Е. Г.

  7. Степанов А.Н. Информатика: Учебник

  8. Соболь Б.В. Информатика: Учебник

  9. Давыдов И.С. Информатика: Учебное пособие для вузов

  10. Данчула А.Н. Информатика: Учебник