Автор Анна Евкова
Преподаватель который помогает студентам и школьникам в учёбе.

Технологии программирования (Кодирование данных двоичным кодом)

Содержание:

ВВЕДЕНИЕ

В ходе информационного процесса данные преобразуются из одного вида в другой с помощью различных методов. Обработка данных включает в себя множество операций. По мере развития научно-технического прогресса и общего усложнения связей в человеческом обществе возрастают неуклонно трудозатраты на обработку данных. Прежде всего, это связано с постоянным усложнением условий управления производством и обществом. Второй фактор, также вызывающий общее увеличение объемов обрабатываемых данных, связан с научно-техническим прогрессом, а именно с быстрыми темпами появления и внедрения новых носителей данных, средств их хранения и доставки.

Данные – составная часть информации. Они представляют собой зарегистрированные сигналы. При этом физический метод регистрации может быть любым. В соответствии с методом регистрации данные могут храниться и транспортироваться на носителях различных видов.

В ходе информационного процесса данные преобразуются из одного вида в другой с помощью методов. Обработка данных включает в себя множество различных операций. По мере развития научно-технического прогресса и общего усложнения связей в человеческом обществе трудозатраты на обработку данных неуклонно возрастают. Прежде всего, это связано с постоянным усложнением условий управления производством и обществом. Второй фактор, также вызывающий общее увеличение объемов обрабатываемых данных, тоже связан с научно-техническим прогрессом, а именно с быстрыми темпами появления и внедрения новых носителей данных, средств хранения и доставки данных.

Для автоматизации работы с данными, относящимися к различным типам, очень важно унифицировать их форму представления – для этого обычно используется прием кодирования, то есть выражение данных одного типа через данные другого типа. Естественные человеческие языки – это не что иное, как системы кодирования понятий для выражения мыслей посредством речи. К языкам близко примыкают азбуки (системы кодирования компонентов языка с помощью графических символов). История знает интересные, хотя и безуспешные попытки создания «универсальных» языков и азбук.

Та же проблема универсального средства кодирования достаточно успешно реализуется в отдельных отраслях техники, науки и культуры. В качестве примеров можно привести систему записи математических выражений, телеграфную азбуку, морскую флажковую азбуку, систему Брайля для слепых и многое другое.

Актуальность курсовой работы обусловлена тем, что одним из важнейших условий обеспечения эффективного функционирования любой организации является правильная обработка данных. В современном обществе, когда многие бизнес-процессы производятся компьютерами, важно понимать что такое данные и какие есть операции с ними.

Целью данной курсовой работы является рассмотрение операций над данными.

Предметом курсовой работы являются данные.

Объект курсовой работы – операции c данными.

Задачи курсовой работы:

1. Рассмотреть связь понятий «информация, данные, знания». Модель DIWK

2. Описать операции с данными

3. Проанализировать системы обработки информации и данных

4. Рассмотреть тему кодирования данных

ГЛАВА 1. ОПЕРАЦИИ С ДАННЫМИ

1.1 Связь понятий «информация, данные, знания». Модель DIWK

Информация - это отображение реального мира с помощью различных сведений. Наряду с термином «информация» в информатике используется понятие «данные». Понятие «данные» подразумевает под собой отрывочные, не связанные между собой сведения [4].

Одной из основных проблем, связанных с документацией данных в компьютере есть точность и корректность четырех разных видов данных.

Данные - это диалектическая составная часть информации. Они представляют собой зарегистрированные сигналы. При этом физический метод регистрации может быть любым: механическое перемещение физических тел, изменение их формы или параметров качества поверхности, изменение электрических, магнитных, оптических характеристик, химического состава и (или) характера химических связей, изменение состояния электронной системы и многое другое. В соответствии с методом регистрации данные могут храниться и транспортироваться на носителях различных видов [9].

Виды данных: большая часть вычислительных компьютеров может быть разделена на два основных типа операций. Арифметические операции - это вычисления с числами, такими как сложение, вычитание и другие математические процедуры. Ранние компьютеры выполняли в основном арифметические операции, что создавало ложное впечатление, что только инженеры и ученые могут извлечь выгоду из компьютеров. Не менее важна способность компьютеров сравнивать два значения, чтобы определить, больше ли одно, меньше или равно другому. Это называется логической операцией. Сравнение может иметь место между цифрами, буквами, звуками или даже рисунками. Обработка компьютера основана на способности компьютера выполнять логические и арифметические операции [19].

Необходимо дать компьютеру инструкции, как обрабатывать получаемые данные и формат, необходимый для вывода и хранения. Возможность следовать программе отличает компьютеры от большинства инструментов. Тем не менее, новые инструменты, начиная от пишущих машинок до микроволновых печей, имеют встроенные компьютеры или встроенные компьютеры. Встроенный компьютер может принимать данные для использования нескольких параметров в своей программе, но сама программа не может быть изменена. Это делает эти устройства гибкими и удобными, но не встроенными компьютерами [11].

Типы данных: с появлением новых компьютерных приложений и аппаратного обеспечения определение данных расширилось и теперь включает много типов.

Числовые данные состоят из цифр и десятичных точек, а также знаков плюс (+) и минус (-). Как арифметические, так и логические операции выполняются с числовыми данными. Это означает, что числа могут использоваться для расчетов, а также сортироваться и сравниваться друг с другом.

Текст или текстовые данные могут содержать любую комбинацию букв, цифр и специальных символов. Иногда текстовые данные известны как буквенно-цифровые данные.

Различные формы данных, которые мы можем услышать и увидеть, составляют аудиовизуальные данные. Компьютер может воспроизводить звуки, музыку и даже человеческий голос. Он также может принимать аудиоинформацию в качестве входных данных. Данные также могут принимать форму рисунков и видеопоследовательностей [1].

Физические данные извлекаются из окружающей среды. Например, свет, температура и давление - это все типы физических данных. Во многих крупных зданиях компьютерные системы обрабатывают несколько видов физических данных для регулирования операций. Компьютеры могут отключать охранные сигналы, контролировать температуру и влажность или включать и выключать свет - все это в ответ на физические данные. Эти приложения повышают безопасность людей и экономят время и деньги [8].

Иерархия «Данные, Информация, Знания, Мудрость» (DIKW) иллюстрируется в форме пирамиды, состоящей из четырех уровней.  Прогресс указывается при прохождении каждого уровня, начиная с основания пирамиды и достигая вершины [5].

Процесс начинается со сбора данных на первом уровне, которые затем обрабатываются для формирования информации на втором уровне. Когда эта информация изучается или рассматривается, она принимает форму Знания на третьем уровне, а создание Знания ведет к обретению Мудрости на четвертом или высшем уровне. Данные, составляющие основу иерархии, могут быть скомпилированы либо вручную, либо с помощью автоматизированных систем, и к этим входам добавляется ценность путем их интерпретации и преобразования в полезный и значимый формат, называемый « Информация». Когда информация применяется в конкретной ситуации и преобразуется в опыт, она определяется как знание мудрость находится на вершине иерархии DIKW и отличается от данных и информации, которые могут быть использованы, а также от знаний, которыми можно делиться. Мудрость более абстрактна, поскольку она является чем-то присущим ей и, как правило, представляет собой совокупность ценностей, суждений, предшествующего опыта или интерпретаций [5].

В организациях данные и информация рассматриваются как инструменты для выполнения задач и улучшения операций, тогда как внедрение систем и практик создает Знания, а накопление Знаний, посредством которых происходят преобразования и обучение, порождает Мудрость.

Иерархия DIKW - это механизм управления знаниями, который можно использовать в организациях для рассмотрения проблем по частям.

Отображение организационных вопросов через иерархию DIKW:

  • Данные: Определите необработанные внешние данные, такие как факты и цифры, которые еще предстоит интерпретировать [5].
  • Информация: проанализируйте данные, чтобы определить, что известно об организационных потребностях. Ключевым моментом, который следует отметить в отношении этого шага, является то, что управление информацией может быть полезным не только для ответов на вопросы, но и для поиска решений в организационных контекстах.
  • Знание: выяснить, как человек знает что-то или как они применяют информацию. Это полезная практика для повышения интеллектуального капитала организации.
  • Мудрость: узнайте, почему люди применяют знания особым образом, например, при принятии решений [5].

Переход от управления информацией к управлению знаниями в организациях

Ключевое различие между уровнями информации и знаний в иерархии DIKW заключается в роли отдельных лиц в последней. Знания создаются, когда люди выбирают и объединяют необходимую информацию для достижения конкретных результатов [5].

В технологическом процессе обработки данных можно выделить 4 этапа:

1. Формирование первичных данных - первичные сообщения о хозяйственных операциях, документы, содержащие нормативные и юридические акты, результаты экспериментов, например, параметры новой модели самолета или автомобиля и т.д.

2. Накопление и систематизация данных, т.е. организация такого размещения данных, которое обеспечило бы быстрый поиск и отбор нужных сведений, методическое обновление данных, защиту от искажений и т.д.

3. Обработка данных - процессы, в результате которых на основе ранее накопленных данных формируются новые виды данных - обобщающие, аналитические, рекомендательные, прогнозные и т.д. Эти данные вторичной обработки могут быть подвергнуты следующей обработке и принести более глубокие, точные обобщения [14].

4. Отображение данных - представление данных в форме, удобной для человека. Это вывод на печать, графические изображения (иллюстрации, графики, диаграммы и т.д.), звук и т.д. [14].

Сообщения, формируемые на первом этапе, могут иметь разный вид: обычный бумажный документ, звук, видео, числовые данные на каком-то носителе. Как правило, носители первичной информации (физические носители, полученные от аналоговых устройств) - бумага, пластинки, кассеты, видеокассеты очень недолговечны.

Компьютерные технологии предлагают принципиально новый подход - цифровое (дискретное) представление информации на магнитных и лазерных носителях.

Посредством технических и программных средств ЭВМ первичные данные преобразуются в машинный код [18].

1.2 Операции с данными

В структуре возможных операций с данными можно выделить следующие:

• сбор - накопление информации с целью обеспечения достаточной полноты для принятия решений;

• формализация - приведение данных, поступающих из разных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, то есть повысить их уровень доступности;

• фильтрация - отсеивание «лишних» данных, в которых нет необходимости для принятия решений; при этом должен уменьшаться уровень «шума», а достоверность и адекватность данных должны возрастать;

• сортировка - упорядочение данных по заданному признаку с целью удобства использования; эта процедура повышает доступность информации [3];

• архивация - организация хранения данных в удобной и легкодоступной форме; служит для снижения экономических затрат по хранению данных и повышает общую надежность информационного процесса в целом [3];

 • защита - комплекс мер, направленных на предотвращение утраты, воспроизведения и модификации данных;

• транспортировка - прием и передача (доставка и поставка) данных между удаленными участниками информационного процесса; при этом источник данных в информатике принято называть сервером, а потребителя - клиентом;  

• преобразование данных - перевод данных из одной формы в другую или из одной структуры в другую. Преобразование данных часто связано с изменением типа носителя, например книги можно хранить в обычной бумажной форме, но можно использовать для этого и электронную форму, и микрофотопленку [13].

Необходимость в многократном преобразовании данных возникает также при их транспортировке, особенно если она осуществляется средствами, не предназначенными для транспортировки данного вида данных. В качестве примера можно упомянуть, что для транспортировки цифровых потоков данных по каналам телефонных сетей (которые изначально были ориентированы только на передачу аналоговых сигналов в узком диапазоне частот) необходимо преобразование цифровых данных в некое подобие звуковых сигналов, чем и занимаются специальные устройства - телефонные модемы [7].

Приведенный здесь список типовых операций с данными далеко не полон. Миллионы людей во всем мире занимаются созданием, обработкой, преобразованием и транспортировкой данных, и на каждом рабочем месте выполняются свои специфические операции, необходимые для управления социальными, экономическими, промышленными, научными и культурными процессами. Полный список возможных операций составить невозможно, да и не нужно. Сейчас нам важен другой вывод: работа с информацией может иметь огромную трудоемкость, и ее надо автоматизировать [12].

Процедура доступа к данным может быть инициирована как самим компьютером (для решения каких-либо своих технических задач), так и конечным пользователем. В последнем случае пользователь формирует запрос, куда включает, в частности, обозначение требуемого вида доступа или действия и указание на то, над какими данными это действие надо выполнить. Как отмечалось ранее, идентификация данных осуществляется с помощью ключей. В качестве же требуемого действия может производиться одно из следующих: добавление, удаление, изменение,  просмотр элемента или обработка данных из элемента [2].

При добавлении элемента информационный массив пополняется новыми данными в виде записи файла или файла в целом, соответственно, для структурированных и неструктурированных данных. В запросе в этом случае, помимо указанной выше информации, приводится и сам новый элемент. При этом объем информационного массива увеличивается.

Удаление, наоборот, является обратным действием, вызывающим исключение упомянутых данных. Это действие приводит к уменьшению объема информационного массива.

Изменение относится не к элементу, а к его составляющим – полям записи файла или тексту, хранящемуся в файле, и означает, в свою очередь,  удаление прежних значений полей или строк текста и/или добавление новых. В запрос включается дополнительная информация, указывающая на требуемые составляющие изменяемого элемента, а также сами новые значения этих составляющих. Объем информационного массива при этом не меняется для структурированных данных и, возможно, меняется для неструктурированных [15].

Просмотр связан с предоставлением данных пользователю на устройстве вывода компьютера, как правило, на дисплее. В запросе в этом случае дополнительно указывается, какие составляющие элемента требуется просмотреть (по умолчанию просматривается весь элемент) [20].

Обработка предусматривает выполнение некоторых арифметических операций над данными элемента, например, накопление суммы и т.д., и относится только к структурированным данным, а потому далее не рассматривается.

Чтобы выполнить любое их указанных выше действий, нужный элемент должен быть предварительно найден в информационном массиве, для чего выполняется его поиск (для добавления нового элемента тоже делается попытка его поиска, которая заканчивается неудачно, и тогда элемент добавляется). Под поиском элемента понимается определение его местонахождения в информационном массиве. Таким образом, любой доступ включает поиск, что делает эту фазу доступа наиболее значимой [17].

Данные характеризуются своим типом и множеством операций над ними. Данные в компьютере условно делятся на простые и сложные.

Примеры простых данных, которые может обрабатывать компьютер приведены в таблице 1:

Таблица 1-Типы данных, обрабатываемых компьютером

Типы данных

Операции

1

Числа (числовые данные)

Все арифметические операции

2

Тексты(символьные данные)

Замещение, вставка, удаление символов, сравнение, конкатенация строк

3

Логические(бинарные) данные

Все логические операции (конъюнкция, дизъюнкция, отрицание и др.)

4

Изображения: рисунки, графика, анимация (графические данные)

Операции над пикселями, из которых состоит изображение: яркость, цвет, контрастность

5

Видео данные

Удаление фрагмента, вставка фрагмента, работа с кадрами

6

Аудио данные

Усиление, уменьшение, удаление фрагмента, вставка фрагмента

К сложным данным относятся: массивы и списки (однотипные), структуры, записи, таблицы (разнотипные). В ходе информационного процесса данные преобразуются из одного вида в другой с помощью методов. Обработка данных включает в себя множество различных операций. По мере развития научно-технического прогресса и общего усложнения связей в человеческом обществе трудозатраты на обработку данных неуклонно возрастают. Прежде всего, это связано с постоянным усложнением условий управления производством и обществом. Второй фактор, также вызывающий общее увеличение объемов обрабатываемых данных, тоже связан с научно-техническим прогрессом, а именно с быстрыми темпами появления и внедрения новых носителей данных, средств их хранения и доставки [16].

В структуре возможных операций с данными можно выделить основные:

1) сбор данных - накопление информации с целью обеспечения достаточной полноты для принятия решений;

2) формализация данных - приведение данных, поступающих из разных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, то есть повысить их уровень доступности;

3) фильтрация данных - отсеивание «лишних» данных, в которых нет необходимости для принятия решений; при этом должен уменьшаться уровень «шума», а достоверность и адекватность данных должны возрастать [3];

4) сортировка данных - упорядочение данных по заданному признаку с целью удобства использования; повышает доступность информации;

5) архивация данных - организация хранения данных в удобной и легкодоступной форме; служит для снижения экономических затрат по хранению данных и повышает общую надежность информационного процесса в целом;

6) защита данных - комплекс мер, направленных на предотвращение утраты, воспроизведения и модификации данных [3];

7) транспортировка данных - прием и передача (доставка и поставка) данных между удаленными участниками информационного процесса; при этом источник данных в информатике принято называть сервером, а потребителя - клиентом;

8) преобразование данных - перевод данных из одной формы в другую или из одной структуры в другую. Преобразование данных часто связано с изменением типа носителя, например книги можно хранить в обычной бумажной форме, но можно использовать для этого и электронную форму, и микрофотопленку [3].

Одна из основных задач, возникающих при работе с базами данных, – это задача поиска. При этом, поскольку информации в базе данных, как правило, содержится много, перед программистами встает задача не просто поиска, а эффективного поиска, т.е. поиска за сравнительно короткое время и с достаточно большой точностью. Для этого (для оптимизации производительности запросов) производят индексирование некоторых полей таблицы. Использовать индексы полезно для быстрого поиска строк с указанным значением одного столбца. Без индекса чтение таблицы осуществляется по всей таблице, начиная с первой записи, пока не будут найдены соответствующие строки [15].

Чем больше объем таблицы, тем выше накладные расходы. Если же таблица содержит индекс по рассматриваемым столбцам, то база данных может быстро определить позицию для поиска в середине файла данных без просмотра всех данных. Это происходит потому, что база данных помещает проиндексированные поля поближе в памяти, так, чтобы можно было побыстрее найти их значения. Для таблицы, содержащей 1000 строк, это будет как минимум в 100 раз быстрее по сравнению с последовательным перебором всех записей. Однако в случае, когда необходим доступ почти ко всем 1000 строкам, быстрее будет последовательное чтение, так как при этом не требуется операций поиска по диску. Так что иногда индексы бывают только помехой. Например, если копируется большой объем данных в таблицу, то лучше не иметь никаких индексов. Однако в некоторых случаях требуется задействовать сразу несколько индексов (например, для обработки запросов к часто используемым таблицам) [2].

Если говорить о MySQL, то там существует три вида индексов: PRIMARY, UNIQUE, и INDEX, а слово ключ (KEY) используется как синоним слова индекс (INDEX). Все индексы хранятся в памяти в виде B-деревьев.

PRIMARY – уникальный индекс (ключ) с ограничением, устанавливающим, что все индексированные им поля не могут иметь пустого значения (т.е. они NOT NULL). Таблица может иметь только один первичный индекс, который может состоять из нескольких полей [2].

UNIQUE – ключ (индекс), задающий поля, которые могут иметь только уникальные значения.

 INDEX – обычный индекс (как описано выше). В MySqL, кроме того, можно индексировать строковые поля по заданному числу символов от начала строки.

1.3. Системы обработки информации и данных

Необходимые данные обработаны компьютером, чтобы стать полезной информации. На самом деле это определение обработки данных. Данные представляют собой набор фактов - неорганизованных, но может быть организовано в полезную информацию [6]. Обработка-это ряд действий или операций, которые преобразуют входы в выходы. Когда мы говорим об обработке данных, вход данных и выход полезной информации. Таким образом, можно определить обработки данных в серии действий или операций, которые преобразует данные в полезную информацию [6].

Термин системы обработки данных включает ресурсы, которые используются для выполнения обработки данных. Существует четыре типа ресурсов: людей, материалов, установок и оборудования. Люди вносят вклад в компьютеры, их эксплуатации, и использовать их вывода.

Основные операции по обработке данных: пять основных операций характерны для всех систем обработки данных: ввод, хранение, обработку, вывод и контроль. Они определяются следующим образом.

Ввод - это процесс ввода данных, которые собираются факты, в систему обработки данных. Хранение является сохранением данных или информации, так что они доступны для начальных или для дополнительной обработки. Обработка представляет собой выполнение арифметических или логических операций на данных, чтобы преобразовать их в полезную информацию. Вывод - это процесс производства полезной информации, такой как печатный отчет или визуального отображения [17].

Управление направляет порядок и последовательность, в которой все вышеуказанные операции выполняются.

Операции обработки данных включают в себя следующие операции.

1. Генерация данных.

2. Запись

Это включает в себя операцию сбора исходных данных. Это означает, что исходные данные собираются и представляются в форме исходного документа, называемого исходным документом [8].

Здесь необработанные данные преобразуются в приемлемую форму. То есть данные транскрибируются из исходных документов на карточках или в некоторых других указанных формах и делаются читаемыми для машин. Эта операция выполняется в течение всего цикла IPO. Перфокарты и бумажные ленты, магнитные ленты, магнитные диски, кассеты с магнитной лентой, дискеты, магнитные барабаны, кассеты с магнитной лентой, дискеты, картридж с ОЗУ, устройства с зарядовой связью и т. д. Используются в качестве носителя записи данных [7].

3. Проверка

После того, как данные были записаны, их точность должна быть проверена. Это можно сделать с помощью другой машины, называемой верификатором, или перечитав.

4. Классификация

Классификация информации - это следующая важная операция, в которой данные разделяются на различные категории.

5. Сортировка

Сортировка включает в себя упорядочение данных в заранее определенном порядке для облегчения обработки. Порядок может быть буквенным или числовым.

6. Объединение

Это операция объединения двух или более упорядоченных (отсортированных) наборов данных для формирования другого единого упорядоченного набора.

7. Расчет

8. Хранение данных [7].

Здесь вычисление большей величины может быть обработано. Расчет включает в себя решение уравнений и манипулирование исходными данными, такими как сложение, вычитание и т.д. Результаты обработки одного набора данных сохраняются в памяти для последующего использования в качестве эталона. Основным требованием для использования компьютера во всех бизнес- приложениях является возможность хранения и доступа к данным. Данные хранятся в месте памяти, называемой упомянутой по его адресу [7]. В крупных организациях необходимо хранить и получать доступ к огромному объему данных. Следовательно, некоторые вспомогательные запоминающие устройства также необходимы для эффективной обработки данных.

9. Получение данных: извлечение данных - это процесс поиска или определения местоположения элемента данных из хранилища. В системе EDP данные извлекаются из запоминающего устройства в последовательном, индексированном последовательном режиме или режиме произвольного доступа. Оперативное хранение и поиск данных очень полезны для правильного функционирования современного предприятия. В этой операции результаты обработки данных становятся доступными для других [7].

10. Отчетность.

Обычно при обработке бизнес - данных операция обработки заканчивается. Об обработанной информации может быть сообщено несколькими способами в зависимости от использования результатов. Результаты могут быть распечатаны в форме платежных ведомостей, счетов и т. д. Или в форме отчетов в виде отчетов ESI, отчетов PF или отчетов о продажах и т. д. [7].

Иерархия хранения данных.

Известно, что данные, организованы и хранятся в последовательно более комплексные группировки. Как правило, эти группировки называются иерархии хранения данных.

1) Символы, которые все письменный язык символов: буквы, цифры и специальные символы.

2) Элементы данных, которые являются значимыми коллекциями соответствующих символов. Данные элементы также называются элементами или полями данных.

3) Записи, которые представляют собой наборы связанных элементов данных.

4) Файлы, которые представляют собой наборы связанных записей. Набор связанных файлов называется база данных или банк данных [10].

Вывод по первой главе: в ходе информационного процесса данные преобразуются из одного вида в другой с помощью методов. Обработка данных включает в себя множество различных операций. По мере развития научно-технического прогресса и общего усложнения связей в человеческом обществе трудозатраты на обработку данных неуклонно возрастают. Прежде всего, это связано с постоянным усложнением условий управления производством и обществом. Второй фактор, также вызывающий общее увеличение

объемов обрабатываемых данных, тоже связан с научно-техническим прогрессом, а именно с быстрыми темпами появления и внедрения новых носителей данных, средств хранения и доставки данных.

Глава 2. КОДИРОВАНИЕ ДАННЫХ

2.1 Кодирование данных двоичным кодом

Кодирование данных - это процесс получения кодов из наблюдаемых данных. В качественном исследовании данные получают либо из наблюдений, интервью или из анкет. Целью кодирования данных является раскрытие сущности и значения данных, предоставленных респондентами. Кодер данных извлекает предварительные коды из наблюдаемых данных, предварительные коды дополнительно фильтруются и уточняются для получения более точных и кратких кодов. Позже, при оценке данных, исследователь присваивает значения, проценты или другие числовые величины этим кодам, чтобы сделать выводы. Следует иметь в виду, что целью кодирования данных является не просто исключение избыточных данных, а их краткое обобщение. Кодер данных должен убедиться, что ни один из важных моментов данных не был потерян при кодировании данных [13].

Для автоматизации работы с данными, относящимися к различным типам, очень важно унифицировать их форму представления. Для этого обычно используется прием кодирования, то есть выражение данных одного типа через данные другого типа. Естественные человеческие языки - это не что иное, как системы кодирования понятий для выражения мыслей посредством речи [9]. К языкам близко примыкают азбуки (системы кодирования компонентов языка с помощью графических символов). История знает интересные, хотя и безуспешные попытки создания «универсальных» языков и азбук [8].

По-видимому, безуспешность попыток их внедрения связана с тем, что национальные и социальные образования естественным образом понимают, что изменение системы кодирования общественных данных непременно приводит к изменению общественных методов (то есть норм права и морали), а это может быть связано с социальными потрясениями. Та же проблема универсального средства кодирования достаточно успешно реализуется в отдельных отраслях техники, науки и культуры. В качестве примеров можно привести систему записи математических выражений, телеграфную азбуку, морскую флажковую азбуку, систему Брайля для слепых и многое другое. Своя система существует и в вычислительной технике - она называется двоичным кодированием и основана на представлении данных последовательностью всего двух знаков: 0 и 1. Эти знаки называются двоичными цифрами, по-английски - binary digit или сокращенно bit (бит). Примеры различных систем кодирования представлены на рисунке 1 [16].

Символы, целые числа, числа с плавающей запятой и т. Д.

При хранении и передаче данных вам необходимо будет представить следующие типы данных:

  • Символы и цифры, например, A и 1
  • Целые числа со знаком и без знака длинные (32 бита) и короткие (16 бит)
  • С плавающей запятой одноместные и двухместные
  • Булевы то есть Истина и Ложь

Так как компьютер хранит букву А или цифру 1?

Как на компьютере хранить номер типа 60101? или 62.0101?

Как вы передаете букву A и т. Д. На другой компьютер по сети?

Компьютеры и кодировка символов

Чтобы сохранить текст в виде двоичных данных, необходимо указать кодировку для этого текста [6].

Компьютерные системы могут использовать различные схемы кодирования символов [3].

Пока данные остаются на компьютере, неважно, как они кодируются.

Однако для передачи данных между системами необходимо принять стандартную схему кодирования.

В 1968 году ASCII (американский стандартный код для обмена информацией) был принят в качестве стандарта для кодирования текста для обмена данными.

ASCII

ASCII - это американский стандарт, разработанный для кодирования английских символов и знаков препинания, используемый на пишущих машинках и телетайпах той эпохи (1960-е годы) [19].

ASCII использует 8 бит, хотя фактически используются только 7 бит.

Поскольку ASCII был разработан во время работы устройств Teletype, он также содержит управляющие коды, предназначенные для управления устройством Teletype.

Расширения ASCII

Поскольку ASCII не может кодировать символы, такие как знак решетки £ или общие символы, найденные в немецком и других европейских языках, были разработаны различные расширения.

Эти расширения сохраняли набор символов ASCII и использовали неиспользуемую часть адресного пространства и управляющие коды для дополнительных символов.

Наиболее распространенными являются Windows 1252 и Latin-1 (ISO-8859).

Windows 1252 и 7-битный ASCII были наиболее широко используемыми схемами кодирования до 2008 года, когда UTF-8 стал самым распространенным [20].

ISO-8859-1, ISO-8859-15, Latin-1

ISO-8859 - это 8-битная кодировка символов, которая расширяет 7-битную схему кодирования ASCII и используется для кодирования большинства европейских языков. Смотрите вики для деталей.

ISO-8859-1 также известен как Latin-1, наиболее широко используемый, так как он может использоваться для большинства распространенных европейских языков, например, немецкого, итальянского, испанского, французского и т.д.

Он очень похож на схему кодирования windows-1252, но не идентичен, см. Сравнение символов в Windows-1252, ISO-8859-1, ISO-8859-15 [5].

Unicode

В связи с необходимостью кодирования символов иностранного языка и других графических символов были разработаны набор символов Unicode и схемы кодирования.

Наиболее распространенные схемы кодирования:

  • UTF-8,
  • UTF-16
  • UTF-32

UTF-8 является наиболее часто используемой схемой кодирования, используемой в современных компьютерных системах и компьютерных сетях.

Это схема кодирования с переменной шириной, разработанная для полной обратной совместимости с ASCII. Используется от 1 до 4 байтов [2]. 

Наборы символов и схемы кодирования

Различие между этими двумя понятиями не всегда ясно, и термины, как правило, взаимозаменяемы.

Набор символов представляет собой список символов, тогда как схема кодирования - это то, как они представлены в двоичном виде.

Это лучше всего видно с Unicode.

Схемы кодирования UTF-8, UTF-16 и UTF-32 используют набор символов Unicode, но кодируют символы по-разному.

ASCII - это набор символов и схема кодирования [2].

Порядок следования байтов (BOM) [4].

Метка порядка байтов (BOM) - это символ Unicode, U + FEFF, который появляется в виде магического числа в начале текстового потока и может сигнализировать о нескольких вещах программе, потребляющей текст: - Wiki

  • Порядок байт или порядок байт , текстового потока;
  • Тот факт, что кодировка текстового потока является Unicode, с высокой степенью достоверности;
  • Какой кодировкой Unicode текстовый поток кодируется как.

Спецификация отличается для кодированного текста UTF-8, UTF-16 и UTF-32 [4].

2.2 Кодирование целых и действительных чисел

Целые числа кодируются двоичным кодом довольно просто - достаточно взять целое число и делить его пополам до тех пор, пока частное не будет равно единице. Совокупность остатков от каждого деления, записанная справа налево вместе с последним частным, и образует двоичный аналог десятичного числа.

19:2 = 9 + 1

9:2=4+1

4:2 = 2 +-0

2:2=1+0

Таким образом, 1910= 100112.

Для кодирования целых чисел от 0 до 255 достаточно иметь 8 разрядов двоичного кода (8 бит). Шестнадцать бит позволяют закодировать целые числа от 0 до 65 535, а 24 бита - уже более 16,5 миллионов разных значений.

Для кодирования действительных чисел используют 80-разрядное кодирование. При этом число предварительно преобразуется в нормализованную форму:

3,1415926 = 0,31415926 * 101 300 000 = 0,3 * 106 [5].

123 456 789 - 0,123456789 * 1010

Первая часть числа называется мантиссой, а вторая -- характеристикой. Большую часть из 80 бит отводят для хранения мантиссы (вместе со знаком) и некоторое фиксированное количество разрядов отводят для хранения характеристики (тоже со знаком) [5].

2.3 Кодирование текстовых данных

Если каждому символу алфавита сопоставить определенное целое число (например, порядковый номер), то с помощью двоичного кода можно кодировать и текстовую информацию. Восьми двоичных разрядов достаточно для кодирования 256 различных символов. Этого хватит, чтобы выразить различными комбинациями восьми битов все символы английского и русского языков, как строчные, так и прописные, а также знаки препинания, символы основных арифметических действий и некоторые общепринятые специальные символы, например символ «§»[11].

Технически это выглядит очень просто, однако всегда существовали достаточно веские организационные сложности. В первые годы развития вычислительной техники они были связаны с отсутствием необходимых стандартов, а в настоящее время вызваны, наоборот, изобилием одновременно действующих и противоречивых стандартов. Для того чтобы весь мир одинаково кодировал текстовые данные, нужны единые таблицы кодирования, а это пока невозможно из-за противоречий между символами национальных алфавитов, а также противоречий корпоративного характера [11].

Для английского языка противоречия уже сняты. Институт стандартизации США (ANSI - American National Standard Institute) ввел в действие систему кодирования ASCII (American Standard Code for Information Interchange - стандартный код информационного обмена США) [12].

В системе ASCII закреплены две таблицы кодирования - базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255 [12].

Первые 32 кода базовой таблицы, начиная с нулевого, отданы производителям аппаратных средств (в первую очередь производителям компьютеров и печатающих устройств). В этой области размещаются так называемые управляющие коды, которым не соответствуют никакие символы языков, и, соответственно, эти коды не выводятся ни на экран, ни на устройства печати, но ими можно управлять тем, как производится вывод прочих данных.

Начиная с кода 32 по код 127 размещены коды символов английского алфавита, знаков препинания, цифр, арифметических действий и некоторых вспомогательных символов. Базовая таблица кодировки ASCII приведена в таблице 2. Аналогичные системы кодирования текстовых данных были разработаны и в других странах. Так, например, в СССР в этой области действовала система кодирования КОИ-7 (код обмена информацией, семизначный). Однако поддержка производителей оборудования и программ вывела американский код ASCII на уровень международного стандарта, и национальным системам кодирования пришлось «отступить» во вторую, расширенную часть системы кодирования, определяющую значения кодов со 128 по 255. Отсутствие единого стандарта в этой области привело к множественности одновременно действующих кодировок. Только в России можно указать три действующих стандарта кодировки и еще два устаревших [15].

Таблица 2- Базовая таблица кодировки ASCII

Так, например, кодировка символов русского языка, известная как кодировка Windows-1251, была введена «извне» - компанией Microsoft, но, учитывая широкое распространение операционных систем и других продуктов этой компании в России, она глубоко закрепилась и нашла широкое распространение. Эта кодировка используется на большинстве локальных компьютеров, работающих на платформе Windows [15].

Другая распространенная кодировка носит название КОИ-8 (код обмена информацией, восьмизначный) - ее происхождение относится ко временам действия Совета Экономической Взаимопомощи государств Восточной Европы. Сегодня кодировка КОИ-8 имеет широкое распространение в компьютерных сетях на территории России и в российском секторе Интернет [1].

Международный стандарт, в котором предусмотрена кодировка символов русского алфавита, носит название кодировки /50 (International Standard Organization -- Международный институт стандартизации). На практике данная кодировка используется редко [16].

На компьютерах, работающих в операционных системах MS-DOS, могут действовать еще две кодировки (кодировка ГОСТ и кодировка ГОСТ-альтернативная). Первая из них считалась устаревшей даже в первые годы появления персональной вычислительной техники, но вторая используется, и по сей день.

В связи с изобилием систем кодирования текстовых данных, действующих в России, возникает задача межсистемного преобразования данных - это одна из распространенных задач информатики [16].

2.4 Универсальная система кодирования текстовых данных

Если проанализировать организационные трудности, связанные с созданием единой системы кодирования текстовых данных, то можно прийти к выводу, что они вызваны ограниченным набором кодов (256). В то же время очевидно, что если, например, кодировать символы не восьмиразрядными двоичными числами, а числами с большим количеством разрядов, то и диапазон возможных значений кодов станет намного больше. Такая система, основанная на 16-разрядном кодировании символов, получила название универсальной - UNICODE. Unicode (Юникод или Уникод, англ. Unicode) - стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков [6]. Юникод имеет несколько форм представления: UTF-8, UTF-16 (UTF-16BE, UTF-16LE) и UTF-32 (UTF-32BE, UTF-32LE). Была разработана также форма представления UTF-7 для передачи по семибитным каналам, но из-за несовместимости с ASCII она не получила распространения и не включена в стандарт. В MicrosoftWindows NT и основанных на ней системах Windows 2000 и Windows XP в основном используется форма UTF-16LE. В UNIX-подобных операционных системах GNU/Linux, BSD и Mac OS X принята форма UTF-8 для файлов и UTF-32 или UTF-8 для обработки символов в оперативной памяти [6].

Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium), объединяющей крупнейшие IT-корпорации. Применение этого стандарта позволяет закодировать очень большое число символов из разных письменностей: в документах Unicode могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита и кириллицы, при этом становятся ненужными кодовые страницы [1].

По мере изменения и пополнения таблицы символов системы Юникода и выхода новых версий этой системы, а эта работа ведётся постоянно, поскольку изначально система Юникод включала только Plane 0 - двухбайтные коды, выходят и новые документы ISO. Система Юникод существует в общей сложности в следующих версиях:

1.1 (соответствует стандарту ISO/IEC 10646-1:1993),

2.0, 2.1 (тот же стандарт ISO/IEC 10646-1:1993 плюс дополнения: «Amendments» с 1-го по 7-е и «Technical Corrigenda» 1 и 2),

3.0 (стандарт ISO/IEC 10646-1:2000).

3.2 (стандарт 2002 года)

4.0 (стандарт 2003)

4.01 (стандарт 2004)

4.1 (стандарт 2005)

5.0 (стандарт 2006) [6].

Хотя формы записи UTF-8 и UTF-32 позволяют кодировать до 231 (2 147 483 648) кодовых позиций, было принято решение использовать лишь 220+216 (1 114 112) для совместимости с UTF-16. Впрочем, даже и этого более чем достаточно - сегодня (в версии 5.0) используется чуть больше 99 000 кодовых позиций [2].

Кодовое пространство разбито на 17 плоскостей по 216 (65536) символов. Нулевая плоскость называется базовой, в ней расположены символы наиболее употребительных письменностей. Первая плоскость используется, в основном, для исторических письменностей. Плоскости 16 и 17 выделены для частного употребления.

Для обозначения символов Unicode используется запись вида «U+xxxx» (для кодов 0…FFFF) или «U+xxxxx» (для кодов 10000…FFFFF) или «U+xxxxxx» (для кодов 100000…10FFFF), где xxx - шестнадцатеричные цифры. Например, символ «я» (U+044F) имеет код 044F16 = 110310.

Универсальная система кодирования (Юникод) представляет собой набор графических символов и способ их кодирования для компьютерной обработки текстовых данных [2].

Графические символы - это символы, имеющие видимое изображение. Графическим символам противопоставляются управляющие символы и символы форматирования.

Графические символы включают в себя следующие группы:

буквы, содержащиеся хотя бы в одном из обслуживаемых алфавитов; цифры; знаки пунктуации; специальные знаки (математические, технические, идеограммы и пр.) разделители.

Юникод - это система для линейного представления текста. Символы, имеющие дополнительные над- или подстрочные элементы, могут быть представлены в виде построенной по определённым правилам последовательности кодов (составной вариант, composite character) или в виде единого символа (монолитный вариант, precomposed character) [5].

Графические символы в Юникоде подразделяются на протяжённые и непротяжённые (бесширинные). Непротяжённые символы при отображении не занимают места в строке. К ним относятся, в частности, знаки ударения и прочие диакритические знаки. Как протяжённые, так и непротяжённые символы имеют собственные коды. Протяжённые символы иначе называются базовыми (base characters), а непротяжённые- модифицирующими (combining characters); причём последние не могут встречаться самостоятельно. Например, символ «б» может быть представлен как последовательность базового символа «a» (U+0061) и модифицирующего символа « ?» (U+0301) или как монолитный символ «б» (U+00C1) [4].

Особый тип модифицирующих символов -- селекторы варианта начертания (variation selectors). Они действуют только на те символы, для которых такие варианты определены. В версии 5.0 варианты начертания определены для ряда математических символов, для символов традиционного монгольского алфавита и для символов письма Phags-Pa.

Поскольку одни и те же символы можно представить различными кодами, что иногда затрудняет обработку, существуют процессы нормализации, предназначенные для приведения текста к определённому стандартному виду [5].

В стандарте Юникода определены 4 формы нормализации текста:

1) Форма нормализации D (NFD) - каноническая декомпозиция. В процессе приведения текста в эту форму все составные символы рекурсивно заменяются на несколько составных, в соответствии с таблицами декомпозиции.

2) Форма нормализации C (NFC) - каноническая декомпозиция с последующей канонической композицией. Сначала текст приводится к форме D, после чего выполняется каноническая композиция - текст обрабатывается от начала к концу и выполняются следующие правила:

Символ S является начальным, если он имеет нулевой класс модификации в базе символов Юникода [9].

В любой последовательности символов, стартующей с начального символа S символ C блокируется от S если и только если между S и C есть какой-либо символ B, который или является начальным, или имеет одинаковый или больший класс модификации, чем C. Это правило распространяется только на строки прошедшие каноническую декомпозицию.

Первичным композитом считается символ, у которого есть каноническая декомпозиция в базе символов Юникода [3].

Символ X может быть первично совмещен с символом Y если и только если существует первичный композит Z, канонически эквивалентный последовательности <X, Y>.

Если очередной символ C не блокируется последним встреченным начальным базовым символом L, и он может быть успешно первично совмещен с ним, то L заменяется на композит L-C, а C удаляется.

3) Форма нормализации KD (NFKD) - совместимая декомпозиция. При приведении в эту форму все составные символы заменяются используя как канонические карты декомпозиции Юникода, так и совместимые карты декомпозиции, после чего результат ставится в каноническом порядке.

4) Форма нормализации KC (NFKC) - совместимая декомпозиция с последующей канонической композицией [3].

Термины «композиция» и «декомпозиция» понимают под собой соответственно соединение или разложение символов на составные части.

Коды в стандарте Unicode разделены на несколько областей. Область с кодами от U+0000 до U+007F содержит символы набора ASCII с соответствующими кодами. Далее расположены области знаков различных письменностей, знаки пунктуации и технические символы. Часть кодов зарезервирована для использования в будущем. Под символы кириллицы выделены коды от U+0400 до U+052F. Шестнадцать разрядов позволяют обеспечить уникальные коды для 65 536 различных символов - этого поля достаточно для размещения в одной таблице символов большинства языков планеты [13].

Несмотря на тривиальную очевидность такого подхода, простой механический переход на данную систему долгое время сдерживался из-за недостаточных ресурсов средств вычислительной техники (в системе кодирования UNICODE все текстовые документы автоматически становятся вдвое длиннее). Во второй половине 90-х годов технические средства достигли необходимого уровня обеспеченности ресурсами, и сегодня мы наблюдаем постепенный перевод документов и программных средств на универсальную систему кодирования. Для индивидуальных пользователей это еще больше добавило забот по согласованию документов, выполненных в разных системах кодирования, с программными средствами, но это надо понимать как трудности переходного периода. [2,4]

2.5 Кодирование графических данных

Если рассмотреть с помощью увеличительного стекла черно-белое графическое изображение, напечатанное в газете или книге, то можно увидеть, что оно состоит из мельчайших точек, образующих характерный узор, называемый растром.

Растр - это метод кодирования графической информации (точечная структура графического изображения) [3].

Поскольку линейные координаты и индивидуальные свойства каждой точки (яркость) можно выразить с помощью целых чисел, то можно сказать, что растровое кодирование позволяет использовать двоичный код для представления графических данных. Общепринятым на сегодняшний день считается представление черно-белых иллюстраций в виде комбинации точек с 256 градациями серого цвета, и, таким образом, для кодирования яркости любой точки обычно достаточно восьмиразрядного двоичного числа [19].

Для кодирования цветных графических изображений применяется принцип декомпозиции произвольного цвета на основные составляющие. В качестве таких составляющих используют три основных цвета:

1) красный (Red, R);

2) зеленый (Green, G);

3) синий (Blue, В) [4].

На практике считается, что любой цвет, видимый человеческим глазом, можно получить путем механического смешения этих трех основных цветов. Такая система кодирования называется системой RGB (по первым буквам названий основных цветов).

Если для кодирования яркости каждой из основных составляющих использовать по 256 значений (восемь двоичных разрядов), как это принято для полутоновых черно-белых изображений, то на кодирование цвета одной точки надо затратить 24 разряда. При этом система кодирования обеспечивает однозначное определение 16,5 млн. различных цветов, что на самом деле близко к чувствительности человеческого глаза. Режим представления цветной графики с использованием 24 двоичных разрядов называется полноцветным (True Color) [16].

Каждому из основных цветов можно поставить в соответствие дополнительный цвет, то есть цвет, дополняющий основной цвет до белого. Нетрудно заметить, что для любого из основных цветов дополнительным будет цвет, образованный суммой пары остальных основных цветов. Соответственно, дополнительными цветами являются:

1) голубой (Cyan, С);

2) пурпурный (Magenta., М);

3) желтый (yellow, Y).

Принцип декомпозиции произвольного цвета на составляющие компоненты можно применять не только для основных цветов, но и для дополнительных, то есть любой цвет можно представить в виде суммы голубой, пурпурной и желтой составляющей. Такой метод кодирования цвета принят в полиграфии, но в полиграфии используется еще и четвертая краска - черная (Black, К) [8]. Поэтому данная система кодирования обозначается четырьмя буквами CMYK (черный цвет обозначается буквой К, потому, что буква В уже занята синим цветом), и для представления цветной графики в этой системе надо иметь 32 двоичных разряда. Такой режим тоже называется полноцветным (True Color) [2].

Если уменьшить количество двоичных разрядов, используемых для кодирования цвета каждой точки, то можно сократить объем данных, но при этом диапазон кодируемых цветов заметно сокращается. Кодирование цветной графики 16-разрядными двоичными числами называется режимом High Color.

При кодировании информации о цвете с помощью восьми бит данных можно передать только 256 цветовых оттенков. Такой метод кодирования цвета называется индексным. Смысл названия в том, что, поскольку 256 значений совершенно недостаточно, чтобы передать весь диапазон цветов, доступный человеческому глазу, код каждой точки растра выражает не цвет сам по себе, а только его номер (индекс) в некоей справочной таблице, называемой палитрой. Разумеется, эта палитра должна прикладываться к графическим данным - без нее нельзя воспользоваться методами воспроизведения информации на экране или бумаге (то есть, воспользоваться, конечно, можно, но из-за неполноты данных полученная информация может быть неправильной: листва на деревьях может оказаться красной, а небо - зеленым) [11].

2.6 Кодирование звуковой информации

Приемы и методы работы со звуковой информацией пришли в вычислительную технику позднее. К тому же, в отличие от числовых, текстовых и графических данных, у звукозаписей не было столь же длительной и проверенной истории кодирования. В итоге методы кодирования звуковой информации двоичным кодом далеки от стандартизации. Множество отдельных компаний разработали свои корпоративные стандарты, но если говорить обобщенно, то можно выделить два основных направления [18].

1) Метод FM (Frequency Modulation) основан на том, что теоретически любой сложный звук можно разложить на последовательность простейших гармонических сигналов разных частот, каждый из которых представляет собой правильную синусоиду, а следовательно, может быть описан числовыми параметрами, то есть кодом. В природе звуковые сигналы имеют непрерывный спектр, то есть являются аналоговыми. Их разложение в гармонические ряды и представление в виде дискретных цифровых сигналов выполняют специальные устройства -- аналогово-цифровые преобразователи (АЦП). Обратное преобразование для воспроизведения звука, закодированного числовым кодом, выполняют цифро-аналоговые преобразователи (ЦАП). При таких преобразованиях неизбежны потери информации, связанные с методом кодирования, поэтому качество звукозаписи обычно получается не вполне удовлетворительным и соответствует качеству звучания простейших электромузыкальных инструментов с окрасом, характерным для электронной музыки. В то же время данный метод кодирования обеспечивает весьма компактный код, и потому он нашел применение еще в те годы, когда ресурсы средств вычислительной техники были явно недостаточны [4].

2) Метод таблично-волнового ( Wave-Table) синтеза лучше соответствует современному уровню развития техники. Если говорить упрощенно, то можно сказать, что где-то в заранее подготовленных таблицах хранятся образцы звуков для множества различных музыкальных инструментов (хотя не только для них). В технике такие образцы называют сэмплами. Числовые коды выражают тип инструмента, номер его модели, высоту тона, продолжительность и интенсивность звука, динамику его изменения, некоторые параметры среды, в которой происходит звучание, а также прочие параметры, характеризующие особенности звука. Поскольку в качестве образцов используются «реальные» звуки, то качество звука, полученного в результате синтеза, получается очень высоким и приближается к качеству звучания реальных музыкальных инструментов [4].

Вывод по второй главе: стандарт кодирования текста ASCII использует 128 уникальных значений (0–127) для представления букв, цифр и знаков препинания, обычно используемых в английском языке , а также выбор управляющих кодов, которые не представляют печатные символы . Например, заглавная буква A является символом ASCII 65, цифра 2 является ASCII 50, символ } является ASCII 125, а возврат каретки метасимвола является ASCII 13. Системы, основанные на ASCII, используют семь битов для представления этих значений в цифровом виде.

Напротив, большинство компьютеров хранят данные в памяти, организованной в восьмибитных байтах. Файлы, которые содержат машинно-исполняемый код и нетекстовые данные, обычно содержат все 256 возможных восьмибитных байтовых значений. Многие компьютерные программы стали полагаться на это различие между семибитовым текстом и восьмибитными двоичными данными и не будут функционировать должным образом, если в данных появляются символы, не относящиеся к ASCII, которые, как ожидается, будут содержать только текст ASCII. Например, если значение восьмого бита не сохраняется, программа может интерпретировать значение байта выше 127 как флаг, указывающий ему выполнять некоторую функцию.

ЗАКЛЮЧЕНИЕ

В ходе информационного процесса данные преобразуются из одного вида в другой. По мере развития НТП и общего усложнения связей в человеческом обществе трудозатраты на обработку данных неуклонно возрастают (постоянное усложнение условий управления производством и обществом + быстрые темпы появления и внедрения новых носителей/хранителей данных – увеличение объёма данных).

В качестве же требуемого действия может быть одно из следующих: добавление, удаление, изменение, просмотр элемента или обработка данных из элемента. При добавлении элемента информационный массив пополняется новыми данными в виде записи файла или файла в целом, соответственно, для структурированных и неструктурированных данных. В запросе в этом случае, помимо указанной выше информации, приводится и сам новый элемент. При этом объем информационного массива увеличивается. Удаление, наоборот, является обратным действием, вызывающим исключение упомянутых данных. Это действие приводит к уменьшению объема информационного массива. Изменение относится не к элементу, а к его составляющим – полям записи файла или тексту, хранящемуся в файле, и означает, в свою очередь, удаление прежних значений полей или строк текста и/или добавление новых. В запрос включается дополнительная информация, указывающая на требуемые составляющие изменяемого элемента, а также сами новые значения этих составляющих. Объем информационного массива при этом не меняется для структурированных данных и, возможно, меняется для неструктурированных. Просмотр связан с предоставлением данных пользователю на устройстве вывода компьютера, как правило, на дисплее. В запросе в этом случае дополнительно указывается, какие составляющие элемента требуется просмотреть (по умолчанию просматривается весь элемент). Обработка предусматривает выполнение некоторых арифметических операций над данными элемента, например, накопление суммы и т.д., и относится только к структурированным данным, а потому далее не рассматривается. Также сортировка, архивация, фильтрация.

Цель курсовой работы достигнута.

В рамках курсовой работы решены следующие задачи:

1. Рассмотрена связь понятий «информация, данные, знания». Модель DIWK

2. Описаны операции с данными

3. Проанализированы системы обработки информации и данных

4. Рассмотреть информацию о кодировании данных.

СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ

1. Агальцов В.П. Информатика для экономистов: Учебник / В.П. Агальцов, В.М. Титов. - М.: ИД ФОРУМ, НИЦ ИНФРА-М, 2016. - 448 c.

2. Балдин К.В. Информатика для ВУЗов: Учебник / К.В. Балдин, В.Б. Уткин. - М.: Дашков и К, 2016. - 395 c.

3. Балдин К.В. Информатика и информационные системы в экономике: Учебное пособие / К.В. Балдин. - М.: НИЦ ИНФРА-М, 2016. - 218 c.

4. Блиновская Я.Ю. Введение в информатику: Учебное пособие / Я.Ю. Блиновская, Д.С. Задоя. - М.: Форум, НИЦ ИНФРА-М, 2016. - 112 c.

5. Бодров О.А. Предметно-ориентированные экономические информационные системы: Учебник для вузов / О.А. Бодров. - М.: Гор. линия-Телеком, 2017. - 244 c.

6. Варфоломеева А.О. Информационные системы предприятия: Учебное пособие / А.О. Варфоломеева, А.В. Коряковский, В.П. Романов. - М.: НИЦ ИНФРА-М, 2017. - 283 c.

7. Васильков А.В. Информатика: Учебное пособие / А.В. Васильков, А.А. Васильков, И.А. Васильков. - М.: Форум, 2017. - 528 c.

8. Вдовин В.М. Предметно-ориентированные экономические информационные системы: Учебное пособие / В.М. Вдовин. - М.: Дашков и К, 2013. - 388 c.

9. Велихов А. С. Основы информатики и компьютерной техники: учебное пособие / А. С. Велихов. – Москва: СОЛОН-Пресс, 2017. – 539 с.

10. Гвоздева В. А. Информатика, автоматизированные информационные технологии и системы: учебник / В. А. Гвоздева. – Москва: Форум: Инфра-М, 2016. – 541 с.

11. Горбенко А.О. Информационные системы в экономике / А.О. Горбенко. - М.: БИНОМ. ЛЗ, 2016. - 292 c.

12. Гришин А.В. Промышленные информационные системы и сети: практическое руководство / А.В. Гришин. - М.: Радио и связь, 2016. - 176 c.

13. Завгородний В.И. Информатика для экономистов: Учебник для бакалавров / В.П. Поляков, Н.Н. Голубева, В.И. Завгородний; Под ред. В.П. Полякова. - М.: Юрайт, 2016. - 524 c.

14. Золотова Е.В. Основы кадастра: Территориальные информационные системы: Учебник для вузов / Е.В. Золотова. - М.: Фонд «Мир», Акад. Проект, 2016. - 416 c.

15. Исаев Г.Н. Информатика в экономике: Учебник для студентов вузов / Г.Н. Исаев. - М.: Омега-Л, 2017. - 462 c.

16. Информатика. Базовый курс: учебное пособие для высших технических учебных заведений / [С. В. Симонович и др.]. – Санкт-Петербург: Питер, 2017. – 639 с.

17. Информатика в экономике: учебное пособие: / [Н. Г. Бубнова и др.]. – Москва: Вузовский учебник, 2016. – 476 с.

18. Иопа Н. И. Информатика: (для технических специальностей): учебное пособие / Н. И. Иопа. – Москва: КноРус, 2016. – 469 с.

19. Мезенцев К.Н. Автоматизированные информационные системы: Учебник для студентов учреждений среднего профессионального образования / К.Н. Мезенцев. - М.: ИЦ Академия, 2017. - 176 c.

20. Олейник П.П. Корпоративные информационные системы: Учебник для вузов. Стандарт третьего поколения / П.П. Олейник. - СПб.: Питер, 2016. - 176 c.