Автор Анна Евкова
Преподаватель который помогает студентам и школьникам в учёбе.

Методы кодирования данных(Определение понятия «кодирование информации» и его значение в дисциплине «Технологии программирования» )

Содержание

Введение 3

Глава I. Определение понятия «кодирование информации» и его значение в дисциплине «Технологии программирования» 
1.1. Понятие и принципы кодирования информации 
1.2. Теория кодирования 
Глава II. Кодирование разных типов информации 
2.1. Методы кодирования данных 
Заключение 
Список использованной литературы 

Введение

Теорию кодирования можно сравнить с древнейшим искусством криптографией. Криптография (от др.-греч. тайнопись), это область знаний о методах обеспечения конфиденциальности, целостности данных, аутентификации, невозможности отказа от авторства[1]. Среди известных ученых умов, которые работали над созданием разного рода шифров можно выделить философа Ф. Бэкона, математиков Д.Валлиса, Д. Кардано и других[2]. По мере развития методов шифрования получили развитие различные способы расшифровки или, другими словами, криптоанализа.

Одновременно с появлением компьютера возникла потребность в кодировании разных видов данных, с которыми работает как отдельная личность, так и все человечество. Однако, нужно отметить, что работа по кодированию информации была начата задолго до возникновения компьютера.

Так, одни из величайших достижений человека- письменность с арифметикой- представляют собой самую настоящую систему кодировки речи и числовых данных. Информация нигде не может быть представлена в чистом виде, ее всегда преподносят в закодированном виде.

Для лучшего понимания данной темы следует рассмотреть примеры кодировки информации, которые использовались в быту. Во времена Руси, в лесах, которые подавляли звуковые волны, чтобы передать срочное сообщение, люди использовали дым от костров. Большинство племен Африки и по сей день применяют специальные барабаны тамтамы, чтобы обмениваться сообщениями на скорости звука. В настоящее время в морском флоте применяется семафорная азбука, где каждая буква обозначается определенным положением рук сигнальщика, которое он подчеркивает флажками. Более того, чтобы ваш сигнал был принят и правильно понят, заранее договаривались о значении двух дымов либо последовательности пары быстрых ударов барабана, а также, например, руки сигнальщика, поднятые наверх.

В результате помимо самого сообщения и методов по его доставке был образован один из важнейших компонентов в виде преобразования полученных сведений или кодирование. При его отсутствии вы не сможете передать информацию.

Стоит добавить, что стандартная разговорная либо письменная речь также представляют собой своеобразную кодировку. В процессе изучения иностранных языков человек изучает новые звуковые и буквенные коды предметов и процессов, с которыми он знаком с детства.

По мере развития человечества возникали новые способы передачи срочных сообщений. Так, в 1831 году Майклом Фарадеем было сделано открытие, которое смогло перевернуть все взгляды: он смог открыть метод, по которому можно было получить электрический ток, которые почти сразу использовали, чтобы передавать разного рода сообщения[3].

Американским изобретателем С. Морзе были созданы и внедрены телеграфы и линии связи[4]. Морзе также создал язык, который похож на африканский барабанный телеграф. Нужно отметить, что у электрического тока и барабана совсем небольшой собственный язык. По барабану могут стучать или нет, электрический ток проходит или не проходит. Аналогично и кодирование Морзе применяло только три специальные буквы в виде длинного сигнала (тире), короткого сигнала (точки), нет сигнала (паузы), чтобы разделять буквы. Поэтому известный сигнал спасения SOS, который означает спасите наши души (Save Our Souls), поддается кодировке в следующем виде:

<точка>, <точка>, <точка> - S

<пауза>

<тире>, <тире>, <тире> - O

<пауза>

<точка>, <точка>, <точка> - S[5]

Азбука Морзе 150 лет служила людям. Ее сигналы могли пробиваться при непогоде, которая глушила всякую речь. Только недавно с появлением спутников связи, ее перестали использовать. Все попытки по созданию машины, которая понимала бы код Морзе, провалились. Созданная техника была то очень большой, то ненадежной и слишком затратной. Конечно, машины, созданные в то время, были несовершенными по сравнению с современными, но и сам код оказался сложным для автоматов.

В 1933 году В.А.Котельников для участия в «I Всесоюзном съезде по вопросам технической реконструкции связи» написал труд «О пропускной способности «эфира» и «проволоки»». Кроме того, его имя входит в название одной из основных теорем теории кодирования, которая помогает определить условия, при которых переданный сигнал можно восстановить, не теряя при этом информации. Данная теорема имеет несколько названий, среди которых «теорема WKS» (первые буквы фамилий ученых Whittaker, Kotelnikov, Shannon). Российские учебники для ВУЗов используют название «теорема Котельникова».[6]

Стоит отметить, что эту теорему отличает долгая история. Так, первая ее часть была доказана французским математиком Э. Борелем. В 1915 году над ее доказательством работал Э. Уиттекер. В 1920 году японцем К. Огурой были опубликованы поправки к работе Уиттекера, в 1928 году американским ученым Гарри Найквистом были уточнены принципы оцифрования и восстановления аналоговых сигналов.

В середине двадцатого века Алан Тьюринг и его команда в столице Великобритании создали компьютеры, которым было под силу обработать буквы и цифры, другими словами символьные данные. В пригороде Лондона в 1943 году им удалось создать компьютер, получивший название Колосс, который смог расшифровать военные коды немцев.[7] Все неприятельские сообщения, которые были перехвачены за один день, вводили в память компьютера, который для поиска соответствий перебирал сотни тысяч вариаций, благодаря чему расшифровке поддавались самые сложные коды.

Пик развития теории связи пришелся на послевоенное время (1948-1949 гг.) после появления работ Клода Шеннона и Норберта Винера. Труд Винера явился следствием исследований военного периода по автоматическому управлению огнем, произведения К. Шеннона: "Математическая теория связи" и "Связь при наличии шума" являются исследованиями по шифрованию сообщений и их передачи по секретным каналам связи.

Итак, с 1949 года началось бурное развитие теории кодирования как отдельной научной дисциплины, а также развитие таких тесно с нею связанных научных дисциплин, как сжатие информации и криптология[8].

Актуальность: По причине повсеместного распространения персональных компьютеров как средств, обрабатывающих данные, так и оперативных устройств общения (электронная почта, телефаксный способ передачи информации), могут появиться трудности с обеспечением защиты данных от преднамеренных искажений. Для предотвращения подобного появляется необходимость в проведении процесса кодировки сведений. Поэтому в современном мире кодирование всякого рода данных играет основную роль и является актуальной.

Объект: Информационные процессы

Предмет: Кодирование информации

Целью написания данной курсовой работы является закрепление знаний, которые были получены в ходе изучения учебной дисциплины «Технологии программирования», рассмотрение особенностей кодировки данных в системе обработки информации.

Задачи работы: определить понятие и роль кодирования данных, рассмотреть методы кодировки; провести анализ особенностей кодирования разных видов данных в системах обработки информации и изучить теорию кодирования.

Глава I. Определение понятия «кодирование информации» и его значение в дисциплине «Технологии программирования»

Понятие и значение кодирования информации

Любая тайна, порожденная человеческим сознанием,

им же может быть и раскрыта.

Шерлок Холмс

В нашей повседневной жизни мы постоянно обмениваемся информацией. По мнению Норберта Винера, одного из создателей современной теории информации, информация есть информация, а не материя или энергия[9].

Винер полагал, что информация предстает новым элементом в дополнении к материи и энергии. Важность информации можно сравнить с трудностью ее представления в естественнонаучной форме.

Мы можем слышать фразу от собеседника «Эта информация важна для меня», при конкретной ситуации либо событии. Но при техническом представлении информации подобное субъективное представление не подойдет. В качестве строгого научного понятия, ее необходимо вводить как измеряемую величину, подобно длине в метрах, напряжению в вольтах.[10]

Любая система подразумевает передачу информации в виде сообщений, представляющих собой совокупность знаков, или беспрерывных сигналов, которые выступают переносчиками информации.

Степень качества информации считают одной из важнейших характеристик для потребителей данных. Его определяют такими характеристиками как[11]:

Репрезентативность – представляет собой правильный выбор информационных источников, который помогает должным образом отразить источник данных;

Достаточность- наименьший, но нужный объем данных, который необходим для целей, которые имеет пользователь информационных источников. В данном случае наличие неполной, либо наоборот избыточной информации может снизить эффективное принятие решений потребителем информации;

Доступность- отсутствие затруднений в процессе нахождения и преобразования данных. Так, информационная система предусматривает передачу информации в доступном и удобном для понимания потребителя виде;

Актуальность- данную характеристику определяет степень сохранения ценности данных во время их использования, которая зависит от временного отрезка, который прошел со времени появления этих сведений;

Своевременность- поступление информации не позднее намеченного времени, которое согласовано с периодом, необходимым для решения поставленных задач;

Точность- уровень сходства передаваемых данных с реальным состоянием предмета, явления, ситуации и так далее;

Адекватность- процент соответствия создаваемых с помощью полученных данных образов с реальным объектом, процессом, явлением и так далее;

Устойчивость- свойство реагирования информации на возможные изменения первоначальных данных, не нарушая при этом необходимую точность;

Сообщения подразделяются на несколько видов:

Дискретные- являются результатом поочередной выдачи источником сообщений отдельных частей-знаков. В этом случае все различные знаки называются «алфавит сообщения», размер множества- объем алфавита;

Непрерывные- делятся на элементы, их можно описать посредством непрерывных сигналов-функций времени, которые принимают значения из непрерывного континиума.

Среду, которая передает сообщения между источником и приемником сообщений, называют канал связи или канал передачи информации. При этом трансформация сообщения в сигнал, который подходит для передачи по определенному каналу связи в широком смысле называют кодированием; обратную последовательность называют декодированием[12].

Другими словами, кодирование информации представляет собой процесс превращения одной последовательности сигналов в другую. Под кодированием сведений понимают выражение данных одного вида через другой. Чтобы автоматизировать информацию, которая относится к различным типам, следует провести процесс ее унификации для представления. В этом случае специалистами используется методика кодирования.

По мере развития информационных технологий кодирование заняло центральное место в вопросах решения различных задач программирования[13]:

  • Представление данных разного вида (числовые, текстовые, графические) в памяти компьютера;
  • Обеспечение помехоустойчивости в процессе передачи данных по каналам связи;
  • Сжатие информации в базах данных.

Выше уже было дано определение понятию «кодирование информации», однако для лучшего понимания необходимо рассмотреть другие понятия, которые помогут в полном изучении темы.

  • Код - представляет собой систему соответствия между частями сообщений и кодовой комбинацией.
  • Кодер- устройство, которое осуществляет кодирование.
  • Декодер- устройство, которое проводит обратное действие, другими словами преобразует кодовую комбинацию в сообщение.
  • Алфавит- представляет собой множество составных частей кода или элементарные символы (кодовые символы) X = {xi}, гдеi = 1, 2, ..., m
  • Основание- количество элементов кода- m. В случае двоичного кода xi = {0, 1} и m = 2.
  • Кодовая комбинация (кодовое слово) является конечной последовательностью символов определенного алфавита.
  • Значность (длина комбинации) является числом элементов кодовой комбинации-n.
  • Объем либо мощность кода представляет собой число разных кодовых комбинаций (N = mn)[14].

Элементами данных, которые необходимо закодировать выступают[15]:

  • Буквы, слова, фразы;
  • Разного рода символы такие как знаки препинания, операции, которые выполняют в арифметике и логике и другие;
  • Числовые обозначения;
  • Аудиовизуальный образ;
  • Явления и ситуационные случаи и другие.

В роли кодовых обозначений чаще всего выступают:

  • Графические изображения
  • Электромагнитные, световые, звуковые сигналы[16];

Процедуру кодирования выполняют для того, чтобы[17]:

  • Создать удобство по хранению, обработке и передаче данных (в большинстве случаев, закодированные сведения представляются в более компактном виде, и форме, которую смогут обработать и передать автоматические программно-технические средства);
  • Производить удобный информационный обмен между субъектами;
  • Иметь наглядное изображение;
  • Идентифицировать объекты с субъектами;
  • Скрыть секретные сведения и другое.

Кодирование данных подразделяется на одно- и многоуровневое. Одноуровневым кодированием являются световые сигналы, которые, например, передаются на светофорах (красный-движение запрещено, желтый- готовиться к движению, зеленый- можно двигаться дальше). Примером, который может показать многоуровневое кодирование является демонстрация графической картинки в форме файла фотографии. Сначала картинку разбивают на составные части (пиксели). Другими словами, отдельные части изображения кодируются простыми элементами. В свою очередь, элементы представляются набором стандартных цветов, которые обладают необходимой яркостью, представленной числовым значением. В результате комбинации чисел, обычно, трансформируются для более удобного представления данных (в формате jpeg и других). В завершении, конечные числа кодируют как электромагнитные сигналы, чтобы была возможность передавать их через каналы связи либо области на информационном носителе. Необходимо подчеркнуть, что числа в процессе программной обработки принимают вид согласно принятой системе кодирования числовых элементов.

Процесс кодирования данных бывает обратимым и необратимым[18]. В случае обратимого кодирования из закодируемого послания возможно восстановление исходного образа (кодируемого сообщения).

В качестве примера кодирования обратимого можно привести представление знаков в телеграфном коде с их восстановлением после процесса передачи.

Необратимым кодированием является, например, перевод с одного языка на другой-обратный перевод, при котором практически невозможно восстановить исходный текст.[19]

Существуют также общедоступные и секретные системы кодирования[20]. Общедоступными пользуются, чтобы облегчить информационный обмен, секретными- для скрытия сведений от третьих лиц.

Таким образом в данном подпункте были даны определения понятиям «информация», «кодирование информации». Были даны определения другим понятиям, без которых невозможно всесторонне изучить выбранную тему. Изучены разновидности процесса кодирования информации. Была определена значимость кодирования информации.

1.2. Теория кодирования

Теория кодирования занимается изучением передачи данных через реальные (либо зашумленные) каналы. Другими словами, с ее помощью мы сможем узнать каким образом лучше запаковать информацию, чтобы, передав сигнальное сообщение, легко выделить нужные данные.

Некоторые путают теорию кодирования с шифрованием, однако это не так. Используя криптографию, пользователи имеют обратную цель: способствовать затрудненному получению информации из данных.

Теория кодирования входит в один из разделов теоретической информатики. В качестве основных задач, над которыми работает данный раздел, можно выделить следующие:

  • Разработку принципов более экономичной кодировки данных;
  • Работу по согласованию параметров передаваемых данных с особенностями канала связи;
  • Разработку приемов, которые обеспечат надежную передачу данных, без отсутствия потерь;[21]

Первая задача- кодирование данных- включает в себя передачу, обработку, хранение данных. Другими словами, занимается решением целого ряда проблем. Их частное решение заключается в представлении сведений в компьютере.

Последние имеют связь с процессами по передаче информации. В результате, можно отметить, что кодировка предшествует процессу передачи и хранению данных.

Хранение связывают с фиксированием определенного состояния носителя данных, а передачу с процессом по изменению состояния со временем.

Данное состояние либо сигналы называют элементарные сигналы, совокупность которых составляет вторичный алфавит[22]. Задачей любого кода является обеспечение однозначного чтения сообщения (надежности) и экономичности (использование как можно меньшего количества элементов в одном сообщении).

При наличии возможности восстановления текста, можно говорить об определенной избыточности, которая позволяет восстановить отсутствующие части на основе имеющихся. Отсюда следует, что избыточность кроется в вероятностях букв и их комбинации, знание которых поможет найти правильный ответ.

Компьютеры могут обрабатывать данные, которые представлены в числовом виде. Поэтому данные другого вида, такие как звуковые, графические, необходимо трансформировать в числовую форму. Благодаря компьютерным программам полученная информация может быть преобразована, также в текстовую.

Во время ввода в компьютер каждая буква проходит кодирование с помощью определенного числа, в процессе вывода с помощью внешних устройств (экрана или печати), для правильного восприятия людьми на основе этих цифр создаются буквенные изображения. Кодировка символов является правильным соответствием между набором букв и числами.

Обычно, числа в компьютерах представлены нулями и единицами, это говорит о том, что компьютер работает с двоичной системой счисления, потому что устройства по их обработке получаются более простыми.

Задачей кодирования является перевод дискретного сообщения из одной разновидности алфавита в другую. Более того, эта трансформация не должна приводить к утере данных.

Алфавит, который предоставляет информацию до трансформации называют первичным, алфавит с конечным представлением-вторичным[23].

Давая определение понятию «код» используются 2 подхода: код является правилом, которое описывает соответствие знаков либо их комбинаций первичного (исходного) алфавита, либо их комбинациям вторичного алфавита. Кроме того, код является набором знаков вторичного алфавита, который используется для представления знаков либо их комбинаций первичного алфавита.

Среди основных проблем теории кодирования можно выделить взаимную однозначность кодирования и сложность реализации канала связи на основе заданных условий[24]. Поэтому теорией кодирования рассматриваются такие направления как[25]:

Сжатие информации- является алгоритмическим преобразованием данных, которое производится для того, чтобы уменьшить объем, который занимают данные. Его применяют, чтобы более рационально использовать устройства по хранению и передаче информации. Обратной процедурой является восстановление данных (распаковка, декомпрессия). Процедура сжатия основывается на ликвидации избыточных данных, которые имеются в исходной информации.

В качестве простого примера избыточности можно привести повторяющиеся куски текстовой информации[26];

Прямую коррекцию ошибок либо помехоустойчивое кодирование, представляет собой технику кодирования или декодирования, которая дает возможность исправить ошибки с помощью метода упреждения. Ее применяют чтобы исправить сбои и ошибки в процессе передачи данных, используя передачу избыточных служебных данных, используя которые можно восстановить исходное содержание данных.

Код, который задействован в прямой коррекции ошибок, требует большего количества избыточности передаваемой информации, чем код, который необходим для обнаружения ошибок. На практике активно применяются в компьютерных ЛВС LAN, а также в разнообразных телекоммуникационных сетях[27];

Криптографию, о который было сказано выше[28];

Физическое кодирование представляет собой метод предоставления данных в форме определенных сигналов. Для примера, в форме уровня амплитуды напряжения, тока, яркости и так далее;[29]

Обнаружение и исправление ошибок: процесс обнаружения ошибок в технике связи представляет собой контроль по сохранению целостности информации во время записи/воспроизведения данных либо их передаче по линиям связи.

Исправление ошибок либо их корректировка является процессом восстановления информационных данных после их прочтения в устройстве хранения, либо канале связи[30].

Теория кодирования включает в себя несколько направлений:

В случае с дискретными каналами без помех Шеннон доказал теорему: при производительности источника RИ<C-, в которой – любая маленькая величина, в любом случае имеется способ кодировки, который дает возможность передавать через канал каждое сообщение источника. Передача всех посланий при условии RИ>C невозможна[31].

Статическое или эффективное кодирование- кодирование, которое позволяет использовать максимально пропускную способность канала связи без помех. При эффективном кодировании реальная скорость передачи данных по каналу R приближается к пропускной способности С, путем достижения согласования источника с каналом.

Сообщения, которые идут из источника кодируют так, чтобы они максимально соответствовали ограничениям, накладываемым на сигналы, которые передают по каналам связи. В данной связи на структуру подходящего кода влияют статистические характеристики и особенности канала.

Помехоустойчивое кодирование- метод обработки сигналов, который необходим чтобы увеличить надежность передачи по цифровым каналам связи.

Корректирующие коды- обнаруживают и исправляют ошибки, возникающие вследствие действия шума при хранении, передаче и обработке информации[32].

Циклические коды- часто используют­ся при передаче данных в локальных сетях и в интернете. Они осо­бенно эффективны для обнаружения пакетов ошибок в системах пе­редачи данных с переспросом[33].

Арифметические коды- алгоритм сжатия информации без потерь, который при кодировании ставит в соответствие тексту вещественное число из отрезка [0;1)[34].

Таким образом, первая глава данной курсовой работы является теоретической частью, в которой были даны определения основным понятиям, которые необходимы для наилучшего понимания и изучения второй главы курсовой работы, являющей практической часть. Кроме того была детально рассмотрена теория кодирования и все элементы, которые в нее входят.

Глава II. Кодирование разных типов информации
2.1. Методы кодирования данных

Разного вида методы кодировки человек использует на протяжении длительного времени. Так, в роли способа кодирования натуральных чисел выступает десятичная позиционная система счисления.

Еще одним способом кодировки натурального числового ряда являются римские числа. Более того данный способ является более наглядным и естественным, так, палец – I, пятерня – V, две пятерни – X. [35]Но используя этот способ вам будет сложнее проводить арифметические операции с большими числами. В этой связи, его вытеснил способ кодировки, который основан на позиционной десятичной системе счисления.

Данный пример свидетельствует о том, что разные виды кодирования имеют специфические особенности, обладающие в зависимости от целей кодировки достоинствами и недостатками.

Известны способы числовой кодировки геометрических объектов и их положения в пространстве ( декартовы координаты и полярные координаты).

Как было сказано выше кодирование является процессом перевода данных, которые представлены в одной системе знаков, в другую систему[36].

Коды должны соответствовать ряду требований:

  • Они должны охватывать каждый элемент, который должен быть закодирован и обладать однозначным обозначением;
  • Предоставление возможности расширения элементов кодировки не изменяя, при этом, правила по их обозначению;
  • Стабильность, удобство восприятия и запоминание обозначений кодов, которые отвечают за простоту заполнения, чтения и обработки;
  • Максимальная информированность кода при наличии минимальной значности;
  • Возможность по использованию кодов, чтобы получить в автоматическом режиме сводные итоги, а также автоматический контроль кодовых обозначений, чтобы была возможность обнаружить ошибки;[37]

Методы кодирования также должны соответствовать определенным требованиям:

Код метода обязан обладать всей необходимой информацией по объекту и проводить процесс его идентификации в границах заданного множества элементов классификации (разделение множества объектов на подмножества по их сходству или различию в соответствии с принятыми методами)[38];

Использование в качестве алфавита кодов десятичных цифр с буквами;

Обеспечение минимальной длины кода и достаточного резерва незанятых элементов для кодировки новых компонентов, не нарушая при этом структуру классификатора;

Максимальная ориентация на процесс автоматической обработки данных;[39]

Зачастую в отдельную категорию объединяют методы кодировки, позволяющие создать (не теряя при этом данные) коды для сообщений, которые будут иметь наименьшую длину по сравнению с исходными сообщениями.

Подобный метод называют методом сжатия либо упаковки данных[40]. Степень качества сжатия определяет коэффициент сжатия, измеряющийся в процентах и показывающий на сколько процентов закодированные данные короче исходных.

Методы кодировки бывают как самостоятельными-регистрационными, так и основанные на предварительной классификации элементов- классификационные методы кодировки.

Первые подразделяются на два вида: порядковые и серийно-порядковые.

Порядковый метод кодировки- является методом, при котором в качестве кодов выступают натуральные числа. В данном случае каждый элемент из ряда классифицируемых множеств подвергается кодировке путем присвоения ему текущих порядковых номеров.

Этот метод позволяет обеспечить длительную долговечность классификатора в случае небольшой избыточности кодов. Благодаря простоте, здесь применяются самые короткие коды и обеспечивается однозначность каждого объекта классификации. Боле того, здесь происходит процесс самого простого присвоения кодов новым элементам, которые появляются при введении классификаторов.

В качестве недостатка этого метода можно отметить отсутствие определенной детальной информации о свойствах предмета, а также затрудненность машинной обработки данных для получения результатов по группам элементов классификации, которые имеют схожие признаки. Также он не дает обеспечение возможности разместить появившиеся объекты классификации в нужной точке классификатора, по причине расположения резервных кодов в конце ряда. Эти причины привели к редкому использованию этого метода для создания классификаторов. Его используют вместе с другими методами кодировки.

Серийно-порядковый метод кодирования – в этом случае в качестве кодов выступают числа натурального ряда, к которым закрепляют отдельные серии этих чисел (интервалы натурального ряда) за элементами классификации, имеющими одинаковые признаки. Каждая серия, наряду с кодами объектов классификации, предусматривает определенное число резервных кодов, располагающихся в середине либо в конце кода. В этом заключается преимущество этого метода при сравнении с порядковой методикой. Его применяют для объектов, которые имеют пару соподчиненных признаков.

Эта методика кодировки имеет недостатки и преимущества порядкового метода кодирования. Несмотря на то, что коды, которые построены по этому методу, имеют соответствующие компоненты классификации, в большинстве случаев они применяются, чтобы идентифицировать объекты в сочетании с классификационными методами кодировки.

Последние подразделяются на последовательные и параллельные[41].

Последовательный метод кодирования представляет собой методику, при которой, образование кода классификационной группы либо предмета классификации происходит за счет применения кодов последовательно расположенных подчиненных групп, которые образуются с использованием иерархического метода кодировки. Тогда код группы нижестоящей получается с помощью прибавления необходимого числа разрядов к коду вышестоящей группы. Его применяют в случае иерархического метода классификации.

Преимущества этого метода заключаются в логичности при построении кода и большой емкости.

Также он имеет недостатки, которыми обладает иерархический метод. Кроме того, у него ограниченные возможности по идентификации элементов.

Его применение подразумевает определенные трудности, которые обусловлены тем фактом, что зависимость последующих разрядов кода от предыдущих не позволяет использовать этот код частями, группировка элементов по разным сочетаниям доставляет определенные трудности, не имеется возможным вносить новые признаки и изменения, не перестроив классификатор. В результате его используют в том случае, когда признаки классификации с их последовательностью остаются стабильными на протяжении долгого времени.

Параллельный метод кодирования – при нем образование кода классификационной группировки либо элемента классификации происходит путем использования независимых групп, которые получены за счет фасетного метода (разделение товаров на отдельные, независимые друг от друга параллельные группы (фасеты) на основе какого-либо признака в каждой из этих групп)[42]. Признаки предмета кодируются независимо друг от друга. В данном случае имеются 2 варианта для записи кодов предмета:

Фасет (группы) и признаки внутри групп обладают собственными кодами, включающимися в состав кода объекта. Этот способ записи применяют в случае наличия неодинакового набора признаков и их разного числа. Для формирования кода какого-либо объекта необходимы лишь нужные признаки.

Чтобы определить группы объектов выделяют фиксированный набор признаков с установлением стабильного порядка их следования, другими словами устанавливают фасетную формулу.

Данный метод обладает рядом преимуществ: гибкостью структуры кода, которая обусловлена независимыми характеристиками, коды которых становятся основой кодов объектов классификации. Его применяют для решения нужных конкретных технико-экономических и социальных кодов характеристик объекта.

Параллельный метод применяют в машинной обработке данных[43]. Конкретная кодовая комбинация позволяет определить набор особенностей, которыми обладают конкретные объекты. Стоит отметить, что небольшое число характеристик позволяют создать больше кодовых комбинаций. Характеристики могут пополняться путем присоединения кода новых признаков.

Его применяют в процессе кодировки однородных элементов, иначе реальными становятся только небольшая часть характеристик, а емкость классификаторов будет применена не в полной мере, что является недостатком этой методики.

Штриховой либо линейный код – комбинация вертикальных полосок, которые имеют разную ширину и пробелы между ними. Базой является ширина узкой части (полоски) кода[44].

Широкая полоса должна быть кратна узкой по ширине либо находиться в определенном соотношении. Основой штрихового кода является цифровой код.

Разные страны используют разные типы штрихового кода, в которых имеется необходимое соотношение между разными полосками и интервалы между ними.

Разработкой штриховых кодов занимается Международная ассоциация по нумерации (ЕАН), коды которой- самые распространенные на европейском континенте. Россия вступила в эту организацию в 1987 году.

В качестве преимуществ штрихкодов можно отметить следующие[45]:

  • Уменьшение количества ошибок в процессе ввода данных в форме штрихового кода при сравнении с процессом ввода данных с клавиатуры на естественном языке;
  • Простота в считывании штрихового кода посредством «электронных оптических систем при сравнении с буквенными и цифровыми символами»;
  • Эффективность в применении системы, основанной на штриховом коде в результате резкого уменьшения цены ввода информации в систему;

В 1988 году Госстандартом СССР были утверждены РД 50-666-88 "Методические указания. Присвоение цифровых кодов товарам народного потребления", которые являются основой штрихкодов, которые наносят на ярлыки, упаковки и этикетки продуктов.

Подобные цифровые (торговые) коды строятся согласно коду ЕАН-13, имеющему тринадцать разрядов и следующую структуру[46]:

Две цифры- идентифицируют страну-изготовителя продукции;

Пять цифр- идентифицируют фирму-изготовителя продукции;

Пять цифр- идентифицируют товар;

Одна цифра- контрольное число[47].

В штриховом коде, который построен на основе ЕАН-13, каждому знаку кода соответствует комбинация 7 компонентов (штрихи и пробелы между ними)[48].

Штрихкоды помимо применения в торговой сфере применяют и в медицине, банковском деле, промышленности и так далее. [49]В данном случае в роли цифровых кодов выступают коды классификаторов ТЭСИ (нормативный документ, представляющий собой свод названий и кодов классификационных групп либо предметов классификации).

Для применения кодов ТЭСИ необходимо обеспечить высокий уровень точности кодированных данных. В этих классификаторах в процессе определения ошибок необходимо использование метода контрольных чисел.

Работа по контролю за правильностью записи кодов в процессе обработки данных основывается на делимости числовых показателей. Другими словами, это называется контроль по модулю. Данный метод основан на том, что к кодам добавляют по одному проверочному знаку (контрольные числа), которые связаны с кодом определенной математической зависимостью.

После ввода кодированных данных в базу, их обработки либо использовании в ЭВМ посредством специализированной программы по контролю проводится процесс проверки данной зависимости по каждому из кодов. В случае нарушения зависимости, аппарат выдаст сведения об ошибке в коде.

Контроль по модулю довольно часто используется в классификаторах ТЭСИ как на территории Российской Федерации, так и за рубежом.

В роли модулей выступают разнообразные числа, однако самое широкое распространение сегодня получил контроль по модулю 11.

В случае с общероссийскими классификаторами расчет контрольных числовых показателей осуществляют согласно методике, которая разработана ВНИИКИ ( Всероссийский научно-исследовательский
конъюнктурный институт). Данная методика основана на том, что в качестве контрольного числа выделяют остаток от деления на 11 суммы произведений весов на значение разрядов кода. В качестве весового коэффициента выступает порядковый номер разряда в коде, который читается слева направо.

Согласно методике ВНИИКИ в роли весов используется натуральный ряд чисел от одного до десяти. В случае с разрядностью кода большей чем 10, происходит повтор набора весов.

При применении этого метода в качестве остатка получаются значения в пределах от нуля до десяти. По причине того, что данный метод основывается на использовании одноразрядных контрольных числовых показателей, то после получения остатка, который будет равен десяти, необходимо провести повторный расчет контрольного числа, сдвинув строку весов.

В данном случае весовой ряд будет начинаться в интервале с трех до десяти. В случае с большей разрядностью кода, весы будут идти с одного до десяти.

Если результатом получения контрольного числа, стал числовой показатель равный десяти, то контрольным числом выступает ноль.

Если сумма произведений весов на значения разрядов равна меньше десяти, то данный результат выступает в качестве контрольного числа.

Применение контрольных чисел дает возможность находить и исправлять ошибки в закодированных документных данных, повышая при этом ее достоверность.

Таким образом, в данной главе были рассмотрены основные методы кодирования данных, такие как порядковый, серийно-порядковый, последовательный, параллельный, а также штриховой(линейный код).

Заключение

За короткий промежуток времени, компьютеры из вычислительных устройств трансформировались в устройства, посредством которых обрабатываются различные виды информации: текстовая, графическая, звуковая. Компьютеры упаковывают, шифруют, передают по каналам связи и отправляют данные по всему миру.

В научном исследовании по теме «Методы кодирования данных» проведен анализ прочитанной литературы, статей по изучаемой тематике, электронных источников.

По результатам курсовой работы достигнута ее цель- закрепление знаний, полученных в ходе изучения предмета «Технологии программирования», изучены основные методы кодирования данных, используемых в настоящее время.

Данную цель удалось достичь после работы над поставленными задачами:

  • Определения понятия и роли кодирования данных;
  • Изучение теории кодирования;
  • Проведения анализа особенностей кодирования различных типов информации;

Выполнив цели и задачи курсовой работы сделаны выводы:

История кодирования более древняя по сравнению с историей компьютерной техники;

Современный мир невозможно себе представить без информации, которую можно передавать различными способами;

Компьютерные устройства передают информацию посредством процесса кодирования, то есть процесс превращения одной последовательности сигналов в другую;

Теория кодирования дает представление о наилучших способах упаковки информации, благодаря которым после передачи сигнального сообщения без труда можно выделить необходимую информацию;

Наиболее часто применяемыми методами кодирования данных являются:

  • Порядковый метод, где в качестве кодов выступают натуральные числа;
  • Серийно-порядковый, в роли кодов выступают числа натурального ряда, к которым закрепляют отдельные серии этих чисел (интервалы натурального ряда) за элементами классификации, имеющими одинаковые признаки;
  • Последовательный метод кодирования - образование кода происходит за счет применения кодов последовательно расположенных подчиненных групп, которые образуются с использованием иерархического метода кодирования;
  • Параллельный метод, при котором образование кода происходит путем использования независимых групп, которые получены за счет фасетного метода;

Штриховой либо линейный код является комбинацией вертикальных полосок, которые имеют разную ширину и пробелы между ними.

Каждый из данных методов имеет свои преимущества и недостатки. Поэтому каждый из них целесообразно применять в отдельных случаях.

В результате, задачи и цели работы были достигнуты.

Список использованной литературы:

Книги

Конхейм А. Г. Основы криптографии. М.: Радио и связь, 1987.

Соловьева Ф. И. Введение в теорию кодирования: Учебное пособие / Новосиб. гос. ун-т. Новосибирск, 2006. 127 с.

Винер Н.  Кибернетика и общество/ Главная редакция изданий для зарубежных стран, 1983. — 344 с.

Вернер М. Основы кодирования. Учебник для ВУЗов. Москва: Техносфера, 2004. – 288 с.

Чикрин Д.Е. Теория информации и декодирования. Курс лекций/ Казанский (Приволжский) Федеральный Университет 2013 год- 116 с.

Основные методы кодирования данных: Методические указания. / Сиб. гос. ун-т телекоммуникаций и информатики. – Новосибирск, 2010. – 54 с.

Анисимов В.В. Криптография (методические указания по выполнению лабораторных работ по дисциплине «Информационная безопасность и защита информации».)/ Хабаровск: Изд-во ДВГУПС, 2012 г.-44с

Чепкунова Е.Г. Пособие к подготовке к экзамену по дисциплине «Теоретические основы информатики». Раздел «Кодирование информации»: Учеб.пособие / Е.Г.Чепкунова. – Казань: Казанский университет, 2012. – 92 с.

Бекман И. Информатика. Курс лекций/ Москва-Рим-2009 года

Марков.А.А. Введение в теорию кодирования. — М.: Наука, 1982. — 192 с.

Сэломон Д. Сжатие данных, изображения и звука. — М.: Техносфера, 2004. — С. 368. — ISBN 5-94836-027-X. 3000 экз

Морелос-Сарагоса Р. Искусство помехоустойчивого кодирования. Методы, алгоритмы, применение / пер. с англ. В. Б. Афанасьева. — М.: Техносфера, 2006. — 320 с. — (Мир связи). — 2000 экз. — ISBN 5-94836-035-0

Михайлов Н.Л. Корректирующие коды: Учебное пособие. – Рыбинск, РГАТА, 2010. – 84 с.

Воронков, А.Н. Технологии штрихового кодирования в логистике [Текст]: учебное пособие/ А.Н.Воронков, А.А. Трифилова; Нижегород. гос. архит.-строит. ун-т – Н. Новгород: ННГАСУ, 2011 – 92 с.

Журналы

Новиков Д.Ю. Методы параллельной обработки данных в распределенных системах // Современная техника и технологии. 2015. № 5 [Электронный ресурс]. URL: http://technology.snauka.ru/2015/05/6560 (дата обращения: 23.09.2018).

Бухарбаева Н.А. Кодирование текстовой информации // Современные научные исследования и инновации. 2017. № 5 [Электронный ресурс] URL: http://web.snauka.ru/issues/2017/05/83194

Черняк Л. «Рождение теории кодирования»: Computerworld Россия №13, 2006

Зарубежная литература

Understanding Digital Television: An Introduction to Dvb Systems With … — Lars-Ingemar Lundström.

Nidhal Abdulaziz, Eesa Bastaki Slope line coding for telecommunication networks // University of Wollongong Research Online, 2007.

Types of Coding // James Irvine, David Harle Data Communications and Networks. John Wiley & Sons, 2002. pp. 268

Tony Sale "Lecture given at the IEEE 18th February 1999"

Faraday, Michael. The philosopher's tree: a selection of Michael Faraday's writings / Michael Faraday, Day. — CRC Press, 1999-02-01. — P. 71.

Электронные источники

https://docplayer.ru/

http://moglobi.ru

http://textarchive.ru

http://gendocs.ru

http://www.docme.ru

https://lektsii.org

http://profbeckman.narod.ru

https://sites.google.com

http://5informatika.net

https://studbooks.net

https://www.insotel.ru

https://studwood.ru

Приложение

Элементами структуры основного стандартного товарного кода EAN-13 являются тринадцать разрядных цифр, которые при простом и визуальном обзоре означают следующее[50].

https://studwood.ru/imag_/12/59003/image002.png

  1. Конхейм А. Г. Основы криптографии. М.: Радио и связь, 1987.

  2. Соловьева Ф. И. Введение в теорию кодирования: Учебное пособие / Новосиб. гос. ун-т. Новосибирск, 2006. С 3.

  3. Faraday, Michael. The philosopher's tree: a selection of Michael Faraday's writings / Michael Faraday, Day. — CRC Press, 1999-02-01. — P. 71.

  4. http://www.inqui.ru/2012/02/8-1838.html

  5. http://5informatika.net/metody-kodirovanija/Metody-kodirovanija-informatsii/001-Kodirovanie-informatsii.html

  6. Черняк Л. «Рождение теории кодирования»: Computerworld Россия №13, 2006

  7.  Tony Sale "Lecture given at the IEEE 18th February 1999"

  8. Соловьева Ф. И. Введение в теорию кодирования: Учебное пособие / Новосибрск. гос. ун-т. Новосибирск, 2006. С 3.

  9. Винер Н.  Кибернетика и общество/ Главная редакция изданий для зарубежных стран, 1983. — 344 с.

  10. Вернер М. Основы кодирования. Учебник для ВУЗов. Москва: Техносфера, 2004. – 1с.

  11. http://edu.tltsu.ru/sites/sites_content/site216/html/media81688/SS.pdf

  12. Чикрин Д.Е. Теория информации и декодирования. Курс лекций/ Казанский (Приволжский) Федеральный Университет 2013 год- С. 13

  13. Основные методы кодирования данных: Методические указания. / Сиб. гос. ун-т телекоммуникаций и информатики. – Новосибирск, 2010. – 54 с.

  14. https://studbooks.net/2024784/informatika/kodirovanie_osnovnye_ponyatiya_opredeleniya

  15. Анисимов В.В. Криптография (методические указания по выполнению лабораторных работ по дисциплине «Информационная безопасность и защита информации».)/ Хабаровск: Изд-во ДВГУПС, 2012 г.-44с

  16. https://sites.google.com/site/anisimovkhv/learning/kripto/lecture/tema20

  17. Там же

  18. Чепкунова Е.Г. Пособие к подготовке к экзамену по дисциплине «Теоретические основы информатики». Раздел «Кодирование информации»: Учеб.пособие / Е.Г.Чепкунова. – Казань: Казанский университет, 2012. – С 16.

  19. http://profbeckman.narod.ru/InformLekc.htm

  20. Бухарбаева Н.А. Кодирование текстовой информации // Современные научные исследования и инновации. 2017. № 5 [Электронный ресурс] URL: http://web.snauka.ru/issues/2017/05/83194

  21. Бекман И. Информатика. Курс лекций/ Москва-Рим-2009 года

  22. http://profbeckman.narod.ru/InformLekc.files/Inf12.pdf

  23. Чепкунова Е.Г. Название: Пособие к подготовке к экзамену по дисциплине «Теоретические остновы информатики». Раздел «Кодирование информации»: Учеб.пособие / Е.Г.Чепкунова. – Казань: Казанский университет, 2012. – 92 с.

  24. Марков.А.А. Введение в теорию кодирования. — М.: Наука, 1982. — 192 с.

  25. Types of Coding // James Irvine, David Harle Data Communications and Networks. John Wiley & Sons, 2002. pp. 268

  26. Сэломон Д. Сжатие данных, изображения и звука. — М.: Техносфера, 2004. — С. 368. — ISBN 5-94836-027-X. 3000 экз

  27. Understanding Digital Television: An Introduction to Dvb Systems With … — Lars-Ingemar Lundström

  28. См. Введение

  29. Nidhal Abdulaziz, Eesa Bastaki Slope line coding for telecommunication networks // University of Wollongong Research Online, 2007.

  30. Морелос-Сарагоса Р. Искусство помехоустойчивого кодирования. Методы, алгоритмы, применение / пер. с англ. В. Б. Афанасьева. — М.: Техносфера, 2006. — 320 с. — (Мир связи). — 2000 экз. — ISBN 5-94836-035-0

  31. http://gendocs.ru/v5529/?cc=6&page=3

  32. Михайлов Н.Л. Корректирующие коды: Учебное пособие. – Рыбинск, РГАТА, 2010. – С 1

  33. Вернер М. Основы кодирования. Учебник для ВУЗов. Москва: Техносфера, 2004. – С 1.

  34. https://docplayer.ru/38966440-Arifmeticheskoe-kodirovanie.html

  35. Шавенько Н.К. Основы теории информации и кодирования. Учебное пособие. – М,: Изд-во МИИГАиК, 2012 – С. 26

  36. http://moglobi.ru/stati/2-predstavlenie-informacii-yaziki-kodirovanie/main.html

  37. http://textarchive.ru/c-1539925-p4.html

  38. Костомаров М.Н. Классификация и кодирование документов и документной информации // Секретарское дело. – 2003. – № 10. – С. 35

  39. http://www.docme.ru/doc/438970/07metody-kodirovaniya-te-si

  40. Шавенько Н.К. Основы теории информации и кодирования. Учебное пособие. – М,: Изд-во МИИГАиК, 2012 – С. 27

  41. Вернер М. Основы кодирования. Учебник для ВУЗов. Москва: Техносфера, 2004. – 288 с

  42. https://lektsii.org/3-92768.html

  43. Новиков Д.Ю. Методы параллельной обработки данных в распределенных системах // Современная техника и технологии. 2015. № 5 [Электронный ресурс]. URL: http://technology.snauka.ru/2015/05/6560 (дата обращения: 23.09.2018).

  44. https://docplayer.ru/25842438-Shtrihovoe-kodirovanie.html

  45. https://www.insotel.ru/press/articles/torgovoe_oborudovanie/tehnologiya_shtrihovogo_kodirovaniya_formirovanie_shtrih_kodov_preimuschestva_sfery_primeneniya/

  46. https://studwood.ru/875677/marketing/struktura_shtrihovyh_kodov

  47. См. приложение

  48. pluginfile.php?file=/74081/mod_folder/content/0/Тема 7.pdf&forcedownload=1

  49. Воронков, А.Н. Технологии штрихового кодирования в логистике [Текст]: учебное пособие/ А.Н.Воронков, А.А. Трифилова; Нижегород. гос. архит.-строит. ун-т – Н. Новгород: ННГАСУ, 2011 – С. 76.

  50. https://studwood.ru/875677/marketing/struktura_shtrihovyh_kodov