Преподаватель который помогает студентам и школьникам в учёбе.

Методы кодирования данных

Содержание:

Введение

Цель курсовой работы - изучение теоретических аспектов методов кодирования данных по дисциплине “Технологии программирования”

Задачи курсовой работы:

Рассмотреть и изучить все методы кодирование данных.
Так же их преимущества и недостатки.

В работе рассмотрено 4 метода кодирования данных, а именно: Порядковый метод кодирования, Серийно-порядковый метод кодирования, Последовательный метод кодирования и Параллельный метод кодирования.

Тема моей курсовой работы достаточно актуальна. Она определяет необходимость рассматривать вопросы, связанные с кодированием данных, в виду их большой практической значимостью.

Кодирование и методы кодирования.

Кодирование представляет собой процесс перевода информации, выраженной одной системой знаков, в другую систему, то есть перевод записи на естественном языке в запись с помощью кодов.

Код – представляет собой условное обозначение объекта знаком или группой знаков по определенным правилам, установленным системами кодирования. Коды могут быть цифровыми, буквенными, комбинированными.

К кодам предъявляются ряд требовании:

должны охватывать все объекты, подлежащие кодированию, и делать им однозначное обозначение;
предоставлять возможность расширения объектов кодирования без изменения правил их обозначения;
быть едиными для разных задач внутри одного экономического объекта (например, коды материалов, подразделений должны быть едиными для задач бухгалтерского учета и технической поддержки производства);
отличаться стабильностью, удобством восприятия и запоминания кодовых обозначений, обеспечивающим простоту заполнения, чтения и обработки;
обладать максимальной информированностью кода при минимальной его значности;
иметь возможность использования кодов для автоматического получения сводных итогов и автоматического контроля кодовых обозначений с целью обнаружения ошибок.

Назначение кодов состоит в:

обеспечении группировки информации в машине,
подведении итогов по всем группированным признакам и их печати в сводных таблицах,
выполнении процедур поиска, хранения, выборки информации,
передачи информации по каналам связи.

Процесс присвоения объектам кодовых обозначений называется кодированием.

Основная цель кодирования состоит в однозначном обозначении объектов, а также в обеспечении необходимой достоверности кодируемой информации.

С помощью кодирования обеспечивается выполнение основных функций, связанных с обработкой экономический информации:

минимизация объема призначной информации при вводе ее в вычислительную систему и передаче по каналам связи,
сортировка и поиск информации по ключевым признакам;
разработка сводных отчетов по различным признакам,
декодирование при переходе от кодов-признаков к их наименованиям при печати сводных экономических отчетов.

Представление информации в компактной форме приспосабливает ее к лучшей обработки средствами ЭВМ. С помощью кодирования упрощается и ускоряется запись данных первичного документа и последующая обработка на машинных носителях.

Для того, чтобы классификационная схема стала средством для создания эффективной системы хранения документов обработки информации, ее поиска и информационного обмена, она должна быть дополнена системой условных обозначений, присваиваемых объектам и классификационным группировкам. Такие обозначения в разных классификационных справочниках могут называться индексами или кодами, a процесс их присвоения объектам классификации или классификационным группировкам – индексированием или кодированием.

Знаки, составляющие индекс или код, называются их алфавитом. Такой алфавит может включать буквы, цифры, знаки пунктуации в их различных комбинациях. Так, индекс дела в номенклатуре дел представляет собой комбинацию знаков, которая включает индекс структурного подразделения, в котором создается и хранится дело, и порядковый номер дела внутри раздела, соответствующего данному структурному подразделению. Индекс какого-либо документа в универсальной десятичной классификации кроме индекса, отражающего основное содержание документа, может дополнительно включать индексы признаков, характеризующих документ (язык документа, исторический период, автор, тип документа и другие).

Индекс или код являются идентификаторами объекта классификации или классификационной группировки, и их основное назначение состоит в однозначном обозначении объектов классификации. Это своего рода формализованное имя объекта, которое должно обеспечивать возможность точного определения объекта классификации. Поэтому разработчики классификационных схем стремятся сделать индексы или коды мнемоничными, то есть такими, чтобы даже по внешнему виду, алфавиту кода пользователь мог определить объект и узнать возможно больше информации о характере объекта классификации, для обозначения которого использован этот код. Например, буквенный код России по Общероссийскому классификатору стран мира (ОКСМ) – RU, а код США – US. Соответственно код российского рубля по Общероссийскому классификатору валют (ОКВ) RUR, а доллара США – USD.

К методам кодирования предъявляются определенные требования, соблюдение которых способствует повышению качества классификатора.

Метод кодирования должен:

код метода должен содержать необходимую информацию об объекте и осуществлять в пределах заданного множества объектов классификации его идентификацию
предусматривать использование в качестве алфавита кода десятичных цифр и букв;
обеспечивать по возможности минимальную длину кода и достаточный резерв незанятых позиций для кодирования новых объектов без нарушения структуры классификатора;
быть максимально ориентированным на автоматизированную обработку информации.

Методы кодирования могут носить самостоятельный характер – регистрационные методы кодирования, или быть основанными на предварительной классификации объектов – классификационные методы кодирования.

Регистрационные методы кодирование бывают двух видов: порядковый и серийно-порядковый.

Порядковый метод кодирования

Порядковый метод кодирования – это такой метод, при котором кодами служат числа натурального ряда. В этом случае каждый из объектов классифицируемого множества кодируется путем присвоения ему текущего порядкового номера.

Данный метод кодирования обеспечивает довольно большую долговечность классификатора при незначительной избыточности кода. Этот метод обладает наибольшей простотой, использует наиболее короткие коды и лучше обеспечивает однозначность каждого объекта классификации. Кроме того, он обеспечивает наиболее простое присвоение кодов новым объектам, появляющимся в процессе ведения классификатора.

Существенным недостатком порядкового метода кодирования является отсутствие в коде какой-либо конкретной информации о свойствах объекта, а также сложность машинной обработки информации при получении итогов по группе объектов классификации с одинаковыми признаками. Этот метод кодирования не обеспечивает возможности размещения вновь появившихся объектов классификации в необходимом месте классификатора, так как резервные коды располагаются в конце ряда. По этим причинам порядковый метод отдельно редко применяется при создании классификаторов. Чаще всего он применяется в сочетании с другими методами кодирования.

Пример: возьмем список студентов в журнале (1,2,3,4,5 …)

1)Абрамов Даниил

2)Баранов Владислав

3)Васильева Екатерина

4)Дедов Александр

5)Завельев Константин

6)Ковалев Максим

7)Линьков Геннадий

8)Маслов Александр

Серийно-порядковый метод кодирования

Серийно-порядковый метод кодирования – метод, при котором кодами служат числа натурального ряда с закреплением отдельных серий этих числе (интервалов натурального ряда) за объектами классификации с одинаковыми признаками. В каждой серии, кроме кодов имеющихся объектов классификации, предусматривается определенное количество кодов для резерва. Резерв кодов располагается в середине или в конце кода. Это является большим преимущество данного метода по сравнению с порядковым методом кодирования. Серийно-порядковый метод кодирования целесообразно применять для объектов, имеющих два соподчиненных признака.

Данный метод кодирования обладает всеми преимуществами и недостатками порядкового метода кодирования. Несмотря на наличие в кодах, построенных по этому методу кодирования, определенных элементов классификации, они чаще всего используются для идентификации объектов в сочетании с классификационными методами кодирования.

Классификационные методы кодирования бывают двух видов: последовательный и параллельный.

Пример: числа натурально ряда и буквенная серия

Маркировка консервов

12 01 06

135 26

1Р

Последовательный метод кодирования

Последовательный метод кодирования – метод, при котором код классификационной группировки и (или) объекта классификации образуется с использованием кодов последовательно расположенных подчиненных группировок, полученных при иерархическом методе кодирования. В этом случае код нижестоящей группировки образуется путем добавления соответствующего количества разрядов к коду вышестоящей группировки. Последовательный метод кодирования чаще всего используется при иерархическом методе классификации.

Преимущества последовательного метода кодирования являются логичность построения кода и большая емкость.

Вместе с тем он обладает всеми недостатками, присущими иерархическому методу классификации, а также ограниченными возможностями идентификации объектов. Использование последовательного метода кодирования связано с определенными трудностями, обусловленными тем, что в результате зависимости последующих разрядов кода от предыдущих применять этот код по частям нельзя, группировать объекты по различным сочетаниям имеющихся признаков сложно, практически невозможно вносить новые признаки и производить изменения в коде без коренной перестройки классификатора. поэтому применять последовательный метод кодирования целесообразно в тех случаях, когда набор признаков классификации и их последовательность стабильны в течение длительного времени.

Пример: одежда может подразделяться по нескольким признакам

- По назначению (спорт, профессиональная, бытовая, национальная…)

- По сезонности (зимняя, летняя …)

- По исходному сырью (по составу – шерсть, хлопок, лен…)

Параллельный метод кодирования

Параллельный метод кодирования – метод, при котором код классификационной группировки и (или) объекта классификации образует с использованием независимых группировок, полученных при фасетном методе классификации. при этом методе кодирования признаки объекта кодируются независимо друг от друга. Для параллельного метода кодирования возможны два варианта записи кодов объекта:

Каждый фасет и признак внутри фасета имеют свои коды, которые включаются в состав кода объекта. Такой способ записи удобно применять тогда, когда объекты характеризуются неодинаковым набором признаков и различны их числом. при формировании кода какого-либо объекта берутся только необходимые признаки.

Для определения групп объектов выделяется фиксированный набор признаков и устанавливается стабильный порядок их следования, то есть устанавливает фасетная формула. В этом случае не надо каждый раз указывать, значение какого признака приведено в определенных разрядах кода объекта.

Параллельный метод кодирования имеет ряд преимуществ. К достоинствам рассматриваемого метода следует отнести гибкость структуры кода, обусловленная независимостью признаков, из кодов которых строится код объекта классификации. Метод позволяет использовать при решении конкретных технико-экономических и социальных коды только тех признаков объектов, которые необходимы, что дет возможность работать в каждом отдельном случае с кодами небольшой длины. При этом методе кодирования можно осуществлять группировку объектов по любому сочетанию признаков. Параллельный метод кодирования хорошо приспособлен для машинной обработки информации. По конкретной кодовой комбинации легко узнать, набором каких характеристик обладает рассматриваемый объект. При этом из небольшого числа признаков можно образовать большое число кодовых комбинаций. Набор признаков при необходимости может легко пополняться присоединением кода нового признака. Это свойство параллельного метода кодирования особенно важно при решении технико-экономических задач, состав которых часто меняется.

Параллельный метод кодирования целесообразно использовать для кодирования однородных объектов, так как в противном случае реальной становится лишь незначительная часть сочетаний признаков, и емкость классификатора будет использоваться не полностью. Это является недостатком данного метода кодирования.

Перечисленные классификационные методы кодирования характеризуются тем, что даже при глубокой классификации объектов код несет информацию о классификационной группировке, но не всегда идентифицирует конкретный объект, а коды, полученные на основе идентификационных методов, хорошо выполняя функцию идентификации объектов, практически не несут информацию об их свойствах. Поэтому идентификационные и классификационные методы кодирования чаще всего применяются в классификаторах в сочетании друг с другом.

Одним из наиболее узких мест во всей технологии использования классификаторов информации является кодирование и ввод данных. С целью устранения этого проводятся исследования по автоматизации процесса кодирования информации. Однако для реализации автоматизированного процесса кодирования требуются большие объемы памяти, так как вначале вся информация вводится на естественном языке, и связанные с этим большие трудозатраты. Другим направлением снижения трудозатрат в процессе кодирования и ускорения этого процесса является использование штриховых (линейных) кодов.

Пример: фасеты (грани) не зависимые только по 1 признаку.

Ткани по составу – (шелк, шерсть, хлопок, лен …)

Штриховые (линейные) коды

Штриховой (линейный) код представляет собой комбинацию вертикальных полосок разной ширины и пробелов между ними. При этом за базу принимается ширина узкого элемента (полоски) кода. Широкие полоски должны быть кратными им по ширине или находиться с ними в определенных соотношениях. В основе штрихового кода лежит цифровой код.

Преимущества штриховых кодов состоят в следующем:

Резкое снижение числа ошибок при вводе информации в виде штриховых кодов по сравнению с вводом информации с клавиатуры на естественном языке;
Легкость считывания штриховых кодов "электронными оптическими системами по сравнению с буквенно-цифровыми символами;
высокая экономическая эффективность применения систем на основе штриховых кодов вследствие резкого снижения стоимости ввода данных в систему.

В разных странах используются различные виды штриховых кодов. В каждом из них установлено определенное соотношение между широкими узкими полосками и между полосками и интервалами между ними. Так, в «Коде 39» каждому знаку цифрового кода соответствует комбинация из девяти элементов (три широких полоски и шесть узких) и из них пять штрихов и четыре интервала между ними.

Разработка штриховых кодов осуществляется Международной ассоциацией по нумерации (ЕАН), коды которой являются наиболее распространенными в Европе. Наша страна с 1987 года также стала членом ЕАН.

В 1988 году Госстандарт СССР утвердил РД 50-666-88 "Методические указания. Присвоение цифровых кодов товарам народного потребления". Этим документом устанавливались правила присвоения товарам народного потребления цифровых (торговых) кодов. Эти цифровые коды служат основой для штриховых кодов, наносимых на ярлыки, упаковку и этикетки товаров. Такой цифровой (торговый) код строится в полном соответствии с кодом ЕАН-13. Он состоит из тринадцати разрядов и имеет следующую структуру:

2 знака – идентификатор страны-изготовителя товара;
5 знаков – идентификатор фирмы-изготовителя товара;
5 знаков – идентификатор товара;
1 знак – контрольное число.

В этом коде, например, США и Канада имеют идентификаторы с 00 до 09, Франция – с 30 до 37, ФРГ – с 40 до 43, СНГ – 46, Япония – 49, Италия – с 80 до 83, Корея – 88 и так далее.

В штриховом коде, построенном на основе ЕАН-13, каждому знаку цифрового кода соответствует комбинация из семи элементов – штрихов и пробелов между ними. Штриховой (линейный) код имеет следующий вид: 9785870"574165

Штриховые коды могут использоваться кроме торговли также в таких областях, как медицина, банковское дело, промышленность и других. При этом в качестве цифровых кодов для них могут использоваться коды классификаторов ТЭСИ.

Использование кодов ТЭСИ

Знак (символ) или совокупность знаков (символов), принятых для обозначения классификационной группировки или объекта классификации.

Кодирование-присвоение кода классификационной группировке или объекту классификации.

Алфавит кода-система знаков (символов), принятых для образования кода.В процессе кодирования объектам классификации и их группировкам по определенным правилам присваиваются цифровые, буквенные и буквенно-цифровые коды.

Использование кодов ТЭСИ требует обеспечения высокой степени достоверности кодированной информации. В классификаторах ТЭСИ для выявления ошибок в кодах используется метод контрольных чисел.

Контроль правильности записи кодов при обработке информация основан на принципе делимости чисел. Иначе его называют контролем по модулю. Суть метода заключается в том, что к коду добавляется еще один проверочный знак (контрольное число), связанный с кодом определенной математической зависимостью, при вводе кодированной информации в базу данных, ее обработке или использовании в ЭВМ специальной программой контроля выполняется проверка этой зависимости по каждому коду. Если зависимость нарушается, машина выдает информацию о наличии ошибки в коде.

Контроль по модулю широко используется в классификаторах ТЭСИ как у нас в стране, так и за рубежом. В качестве модуля используют различные числа, но наибольшее распространение получил в настоящее время контроль по модулю 11. Для общероссийских классификаторов расчет контрольных чисел осуществляется в соответствии с методикой, разработанной “ВНИИКИ”. В соответствии с этой методикой контрольным числом является остаток от деления на 11 суммы произведений весов на значения разрядов кода. Весом (весовым коэффициентом) является порядковый номер разряда в коде слева направо.

Методика ВНИИКИ

Методика ВНИИКИ предлагает использовать в качестве весов натуральный ряд чисел от 1 до 10. Если разрядность кода больше 10, то набор весов повторяется. При использовании данного метода остаток может получить значение от 0 до 10. Так как методика предусматривает использование одноразрядных контрольных чисел, то при получении остатка, равного 10, следует сделать повторный расчет контрольного числа со сдвигом строки весов. В этом случае весовой ряд начинается с 3 до 10, а если разрядность кода больше, то дальше веса идут с 1 до 10. В случае повторного получения контрольного числа, равного 10, в качестве контрольного числа используется 0. В случае, если сумма произведений весов на значения разрядов получается меньше 10, то эта сумма и является контрольным числом.

Использование контрольных чисел обеспечивает возможность обнаруживать и исправлять ошибки в кодированной документной информации, что повышает ее достоверность.

При помощи методов классификации и кодирования проводится классификации информации по конкретным отраслям деятельности. Эта классификация находит свое отражение в создании общероссийских классификаторов ТЭСИ. Для изучения как применяются данные методы классификации на практике необходимо рассмотреть разработку общероссийских классификаторов ТЭСИ.

Кодирование - это процесс перевода информации, выраженной одной системой знаков, в другую систему, то есть перевод записи на естественном языке в запись с помощью кодов.

Методы кодирования технико-экономической и социальной информации тесно взаимосвязаны с методами классификации. Каждому методу классификации соответствует один или несколько методов кодирования.

В процессе кодирования объектам классификации и их группировкам по определенным правилам присваиваются цифровые, буквенные и буквенно-цифровые коды. Код характеризуется алфавитом, то есть знаками, используемыми для его образования, основанием кода - числом знаков в алфавите кода и длиной кода.

Заключение

В курсовой работе было рассмотрено следующее:

Кодирование и методы кодирования

Порядковый метод кодирования
Серийно-порядковый метод кодирования
Последовательный метод кодирования
Параллельный метод кодирования

Так же по мимо методов кодирования были рассмотрены:

Штриховые (линейные) коды
Код ТЭСИ
Методика ВНИИКИ

Хочу подчеркнуть, что тема курсовой мне очень интересна, а так же на мой взгляд, актуальна.

Список используемой литературы

Кузьмин И. В., Кедрус В. А. Основы теории информации и кодирования. — Киев: Высшая школа, 1977. https://ru.b-ok.xyz/book/2475032/fa2b8d
Мамиконов А. Г. Управление и информация. — М.: Наука, 1975.https://nashol.com/20180824103270/prinyatie-reshenii-i-informaciya-mamikonov-a-g-1983.html
Сидельников В.М. Теория кодирования. Сборник. — М.: Мир, 1964. https://nashol.com/2015042184210/teoriya-kodirovaniya-sidelnikov-v-m.html
Хемминг Р. В. Теория кодирования и теория информации. — М.: Радио и связь, 1983. http://bookre.org/reader?file=478168&pg=70
Могилев А.В. Информатика / А.В. Могилев, Н.И. Пак, Е.К. Хённер. -- М.: учебное пособие, 2004. -- 848 с. https://alleng.org/d/comp/comp33.htm
Семенюк В.В. Экономное кодирование дискретной информации. - СПб.: СПбГИТМО (ТУ), 2001 https://www.compression.ru/download/articles/rev_univ/semenyuk_2001_econom_encoding.pdf
Дмитриев В.И. Прикладная теория информации. М.: Высшая школа, 2009. http://www.nashaucheba.ru/v8996/%D0%B4%D0%BC%D0%B8%D1%82%D1%80%D0%B8%D0%B5%D0%B2_%D0%B2.%D0%B8._%D0%BF%D1%80%D0%B8%D0%BA%D0%BB%D0%B0%D0%B4%D0%BD%D0%B0%D1%8F_%D1%82%D0%B5%D0%BE%D1%80%D0%B8%D1%8F_%D0%B8%D0%BD%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%86%D0%B8%D0%B8
Колесник В.Д., Полтырев Г.Ш. Курс теории информации. М.: Наука, 20 https://www.studmed.ru/view/kolesnik-vd-poltyrev-gsh-kurs-teorii-informacii_e6dc6f40f92.html
Анашкина, Н.В. Технологии и методы программирования: Учебное пособие для студентов учреждений высшего профессионального образования https://www.academia-moscow.ru/ftp_share/_books/fragments/fragment_15151.pdf
Иванова Г.С. Основы программирования [Учеб. для вузов] 2-е - изд. перераб. и дополнено. - М.: изд - во МГТУ им. Н.Э. Баумана, 2002. - 415 с. ил. https://studfile.net/preview/2807277/
Д. Кнут. Искусство программирования / Кнут Дональд. — М: Вильямс. 3-е издание. 2000. https://nashol.com/2011090659497/iskusstvo-programmirovaniya-tom-1-knut-d-e.html
ктн Е. В. Курапова, кф-мн Е. П. Мачикина. Основные методы кодирования данных: Практикум. / СибГУТИ. – Новосибирск, 2010. – 62 с. https://studfile.net/preview/2919113/page:13/