Автор Анна Евкова
Преподаватель который помогает студентам и школьникам в учёбе.

Банки данных и базы данных (Базы данных)

Содержание:

ВВЕДЕНИЕ

Развитие вычислительной техники и появление емких внешних запо­минающих устройств прямого доступа предопределило интенсивное развитие автоматических и автоматизированных систем разного на­значения и масштаба, в первую очередь заметное в области бизнес-приложений.

Такие системы работают с большими объемами инфор­мации, которая обычно имеет достаточно сложную структуру, требу­ет оперативности в обработке, часто обновляется и в то же время тре­бует длительного хранения.

Примерами таких систем являются авто­матизированные системы управления предприятием, банковские системы, системы резервирования и продажи билетов и т. д.

Другими направлениями, стимулировавшими развитие, стали, с одной стороны, системы управления физическими эксперимента­ми, обеспечивающими сверхоперативную обработку в реальном масштабе времени огромных потоков данных от датчиков, а с другой — автоматизированные библиотечные информационно-поиско­вые системы.

1. ПОНЯТИЕ БАЗЫ И БАНКОВ ДАННЫХ И ИХ НАЗНАЧЕНИЕ

Под банком данных понимается совокупность баз данных, а также программные, языковые и другие средства, предназначенные для централизованного накопления данных и их использования с помощью электронных вычислительных машин.

В состав банка данных входят одна или несколько баз данных, справочник баз данных, система управления базами данных (СУБД), а также библиотеки запросов и прикладных программ.

Банк данных предназначен для хранения больших массивов информации, быстрого поиска нужных сведений и документов.

Создается банк данных в абонентской системе любой производительности — от персонального компьютера до суперкомпьютера. Но даже самый крупный банк данных ограничен в своих возможностях. Поэтому банки в сети специализируются, собирая информацию в определенных областях науки, технологии, продукции. Ядром банка являются базы данных и базы знаний. База данных — это организованная структура, предназначенная для хранения информации. Данные и информация — понятия взаимосвязанные, но не тождественные, должен заметить несоответствие в этом определении. Сегодня большинство систем управления базами данных (СУБД) позволяют размещать в своих структурах не только данные, но и методы (то есть программный код), с помощью которых происходит взаимодействие с потребителем или с другими программно-аппаратными комплексами. Таким образом, можно говорить, что в современных базах данных хранятся отнюдь не только данные, но и информация.

В БнД имеются специальные средства, облегчающие для пользователей работу с данными (СУБД).

Централизованное управление данными имеет преимущества
по сравнению с обычной файловой системой:

— сокращение избыточности хранения данных;

— сокращение трудоемкости разработки, эксплуатации и модернизации ИС;

-обеспечение удобного доступа к данным как пользователям

— профессионалам в области обработки данных, так и конечным пользователям.

Основные требования, предъявляемые к БнД:

— адекватность отображения предметной области (полнота, целостность и — непротиворечивость данных, актуальность информации;

— возможность взаимодействия пользователей разных категорий, высокая эффективность доступа к данным;

— дружелюбность интерфейсов, малое время на обучение;

— обеспечение секретности и разграничение доступа к данным для разных пользователей;

— надежность хранения и защита данных.

Определение термина Банк данных дано во Временном положении о государственном учете и регистрации баз и банков данных, утвержденное постановлением Правительства Российской Федерации от 28.02.96 № 226, п.2 (СЗ РФ, 1996, № 12, ст. 1114)

Первоначально (начало 60-х годов) использовалась файловая система хранения. Для решения преимущественно инженерных задач, характеризующихся небольшим количеством данных и значительным объемом вычислений, данные хранились непосредственно в программе. Применялся последовательный способ организации данных, имелась их высокая избыточность, идентичность логической и физической структур и полная зависимость данных. С появлением экономико-управленческих задач (информационная система руководства — MIS), отличающихся большими объемами данных и малой долей вычислений, указанная организация данных оказалась неэффективной. Требовалось упорядочение данных, которое, как выяснилось, возможно было проводить по двум критериям: использование (информационные массивы); хранение (базы данных). Первоначально применяли информационные массивы, но вскоре стало ясно превосходство баз данных. Использование файлов для хранения только данных было предложено Мак Гри в 1959 году. Были разработаны методы доступа (в том числе произвольного) к таким файлам, при этом физическая и логическая структуры уже различались, а физическое расположение данных можно было менять без изменения логического представления.

В 1963 году С. Бахманом была построена первая промышленная база данных IDS с сетевой моделью данных, которая все еще характеризовалась избыточностью данных и их использованием только для одного приложения. Доступ к данным осуществлялся с помощью соответствующего программного обеспечения. В 1969 году сформировалась группа, создавшая набор стандартов CODASYL для сетевой модели данных.

Фактически начала использоваться современная архитектура базы данных. Под архитектурой понимается разновидность (обобщение) структуры, в которой какой-либо элемент может быть заменен на другой элемент, характеристики входов и выходов которого идентичны первому элементу. Существенный скачок в развитии технологии баз данных дала предложенная М. Коддом в 1970 году парадигма реляционной модели данных. Под парадигмой понимается научная теория, воплощенная в систему понятий, отражающих существенные черты действительности. Теперь логические структуры могли быть получены из одних и тех же физических данных, т.е. доступ к одним и тем же физическим данным мог осуществляться различными приложениями по разным путям. Стало возможным обеспечение целостности и независимости данных.

В конце 70-х годов появились современные СУБД, обеспечивающие физическую и логическую независимость, безопасность данных, обладающие развитыми языками БД. Последнее десятилетие характеризуется появлением распределенных и объектно-ориентированных баз данных, характеристики которых определяются приложениями средств автоматизации проектирования и интеллектуализации БД.

С понятием базы данных тесно связано понятие системы управления базой данных – это комплекс программных средств, предназначенных для создания структуры новой базы, наполнения ее содержимым, редактирования содержимого и визуализации информации. Под визуализацией информации базы понимается отбор отображаемых данных в соответствии с заданным критерием, их упорядочение, оформление и последующая выдача на устройство вывода или передача по каналам связи.

В мире существует множество систем управления базами данных. Несмотря на то, что они могут по-разному работать с разными объектами и предоставляют пользователю различные функции и средства, большинство СУБД опираются на единый устоявшийся комплекс основных понятий. Это дает нам возможность рассмотреть одну систему и обобщить ее понятия, приемы и методы на весь класс СУБД.

СУБД организует хранение информации таким образом, чтобы ее было удобно:

  1. Просматривать;
  2. Пополнять;
  3. Изменять;
  4. Искать нужные сведения;
  5. Делать любые выборки;
  6. Осуществлять сортировку в любом порядке.

Классификация баз данных:

а) по характеру хранимой информации:

— фактографические (картотеки),

— документальные (архивы)

б) по способу хранения данных:

— централизованные (хранятся на одном компьютере),

— распределенные (используются в локальных и глобальных компьютерных сетях).

в) по структуре организации данных:

— табличные (реляционные),

— иерархические,

Современные СУБД дают возможность включать в них не только текстовую и графическую информацию, но и звуковые фрагменты и даже видеоклипы.

Простота использования СУБД позволяет создавать новые базы данных, не прибегая к программированию, а пользуясь только встроенными функциями. СУБД обеспечивают правильность, полноту и непротиворечивость данных, а также удобный доступ к ним.

Популярные СУБД — FoxPro, Access for Windows, Paradox. Для менее сложных применений вместо СУБД используются информационно-поисковые системы (ИПС), которые выполняют следующие функции:

  1. Хранение большого объема информации;
  2. Быстрый поиск требуемой информации;
  3. Добавление, удаление и изменение хранимой информации;
  4. Вывод ее в удобном для человека виде.

Информация в базах данных структурирована на отдельные записи, которыми называют группу связанных между собой элементов данных. Характер связи между записями определяет два основных типа организации баз данных: иерархический и реляционный.

Если в базе нет никаких данных (пустая база), то это все равно полноценная база данных. Этот факт имеет методическое значение. Хотя данных в базе и нет, но информация в ней все-таки есть — это структура базы. Она определяет методы занесения данных и хранения их в базе. Простейший «некомпьютерный» вариант базы данных — деловой ежедневник, в котором каждому календарному дню выделено по странице. Даже если в нем не записано ни строки, он не перестает быть ежедневником, поскольку имеет структуру, четко отличающую его от записных книжек, рабочих тетрадей и прочей писчебумажной продукции.

Базы данных могут содержать различные объекты, но основными объектами любой базы данных являются ее таблицы. Простейшая база данных имеет хотя бы одну таблицу. Соответственно, структура простейшей базы данных тождественно равна структуре ее таблицы.

В настоящее время наблюдается стремительный рост числа систем электронной коммерции (СЭК). Электронная коммерция имеет ряд отличительных особенностей, резко выделяющих её от всех ранее известных способов классической коммерции благодаря исключительным коммуникативным характеристикам Интернета

Системы электронной коммерции должны обладать способностью координировать бизнес-транзакции в многочисленных бизнес-приложениях, уметь извлекать отдельные части информации из различных источников, своевременно и беспрепятственно доставлять клиенту необходимую информацию, — все по единственному Web-запросу пользователя.

СЭК обладает набором специфических свойств, которые отличают их от классических систем коммерции (обыкновенные магазины, супермаркеты, биржи и т.п.). В то же время эти свойства необходимо учитывать при построении и анализе моделей процессов в СЭК, поскольку классическая постановка оптимизационной задачи оптимального управления дискретной системой не подходит. Итак, свойства СЭК: Время работы неограниченно в отличие от классических систем, где есть строго регламентированное расписание работы. Можно говорить о том, что поток посетителей распределен равномерно во времени. В отличие от классических систем в СЭК (особенно это характерно для систем класса B2C) посетители приходят не только за покупками, но и за получением некоторой информации: ознакомиться с ассортиментом, ценами, условиями оплаты и доставки товара.

В то же время для классических систем характерна такая особенность, что посетители с очень большой долей вероятности становятся покупателями. Поэтому возможно рассмотрение различных моделей и способов оценки эффективности функционирования СЭК: соотношение числа покупателей к числу посетителей, влияние работы СЭК и обратной связи на входной поток заявок.

Для СЭК характерно, что многие посетители приходят туда несколько раз, чтобы получить некоторую информацию, и только после того, как они будут удовлетворены всеми условиями, они сделают покупку.

СЭК может обслуживать одновременно достаточно большое число посетителей. Эта характеристика ограничена только программно-аппаратными возможностями СЭК. То есть в случае СЭК с точки зрения пользователя нет очередей ожидания обслуживания. Особенно это характерно для полностью или частично автоматизированных СЭК.

В СЭК возможен случай, когда посетитель, набравший продукцию в виртуальную корзину, покидает систему, не совершив покупки (при этом естественно, что вся продукция остаётся в системе, поскольку украсть её просто невозможно). Проводя аналогию с классическими торговыми системами, опять же трудно представить себе ситуацию, когда посетитель, зайдя в магазин, сначала нагружает полную тележку товарами, а потом все разгружает и покидает магазин. В СЭК этот случай возможен, если набор управляющих факторов не является оптимальным (или субоптимальным)

Системы управления базами данных позволяют объединять большие объемы информации и обрабатывать их, сортировать, делать выборки по определённым критериям и т.п.

Современные СУБД дают возможность включать в них не только текстовую и графическую информацию, но и звуковые фрагменты и даже видеоклипы. Простота использования СУБД позволяет создавать новые базы данных, не прибегая к программированию, а пользуясь только встроенными функциями. СУБД обеспечивают правильность, полноту и непротиворечивость данных.

2. ИСПОЛЬЗОВАНИЕ БАЗ ДАННЫХ В ИНФОРМАЦИОННЫХ СИСТЕМАХ ПРОФЕССИОНАЛЬНОГО НАЗНАЧЕНИЯ

Информационная технология обработки данных предназначена для решения хорошо структурированных задач, по которым имеются необходимые входные данные и известны алгоритмы и другие стандартные процедуры их обработки. Эта технология применяется на уровне операционной (исполнительской) деятельности персонала невысокой квалификации в целях автоматизации некоторых рутинных постоянно повторяющихся операций управленческого труда. Поэтому внедрение информационных технологий и систем на этом уровне существенно повысит производительность труда персонала, освободит его от рутинных операций, возможно, даже приведет к необходимости сокращения численности работников.

На уровне операционной деятельности решаются следующие задачи:

  1. Обработка данных об операциях, производимых фирмой;
  2. Создание периодических контрольных отчетов о состоянии дел в фирме;
  3. Получение ответов на всевозможные текущие запросы и оформление их в виде бумажных документов или отчетов.

Существует несколько особенностей, связанных с обработкой данных, отличающих данную технологию от всех прочих:

  1. Выполнение необходимых фирме задач по обработке данных. Каждой фирме предписано законом иметь и хранить данные о своей деятельности, которые можно использовать как средство обеспечения и поддержания контроля на фирме. Поэтому в любой фирме обязательно должна быть информационная система обработки данных и разработана соответствующая информационная технология;
  2. Решение только хорошо структурированных задач, для которых можно разработать алгоритм;
  3. Выполнение стандартных процедур обработки. Существующие стандарты определяют типовые процедуры обработки данных и предписывают их соблюдение организациями всех видов;
  4. Выполнение основного объема работ в автоматическом режиме с минимальным участием человека;
  5. Использование детализированных данных. Записи о деятельности фирмы имеют детальный (подробный) характер, допускающий проведение ревизий. В процессе ревизии деятельность фирмы проверяется хронологически от начала периода к его концу и от конца к началу;
  6. Акцент на хронологию событий;
  7. Требование минимальной помощи в решении проблем со стороны специалистов других уровней.

Представим основные компоненты информационной технологии обработки данных (рис. 1) и приведем их характеристики.

Сбор данных. По мере того как фирма производит продукцию или услуги, каждое ее действие сопровождается соответствующими записями данных. Обычно действия фирмы, затрагивающие внешнее окружение, выделяются особо как операции, производимые фирмой.

051914 0056 2 ПОНЯТИЕ БАЗЫ И БАНКОВ ДАННЫХ И ИХ НАЗАНЧЕНИЕ

Рис. 1. Основные компоненты информационной технологии обработки данных

Обработка данных. Для создания из поступающих данных информации, отражающей деятельность фирмы, используются следующие типовые операции:

  1. Классификация или группировка. Первичные данные обычно имеют вид кодов, состоящих из одного или нескольких символов. Эти коды, выражающие определенные признаки объектов, используются для идентификации и группировки записей;
  2. Сортировка, с помощью которой упорядочивается последовательность записей;
  3. Вычисления, включающие арифметические и логические операции. Эти операции, выполняемые над данными, дают возможность получать новые данные;
  4. Укрупнение или агрегирование, служащее для уменьшения количества данных и реализуемое в форме расчетов итоговых или средних значений.

Хранение данных. Многие данные на уровне операционной деятельности необходимо сохранять для последующего использования либо здесь же, либо на другом уровне. Для их хранения создаются базы данных.

Создание отчетов (документов). 

В информационной технологии обработки данных необходимо создавать документы для руководства и работников фирмы, а также для внешних партнеров. При этом документы или в связи с проведенной фирмой операцией так и периодически в конце каждого месяца, квартала или года.

Содержимое базы данных при помощи соответствующего программного обеспечения преобразуется в периодические и специальные отчеты, поступающие к специалистам, участвующим в принятии решений в организации. База данных, используемая для получения указанной информации, должна состоять из двух элементов:

1) данных, накапливаемых на основе оценки операций, проводимых фирмой;

2) планов, стандартов, бюджетов и других нормативных документов, определяющих планируемое состояние объекта управления (подразделения фирмы).

На пользовательском уровне достижения информатики проявляются в создании и развитии информационных систем, обеспечивающих хранение и преобразование необходимых пользователю данных.

Информационная система (ИС) в целом — автоматизированная система, предназначенная для организации, хранения, пополнения, поддержки и представления пользователям информации в соответствии с их запросами.

Рассмотрим укрупненную функциональную схему информационной системы (рисунок 2).

051914 0056 3 ПОНЯТИЕ БАЗЫ И БАНКОВ ДАННЫХ И ИХ НАЗАНЧЕНИЕ

1 — система организации, хранения и представления информации;

2 — система ввода, обновления и корректировки информации;

3 — система потребления информации.

Рис. 2 Укрупненная функциональная схема информационной системы

Как видно из этой схемы, область определения любой информационной системы (предметная область) представляет собой некоторое информационное пространство, содержащее совокупность информационных объектов. Каждый из объектов может быть описан с точки зрения систем организации и хранения, ввода, обработки и поиска информации, систем потребления информации и взаимосвязей данного объекта с другими объектами рассматриваемой предметной области. В общем случае информационное пространство неоднородно, так как содержит информационные объекты, различающиеся по методам формирования, организации и пополнения информации.

Все преобразования информации, осуществляемые системой 1, можно свести к пяти основным процедурам: хранение, поиск, обработка, ввод, вывод. Первые три процедуры являются внутренними, а четвертая и пятая обеспечивают связь данной системы с объектами предметной области, т. е. источниками информации и внешней средой (потребителями информации). Таким образом, любая информационная система и обрабатываемая ею информация образуют сложную неоднородную систему, которая в свою очередь, является элементом еще более сложной глобальной системы «природа — человек — человеческая деятельность-общество».

Эффективность управления любой динамической системой (технологическим процессом, производством, процессом создания нового изделия и т. д.) во многом определяется тем, как организованы хранение, поиск, обработка и пополнение информации. Очевидно, что управление возможно только в той системе, в которой четко определены информационные связи как между отдельными элементами, так и с внешней средой. В этом случае обеспечиваются возможность координации деятельности различных подсистем, сопряжения данной системы управления с системами более высокого и более низкого уровней.

Информация, выдаваемая информационной системой потребителю, является одним из ресурсов, позволяющих повысить производительность труда и эффективность его деятельности. Важнейшим аспектом взаимоотношений потребителя и информационной системы является по возможности наиболее полное и рациональное удовлетворение информационной потребности пользователя, другими словами, обеспечение эффективного использования информационных ресурсов. Это, в свою очередь, предполагает доведение информации до потребителя в требуемом объеме, в заданные сроки и удобной для восприятия форме. Именно использование информационных ресурсов, таким образом, позволяет минимизировать расход всех других видов ресурсов (материальных, трудовых, финансовых, вычислительных) при информационном обеспечении потребителей.

Таким образом, информационные ресурсы представляют собой один из обязательных элементов, необходимых для осуществления любого вида человеческой деятельности: производства, управления, научных исследований, проектирования новой техники и технологии, подготовки и переподготовки кадров.

Информационные системы, содержащие информационные ресурсы, разделяют по масштабу на одиночные, групповые, корпоративные.

Одиночные информационные системы реализуются на автономном компьютере. Такая система может содержать несколько простых приложений, связанных общим информационным фондом, и рассчитана на работу одного пользователя или группы пользователей, разделяющих по времени одно рабочее место.

Групповые информационные системы ориентированы на коллективное использование информации членами рабочей группы (одного подразделения), чаще всего строятся на основе локальной вычислительной сети. Однотипные или специализированные рабочие места обеспечивают вызов одного или нескольких конкретных приложений. Общий информационный фонд представляет собой базу данных или совокупность файлов документов.

Корпоративные информационные системы являются развитием систем для рабочих групп и ориентированы на масштаб предприятия, могут поддерживать территориально разнесенные узлы или сети. Главная особенность — обеспечение доступа из подразделения к центральной или распределенной базе данных предприятия (организации) помимо доступа к информационному фонду рабочей группы.

В зависимости от особенностей применения информационные системы делят на две основные группы: системы информационного обеспечения и системы, имеющие самостоятельное целевое назначение и область применения.

Системы (или подсистемы) информационного обеспечения входят в состав любой автоматизированной управляющей системы и являются ее важнейшими компонентами.

К числу ИС, имеющих самостоятельное значение, относятся информационно-поисковые (ИПС), информационно-справочные системы (ИСС) и информационно-управляющие системы (ИУС) различных видов. Информационно-поисковые и информационно-справочные системы предназначены для хранения и представления пользователю информации (фактографических записей, текстов, документов и т.п.) в соответствии с некоторыми формально задаваемыми характеристиками. Для ИПС и ИСС характерны два основных этапа функционирования: сбор и хранение информации; поиск и выдача информации пользователю. Движение информации в таких системах осуществляется по замкнутому контуру от источника к потребителю информации. При этом ИПС или ИСС выступает лишь как средство ускорения поиска необходимых данных. Наиболее сложным процессом с точки зрения его реализации выступает поиск необходимой информации, который осуществляется в соответствии со специально создаваемым поисковым образом документа (ПОД), текста и т.п.

В зависимости от режима организации поиска ИПС и ИСС могут быть разделены на документальные и фактографические.

Документальными называют информационно-поисковые системы, в которых реализуется поиск в информационном фонде документов или текстов в соответствии с полученным запросом с последующим предоставлением пользователю этих документов или их копий. Вся обработка полученной информации в документальных ИПС осуществляется самим пользователем.

В зависимости от того, по каким хранимым документам или по их описаниям (вторичным документам) осуществляется поиск, документальные ИПС часто делят на системы с библиотечным или системы c библиографическим поиском. В первом случае поиск ведется в информационном фонде, содержащем первичные документы, во втором — в информационном фонде вторичных документов.

Фактографические информационно-поисковые системы реализуют поиск и выдачу фактов, текстов, документов, содержащих сведения, которые могут удовлетворить поступивший запрос пользователя. В этом случае осуществляются поиск не какого-то конкретного документа, а всей совокупности сведений по данному запросу, хранящихся в информационном фонде ИПС или ИСС. Основным отличием фактографических информационно-поисковых систем от документальных является то, что эти системы предоставляют пользователю не только ранее введенный документ, но и обработанную информацию.

Еще одним признаком классификации ИПС и ИСС может выступать реализуемый режим распространения информации. По этому признаку различают:

— системы с режимом избирательного распространения информации (ИРИ), обеспечивающие организацию периодического (раз в неделю, раз в месяц, раз в квартал и т. п.) поиска информации в соответствии с заданным ПОД в массиве новых поступлений в информационный фонд ИПС и предоставление пользователю сообщений о появлении таких документов;

— системы с режимом ретроспективного поиска (РП), реализующие поиск информации по заданным ПОД во всем информационном фонде ИПС или ИСС;

— интегральные системы, в которых реализованы как ИРИ-режим, так и РП-режим.

ЗАКЛЮЧЕНИЕ

Под банком данных понимается совокупность баз данных, а также программные, языковые и другие средства, предназначенные для централизованного накопления данных и их использования с помощью электронных вычислительных машин. В состав банка данных входят одна или несколько баз данных, справочник баз данных, система управления базами данных (СУБД), а также библиотеки запросов и прикладных программ. Банк данных предназначен для хранения больших массивов информации, быстрого поиска нужных сведений и документов. Ядром банка являются базы данных и базы знаний. База данных — это организованная структура, предназначенная для хранения информации. Данные и информация — понятия взаимосвязанные, но не тождественные, должен заметить несоответствие в этом определении. Основные требования, предъявляемые к базам данных: адекватность отображения предметной области (полнота, целостность непротиворечивость данных, актуальность информации; возможность взаимодействия пользователей разных категорий, высокая эффективность доступа к данным; дружелюбность интерфейсов, малое время на обучение; обеспечение секретности и разграничение доступа к данным для разных пользователей; надежность хранения и защита данных.

СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ

  1. Дейт К. Дж. Введение в системы баз данных Introduction to Database Systems. — 8-е изд. — М.: «Вильямс», 2006. – 1158 с.
  2. Информатика для юристов и экономистов / Под ред. С.В. Симоновича. –СПб.: Питер, 2001.
  3. Корнеев В. В., Гареев А. Ф., Васютин С.В., Райх В. В. Базы данных. Интеллектуальная обработка информации. – М.: Нолидж, 2001.- 352 с.
  4. Корнеев И.И., Машурцев В.А. Информационные технологии в управлении.–М.: ИНФРА-М, 2001.
  5. Четвериков В.Н., Ревунков Г.И., Самохвалов Т.М. Базы и банки данных. – М.: Высшая школа, 1987. – 248 с.