Автор Анна Евкова
Преподаватель который помогает студентам и школьникам в учёбе.

Распределённые базы данных

Содержание:

1.Введение

Технология распределенных баз данных, получившая в настоящее время широкое распространение, способствует обратному переходу от централизованной обработки данных к децентрализованной. Создание технологии систем управления распределенными базами данных является одним из самых больших достижений в области баз данных.

Основной причиной разработки информационных систем, использующих базы данных, является стремление интегрировать все обрабатываемые в организации данные в единое целое и обеспечить к ним контролируемый доступ. Хотя такая интеграция способствует централизации, последняя не является самоцелью. Создание компьютерных сетей приводит к децентрализации обработки данных. Децентрализованный подход, по сути, отражает организационную структуру предприятия, логически состоящего из отдельных подразделений, отделов, групп и тому подобного, которые физически распределены по разным офисам, отделениям или филиалам, причем каждая отдельная единица имеет дело с собственным набором обрабатываемых данных [1, 2]. Разработка распределенных баз данных, отражающих организационные структуры предприятий, позволяет сделать данные, поддерживаемые каждым из существующих подразделений, общедоступными, обеспечив при этом их сохранение именно в тех местах, где они чаще всего используются. Подобный подход расширяет возможности совместного использования информации, одновременно повышая эффективность доступа к ней.

Распределенные системы решают проблему островов информации. Базы данных можно представить, как некие электронные острова, представляющие собой отдельные, и в общем случае, труднодоступные места, подобные удаленным друг от друга островам. Такое положение может являться следствием географической разобщенности, несовместимости используемой архитектуры компьютеров, несовместимости используемых коммутационных протоколов и т.д. Интеграция отдельных баз данных в одно логическое целое способна изменить подобное положение дел.

2. Основные понятия и определения

Распределенная база данных – это набор логически связанных между собой разделяемых данных и их описаний, которые физически распределены в некоторой компьютерной сети.

Распределенная система управления базой данных (РСУБД) – это программная система, предназначенная для управления распределенными базами данных и позволяющая сделать распределенность информации прозрачной для конечного пользователя.

Распределенная система управления базами данных состоит из единой логической базы данных, разделенной на некоторое количество фрагментов. Каждый фрагмент базы данных хранится на одном или нескольких компьютерах (узлах, sites), которые соединены между собой коммуникационной сетью и каждый из которых работает под управлением отдельной СУБД. Любой пользователь может выполнить операции над данными на своем локальном узле точно так же, как если бы этот узел вовсе не входил в распределенную систему (что создает определенную степень локальной автономии). С другой стороны, любой узел способен обрабатывать данные, сохраняемые на других компьютерах сети.

Пользователи взаимодействуют с распределенной базой данных через приложения. Локальные приложения не требуют доступа к данным на других узлах, глобальные приложения требуют подобного доступа. В распределенной СУБД должно существовать хотя бы одно глобальное приложение, поэтому любая РСУБД должна иметь следующие особенности.

  • Набор логически связанных разделяемых данных.
  • Сохраняемые данные разбиты на некоторое количество фрагментов.
  • Между фрагментами может быть организована репликация данных.
  • Фрагменты и их реплики распределены по различным узлам.
  • Узлы связаны между собой сетевыми соединениями.
  • Работа с данными на каждом узле управляется СУБД.
  • СУБД на каждом узле способны поддерживать автономную работу локальных приложений

3. Характеристики

  • Базы данных в коллекции логически взаимосвязаны друг с другом. Часто они представляют собой единую логическую базу данных.
  • Данные физически хранятся на нескольких сайтах. Данные на каждом сайте могут управляться СУБД независимо от других сайтов.
  • Процессоры на сайтах подключены через сеть. Они не имеют многопроцессорной конфигурации.
  • Распределенная база данных не является слабо связанной файловой системой.
  • Распределенная база данных включает обработку транзакций, но она не является синонимом системы обработки транзакций.

Базы данных в коллекции логически взаимосвязаны друг с другом. Часто они представляют собой единую логическую базу данных.

Данные физически хранятся на нескольких сайтах. Данные на каждом сайте могут управляться СУБД независимо от других сайтов.

Процессоры на сайтах подключены через сеть. Они не имеют многопроцессорной конфигурации.

Распределенная база данных не является слабо связанной файловой системой.

Распределенная база данных включает обработку транзакций, но она не является синонимом системы обработки транзакций.

4. Система управления распределенной базой данных

Распределенная система управления базами данных (DDBMS) — это централизованная программная система, которая управляет распределенной базой данных таким образом, как если бы она все хранилась в одном месте.

Характеристики

  • Он используется для создания, поиска, обновления и удаления распределенных баз данных.
  • Он периодически синхронизирует базу данных и предоставляет механизмы доступа, благодаря которым распределение становится прозрачным для пользователей.
  • Это гарантирует, что данные, измененные на любом сайте, будут постоянно обновляться.
  • Он используется в прикладных областях, где большие объемы данных обрабатываются и доступны множеству пользователей одновременно.
  • Он предназначен для гетерогенных платформ баз данных.
  • Он поддерживает конфиденциальность и целостность данных баз данных.

Он используется для создания, поиска, обновления и удаления распределенных баз данных.

Он периодически синхронизирует базу данных и предоставляет механизмы доступа, благодаря которым распределение становится прозрачным для пользователей.

Это гарантирует, что данные, измененные на любом сайте, будут постоянно обновляться.

Он используется в прикладных областях, где большие объемы данных обрабатываются и доступны множеству пользователей одновременно.

Он предназначен для гетерогенных платформ баз данных.

Он поддерживает конфиденциальность и целостность данных баз данных.

5.Мульти базовые системы

Одной из разновидностей, распределенных СУБД являются мульти базовые системы.

Мульти базовая система – распределенная система управления базами данных, в которой управление каждым из узлов осуществляется совершенно автономно.

В мульти базовых системах предпринимается попытка интеграции таких распределенных систем баз данных, в которых весь контроль над отдельными локальными системами целиком и полностью осуществляется их операторами. Полная автономия узлов позволяет не вносить какие- либо изменения в локальные СУБД. Следовательно, мульти базовые СУБД требуют создания поверх существующих локальных систем дополнительного уровня программного обеспечения, предназначенного для предоставления необходимой функциональности.

Мульти базовые системы позволяют конечным пользователям разных узлов получать доступ и совместно использовать данные без необходимости физической интеграции существующих баз данных. Они обеспечивают пользователям возможность управлять базами данных их собственных узлов без какого-либо централизованного контроля, который обязательно присутствует в обычных типах РСУБД. Администратор локальной базы данных может разрешить доступ к определенной части своей базы данных посредством создания схемы экспорта, определяющей, к каким элементам локальной базы данных смогут получать доступ внешние пользователи.

Говоря простыми словами, мульти базовая СУБД является такой СУБД, которая прозрачным образом располагается поверх существующих баз данных и файловых систем, предоставляя их своим пользователям как некоторую единую базу данных. Такая поддержка глобальной схемы позволяет пользователям на основании этой схемы строить запросы и модифицировать данные. Мульти базовая СУБД работает только с глобальной схемой, тогда как локальные СУБД собственными силами обеспечивают поддержку данных всех их пользователей. Глобальная схема создается посредством интеграции схем локальных баз данных. Программное обеспечение мульти базовой СУБД предварительно транслирует глобальные запросы и превращает их в запросы и операторы модификации данных соответствующих локальных СУБД. Полученные после выполнения локальных запросов результаты сливаются в единый глобальный результат, предоставляемый пользователю. Кроме того, мульти базовая СУБД осуществляет контроль за выполнением фиксации или отката отдельных операций глобальных транзакций локальных СУБД, а также обеспечивает сохранение целостности данных в каждой из локальных баз данных. Программы мульти базовой СУБД управляют различными шлюзами, с помощью которых контролируют работу локальных СУБД.

6.Преимущества и недостатки распределенных СУБД

Основной причиной использования распределенных баз данных является то, что обычно предприятия уже распределены, по крайней мере, логически, т.е. на подразделения, отделы, рабочие группы и т.д. Крупные организации могут быть распределены и физически на отделения, заводы, лаборатории, которые могут находиться в разных концах страны и даже за ее пределами. Вполне логично будет предположить, что данные также распределены, поскольку каждая организационная единица создает и обрабатывает собственные данные, относящиеся к деятельности этой единицы. Таким образом, информация предприятия разбивается на части, которые можно назвать островами информации. Распределенная база данных обеспечивает мосты для их соединения в целое. В подобной базе данных персонал отделения компании сможет выполнять необходимые ему локальные запросы. Руководству компании может потребоваться выполнять глобальные запросы, предусматривающие получение доступа к данным, хранящимся во всех отделениях компании. Иначе говоря, распределенная система позволяет структуре базы данных отражать структуру организации. Это является наиболее важным преимуществом распределенных СУБД.

В распределенных системах данные размещаются на том сайте, на котором зарегистрированы пользователи, которые их чаще всего используют. В результате пользователи этого узла получают локальный контроль над требуемыми им данными и могут регулировать локальные ограничения на их использование. В этом заключается разделимость и локальная автономность распределенных СУБД.

В централизованных СУБД отказ центрального компьютера вызывает прекращение функционирования всей СУБД. Распределенные СУБД проектируются так, чтобы обеспечить работоспособность системы, несмотря на отказ одного из узлов РСУБД или линии связи между узлами. Это достигается организацией репликации данных, так что данные и их копии будут размещены на более чем одном сайте. Система будет перенаправлять запросы к отказавшему узлу в адрес другого сайта. Это приводит к повышению надежности системы и доступности данных.

В настоящее время считается, что намного дешевле собрать из небольших компьютеров систему, мощность которой будет эквивалентна мощности одного большого компьютера. Оказывается, что намного выгоднее устанавливать в подразделениях организации собственные маломощные компьютеры, кроме того, гораздо дешевле добавить в сеть новые рабочие станции, чем модернизировать систему с мейнфреймом. Из этого следуют экономические преимущества использования РСУБД.

Благодаря модульности распределенной среды расширение существующей системы осуществляется намного проще. Добавление в сеть нового узла не оказывает влияния на функционирование уже существующих. Подобная гибкость позволяет организации легко расширяться. В централизованных СУБД рост размера базы данных может потребовать замены и вычислительной системы на более мощную, и используемого программного обеспечения на более мощную и гибкую СУБД.

Распределенным системам свойственны и некоторые недостатки, наиболее существенным из которых является повышение сложности, по крайней мере, с технической точки зрения. Распределенные СУБД являются более сложными программными комплексами, чем централизованные СУБД. Достаточно указать на тот факт, что данные могут подвергаться репликации. Если репликация данных не будет поддерживаться на требуемом уровне, система будет иметь более низкий уровень доступности данных, надежности и производительности, чем централизованные системы.

В распределенных системах могут возникнуть проблемы защиты не только данных, реплицируемых на несколько различных сайтов, но и защиты сетевых соединений самих по себе. В централизованных системах доступ к данным легко контролируется.

Усложнение контроля за целостностью данных – еще один из недостатков, распределенных СУБД. Требования обеспечения целостности (корректности и согласованности данных) формулируются в виде ограничений. Выполнение ограничений гарантирует защиту информации в базе данных от разрушения. Реализация таких ограничений целостности требует доступа к большому количеству данных, используемых во время проверок. В распределенных СУБД повышенная стоимость передачи и обработки данных может препятствовать организации эффективной защиты от нарушений целостности данных.

Наконец, нельзя не сказать об усложнении процедуры проектирования базы данных. Помимо обычных проблем, связанных с проектированием централизованных баз данных, разработка распределенных СУБД требует принятия решения о фрагментации данных, распределения фрагментов по отдельным сайтам и организации процедур репликации данных.

7. Бедствия распределенных баз данных

Ниже приведены некоторые неприятности, связанные с распределенными базами данных.

Потребность в сложном и дорогом программном обеспечении — DDBMS требует сложного и часто дорогостоящего программного обеспечения для обеспечения прозрачности данных и координации на нескольких сайтах.

Затраты на обработку — даже простые операции могут потребовать большого количества сообщений и дополнительных вычислений для обеспечения единообразия данных на всех площадках.

Целостность данных. Необходимость обновления данных на нескольких сайтах создает проблемы целостности данных.

Затраты на неправильное распределение данных. Отзывчивость запросов во многом зависит от правильного распределения данных. Неправильное распределение данных часто приводит к очень медленному ответу на пользовательские запросы.

Используемые источники:

http://www.inf.vspu.ac.ru/umm_chul/files/pido/lection2.pdf

https://docplayer.ru/30187268-Raspredelennye-bazy-dannyh-vvedenie.html

https://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D1%91%D0%BD%D0%BD%D0%B0%D1%8F_%D0%B1%D0%B0%D0%B7%D0%B0_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85

https://coderlessons.com/tutorials/akademicheskii/izuchite-raspredelennuiu-subd/raspredelennaia-subd-raspredelennye-bazy-dannykh