Зарегистрироваться

Реляционная база данных

Категории Математическая кибернетика | Под редакцией сообщества: Математика

Реляционная база данных (РБД) – база данных, логическая представление которой описывается на языке алгебры отношений.

Заслуга разработки и развития реляционной модели данных принадлежит  Е. Кодду.

Пусть даны множества D1, D2, …, Dn. Подмножество R декартова произведения множеств D1, D2, …, Dn называется отношением, множества D1, D2, …, Dn доменами отношения R, элементы отношения – кортежами, число n – степенью или арностью отношения, а число кортежей – мощностью отношения.

Отношение представляется двумерной таблицей. Строки таблицы (экземпляры записей) называются кортежами, а столбцы – атрибутами. Областью значений i-го атрибута является i-ый домен отношения. Отношению и атрибутам присваиваются имена. Если отношение называется R, а имена его атрибутов U1, U2, …, Un, то схема отношения обозначается следующим образом: R(U1, U2, …, Un).

В таблице, задающей отношение, все строки различны. Подмножество атрибутов отношения называется ключом, если в таблице, образованной только столбцами из ключа, все строки различны, но удаление любого атрибута из ключа нарушает это свойство, т.е. понятие ключа соответствует понятию тупикового теста. Отношение может иметь несколько ключей, называемых возможными, среди них выбирается один и называется первичным.

РБД – это множество двумерных таблиц (отношений) с операциями над отношениями. Множество операций над отношениями обычно состоит из стандартных теоретико-множественных операций: объединения, пересечения, разности, декартова произведения, и специальных операций: проекции, соединения, селекции, частного. Алгебра отношений составляет теоретическую основу РБД.

С помощью метода нормализации можно древовидное или сетевое описание преобразовать к набору плоских таблиц. Основную идею этого метода можно продемонстрировать на примере разрешения одной связи в древовидном описании. Пусть запись СЛУЖАЩИЙ(НОМЕР-СЛУЖАЩЕГО, ИМЯ-СЛУЖАЩЕГО) имеет в качестве потомка запись ДЕТИ(ИМЯ-РЕБЕНКА, ВОЗРАСТ-РЕБЕНКА). Эту связь можно представить в виде следующих схем отношений СЛУЖАЩИЙ(НОМЕР-СЛУЖАЩЕГО, ИМЯ-СЛУЖАЩЕГО); ДЕТИ(НОМЕР-СЛУЖАЩЕГО, ИМЯ-РЕБЕНКА, ВОЗРАСТ-РЕБЕНКА). Связи между объектами можно представлять также введение нового отношения, при этом роль атрибутов отношения играют объекты, участвующие в связи.

Чтобы повысить устойчивость логического описания к операциям добавления новых данных, новых связей между ними и определения новых способов их использования, к исходным схемам отношений применяют процедуру нормализации. На первом этапе нормализации происходит переход к первой нормальной форме (ПНФ). Схема отношения находится в ПНФ тогда и только тогда, когда все входящие в нее атрибуты являются атомарными, т.е. элементы доменов не являются множествами. Например, схема отношения РЕБЕНОК(ФИО, ДАТА-РОЖДЕНИЯ) при переходе к ПНФ превращается в РЕБЕНОК(Ф., И., О., ЧИСЛО, МЕСЯЦ, ГОД). Атрибут (набор атрибутов) A отношения R функционально зависит от атрибута (набора атрибутов) B того же отношения R, если значение A однозначно определяется значением B. Атрибут (набор атрибутов) A отношения R называется полностью зависимым от другого набора атрибутов B отношения R, если A функционально зависит от всего множества B, но не зависит ни от какого подмножества B. Атрибут, входящий в ключ отношения, называется первичным. На втором этапе нормализации осуществляется переход ко второй нормальной форме. Отношение задано во второй нормальной форме (ВНФ), если оно является отношением в ПНФ, и каждый атрибут, не являющийся первичным атрибутом в этом отношении, полностью зависит о любого возможного ключа этого отношения. Пусть A, B и C – три атрибута (набора атрибутов) отношения R. Если C зависит от B, а B – от A, но A не зависит от B или B не зависит от C, то говорят, что C транзитивно зависит от A. При переходе от ВНФ к третьей нормальной форме ликвидируются транзитивные зависимости, при этом отношение, содержащее транзитивную зависимость, расщепляется на два.

Такие преимущества РБД как простота, гибкость, устойчивость к операциям обновления (после нормализации) и др. объясняют, почему РБД являются наиболее распространенными в настоящее время.

Рекомендуемая литература

Мейер Д. Теория реляционных баз данных. Мир, Москва, 1987

Codd E. F. A Relation Model of Data for Large Shared Data Banks, Comm. ACM 13, 6, ACM, New York, London, Amsterdam, June 1970, 377--387

Codd E. F. Further Normalization of the Data Base Relational Model, Courant Computer Sci. Symposia (vol. 6: "Data-Base System"), ed. by R. Rustin, Prentice- Hall, Inc., Englewood Cliffs, New Jersey, 1972

Эта статья еще не написана, но вы можете сделать это.