Развитие идей и приложений реляционной СУБД System R

Используемая терминология


Что касается общей терминологии реляционного подхода, то она является достаточно установившейся, и мы будем активно ей пользоваться. К таким терминам относятся названия реляционных операций - селекция, проекция, соединение; названия теоретико-множественных операций - объединение, пересечение, разность и т.д.

В тех случаях, когда традиционная терминология System R расходится с общепринятой, мы будем отдавать предпочтение терминологии System R. В частности, это касается использования термина "поле отношения" вместо "атрибут отношения".

В самой System R при переходе к коммерческим системам также произошла некоторая смена терминологии. В частности, в некоторых последних публикациях появилась тенденция к употреблению более привычных в среде пользователей IBM терминов: файл, запись и т.д. В этой статье мы будем использовать термины System R, более близкие реляционным системам. Далее мы определим некоторые основные термины System R, исходя при этом в основном не из теоретических предпосылок, а стремясь в большей степени отразить практические аспекты соответствующих понятий.

Базовым понятием System R является понятие таблицы (приб- лиженный к реализации эквивалент основного понятия реляционного подхода отношения; иногда, в зависимости от контекста, мы будем использовать и этот термин). Таблица - это некоторая регулярная структура, состоящая из конечного набора однотипных записей - кортежей. Каждый кортеж одного отношения состоит из конечного (и одинакового) числа полей кортежа, причем i-тое поле каждого кортежа одного отношения может содержать данные только одного типа, и число допустимых типов данных в System R предопределено и фиксировано. В силу регулярности структуры отношения понятие поля кортежа расширяется до понятия поля таблицы. I-тое поле таблицы можно трактовать как набор одноместных кортежей, полученных выборкой i-тых полей из каждого кортежа этой таблицы, т.е. в общепринятой терминологии как проекцию отношения на i-тый атрибут. В терминологию System R не входит понятие домена, оно заменяется здесь понятием типа поля, т.е.
типом допустимых данных, которые могут храниться в данном поле (это не вполне эквивалентная замена, но такова реальность System R). Таблицы, составляющие базу данных System R, могут физически храниться в одном или нескольких сегментах, которые проще всего понимать как файлы внешней памяти (и это вполне соответствует действительности). Сегменты разбиваются на страницы, в которых располагаются кортежы отношений и вспомогательные служебные структуры данных индексы. Соответственно, каждый сегмент содержит две группы страниц - страницы данных и страницы индексной информации. Страницы каждой группы имеют фиксированный размер, но страницы с индексной информацией меньше по размеру, чем страницы данных. В страницах данных могут располагаться кортежи более, чем одного отношения (это очень важное свойство физической организации баз данных System R; полностью разъяснить следующие из этой организации преимущества мы сможем только в Разделе 3). Этим, конечно, не исчерпывается набор понятий System R, но остальные термины мы будем вводить по ходу изложения, поскольку для этого требуется соответствующий понятийный контекст. | |


Содержание раздела