Способы организации размещения данных

Простейшая единица данных (одно или группа) называется записью.

Различают логическую и физическую форму записи. Обозначения записи какими-либо символами и цифрами называется логической записью, а ее содержание, размещенное на каком-либо физическом носителе, например магнитной ленте или диске, — физической записью или блоком. Таким образом, логическая запись – форма записи, воспринимаемая пользователем, а физическая запись – материализованная форма логической записи.

Обычно запись содержит не только числовые значения данных, но и вспомогательную информацию, позволяющую отличать записи друг от друга. Эта информация называется ключом записи. Различают два типа ключей – ключи порядка, с помощью которых определяется место записи в базе данных среди других записей, и смысловые ключи (ключи типа данных), определяющие смысловое содержание записи и позволяющие выделить данную запись среди других.

Работа с записями может выполняться в трех основных режимах: последовательная обработка, произвольная обработка (в произвольном порядке) и корректировка.

Рассмотрим теперь основные четыре способа организации размещения записей: последовательный, прямой, библиотечный и индексно-последовательный.

Последовательная организация записей состоит в последовательном размещении логических записей друг за другом. При этом физические записи могут либо следовать подряд друг за другом, либо располагаться в различных местах носителя информации. В последнем случае записи организуются в виде связанного списка, когда в конце каждой записи имеется указание начала следующей записи.

Прямая организация записей состоит в том, что ключ логической записи однозначно определяет физический адрес ее начала.

Прямая организация файла данных предполагает произвольный режим его обработки и отличается высокой скоростью поиска отдельных логических записей, который состоит лишь в поиске нужного ключа и определении по нему адреса начала записи.

Библиотечная организация данных может рассматриваться как вариант прямой организации. Записи разделяются на группы, называемые разделами. Каждый раздел получает свое имя. Список имен и адреса начала первых и конца последних записей каждого раздела помещаются в начале файла и образуют его оглавление (каталог). Таким образом, поиск нужного раздела состоит в просмотре каталога. Внутри раздела записи могут организовываться любым способом.

Индексно-последовательная организация данных предназначена для ускорения поиска записей по сравнению с последовательной организацией. Логические записи размещаются по мере возрастания значений их ключей порядка. Файл ключей порядка записей разбивается на части так, что начальные адреса этих частей, называемые индексами, образуют иерархическую структуру типа дерева, верхние уровни которого соответствуют более крупным частям, а нижние – более мелким.