3.2. Информационное обеспечение ССВ

Основу информационного обеспечения ССВ составляют общегородские справочники, словари и классификаторы, а также база данных метаинформации по городским информационным системам и ресурсам.

3.2.1. Объектно-ориентированный подход для формального описания объектов городской инфраструктуры

В основу формирования общесистемных справочников и словарей положен объектно-ориентированный подход. Основной смысл объектной идеологии заключается в том, что все информационное пространство, включающее структурированную информацию отраслевых баз данных и неструктурированную информацию органов управления городом, рассматривается как динамическая совокупность информационных объектов.

В соответствии с концептуальной моделью описания инфраструктуры городской территории, включающей объекты и субъекты правоотношений на территории города, исходя из уровней абстракции можно выделить три уровня представления информационных объектов (рис. 3.4):

- обобщенный уровень — информационные объекты описания функционирования городской инфраструктуры;

- отраслевые информационные объекты по функциональной принадлежности;

- информационные объекты пользователя, с которыми работают организации — первоисточники информации.

Различие состоит в правах манипулирования информацией, в регламентирующих документах по порядку обмена и представления информации в системе, правилах внесения изменений, статусе утверждения первоисточников информации и структур ее представления, в выборе классификационных признаков.

Основу информационного пространства ССВ составляют базовые информационные объекты.

Каждый базовый информационный объект имеет один первоисточник данных — организацию, юридически ответственную за эти данные и отвечающую за их достоверность и актуальность. Эта организация в процессе регистрации реальных объектов или отношений при их информационном описании в своей системе определяет и присваивает значение идентификатора (идентификационных признаков).

Базовые информационные объекты используются для конструирования других сложных информационных объектов рассматриваемого или вышестоящих уровней.

Определение информационного объекта заключается в описании его:

- идентификатора;

- параметров территориальной привязки;

- семантических характеристик.

В качестве территориальной привязки могут выступать:

- географические координаты с заданной точностью для картографического топоплана в принятой метрической системе координат;

- позиционное представление на графической схеме, плане;

- опосредованно через семантические характеристики (посредством "адресной привязки").

Введение понятия "адресная привязка" вытекает из исторически сложившегося способа идентификации реальных объектов городской инфраструктуры по "адресам". Прежде всего, к таким объектам относятся здания, сооружения, строения.

Указание местоположения объектов и относительно них описание субъектов деятельности на территории города посредством адресной привязки используется в первую очередь при заполнении различного вида документов.

В настоящее время в городских информационных системах для организации адресной привязки используется совокупность полей Наименование улицы, Тип улицы, Номер дома, Номер строения/корпуса, Номер квартиры/помещения. Причем Наименование и Тип улицы, как правило, вводятся из словаря, а остальные поля заполняются в свободном режиме, без проверки допустимости их значений.

Рис. 3.4. Схема городских информационных объектов

Разработка и внедрение информационных технологий идентификации объектов по их адресу и правильная интерпретация указания местоположения объектов городской инфраструктуры — это одна из первоочередных задач при создании городских информационных ресурсов и интеграции отраслевых и территориальных информационных систем в ОИС.

Решение ее связано с формированием кадастровых городских систем.

Для обеспечения функционирования ССВ и информационной совместимости в рамках ОИС в справочниках баз данных, разрабатываемых и функционирующих информационных систем, следует выделять общесистемную (стандартизованную) часть, используемую в рамках всей ОИС, и внутриведомственную часть, используемую в рамках отдельных ведомств-участников ОИС. 

Принципы описания информационных объектов

Представление информационных объектов осуществляется в виде их справочников, описание которых содержит:

- наименование справочника, описание целей и области его применения в соответствии тем функциям и задачам, в которых он используется;

-

- — организация, ответственная за поддержание в актуальном состоянии и наполнение информацией справочников (источник информации) и соответствующих полей баз данных, классификаторов;

- — особенности работы с этим справочником и, если это необходимо, его связь с другими справочниками, словарями;

- — структура справочника и описание элементов данных.

В описании справочников приведена общесистемная (стандартизуемая) часть, используемая в рамках всей ОИС.

Внутриведомственная часть, используемая в рамках отдельных ведомств-участников ОИС для своих нужд, опущена. 

В описании элементов данных справочника указывается наименование реквизита и способ его представления.

В качестве описания способа представления данных указывается один из простых типов данных, либо их комбинации с перечнем допустимых значений или диапазоном значений.

В качестве простых типов представления данных используются следующие:

Целое — целое число.

Действительное — действительное число.

Строка  — строка литер и ее длина (максимальная длина)

Текст — произвольный набор строк, представляющий собой фрагмент текста.

Дата — календарная дата.

Время — календарное время.

Имя — идентификатор объекта. 

Указатель — тип данных, представляющий указатель на элемент упорядоченного набора величин; такой набор задается перечислением допустимых значений, либо соответствующим словарем.

Координата — координата точки в единой метрической системе координат картографического топоплана.

Схема (план), карта — графические представления участка поверхности земли с нанесенным изображением объектов.

Общего вида — поле данных произвольной структуры.

Для сокращения описания справочников и большей ясности представления в ряде случаев используется составной тип данных, представляющий собой определенную совокупность из вышеприведенных простых типов.

Вектор значений                                           простого типа,

например: 2*Целое или n*Целое.

Матрица значений                                        простого типа,

например: 3*2*Целое.

Перечень значений                                        одного типа (простого или векторного),

например: n*Целое и n*2*Целое.

Массив значений                                           простого типа,

например: n*n*Целое.

Упорядоченное множество значений          различных типов,

например: (целое, строка).

Для представления адресов объектов, возможно, использовать составной тип данных Адрес (табл. 3.1).

При этом существует несколько видов адресов: градостроительный, почтовый (Комсомольский, Российский, Международный), милицейский (прописки) и т.д. В силу этого составной тип Адрес необходимо задавать с учетом используемого вида адреса.

Таблица 3.1

Используемые структуры типа "Адрес"

Наименование элемента

Тип данных

Адрес Градостроительный — АдресГ:

Рег. номер квартала (микрорайона)

(Целое, Строка)

Рег. номер домовладения (земельного участка) в квартале

(Целое, Строка)

Рег. номер строения в домовладении (земельном участке)

(Целое, Строка)

Тип и рег. номер помещений(я)

n*(Указатель, Целое, Строка)

Адрес на территории г. Комсомольска (милицейский адрес) — АдресТ:

Микрорайон (населенный пункт)

Указатель

Наименование улицы

Имя

Номер дома

(Целое, Строка)

Тип и номер строения (корпуса)

(Указатель, (Целое, Строка))

Тип и рег. номер помещений(я)

n*(Указатель, (Целое, Строка))

Адрес Комсомольский почтовый:

Почтовый индекс

Целое

Микрорайон (населенный пункт)

Указатель

Наименование улицы

Имя

Номер дома

(Целое, Строка)

Тип и номер строения (корпуса)

(Указатель, (Целое, Строка))

Тип и рег. номер помещений(я)

n*(Указатель, (Целое, Строка))

Адрес Российский почтовый:

Почтовый индекс

Целое

Республика в составе РФ или край

Указатель

Область в составе республики (края)

Указатель

Район в составе области

Строка

Населенный пункт

Строка

Наименование улицы

Строка

Тип улицы

Указатель

Номер дома

Строка

Номер строения (корпуса)

Строка

Номер помещения (квартиры)

Строка

Адрес Международный почтовый:

Почтовый индекс

Строка

Страна

Указатель

Населенный пункт

Строка

Наименование улицы

Строка

Тип улицы

Строка

Номер дома

Строка

Номер помещения (квартиры)

Строка

Для обеспечения технологичной работы в рамках ССВ общесистемные справочники должны обеспечивать в различных городских информационных системах простоту выполнения основных операций с данными:

· Добавление            — добавляется описание нового объекта.

· Замена                    — изменяются характеристики реального объекта и как   следствие создается новое его описание (с новым идентификатором), т.е.



в директивном порядке осуществляется замена описания данного объекта на другое.

· Слияние                 — объединение описаний нескольких объектов с образова-         нием одного нового.

· Разукрупнение      — разделение описания одного объекта с образованием нескольких новых.

· Ликвидация           — объект городской инфраструктуры ликвидируется, информация по нему становится "недействительной" и как следствие ликвидируется его описание.

И примыкающую к ним рабочую операцию:

· Изменение             — изменение содержательной части описания конкретного реального объекта без изменения его идентификатора необходимо, в частности, для исправления ошибок (например, грамматических).

Для обеспечения корректности операции поиска и сохранения исторической преемственности необходимо "старые" данные сохранять (архивировать), обеспечивая доступ как к ним от существующих объектов, так и от них к существующим. Это реализуется посредством двунаправленной списковой структуры, где каждый из объектов ссылается как на своих "родителей", так и "потомков".

Для такого описания истории реальных объектов вводится составной тип данных — История, описываемый следующим образом:

Наименование элемента

Тип данных

Статус описания1

Указатель

История рождения:

Дата образования объекта

Дата

Причина

Указатель

Основание (документ)

Строка

Дополнительная информация

Общего вида

История "родителей":

Количество "родителей"

Целое

Объекты "родители" и дополнительная информация

n*(Имя, Общего вида)

История "потомков" при замене, слиянии, разукрупнении объекта:

Количество "потомков"

Целое

Объекты "потомки" и дополнительная информация

n*(Имя, Общего вида)

История ликвидации при ликвидации объекта:

Дата ликвидации объекта

Дата

Причина

Указатель

Основание (документ)

Строка

Дополнительная информация

Общего вида

Другим важным аспектом ведения информации является отслеживание синонимов элементов данных, в частности наименования объектов. Для этого предназначен составной тип данных — Синонимы:

Наименование элемента

Тип данных

Число синонимов

Целое

Синонимы1

n*Тип_данных

Приведенные описания используемых типов данных для представления в ССВ общесистемного информационного обеспечения составляют основу для лингвистического обеспечения ССВ.

Формирование общесистемных справочников и идентификаторов информационных объектов

На основе анализа потребностей пользователей определяются и создаются необходимые перечни справочников требуемых видов информации, определяется их структура, формируются необходимые словари и идентификаторы, выбираются признаки классификации (и их группы), по которым строятся соответствующие классификаторы.

Общесистемные справочники служат для описания городских информационных ресурсов и являются описанием внешнего представления структур баз данных информационных систем организаций — участников ОИС.

Общесистемные справочники и ведущаяся в соответствии с ними информация в различных городских организациях являются основой для построения и ведения общесистемных словарей, классификаторов и их внедрения (рис. 3.5).

Каждый отдельно взятый элемент (поле) или группа элементов данных в общесистемных справочниках ведется одной из организаций. Для встречающихся у нескольких информационных объектов одноименных данных, значения которых используются в разных организациях, в ОИС предусмотрено построение и использование единых для всех организаций общесистемных словарей и классификаторов.

Элементы данных (поля семантических данных и территориальной привязки) делятся на те, значения которых ведущая организация может присваивать независимо от других организаций, и на те, значения которых можно лишь выбирать из общесистемного классификатора в соответствии со структурой его справочника или использовать словарь.

Прежде всего, в общесистемный справочник включаются те поля, которые являются ключевыми и служат для поиска информационных объектов.

Идентификаторы информационных объектов присваиваются и ведутся одной из организаций, осуществляющей первичную регистрацию данного класса информационных объектов в системе и отвечающей за информационное наполнение соответствующего классификатора согласно структуре его справочника.

В случае отличия идентификаторов в информационных системах этих организаций обеспечивается согласование идентификаторов внутренних баз данных с общесистемными идентификаторами.

Тем самым обеспечивается логическая целостность и непротиворечивость ССВ в целом и возможность получения интегрированной информации из информационных систем различных городских организаций.

Рис. 3.5. Схема формирования классификаторов и словарей

3.2.2. Концептуальная структура метабазы

Метабаза, являясь основным инструментом, обеспечивающим централизованное хранение информации о городских информационных системах и ресурсах, должна включать следующие основные группы данных об информационных объектах:

- — адресно-справочную информацию;

- — описание информационной системы, баз данных, используемых и имеющихся классификаторов, других данных;

- — технико-экономические показатели функционирования;

- — данные об информационных услугах и решаемых задачах;

- — словарно-лингвистическую информацию.

Содержательное описание баз данных (метаданные в узком смысле слова) включают сведения о классе объектов, представленных в базе данных и номенклатуру этих объектов.

Информация об объекте, кроме наименования, может быть представлена:

- наименованием атрибутов;

- наименованиями идентифицирующих (ключевых) атрибутов;

- наименованиями источников (документов), из которых извлекается информация об объекте, и количеством атрибутов;

- списком решаемых задач и их владельцев;

- правилами представления в базах данных наименований объектов, признаков и значений, в том числе имен (типов) классификаторов, или других средств, используемых для идентификации, кодирования или представления данных.

Метабаза по информационным системам состоит из трех основных информационных массивов (рис. 3.6):

- Организации,

- Информационные системы,

- Классификаторы и словари.

Информационный массив "Информационные системы" в свою очередь имеет три вспомогательных массива:

- Выходная информация,

- Источники информации,

- Базы данных.

Связь между этими информационными массивами — один ко многим, т.е. организация содержит ссылки на эксплуатирующиеся в ней информационные системы, которые в свою очередь содержат ссылки на используемые классификаторы и словари, используемые в предметных базах данных.

Организации-владельцы классификаторов и общесистемных словарей содержат ссылки на поставляемые ими классификаторы и словари.

Необходима отработка этих ссылок в обоих направлениях, т.е. обеспечение возможности как получения списка организаций с указанием их информационных систем и используемых в них классификаторов, так и наоборот — получение списка классификаторов с указанием использующих их информационных систем и соответственно организаций-владельцев этих систем.

Рис. 3.6. Структура метабазы

Выборка (поиск) информации должна осуществляться как по основным информационным массивам (Организации, Информационные системы, Классификаторы и словари), так и по вспомогательным (Выходная информация, Источники информации, Базы данных) и их сочетанию. Данные вопросы должны решаться на стадиях разработки и внедрения метабазы и связаны с технологией ее ведения.

Метабаза по сути своей является документоориентированной, содержащаяся в ней информация носит описательный характер и трудно формализуема.

Состав полей метабазы носит характер структурированного представления документа-описания информационных систем и классификаторов/словарей, а не хранения конкретных значений тех или иных величин.

В силу этого необходимо широкое использование "ключевых слов" и рубрикаторов для классификации информации и организации быстрого поиска. Кроме того, должна обеспечиваться возможность полнотекстового поиска практически по любому из текстовых полей.

Метабаза является информационно-справочной системой, поэтому основной упор при ее реализации следует сделать на обеспечение простоты доступа к метабазе пользователей, в том числе и средствами телекоммуникаций. Необходимо предоставить пользователю простой инструмент организации различных выборок элементов из базы данных метаинформации и формирования разного рода списков этих элементов, отличающихся друг от друга составом полей и критериями отбора и сортировки.

Основная задача метабазы — предоставить пользователям точные сведения о том, где они могут взять необходимую им информацию о реальных объекта городской инфраструктуры, о том, где, какие, на каких условиях и в каком виде он сможет получить необходимые ему данные. Это еще раз подчеркивает информационно-справочный и "публичный" характер метабазы.

Следует учитывать, что объем метабазы достаточно ограничен — десятки, а не тысячи элементов. Это позволяет особое внимание уделить простоте доступа к информации, анализа пользователем достаточно неформализованной информации, технологическим вопросам ведения информации, а не скорости обработки больших массивов данных.

Источниками информации для ведения метабазы должны являться регулярно проводимые опросы-обследования городских информационных систем на основе специально разработанных анкет, материалы комиссий по приемке новых систем в эксплуатацию и их сертификации и сведения, подаваемые городскими организациями в инициативном порядке для обеспечения рекламы их информационной продукции и услуг.

Следует обеспечить технологию получения такого рода информации не только в "бумажном", но и в электронном виде, в среде функционирования метабазы в реальном времени.