Основу информационного обеспечения ССВ составляют общегородские справочники, словари и классификаторы, а также база данных метаинформации по городским информационным системам и ресурсам.
3.2.1. Объектно-ориентированный подход для формального описания объектов городской инфраструктуры
В основу формирования общесистемных справочников и словарей положен объектно-ориентированный подход. Основной смысл объектной идеологии заключается в том, что все информационное пространство, включающее структурированную информацию отраслевых баз данных и неструктурированную информацию органов управления городом, рассматривается как динамическая совокупность информационных объектов.
В соответствии с концептуальной моделью описания инфраструктуры городской территории, включающей объекты и субъекты правоотношений на территории города, исходя из уровней абстракции можно выделить три уровня представления информационных объектов (рис. 3.4):
- обобщенный уровень — информационные объекты описания функционирования городской инфраструктуры;
- отраслевые информационные объекты по функциональной принадлежности;
- информационные объекты пользователя, с которыми работают организации — первоисточники информации.
Различие состоит в правах манипулирования информацией, в регламентирующих документах по порядку обмена и представления информации в системе, правилах внесения изменений, статусе утверждения первоисточников информации и структур ее представления, в выборе классификационных признаков.
Основу информационного пространства ССВ составляют базовые информационные объекты.
Каждый базовый информационный объект имеет один первоисточник данных — организацию, юридически ответственную за эти данные и отвечающую за их достоверность и актуальность. Эта организация в процессе регистрации реальных объектов или отношений при их информационном описании в своей системе определяет и присваивает значение идентификатора (идентификационных признаков).
Базовые информационные объекты используются для конструирования других сложных информационных объектов рассматриваемого или вышестоящих уровней.
Определение информационного объекта заключается в описании его:
- идентификатора;
- параметров территориальной привязки;
- семантических характеристик.
В качестве территориальной привязки могут выступать:
- географические координаты с заданной точностью для картографического топоплана в принятой метрической системе координат;
- позиционное представление на графической схеме, плане;
- опосредованно через семантические характеристики (посредством "адресной привязки").
Введение понятия "адресная привязка" вытекает из исторически сложившегося способа идентификации реальных объектов городской инфраструктуры по "адресам". Прежде всего, к таким объектам относятся здания, сооружения, строения.
Указание местоположения объектов и относительно них описание субъектов деятельности на территории города посредством адресной привязки используется в первую очередь при заполнении различного вида документов.
В настоящее время в городских информационных системах для организации адресной привязки используется совокупность полей Наименование улицы, Тип улицы, Номер дома, Номер строения/корпуса, Номер квартиры/помещения. Причем Наименование и Тип улицы, как правило, вводятся из словаря, а остальные поля заполняются в свободном режиме, без проверки допустимости их значений.
Рис. 3.4. Схема городских информационных объектов
Разработка и внедрение информационных технологий идентификации объектов по их адресу и правильная интерпретация указания местоположения объектов городской инфраструктуры — это одна из первоочередных задач при создании городских информационных ресурсов и интеграции отраслевых и территориальных информационных систем в ОИС.
Решение ее связано с формированием кадастровых городских систем.
Для обеспечения функционирования ССВ и информационной совместимости в рамках ОИС в справочниках баз данных, разрабатываемых и функционирующих информационных систем, следует выделять общесистемную (стандартизованную) часть, используемую в рамках всей ОИС, и внутриведомственную часть, используемую в рамках отдельных ведомств-участников ОИС.
Принципы описания информационных объектов
Представление информационных объектов осуществляется в виде их справочников, описание которых содержит:
- наименование справочника, описание целей и области его применения в соответствии тем функциям и задачам, в которых он используется;
-
- — организация, ответственная за поддержание в актуальном состоянии и наполнение информацией справочников (источник информации) и соответствующих полей баз данных, классификаторов;
- — особенности работы с этим справочником и, если это необходимо, его связь с другими справочниками, словарями;
- — структура справочника и описание элементов данных.
В описании справочников приведена общесистемная (стандартизуемая) часть, используемая в рамках всей ОИС.
Внутриведомственная часть, используемая в рамках отдельных ведомств-участников ОИС для своих нужд, опущена.
В описании элементов данных справочника указывается наименование реквизита и способ его представления.
В качестве описания способа представления данных указывается один из простых типов данных, либо их комбинации с перечнем допустимых значений или диапазоном значений.
В качестве простых типов представления данных используются следующие:
Целое — целое число.
Действительное — действительное число.
Строка — строка литер и ее длина (максимальная длина)
Текст — произвольный набор строк, представляющий собой фрагмент текста.
Дата — календарная дата.
Время — календарное время.
Имя — идентификатор объекта.
Указатель — тип данных, представляющий указатель на элемент упорядоченного набора величин; такой набор задается перечислением допустимых значений, либо соответствующим словарем.
Координата — координата точки в единой метрической системе координат картографического топоплана.
Схема (план), карта — графические представления участка поверхности земли с нанесенным изображением объектов.
Общего вида — поле данных произвольной структуры.
Для сокращения описания справочников и большей ясности представления в ряде случаев используется составной тип данных, представляющий собой определенную совокупность из вышеприведенных простых типов.
Вектор значений простого типа,
например: 2*Целое или n*Целое.
Матрица значений простого типа,
например: 3*2*Целое.
Перечень значений одного типа (простого или векторного),
например: n*Целое и n*2*Целое.
Массив значений простого типа,
например: n*n*Целое.
Упорядоченное множество значений различных типов,
например: (целое, строка).
Для представления адресов объектов, возможно, использовать составной тип данных Адрес (табл. 3.1).
При этом существует несколько видов адресов: градостроительный, почтовый (Комсомольский, Российский, Международный), милицейский (прописки) и т.д. В силу этого составной тип Адрес необходимо задавать с учетом используемого вида адреса.
Таблица 3.1
Используемые структуры типа "Адрес"
Наименование элемента |
Тип данных |
Адрес Градостроительный — АдресГ: |
|
Рег. номер квартала (микрорайона) |
(Целое, Строка) |
Рег. номер домовладения (земельного участка) в квартале |
(Целое, Строка) |
Рег. номер строения в домовладении (земельном участке) |
(Целое, Строка) |
Тип и рег. номер помещений(я) |
n*(Указатель, Целое, Строка) |
Адрес на территории г. Комсомольска (милицейский адрес) — АдресТ: |
|
Микрорайон (населенный пункт) |
Указатель |
Наименование улицы |
Имя |
Номер дома |
(Целое, Строка) |
Тип и номер строения (корпуса) |
(Указатель, (Целое, Строка)) |
Тип и рег. номер помещений(я) |
n*(Указатель, (Целое, Строка)) |
Адрес Комсомольский почтовый: |
|
Почтовый индекс |
Целое |
Микрорайон (населенный пункт) |
Указатель |
Наименование улицы |
Имя |
Номер дома |
(Целое, Строка) |
Тип и номер строения (корпуса) |
(Указатель, (Целое, Строка)) |
Тип и рег. номер помещений(я) |
n*(Указатель, (Целое, Строка)) |
Адрес Российский почтовый: |
|
Почтовый индекс |
Целое |
Республика в составе РФ или край |
Указатель |
Область в составе республики (края) |
Указатель |
Район в составе области |
Строка |
Населенный пункт |
Строка |
Наименование улицы |
Строка |
Тип улицы |
Указатель |
Номер дома |
Строка |
Номер строения (корпуса) |
Строка |
Номер помещения (квартиры) |
Строка |
Адрес Международный почтовый: |
|
Почтовый индекс |
Строка |
Страна |
Указатель |
Населенный пункт |
Строка |
Наименование улицы |
Строка |
Тип улицы |
Строка |
Номер дома |
Строка |
Номер помещения (квартиры) |
Строка |
Для обеспечения технологичной работы в рамках ССВ общесистемные справочники должны обеспечивать в различных городских информационных системах простоту выполнения основных операций с данными:
· Добавление — добавляется описание нового объекта.
· Замена — изменяются характеристики реального объекта и как следствие создается новое его описание (с новым идентификатором), т.е. в директивном порядке осуществляется замена описания данного объекта на другое.
· Слияние — объединение описаний нескольких объектов с образова- нием одного нового.
· Разукрупнение — разделение описания одного объекта с образованием нескольких новых.
· Ликвидация — объект городской инфраструктуры ликвидируется, информация по нему становится "недействительной" и как следствие ликвидируется его описание.
И примыкающую к ним рабочую операцию:
· Изменение — изменение содержательной части описания конкретного реального объекта без изменения его идентификатора необходимо, в частности, для исправления ошибок (например, грамматических).
Для обеспечения корректности операции поиска и сохранения исторической преемственности необходимо "старые" данные сохранять (архивировать), обеспечивая доступ как к ним от существующих объектов, так и от них к существующим. Это реализуется посредством двунаправленной списковой структуры, где каждый из объектов ссылается как на своих "родителей", так и "потомков".
Для такого описания истории реальных объектов вводится составной тип данных — История, описываемый следующим образом:
Наименование элемента |
Тип данных |
Статус описания1 |
Указатель |
История рождения: |
|
Дата образования объекта |
Дата |
Причина |
Указатель |
Основание (документ) |
Строка |
Дополнительная информация |
Общего вида |
История "родителей": |
|
Количество "родителей" |
Целое |
Объекты "родители" и дополнительная информация |
n*(Имя, Общего вида) |
История "потомков" при замене, слиянии, разукрупнении объекта: |
|
Количество "потомков" |
Целое |
Объекты "потомки" и дополнительная информация |
n*(Имя, Общего вида) |
История ликвидации при ликвидации объекта: |
|
Дата ликвидации объекта |
Дата |
Причина |
Указатель |
Основание (документ) |
Строка |
Дополнительная информация |
Общего вида |
Другим важным аспектом ведения информации является отслеживание синонимов элементов данных, в частности наименования объектов. Для этого предназначен составной тип данных — Синонимы:
Наименование элемента |
Тип данных |
Число синонимов |
Целое |
Синонимы1 |
n*Тип_данных |
Приведенные описания используемых типов данных для представления в ССВ общесистемного информационного обеспечения составляют основу для лингвистического обеспечения ССВ.
Формирование общесистемных справочников и идентификаторов информационных объектов
На основе анализа потребностей пользователей определяются и создаются необходимые перечни справочников требуемых видов информации, определяется их структура, формируются необходимые словари и идентификаторы, выбираются признаки классификации (и их группы), по которым строятся соответствующие классификаторы.
Общесистемные справочники служат для описания городских информационных ресурсов и являются описанием внешнего представления структур баз данных информационных систем организаций — участников ОИС.
Общесистемные справочники и ведущаяся в соответствии с ними информация в различных городских организациях являются основой для построения и ведения общесистемных словарей, классификаторов и их внедрения (рис. 3.5).
Каждый отдельно взятый элемент (поле) или группа элементов данных в общесистемных справочниках ведется одной из организаций. Для встречающихся у нескольких информационных объектов одноименных данных, значения которых используются в разных организациях, в ОИС предусмотрено построение и использование единых для всех организаций общесистемных словарей и классификаторов.
Элементы данных (поля семантических данных и территориальной привязки) делятся на те, значения которых ведущая организация может присваивать независимо от других организаций, и на те, значения которых можно лишь выбирать из общесистемного классификатора в соответствии со структурой его справочника или использовать словарь.
Прежде всего, в общесистемный справочник включаются те поля, которые являются ключевыми и служат для поиска информационных объектов.
Идентификаторы информационных объектов присваиваются и ведутся одной из организаций, осуществляющей первичную регистрацию данного класса информационных объектов в системе и отвечающей за информационное наполнение соответствующего классификатора согласно структуре его справочника.
В случае отличия идентификаторов в информационных системах этих организаций обеспечивается согласование идентификаторов внутренних баз данных с общесистемными идентификаторами.
Тем самым обеспечивается логическая целостность и непротиворечивость ССВ в целом и возможность получения интегрированной информации из информационных систем различных городских организаций.
Рис. 3.5. Схема формирования классификаторов и словарей
3.2.2. Концептуальная структура метабазы
Метабаза, являясь основным инструментом, обеспечивающим централизованное хранение информации о городских информационных системах и ресурсах, должна включать следующие основные группы данных об информационных объектах:
- — адресно-справочную информацию;
- — описание информационной системы, баз данных, используемых и имеющихся классификаторов, других данных;
- — технико-экономические показатели функционирования;
- — данные об информационных услугах и решаемых задачах;
- — словарно-лингвистическую информацию.
Содержательное описание баз данных (метаданные в узком смысле слова) включают сведения о классе объектов, представленных в базе данных и номенклатуру этих объектов.
Информация об объекте, кроме наименования, может быть представлена:
- наименованием атрибутов;
- наименованиями идентифицирующих (ключевых) атрибутов;
- наименованиями источников (документов), из которых извлекается информация об объекте, и количеством атрибутов;
- списком решаемых задач и их владельцев;
- правилами представления в базах данных наименований объектов, признаков и значений, в том числе имен (типов) классификаторов, или других средств, используемых для идентификации, кодирования или представления данных.
Метабаза по информационным системам состоит из трех основных информационных массивов (рис. 3.6):
- Организации,
- Информационные системы,
- Классификаторы и словари.
Информационный массив "Информационные системы" в свою очередь имеет три вспомогательных массива:
- Выходная информация,
- Источники информации,
- Базы данных.
Связь между этими информационными массивами — один ко многим, т.е. организация содержит ссылки на эксплуатирующиеся в ней информационные системы, которые в свою очередь содержат ссылки на используемые классификаторы и словари, используемые в предметных базах данных. Организации-владельцы классификаторов и общесистемных словарей содержат ссылки на поставляемые ими классификаторы и словари. Необходима отработка этих ссылок в обоих направлениях, т.е. обеспечение возможности как получения списка организаций с указанием их информационных систем и используемых в них классификаторов, так и наоборот — получение списка классификаторов с указанием использующих их информационных систем и соответственно организаций-владельцев этих систем. |
Рис. 3.6. Структура метабазы
Выборка (поиск) информации должна осуществляться как по основным информационным массивам (Организации, Информационные системы, Классификаторы и словари), так и по вспомогательным (Выходная информация, Источники информации, Базы данных) и их сочетанию. Данные вопросы должны решаться на стадиях разработки и внедрения метабазы и связаны с технологией ее ведения.
Метабаза по сути своей является документоориентированной, содержащаяся в ней информация носит описательный характер и трудно формализуема.
Состав полей метабазы носит характер структурированного представления документа-описания информационных систем и классификаторов/словарей, а не хранения конкретных значений тех или иных величин.
В силу этого необходимо широкое использование "ключевых слов" и рубрикаторов для классификации информации и организации быстрого поиска. Кроме того, должна обеспечиваться возможность полнотекстового поиска практически по любому из текстовых полей.
Метабаза является информационно-справочной системой, поэтому основной упор при ее реализации следует сделать на обеспечение простоты доступа к метабазе пользователей, в том числе и средствами телекоммуникаций. Необходимо предоставить пользователю простой инструмент организации различных выборок элементов из базы данных метаинформации и формирования разного рода списков этих элементов, отличающихся друг от друга составом полей и критериями отбора и сортировки.
Основная задача метабазы — предоставить пользователям точные сведения о том, где они могут взять необходимую им информацию о реальных объекта городской инфраструктуры, о том, где, какие, на каких условиях и в каком виде он сможет получить необходимые ему данные. Это еще раз подчеркивает информационно-справочный и "публичный" характер метабазы.
Следует учитывать, что объем метабазы достаточно ограничен — десятки, а не тысячи элементов. Это позволяет особое внимание уделить простоте доступа к информации, анализа пользователем достаточно неформализованной информации, технологическим вопросам ведения информации, а не скорости обработки больших массивов данных.
Источниками информации для ведения метабазы должны являться регулярно проводимые опросы-обследования городских информационных систем на основе специально разработанных анкет, материалы комиссий по приемке новых систем в эксплуатацию и их сертификации и сведения, подаваемые городскими организациями в инициативном порядке для обеспечения рекламы их информационной продукции и услуг.
Следует обеспечить технологию получения такого рода информации не только в "бумажном", но и в электронном виде, в среде функционирования метабазы в реальном времени.