2.4.2. Информационная база и способы ее организации

Основной частью внутримашинного информационного обес­печения является информационная база (ИБ). Информационная база это определенным способом организованная совокуп­ность данных, хранимых в памяти вычислительной системы в виде файлов, с помощью которых удовлетворяются информа­ционные потребности управленческих процессов и решаемых задач.

Файлэто некоторое множество записей однородной струк­туры, предназначенное для решения экономических задач. Записьэто набор полей определенного формата, объединенных по общему ключевому полю. Все файлы ЭИС можно классифи­цировать по следующим признакам:

· по этапам обработки (входные, базовые, результатные);

· по типу носителя (на промежуточных носителях – гибких маг­нитных дисках и магнитных лентах и на основных носителях – жестких магнитных дисках, магнитооптических дисках и др.);

· по составу информации (с оперативной информацией и с постоянной информацией);

· по назначению (по типу функциональных подсистем);

· по типу логической организации (с линейной и иерархи­ческой структурой записи, реляционные, табличные);

· по способу физической организации (с последовательным, индексным и прямым способом доступа).

Входные файлы создаются с первичных документов для вво­да данных или обновления базовых файлов.

Файлы с результатной информацией предназначаются для вывода ее на печать или передачи по каналам связи и не подле­жат долговременному хранению.

К числу базовых файлов, хранящихся в информационной базе, относят основные, рабочие, промежуточные, служебные и архи­вные файлы.

Основные файлы должны иметь однородную структуру запи­сей и могут содержать записи с оперативной и условно-постоян­ной информацией. Оперативные файлы могут создаваться на базе одного или нескольких входных файлов и отражать информацию одного или нескольких первичных документов. Файлы с условно-постоянной информацией могут содержать справочную, расценоч­ную, табличную и другие виды информации, изменяющейся в течение года не более чем на 40 %, а следовательно, имеющие коэффициент стабильности (Кст) не менее 0,6.

Файлы со справочной информацией должны отражать все ха­рактеристики элементов материального производства (материа­лы, сырье, основные фонды, трудовые ресурсы и т.п.). Как пра­вило, справочники содержат информацию классификаторов и дополнительные сведения об элементах материальной сферы, например о ценах. Нормативно-расценочные файлы должны со­держать данные о нормах расхода и расценках на выполнение операций и услуг. Табличные файлы содержат сведения об эконо­мических показателях, считающихся постоянными в течение дли­тельного времени (например, процент удержаний, отчислений и пр.). Плановые файлы содержат плановые показатели, хранящи­еся весь плановый период.

Рабочие файлы создаются для решения конкретных задач на базе основных файлов путем выборки части информации из не­скольких основных файлов с целью сокращения времени обра­ботки данных.

Промежуточные файлы отличаются от рабочих файлов тем, что они образуются в результате решения экономических задач, подвергаются хранению с целью дальнейшего использования для решения других задач. Эти файлы так же, как и рабочие файлы, при высокой частоте обращений могут быть переведены в категорию основных файлов.

Служебные файлы предназначаются для ускорения поиска информации в основных файлах и включают в себя справочни­ки, индексные файлы и каталоги.

Архивные файлы содержат ретроспективные данные из основ­ных файлов, которые используются для решения аналитических, например прогнозных, задач. Архивные данные могут также ис­пользоваться для восстановления информационной базы при раз­рушениях.

При организации хранения файлов в информационной базе дол­жны быть обеспечены следующие требования:

· полнота хранимой информации для выполнения всех функ­ций управления и решения экономических задач;

· целостность хранимой информации, т.е. непро­тиворечивость данных при вводе информации в ИБ;

· своевременность и одновременность обновления данных во всех копиях данных;

· гибкость системы, т.е. адаптируемость ИБ к изменяющимся информационным потребностям;

· реализуемость системы требуемой степени сложности;

· релевантность ИБ, под которой подразумевается способность системы осуществлять поиск и выдавать информацию, точно соответствующую запросам пользователей;

· удобство языкового интерфейса, позволяющее быстро фор­мулировать запрос к ИБ;

· разграничение прав доступа, т.е. определение для каждого пользователя доступных типов записей, полей, файлов и ви­дов операций над ними.

Существуют следующие способы организации ИБ: совокуп­ность локальных файлов, поддерживаемых функциональными пакетами прикладных программ, и интегрированная база данных, основывающаяся на использовании универсальных программных средств загрузки, хранения, поиска и ведения данных, т.е. систе­мы управления базами данных (СУБД).

Локальные файлы вследствие специализации структуры дан­ных под задачи обеспечивают, как правило, более быстрое время обработки данных. Однако недостатки организации локальных файлов, связанные с большим дублированием данных в инфор­мационной системе и, как следствие, несогласованностью дан­ных в разных приложениях, а также негибкостью доступа к ин­формации, перекрывают указанные преимущества. Поэтому организация локальных файлов может применяться только в спе­циализированных приложениях, требующих очень высокую ско­рость реакции, при импорте необходимых данных.

Интегрированная ИБ, т.е. база данных (БД), – это совокупность взаимосвязанных, хранящихся вместе данных при такой мини­мальной избыточности, которая допускает их использование оп­тимальным образом для множества приложений.

Централизация управления данными с помощью СУБД обес­печивает совместимость этих данных, уменьшение синтаксичес­кой и семантической избыточности, соответствие данных реаль­ному состоянию объекта, разделение хранения данных между пользователями и возможность подключения новых пользовате­лей. Но централизация управления и интеграция данных приво­дят к проблемам другого характера: необходимости усиления контроля вводимых данных, необходимости обеспечения согла­шения между пользователями по поводу состава и структуры дан­ных, разграничения доступа и секретности данных.

Основными способами организации БД являются создание централизованных и распределенных БД. Основным критерием выбора способа организации ИБ является достижение минималь­ных трудовых и стоимостных затрат на проектирование структу­ры ИБ, программного обеспечения системы ведения файлов, а также на перепроектирование ИБ при возникновении новых задач.

К организации БД предъявляются следующие основные тре­бования:

· логическая и физическая независимость данных (программ от изменений структуры БД);

· контролируемая избыточность данных;

· стандартизация данных за счет использования классифика­торов;

· наличие словаря данных;

· специализация интерфейса для администратора БД и пользо­вателя системы;

· контроль целостности данных;

· защита данных от несанкционированного доступа;

· наличие вспомогательных программных средств (утилит) про­ектирования и эксплуатации БД.

Принципами построения централизованной БД являются:

· обеспечение логической организации данных с помощью по­строения глобальной модели данных;

· представление информационных потребностей для каждой задачи в виде подмоделей данных;

· выделение специального языка описания данных для получе­ния схем и подсхем;

· описание процедур обработки данных с использованием язы­ка манипулирования данными;

· разделение доступа к полям данных;

· защита данных через пароль;

· обеспечение доступности данных одновременно для несколь­ких пользователей.

Для распределенных БД существуют свои требования:

· учет территориального расположения подразделений ЭИС;

· обеспечение независимости данных от их территориального расположения;

· оптимальное размещение БД между абонентами и серверами;

· сокращение стоимости информационного обслуживания або­нентов;

· обеспечение решения сложных межведомственных задач;

· надежность хранения обработки данных;

· использование СУБД, которые имеют язык описания данных, манипулиро­вания данными и язык запросов, ориентированные на работу в сети;

· возможность параллельного обращения к данным из различ­ных узлов обработки данных.