2.2.1. Основные понятия классификации экономической информации

В условиях рыночной экономики возрастает роль информа­ции как одного из наиболее важных ресурсов предприятия, необ­ходимого для принятия эффективных и своевременных управлен­ческих решений. Одним из наиболее существенных компонентов этого ресурса является экономическая информация. Основные особенности этой информации:

· ежегодно создаются, обрабатываются и хранятся большие объемы информации (до нескольких сотен миллионов символов в год для среднего предприятия);

· большая часть этой информации имеет символьное представ­ление, слабо приспособленное для логической и арифмети­ческой обработки;

· уровень стоимостных и трудовых затрат на поиск и обработку информации высокий.

Для того чтобы приспособить экономическую информацию для эффективного поиска, обработки на ЭВМ и передачи по каналам связи, ее необходимо представить в цифровом виде. С этой целью ее нужно сначала упорядочить (классифицировать), а затем фор­мализовать (закодировать) с использованием классификатора. Классификатор – это документ, с помощью которого осуществля­ется формализованное описание экономической информации в ЭИС, содержащей наименования объектов, наименования класси­фикационных группировок и их кодовые обозначения.

Экономическая информация существует в двух формах: в фор­ме экономических показателей (рис. 2.10) и документов.

Экономический показатель является составной единицей ин­формации, отражающей количественную характеристику неко­торого процесса предметной области – реквизит-основание вмес­те с однозначно определяющими его качество реквизитами-признаками [23].

Рис. 2.10. Структура экономического показателя

Реквизиты-основания подразделяются по типу алгоритмов их получения на количественные, стоимостные, проценты, удельные веса и др. Множество реквизитов-признаков по степени формали­зации делится на два подмножества:

· справочные реквизиты-признаки – это, как правило, наименования, предназначенные для понимания показателя пользователем-эко­номистом;

· группированные реквизиты-признаки – это закодированные ана­логи справочных признаков, предназначенные для логичес­кой обработки информации на ЭВМ.

Основными объектами классификации и кодирования являются справочные реквизиты-признаки, описывающие процессы, место, время выполнения процессов, субъекты и объекты действия, отра­жаемые в показателе. Например, к числу наименований элементов можно отнести наименования материальных, трудовых, денежных, энергетических ресурсов, основных средств, готовой продукции и услуг. К числу наименований процессов относятся наименования функций управления, деловых процессов, операций поступления сырья и материалов, отпуска их в производство, производства и выпуска готовой продукции или оказания услуг, процессов выпол­нения заказов, обслуживания клиентов, хранения, реализации го­товой продукции, расчетов с поставщиками и покупателями, по­лучения оплаты за реализованную продукцию и т.д.

К объектам классификации и кодирования относятся также наименования показателей и документов. Помимо этого к объек­там классификации и кодирования относят также наименования компонентов проекта ЭИС, в том числе файлов, задач, подсис­тем, программных модулей и др.

Целью разработки классификаторов является установление соответствия между значениями справочных или описательных признаков какого-либо элемента или процесса и значениями группировочных признаков, например между значением рекви­зита «Фамилия И.О. рабочего» и значением «Табельный номер» рабочего или между значениями «Наименование материала» и «Код материала».

Для кодирования объектов необходимо эти объектыупорядочить по некоторым признакам. Результат упорядоченного распределения объектов заданного множества носит название классификации, а совокупность правил распределения объектов множества на под­множества называется системой классификации. Процесс распре­деления объектов классификации в соответствии с принятой сис­темой классификации носит название процесса классифицирова­ния. То свойство (или характеристика) объекта классификации, которое позволяет установить его сходство или различие с дру­гими объектами классификации, называется признаком классифи­кации. Множество или подмножество, объединяющее часть объек­тов классификации по одному или нескольким признакам, носит название классификационной группировки.

Основанием классификации называется признак, по которому ведется разбиение множества на подмножества на определенной ступени классификации. Ступень классификацииэто результат очередного распределения объектов одной классификационной группировки. Уровень классификацииэто совокупность класси­фикационных группировок, расположенных на одних и тех же сту­пенях, классификации. Глубина системы классификацииэто коли­чество уровней классификации, допустимое в данной системе.

Каждая система классификации характеризуется следующи­ми свойствами:

· гибкостью;

· емкостью;

· степенью заполненности (коэффициент заполнен­ности).

Гибкость системыэто способность допускать включение новых признаков, объектов без разрушения структуры клас­сификатора. Гибкость определяется временем жизни (Тж) сис­темы.

Емкость системыэто наибольшее количество классифика­ционных группировок, допускаемое в данной системе классифи­кации (Р).

Степень заполненности системы (Кзап) определяется как част­ное от деления фактического количества группировок (Qф) на величину емкости системы (Р):

.

В настоящее время чаще всего применяются два типа систем классификации: иерархическая и многоаспектная.

Характерными особенностями иерархической системы явля­ются:

· наличие в системе неограниченного количества признаков классификации;

· соподчиненность признаков классификации, что выражается разбиением каждой классификационной группировки, обра­зованной по одному признаку, на множество классификаци­онных группировок по нижестоящему (подчиненному) при­знаку.

При построении иерархической системы классификации сна­чала выделяется некоторое множество объектов, подлежащее классифицированию (Мо), для которого определяются полное мно­жество признаков классификации (G) и их соподчиненность друг другу, затем производится разбиение исходного множества объек­тов на классификационные группировки на каждой ступени клас­сификации (рис. 2.11).

При использовании иерархической системы классификации необходимо соблюдать следующие ограничения:

· получающиеся на каждом уровне классификационные груп­пировки должны составлять исходное множество объектов (Мо);

· классификационные группировки () на каждой ступени не должны пересекаться;

· классификация на каждой ступени должна проводиться толь­ко по одному признаку (G).

Рис. 2.11. Схема построения иерархической системы классификации

К положительным сторонам данной системы следует отнести логичность, простоту ее построения и удобство логической и арифметической обработки.

Мощность классифицируемого множества:

Мо = {х1, х2, …, х, …, хn},

где х1, х2, … – признаки классификации и х1  М;  х М 2.

Однако эта система характеризуется жесткой структурой классификации, не позволяющей вносить новые признаки или изменять их последовательность. Гибкость этой системы обес­печивается только за счет ввода большой избыточности в вет­вях, что приводит к слабой заполненности структуры класси­фикатора.

Недостатки, отмеченные в иерархической системе, отсутству­ют в других системах, которые относятся к классу многоаспект­ных систем классификации (аспект – точка зрения на объект клас­сификации, который характеризуется одним или несколькими признаками). Многоаспектная системаэто система класси­фикации, которая использует параллельно несколько независимых признаков (аспектов) в качестве основания классификации. Существуют два типа многоаспектных систем: фасетные и дескрипторные. Фасет – это аспект классификации, который исполь­зуется для образования независимых классификационных груп­пировок. Дескриптор – ключевое слово, ляющее неко­торое понятие, которое формирует описание объекта и указывает на при­опреденадлежность этого объекта к классу, группе и т.д.

Фасетная система характеризуется следующими особеннос­тями построения:

ü имеется некоторое множество классифицируемых объектов ;

ü это множество можно рассматривать в нескольких аспектах, каждый из которых может характеризоваться одним или не­сколькими признаками, образующими фасет ;

ü устанавливается некоторый порядок следования фасетов с помощью фасетной формулы (при этом последовательность фасетов определяется по частоте обращения к этим фасетам на некотором множестве заданных задач):

;

ü определяется количество подмножеств классификационных группировок, число которых определяется числом задач, обращающихся при своем решении к тем или иным фасетам (рис. 2.12).

Рис. 2.12. Схема построения фасетной системы организации

Внутри фасета значения признаков могут просто перечислять­ся по некоторому порядку или образовывать сложную иерархи­ческую структуру, если существует соподчиненность выделенных признаков.

К преимуществам фасетной системы следует отнести большую емкость системы и высокую степень гибкости, поскольку при не­обходимости можно вводить дополнительные фасеты и изменять их место в формуле. К недостаткам, характерным для данной си­стемы, можно отнести сложность структуры и низкую степень заполненности системы.

Рассмотренные системы классификации хорошо приспо­соблены для организации поиска с целью последующей логичес­кой и арифметической обработки информации на ЭВМ и лишь частично решают проблему содержательного поиска экономичес­кой информации при принятии управленческих решений. Это объясняется далеко не полным охватом этими системами всех понятий и терминов, используемых для выражения смысла эко­номических показателей и документов. Кроме того, в этих си­стемах не решается проблема обеспечения однозначности исполь­зуемой терминологии, идентификации роли отдельных терминов в их общей последовательности при формировании наименова­ний экономических показателей.

К недостаткам этих систем клас­сификации можно отнести также и то, что в них не отражаются все отношения между терминами, необходимые для формализа­ции содержания показателей и документов и установления взаи­мосвязей между показателями и документами, которые исполь­зуются на этапе принятия управленческих решений.

Для поиска показателей и документов по набору содержатель­ных признаков используется информационный язык дескрипторного типа, который характеризуется совокупностью терминов, дескрипторов или лексикой и набором отношений между терми­нами. Эти отношения могут быть двух типов:

1) постоянные логические отношения между терминами, выте­кающие из отношений между отображаемыми объектами, ко­торые называются парадигматическими отношениями;

2) переменные отношения между понятиями, возникающие в про­цессе построения конкретного высказывания, например по­казателя, называемые синтагматическими отношениями.

Парадигматические отношения между терминами отражают статику языка. К ним относятся, например, родовидовые отно­шения. При этом родовым называется термин или понятие, выражающие существенные признаки класса предметов, в состав ко­торого входят предметы, являющиеся видами этого рода. Видо­вое понятие выражает существенные признаки подкласса пред­метов, являющегося видом какого-либо другого класса предме­тов и входящего в состав этого класса. Например, понятие «машинный носитель» является родовым по отношению к поня­тиям «жесткий магнитный диск», «гибкий диск», «магнитная лен­та» и т.д. Отношения этого типа отражаются в классификаторах экономической информации.

Синтагматические отношения составляют грамматику этого языка, т.е. правила построения высказываний из набора терми­нов или понятий. Такие отношения используются в динамике при вводе данных и формулировании запросов.

В зависимости от того, на каком этапе фиксируются все воз­можные выражения, языки делятся на предкоординированные и посткоординируемые. Предкоординированными называются языки, в которых на стадии разработки выделяются все высказывания в терминах этих языков и, тем самым, заранее определяются посто­янные отношения между терминами. Для посткоординируемых языков характерна предварительная фиксация лишь постоянных отношений. Все высказывания образуются при использовании лексики данного языка и его грамматики. Языки предкоординированного типа менее гибки при использовании, так как с их по­мощью можно описывать только те выражения, которые были заранее зафиксированы. Использование посткоординированных языков позволяет образовывать с их помощью значительно боль­шее число высказываний.

Наиболее типичным примером предкоординированных язы­ков являются классификационные языки, основанные на исполь­зовании иерархической и многоаспектной систем классифика­ции, преимущества и недостатки которых были рассмотрены ранее. К языкам классификационного типа можно отнести разработанный ныне Общесистемный классификатор технико-экономических показателей (ОКТЭП). Он содержит способ упо­рядоченного представления системы показателей и средства их взаимной увязки на основе многоаспектной классификации этих показателей, которая должна отражать наиболее суще­ственные для народного хозяйства методологичес­кие особенности их расчета, взаимосвязи показателей, наибо­лее важные признаки группировки показателей и их поиска в ЭИС.

Общим недостатком информационных языков классификаци­онного типа являются их слабая приспособленность к новым, за­ранее не предусмотренным условиям функционирования систем, возможность составления запросов на этих языках регламенти­рованного содержания. Эти недостатки отсутствуют у языков посткоординированного типа, к которым относятся дескрипторные языки, основанные на применении метода координатного, или ассоциативного, индексирования.

Согласно идее координатного индексирования предполага­ется, что содержание документов или показателей можно дос­таточно полно и точно отразить с помощью списка ключевых слов – дескрипторов. Дескриптор – это термин естественного языка (слово или словосочетание), используемый при описании документов или показателей, который имеет самостоятельный смысл и неделим без изменения своего значения. Например, показатель «Количество продукции, выработанное фактически цехом за смену», записанный на естественном языке, при исполь­зовании метода координатного индексирования будет иметь вид: «количество, продукция, выработка, фактический, цех, смена».

Для того чтобы обеспечить точность и однозначность поиска с помощью такого языка, необходимо предварительно опреде­лить все постоянные отношения между терминами: родовидовые, отношения синонимии, омонимии и полисемии, а также ассоци­ативные отношения. Характеристика родовидовых отношений была нами уже рассмотрена. Особый вид парадигматических отношений представляют отношения синонимии, омонимии и полисемии, всегда присутствующие в естественных языках.

Синонимияэто отношение между двумя и более различными ключевыми словами, когда они имеют одинаковое значение, обо­значают один и тот же предмет или понятие. Можно выделить синонимы с одним корнем, но с различным морфологическим составом (например, «производство» и «произведено»), с различ­ными корнями (например, «издержки» и «расходы»). К синони­мам относятся также термины, которые могут существовать как в полном, так и в сокращенном виде, например «научно-исследо­вательские работы» и «НИР», «кубические метры» и «м3».

Омонимияэто такое отношение между одинаковыми по зву­чанию и написанию ключевыми словами, когда они имеют раз­ное значение и обозначают разные предметы и понятия. Можно выделить термины, обозначающие такие разные понятия, объе­мы которых не пересекаются, и называемые полными омонима­ми. Например, термин «прокат» используется в двух различных смыслах: «прокат тонкой листовой стали» и «сдача предметов во временное пользование», поэтому он относится к числу полных омонимов. Однако встречаются термины, обозначающие разные понятия, объемы которых пересекаются. Такие термины называ­ются частичными омонимами. Явление частичной омонимии носит название полисемии.

Большое значение для построения дескрипторного языка име­ют выявление и фиксирование ассоциативных отношений между терминами, которые позволяют выдавать более точные ответы на запросы пользователей. К числу ассоциативных отношений относят такие, как отношение части к целому (например, «цех» – «участок»), причинно-следственные отношения (например, «про­гул» – «невыполнение»), связи предмета и процесса (например, «план» – «планирование») и др.

Все выделенные отношения явно описываются в системати­ческом словаре понятий – тезаурусе, который разрабатывается с целью проведения индексирования документов, показателей и информационных запросов.

В свою очередь, дескрипторные языки различаются по семан­тической силе, которая определяется тем, какой объем сведений может индексироваться с их применением. Семантическая сила языка зависит от числа типов постоянных отношений, фиксируе­мых в тезаурусе, а также от наличия средств грамматики и степе­ни их сложности. В соответствии с этим признаком дескриптор­ные языки подразделяются на языки без грамматики, языки с не­полной грамматикой и языки с развитой грамматикой. При этом языки первого вида содержат только словари используемых клю­чевых слов и тезаурусы. В языках с неполной грамматикой, по­мимо словарей и тезаурусов, имеются правила взаимосвязи только некоторых категорий терминов. Языки с развитой грамматикой позволяют описывать с помощью всех средств сложные выска­зывания.

В том случае, если объектом поиска в ЭИС является документ, для этих целей используют информационные языки дескриптор­ного типа без грамматики. При необходимости хранения и осу­ществления поиска экономических показателей проектировщи­ки отдают предпочтение языкам второго и третьего типов.