Экспертные системы являются одним из результатов исследований в области искусственного интеллекта и рассматриваются в качестве программного средства, которое позволяет представить знания специалистов высокой квалификации о предметной области (рисунок 5.2). Экспертные системы воспроизводят осознанные мыслительные процессы человека. Это системы, которые используют логику принятия решения человеческого эксперта.
Для того чтобы спроектировать экспертную систему, специалист, называемый инженером знания (специально подготовленный системный аналитик или группа специалистов), очень тесно работает с одним или большим количеством экспертов в изучаемой области. Инженеры знания пробуют узнавать все относительно способа, которым эксперт принимает решения. Если строится экспертная система для планирования оборудования, то инженер знания работает с опытными планировщиками оборудования, чтобы видеть, как они работают. Знание, полученное инженером знания, затем загружается в компьютерную систему в специализированном формате в блок, называемый базой знаний. Эта база знаний содержит правила и заключения, которые используются в принятии решений – параметры, или факты, необходимые для решения. База знаний является центральным элементом экспертной системы.
Другие главные фрагменты экспертной системы – создатель заключения и интерфейс пользователя. Создатель заключения – логический каркас, который автоматически проводит линию рассуждения и который обеспечен правилами заключения и параметрами, вовлеченными в решение. Таким образом, один и тот же создатель заключения может использоваться для многих различных экспертных систем с различными базами знаний.
Интерфейс пользователя – блок, используемый конечным пользователем, например неопытным планировщиком оборудования.
Другие блоки включают подсистему объяснения, чтобы разъяснять доводы, что система движется в направлении решения, и подсистему накопления знания, чтобы помочь инженеру знания в регистрации и добавлении правил заключения и параметров в базе знаний. В экономике экспертные системы используются для консультаций по выработке инвестиционных решений, выбору стратегии маркетинга, кредитования и т.д.
В то время как экспертные системы пробуют ввести опыт людей в компьютерную программу, нейронные сети пытаются создать значимые модели из большого количества данных. Нейронные сети могут распознавать модели, слишком не ясные для людей, и адаптировать их при получении новой информации.
Нейросетевые технологии, в отличие от экспертных систем, предназначены для воспроизведения неосознанных мыслительных усилий человека (например, человек плохо знает, как он распознает цвет предмета). Такого рода технологии используются для распознавания каких-либо событий или предметов. С их помощью можно воспроизвести многочисленные связи между множеством объектов. Принципиальное отличие искусственных нейросетей от обычных программных систем, например экспертных, состоит в том, что они не требуют программирования. Они сами настраиваются, т.е. обучаются тому, что требуется пользователю.
Известны следующие сферы применения нейросетей:
· экономика и бизнес – предсказание поведения рынков, предсказание банкротств, оценка стоимости недвижимости, автоматическое рейтингование, оценка кредитоспособности, прогнозирование курса валют;
· медицина – обработка медицинских изображений, диагностика;
· Интернет – ассоциативный поиск информации;
· автоматизация производства – оптимизация режимов производственного процесса, диагностика качества продукции, предупреждение аварийной ситуации;
· политические технологии – обобщение социологических опросов;
· безопасность и охранные системы – идентификация личности, распознавание автомобильных номеров и аэрокосмических снимков;
· геологоразведка – анализ сейсмических данных, оценка ресурсов месторождений.
Нейросеть состоит из нейронов, распределяемых по слоям (рисунок 5.3). Один нейрон работает следующим образом: на его вход поступает набор входных сигналов, нейрон суммирует входные сигналы и генерирует выходной, который направляется либо в другие нейроны, либо на выход сети. Связь между нейронами характеризуется интенсивностью (силой возбуждения), называемой также синоптическим весом. Представить их можно в виде синаптической матрицы, элементы которой указывают на силу возбуждения связей между нейронами.
Применение нейросетей осуществляется поэтапно:
· постановка задачи – формирование цели применения нейросети (например, прогнозирование курса ценных бумаг);
· обучение нейросети – подготовка обучающих примеров, которые представляют собой уже известные результаты решения задачи без нейросети, и предъявление их последней;
· эксплуатация сети – предъявление сети некоторых ситуаций, которые либо распознаются, либо нет.
Обучение нейронных сетей представляет собой последовательный процесс изменения синаптических весов, отражающих силу возбуждения связей между нейронами.
Программе нейронных сетей сначала дается набор данных, состоящих из многих переменных, связанных с большим количеством случаев, или исходов, в которых результаты известны. Программа анализирует данные и обрабатывает все корреляции, а затем выбирает комбинацию переменных, которые строго соотнесены с частными известными результатами, как начальная модель. Эта начальная модель используется, чтобы попробовать предсказать результаты различных случаев, а предсказанные результаты сравниваются с известными результатами. Базируясь на этом сравнении, программа изменяет модель, регулируя параметры переменных или даже заменяя их. Этот процесс программа нейронных сетей повторяет много раз, стремясь улучшить прогнозирующую способность при наладке модели. Когда в этом итерационном подходе дальнейшее усовершенствование исчерпывается, программа готова делать предсказания для будущих случаев.
Как только станет доступным новое большое количество случаев, эти данные также вводятся в нейронную сеть, и модель еще раз корректируется.
Преимуществами нейросетей является то, что они:
· способны обучаться на примерах без программирования, что позволяет отказаться от поиска каких-либо аналитических зависимостей между входными данными и результатами;
· могут обучаться на неполной, противоречивой и искаженной информации;
· для использования не требуют высококвалифицированных кадров;
· не требуют выполнения условия отсутствия взаимосвязи между входными факторами, как это требуется в регрессионном анализе.