WWW.DISS.SELUK.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА
(Авторефераты, диссертации, методички, учебные программы, монографии)

 

Pages:     || 2 | 3 |

«Ю.Ю. Громов, О.Г. Иванова, В.В. Алексеев, М.П. Беляев, Д.П. Швец, А.И. Елисеев ИНТЕЛЛЕКТУАЛЬНЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ И ТЕХНОЛОГИИ Рекомендовано федеральным государственным бюджетным образовательным учреждением высшего ...»

-- [ Страница 1 ] --

Министерство образования и науки Российской Федерации

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

«Тамбовский государственный технический университет»

Ю.Ю. Громов, О.Г. Иванова, В.В. Алексеев, М.П. Беляев,

Д.П. Швец, А.И. Елисеев

ИНТЕЛЛЕКТУАЛЬНЫЕ

ИНФОРМАЦИОННЫЕ

СИСТЕМЫ И ТЕХНОЛОГИИ

Рекомендовано федеральным государственным бюджетным образовательным учреждением высшего профессионального образования «Московский государственный технический университет имени Н.Э. Баумана» в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлению подготовки 230400 «Информационные системы и технологии»

Тамбов Издательство ФГБОУ ВПО «ТГТУ»

УДК 004.8(075.8) ББК 813я И Р е ц е н з е н т ы:

Заслуженный деятель науки Российской Федерации, доктор физико-математических наук, профессор В.Ф. Крапивин Кандидат технических наук, профессор Ю.Ф. Мартемьянов И73 Интеллектуальные информационные системы и технологии :

учебное пособие / Ю.Ю. Громов, О.Г. Иванова, В.В. Алексеев и др. – Тамбов : Изд-во ФГБОУ ВПО «ТГТУ», 2013. – 244 с. – 100 экз. – ISBN 978-5-8265-1178-7.

Рассматриваются методы искусственного интеллекта и их применение для решения задач из различных предметных областей. Описаны методы приобретения, представления и обработки знаний в интеллектуальных системах, а также технологии проектирования и реализации интеллектуальных систем. Особое внимание уделено практическим вопросам программирования в среде CLIPS.

Предназначено для студентов высших учебных заведений, обучающихся по направлению подготовки 230400 «Информационные системы и технологии».

УДК 004.8(075.8) ББК 813я © Федеральное государственное бюджетное ISBN 978-5-8265-1178- образовательное учреждение высшего профессионального образования «Тамбовский государственный технический университет» (ФГБОУ ВПО «ТГТУ»),

ПРЕДИСЛОВИЕ

Настоящая книга посвящена интеллектуальным информационным системам и технологиям, т.е. вопросам организации, проектирования, разработки и применения систем, предназначенных для обработки информации, базирующихся на применении методов искусственного интеллекта.

В главе 1 приведены краткий обзор приложений искусственного интеллекта, общая характеристика интеллектуальных информационных систем, а также основные понятия и определения, которые используются в книге.

Известно, что только небольшую часть своих знаний человек может точно сформулировать вербальным или формальным способом.

Обширная область интуитивных знаний специалистов, которые необходимы для успешной работы интеллектуальных систем, остаётся недоступной из-за отсутствия средств их извлечения и представления.

Неуловимый характер человеческих знаний и их постоянное развитие помешали сторонникам «нисходящего метода» в области искусственного интеллекта удержать в своих руках пальму первенства. «Нисходящий метод» соответствует дедуктивному подходу, в рамках которого на этапе становления искусственного интеллекта разрабатывались программы, способные решать сложные задачи на основе логической обработки содержащихся в них знаний. Примерами таких программ являются знаменитый «Логик–Теоретик» и GPS – универсальный решатель задач. В их разработке участвовали известные учёные А. Ньюэлл, А. Тьюринг, К. Шеннон, Г. Саймон, Дж. Шоу и др.

«Восходящий метод» развивался в работах Дж. Маккалоха, У. Питтса, Ф. Розенблата и др., посвящённых созданию самоорганизующихся систем и «самообучающихся машин». Эти учёные опирались на идею Н. Винера об обратной связи, благодаря которой всё живое приспосабливается к окружающей среде и добивается своих целей.

Так возникло направление, связанное с разработкой нейронных сетей, которое, не успев твёрдо встать на ноги, было подвергнуто суровой критике оппонентов из противоположного лагеря (М. Минский и С. Пейперт) и какое-то время считалось неперспективным. Однако стремительное развитие аппаратных компьютерных средств и не оправдавшиеся надежды на возможности экспертных систем с дедуктивными выводами стали причиной второго рождения нейросетевых технологий в 1980-х гг. Сегодня модели нейронных сетей активно разрабатываются и применяются для решения задач прогнозирования, распознавания, извлечения знаний из хранилищ данных. Этим вопросам посвящена глава 2.

Глава 3 содержит описание методов обработки информации, основанных на эволюционных аналогиях. Наличие символьной информации и отсутствие детерминированных алгоритмов её обработки в интеллектуальных системах послужило причиной возникновения задач поиска в пространстве высокой размерности, а также комбинаторных задач, для решения которых успешно применяются генетические алгоритмы, методы эволюционного программирования и эволюционные стратегии. При этом для решения сложных и плохо обусловленных задач всё чаще применяются комбинированные подходы, в которых сочетаются методы нечёткого представления знаний, модели нейронных сетей для получения результата при отсутствии чётко заданного алгоритма и генетические методы для оптимизации полученных решений.

В главе 4 рассмотрены вопросы проектирования и применения мультиагентных систем, ориентированных на автономное выполнение интеллектуальных задач в распределённых компьютерных средах. Это одно из самых новых направлений в искусственном интеллекте, которое имеет большие перспективы в связи с широким распространением Интернета и представляет особый интерес для специалистов в области экономики и бизнеса, так как является базой для создания виртуальных предприятий.



Одно из современных средств, позволяющее использовать целый ряд подходов, обеспечивающее поддержку программирования на основе правил объектно-ориентированного и процедурного программирования – это язык CLIPS. Название языка CLIPS – аббревиатура от C Language Integrated Production System. Язык был разработан в Центре космических исследований NASA (NASA's Johnson Space Center) в середине 1980-х годов и во многом сходен с языками, созданными на базе LISP, в частности OPS5 и ART. Хотя в то время на рынке уже появились программные средства для задач искусственного интеллекта, разработанные на языке C, специалисты из NASA решили создать такой продукт самостоятельно. В настоящее время эта система доступна во всем мире, и нужно отметить, что по своим возможностям она не уступает множеству гораздо более дорогих коммерческих продуктов, поэтому на рассмотрении возможностей данного языка авторы остановились более подробно. Вопросам реализации информационных технологий на языке CLIPS посвящена глава 5.

В главе 6 рассмотрены примеры реализации интеллектуальных информационных технологий на языке CLIPS.

В конце каждой главы учебника приведены список литературы, а также контрольные вопросы и задания. В приложениях А и Б учебника представлены содержательные примеры реализации экспертных систем на языке CLIPS.

1. ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ –

ОСНОВА НОВЫХ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ

Искусственный интеллект (ИИ) как наука существует около полувека. Первой интеллектуальной системой считается программа «Логик–Теоретик», предназначенная для доказательства теорем и исчисления высказываний. Её работа впервые была продемонстрирована 9 августа 1956 г. В создании программы участвовали такие известные учёные, как А. Ньюэлл, А. Тьюринг, К. Шеннон, Дж. Лоу, Г. Саймон и др. За прошедшее с тех пор время в области ИИ разработано великое множество компьютерных систем, которые принято называть интеллектуальными. Области их применения охватывают практически все сферы человеческой деятельности, связанные с обработкой информации.

На сегодняшний день не существует единого определения, которое однозначно описывает эту научную область. Академик Г.С. Поспелов в книге «Искусственный интеллект – основа новой информационной технологии» писал [7]: «под "искусственным интеллектом" понимается наука о том, как заставить машину делать то, что умеет делать умный человек». Среди многих точек зрения на область разработок искусственного интеллекта доминируют следующие три. Согласно первой исследования в области ИИ относятся к фундаментальным, в процессе которых разрабатываются новые модели и методы решения задач, традиционно считавшихся интеллектуальными и не поддававшихся ранее формализации и автоматизации. Согласно второй точке зрения это направление связано с новыми идеями решения задач на ЭВМ, с разработкой новых технологий программирования и с переходом к компьютерам не фон-неймановской архитектуры. Третья точка зрения, наиболее прагматическая, основана на том, что в результате исследований, проводимых в области ИИ, появляется множество прикладных систем, способных решать задачи, для которых ранее создаваемые системы были непригодны. По последней трактовке ИИ является экспериментальной научной дисциплиной, в которой роль эксперимента заключается в проверке и уточнении интеллектуальных систем, представляющих собой аппаратно-программные информационные комплексы.

1.1. Основные направления исследований в области интеллектуальных информационных систем Интеллектуальные информационные системы проникают во все сферы нашей жизни, поэтому трудно провести строгую классификацию направлений, по которым ведутся активные и многочисленные исследования в области ИИ. Рассмотрим кратко некоторые из них.

Разработка интеллектуальных информационных систем или систем, основанных на знаниях. Это одно из главных направлений ИИ.

Основной целью построения таких систем являются выявление, исследование и применение знаний высококвалифицированных экспертов для решения сложных задач, возникающих на практике. При построении систем, основанных на знаниях (СОЗ), используются знания, накопленные экспертами в виде конкретных правил решения тех или иных задач. Это направление преследует цель имитации человеческого искусства анализа неструктурированных и слабоструктурированных проблем [9]. В данной области исследований осуществляется разработка моделей представления, извлечения и структурирования знаний, а также изучаются проблемы создания баз знаний (БЗ), образующих ядро СОЗ. Частным случаем СОЗ являются экспертные системы (ЭС).

Разработка естественно-языковых интерфейсов и машинный перевод. Проблемы компьютерной лингвистики и машинного перевода разрабатываются в ИИ с 1950-х гг. Системы машинного перевода с одного естественного языка на другой обеспечивают быстроту и систематичность доступа к информации, оперативность и единообразие перевода больших потоков, как правило, научно-технических текстов [6]. Системы машинного перевода строятся как интеллектуальные системы, поскольку в их основе лежат БЗ в определённой предметной области и сложные модели, обеспечивающие дополнительную трансляцию «исходный язык оригинала – язык смысла – язык перевода».

Они базируются на структурно-логическом подходе, включающем последовательный анализ и синтез естественно-языковых сообщений.

Кроме того, в них осуществляется ассоциативный поиск аналогичных фрагментов текста и их переводов в специальных базах данных (БД).

Данное направление охватывает также исследования методов и разработку систем, обеспечивающих реализацию процесса общения человека с компьютером на естественном языке (так называемые системы ЕЯ-общения) [6].

Генерация и распознавание речи. Системы речевого общения создаются в целях повышения скорости ввода информации в ЭВМ, разгрузки зрения и рук, а также для реализации речевого общения на значительном расстоянии. В таких системах под текстом понимают фонемный текст (как слышится).

Обработка визуальной информации. В этом научном направлении решаются задачи обработки, анализа и синтеза изображений [6]. Задача обработки изображений связана с трансформированием графических образов, результатом которого являются новые изображения.

В задаче анализа исходные изображения преобразуются в данные другого типа, например в текстовые описания. При синтезе изображений на вход системы поступает алгоритм построения изображения, а выходными данными являются графические объекты (системы машинной графики).

Обучение и самообучение. Эта актуальная область ИИ включает модели, методы и алгоритмы, ориентированные на автоматическое накопление и формирование знаний с использованием процедур анализа и обобщения данных [4, 13]. К данному направлению относятся не так давно появившиеся системы добычи данных (Data Mining) и системы поиска закономерностей в компьютерных базах данных (Knowledge Discovery).

Распознавание образов. Это одно из самых ранних направлений ИИ, в котором распознавание объектов осуществляется на основании применения специального математического аппарата, обеспечивающего отнесение объектов к классам [7], а классы описываются совокупностями определённых значений признаков.

Игры и машинное творчество. Машинное творчество охватывает сочинение компьютерной музыки [5], стихов [6], интеллектуальные системы для изобретения новых объектов [2, 14]. Создание интеллектуальных компьютерных игр является одним из самых развитых коммерческих направлений в сфере разработки программного обеспечения. Кроме того, компьютерные игры предоставляют мощный арсенал разнообразных средств, используемых для обучения.

Программное обеспечение систем ИИ. Инструментальные средства для разработки интеллектуальных систем включают специальные языки программирования, ориентированные на обработку символьной информации (LISP, SMALLTALK, РЕФАЛ), языки логического программирования (PROLOG), языки представления знаний (OPS5, KRL, FRL), интегрированные программные среды, содержащие арсенал инструментальных средств для создания систем ИИ (КЕ, ARTS, GURU, G2), а также оболочки экспертных систем (BUILD, EMYCIN, EXSYS Professional, ЭКСПЕРТ), которые позволяют создавать прикладные ЭС, не прибегая к программированию [8, 11].

Новые архитектуры компьютеров. Это направление связано с созданием компьютеров не фон-неймановской архитектуры, ориентированных на обработку символьной информации. Известны удачные промышленные решения параллельных и векторных компьютеров [1, 8], однако в настоящее время они имеют весьма высокую стоимость, а также недостаточную совместимость с существующими вычислительными средствами.

Интеллектуальные роботы. Создание интеллектуальных роботов составляет конечную цель робототехники. В настоящее время в основном используются программируемые манипуляторы с жёсткой схемой управления, названные роботами первого поколения. Несмотря на очевидные успехи отдельных разработок, эра интеллектуальных автономных роботов пока не наступила. Основными сдерживающими факторами в разработке автономных роботов являются нерешённые проблемы в области интерпретации знаний, машинного зрения, адекватного хранения и обработки трёхмерной визуальной информации.

1.2. Основные типы интеллектуальных информационных систем и Интеллектуальная информационная система (ИИС) основана на концепции использования базы знаний для генерации алгоритмов решения прикладных задач различных классов в зависимости от конкретных информационных потребностей пользователей.

Для ИИС характерны следующие признаки [12]:

– развитые коммуникативные способности;

– умение решать сложные плохо формализуемые задачи;

– способность к самообучению;

– адаптивность.

Каждому из перечисленных признаков условно соответствует свой класс ИИС. Различные системы могут обладать одним или несколькими признаками интеллектуальности с различной степенью проявления.

Средства ИИ могут использоваться для реализации различных функций, выполняемых ИИС. На рисунке 1.1 приведена классификация ИИС, признаками которой являются следующие интеллектуальные функции:

коммуникативные способности – способ взаимодействия конечного пользователя с системой;

решение сложных плохо формализуемых задач, которые требуют построения оригинального алгоритма решения в зависимости от конкретной ситуации, характеризующейся неопределённостью и динамичностью исходных данных и знаний;

Системы с интеллек- Экспертные системы Самообслуживающиеся Адаптивные Рис. 1.1. Классификация интеллектуальных информационных систем способность к самообучению – умение системы автоматически извлекать знания из накопленного опыта и применять их для решения задач;

адаптивность – способность системы к развитию в соответствии с объективными изменениями области знаний.

Системы с интеллектуальным интерфейсом. Применение ИИ для усиления коммуникативных способностей информационных систем привело к появлению систем с интеллектуальным интерфейсом, среди которых можно выделить следующие типы.

1. Интеллектуальные базы данных. Позволяют в отличие от традиционных БД обеспечивать выборку необходимой информации, не присутствующей в явном виде, а выводимой из совокупности хранимых данных.

2. Естественно-языковой интерфейс. Применяется для доступа к интеллектуальным базам данных, контекстного поиска документальной текстовой информации, голосового ввода команд в системах управления, машинного перевода с иностранных языков. Для реализации ЕЯ-интерфейса необходимо решить проблемы морфологического, синтаксического и семантического анализа, а также задачу синтеза высказываний на естественном языке. При морфологическом анализе осуществляются распознавание и проверка правильности написания слов в словаре.

Синтаксический контроль предполагает разложение входных сообщений на отдельные компоненты, проверку соответствия грамматическим правилам внутреннего представления знаний и выявление недостающих частей. Семантический анализ обеспечивает установление смысловой правильности синтаксических конструкций. В отличие от анализа синтез высказываний заключается в преобразовании цифрового представления информации в представление на естественном языке.

3. Гипертекстовые системы. Используются для реализации поиска по ключевым словам в базах данных с текстовой информацией. Для более полного отражения различных смысловых отношений терминов требуется сложная семантическая организация ключевых слов. Решение этих задач осуществляется с помощью интеллектуальных гипертекстовых систем, в которых механизм поиска сначала работает с базой знаний ключевых слов, а затем – с самим текстом. Аналогичным образом проводится поиск мультимедийной информации, включающей кроме текста графическую информацию, аудио- и видеообразы.

4. Системы контекстной помощи. Относятся к классу систем распространения знаний. Такие системы являются, как правило, приложениями к документации. Системы контекстной помощи – частный случай гипертекстовых и ЕЯ-систем. В них пользователь описывает проблему, а система на основе дополнительного диалога конкретизирует её и выполняет поиск относящихся к ситуации рекомендаций. В обычных гипертекстовых системах, наоборот, компьютерные приложения навязывают пользователю схему поиска требуемой информации.

5. Системы когнитивной графики. Ориентированы на общение с пользователем ИИС посредством графических образов, которые генерируются в соответствии с изменениями параметров моделируемых или наблюдаемых процессов. Когнитивная графика позволяет в наглядном и выразительном виде представить множество параметров, характеризующих изучаемое явление, освобождает пользователя от анализа тривиальных ситуаций, способствует быстрому освоению программных средств и повышению конкурентоспособности разрабатываемых ИИС. Применение когнитивной графики особенно актуально в системах мониторинга и оперативного управления, в обучающих и тренажёрных системах, в оперативных системах принятия решений, работающих в режиме реального времени.

Экспертные системы как самостоятельное направление в искусственном интеллекте сформировалось в конце 1970-х гг. История ЭС началась с сообщения японского комитета по разработке ЭВМ пятого поколения, в котором основное внимание уделялось развитию «интеллектуальных способностей» компьютеров с тем, чтобы они могли оперировать не только данными, но и знаниями, как это делают специалисты (эксперты) при выработке умозаключений. Группа по экспертным системам при Комитете British Computer Society определила ЭС как «воплощение в ЭВМ компоненты опыта эксперта, основанной на знаниях, в такой форме, что машина может дать интеллектуальный совет или принять решение относительно обрабатываемой функции». Одним из важных свойств ЭС является способность объяснить ход своих рассуждений понятным для пользователя образом [15].

Область исследования ЭС называют «инженерией знаний». Этот термин был введён Е. Фейгенбаумом и в его трактовке означает «привнесение принципов и инструментария из области искусственного интеллекта в решение трудных прикладных проблем, требующих знаний экспертов». Другими словами, ЭС применяются для решения неформализованных проблем, к которым относят задачи, обладающие одной (или несколькими) из следующих характеристик:

задачи не могут быть представлены в числовой форме;

исходные данные и знания о предметной области обладают неоднозначностью, неточностью, противоречивостью;

цели нельзя выразить с помощью чётко определённой целевой функции;

не существует однозначного алгоритмического решения задачи;

алгоритмическое решение существует, но его нельзя использовать по причине большой размерности пространства решений и ограничений на ресурсы (времени, памяти).

Главное отличие ЭС и систем искусственного интеллекта от систем обработки данных состоит в том, что в них используется символьный, а не числовой способ представления данных, а в качестве методов обработки информации применяются процедуры логического вывода и эвристического поиска решений.

ЭС охватывают самые разные предметные области, среди которых лидируют бизнес, производство, медицина, проектирование и системы управления [4, 6, 11, 12, 15, 17].

Во многих случаях ЭС являются инструментом, усиливающим интеллектуальные способности эксперта.

Для классификации ЭС используются следующие признаки:

способ формирования решения;

способ учёта временного признака;

вид используемых данных и знаний;

число используемых источников знаний.

По способу формирования решения ЭС можно разделить на анализирующие и синтезирующие. В системах первого типа осуществляется выбор решения из множества известных решений на основе анализа знаний, в системах второго типа решение синтезируется из отдельных фрагментов знаний.

В зависимости от способа учёта временного признака ЭС делят на статические и динамические. Статические ЭС предназначены для решения задач с неизменяемыми в процессе решения данными и знаниями, а динамические ЭС допускают такие изменения.

По видам используемых данных и знаний различают ЭС с детерминированными и неопределёнными знаниями. Под неопределённостью знаний и данных понимаются их неполнота, ненадёжность, нечёткость.

ЭС могут создаваться с использованием одного или нескольких источников знаний.

В соответствии с перечисленными признаками можно выделить четыре основных класса ЭС (рис. 1.2): классифицирующие, доопределяющие, трансформирующие и мультиагентные [12].

Классифицирующие ЭС решают задачи распознавания ситуаций.

Основным методом формирования решений в таких системах является дедуктивный логический вывод.

Доопределяющие ЭС используются для решения задач с не полностью определёнными данными и знаниями. В таких ЭС возникают задачи интерпретации нечётких знаний и выбора альтернативных направлений поиска в пространстве возможных решений. В качестве методов обработки неопределённых знаний могут использоваться байесовский вероятностный подход, коэффициенты уверенности, нечёткая логика.

Трансформирующие ЭС относятся к синтезирующим динамическим экспертным системам, в которых предполагается повторяющееся преобразование знаний в процессе решения задач. В ЭС данного класса используются различные способы обработки знаний:

генерация и проверка гипотез;

логика предположений и умолчаний (когда по неполным данным формируются представления об объектах определённого класса, которые впоследствии адаптируются к конкретным условиям изменяющихся ситуаций);

использование метазнаний (более общих закономерностей) для устранения неопределённостей в ситуациях.

Мультиагентные системы – это динамические ЭС, основанные на интеграции нескольких разнородных источников знаний. Эти источники обмениваются между собой получаемыми результатами в ходе решения задач. Системы данного класса имеют следующие возможности:

Неопределён- Доопреде- Мультиисточников Рис. 1.2. Основные классы экспертных систем реализация альтернативных рассуждений на основе использования различных источников знаний и механизма устранения противоречий;

распределенное решение проблем, декомпозируемых на параллельно решаемые подзадачи с самостоятельными источниками знаний;

применение различных стратегий вывода заключений в зависимости от типа решаемой проблемы;

обработка больших массивов информации из баз данных;

использование математических моделей и внешних процедур для имитации развития ситуаций.

Самообучающиеся интеллектуальные системы основаны на методах автоматической классификации ситуаций из реальной практики, или на методах обучения на примерах. Примеры реальных ситуаций составляют так называемую обучающую выборку, которая формируется в течение определённого исторического периода. Элементы обучающей выборки описываются множеством классификационных признаков.

Стратегия «обучение с учителем» предполагает задание специалистом для каждого примера значений признаков, показывающих его принадлежность к определённому классу ситуаций. При обучении «без учителя» система должна самостоятельно выделять классы ситуаций по степени близости значений классификационных признаков.

В процессе обучения проводится автоматическое построение обобщающих правил или функций, описывающих принадлежность ситуаций к классам, которыми система впоследствии будет пользоваться при интерпретации незнакомых ситуаций. Из обобщающих правил, в свою очередь, автоматически формируется база знаний, которая периодически корректируется по мере накопления информации об анализируемых ситуациях.

Построенные в соответствии с этими принципами самообучающиеся системы имеют следующие недостатки:

относительно низкую адекватность баз знаний возникающим реальным проблемам из-за неполноты и/или зашумлённости обучающей выборки;

низкую степень объяснимости полученных результатов;

поверхностное описание проблемной области и узкую направленность применения из-за ограничений в размерности признакового пространства.

Индуктивные системы позволяют обобщать примеры на основе принципа индукции «от частного к общему». Процедура обобщения сводится к классификации примеров по значимым признакам. Алгоритм классификации примеров включает следующие основные шаги.

1. Выбор классификационного признака из множества заданных.

2. Разбиение множества примеров на подмножества по значению выбранного признака.

3. Проверка принадлежности каждого подмножества примеров одному из классов.

4. Проверка окончания процесса классификации. Если какое-то подмножество примеров принадлежит одному подклассу, т.е. у всех примеров этого подмножества совпадает значение классификационного признака, то процесс классификации заканчивается.

5. Для подмножеств примеров с несовпадающими значениями классификационных признаков процесс распознавания продолжается, начиная с первого шага. При этом каждое подмножество примеров становится классифицируемым множеством.

Нейронные сети представляют собой классический пример технологии, основанной на примерах. Нейронные сети – обобщённое название группы математических алгоритмов, обладающих способностью обучаться на примерах, «узнавая» впоследствии черты встреченных образцов и ситуаций. Благодаря этой способности нейронные сети используются при решении задач обработки сигналов и изображений, распознавания образов, а также для прогнозирования [10].

Нейронная сеть – это кибернетическая модель нервной системы, которая представляет собой совокупность большого числа сравнительно простых элементов – нейронов, топология соединения которых зависит от типа сети. Чтобы создать нейронную сеть для решения какойлибо конкретной задачи, следует выбрать способ соединения нейронов друг с другом и подобрать значения параметров межнейронных соединений.

В системах, основанных на прецедентах, БЗ содержит описания конкретных ситуаций (прецеденты). Поиск решения осуществляется на основе аналогий и включает следующие этапы:

получение информации о текущей проблеме;

сопоставление полученной информации со значениями признаков прецедентов из базы знаний;

выбор прецедента из базы знаний, наиболее близкого к рассматриваемой проблеме;

адаптация выбранного прецедента к текущей проблеме;

проверка корректности каждого полученного решения;

занесение детальной информации о полученном решении в БЗ.

Прецеденты описываются множеством признаков, по которым строятся индексы быстрого поиска. Однако в системах, основанных на прецедентах, в отличие от индуктивных систем допускается нечёткий поиск с получением множества допустимых альтернатив, каждая из которых оценивается некоторым коэффициентом уверенности. Наиболее эффективные решения адаптируются к реальным ситуациям с помощью специальных алгоритмов.

Системы, основанные на прецедентах, применяются для распространения знаний и в системах контекстной помощи.

Информационные хранилища отличаются от интеллектуальных баз данных тем, что представляют собой хранилища значимой информации, регулярно извлекаемой из оперативных баз данных. Хранилище данных – это предметно-ориентированное, интегрированное, привязанное ко времени, неизменяемое собрание данных, применяемых для поддержки процессов принятия управленческих решений [3].

Предметная ориентация означает, что данные объединены в категории и хранятся в соответствии с теми областями, которые они описывают, а не с приложениями, которые их используют. В хранилище данные интегрируются в целях удовлетворения требований предприятия в целом, а не отдельной функции бизнеса. Привязанность данных ко времени выражает их «историчность», т.е. атрибут времени всегда явно присутствует в структурах хранилища данных. Неизменяемость означает, что, попав однажды в хранилище, данные уже не изменяются в отличие от оперативных систем, где данные присутствуют только в последней версии, поэтому постоянно меняются.

Технологии извлечения знаний из хранилищ данных основаны на методах статистического анализа и моделирования, ориентированных на поиск моделей и отношений, скрытых в совокупности данных. Эти модели могут в дальнейшем использоваться для оптимизации деятельности предприятия или фирмы.

Для извлечения значимой информации из хранилищ данных имеются специальные методы (OLAP-анализа, Data Mining или Knowledge Discovery), основанные на применении методов математической статистики, нейронных сетей, индуктивных методов построения деревьев решений и др.

Технология OLAP (On-Line Analytical Processing – оперативный анализ данных) предоставляет пользователю средства для формирования и проверки гипотез о свойствах данных или отношениях между ними на основе разнообразных запросов к базе данных. Они применяются на ранних стадиях процесса извлечения знаний, помогая аналитику сфокусировать внимание на важных переменных. Средства Data Mining отличаются от OLAP тем, что кроме проверки предполагаемых зависимостей они способны самостоятельно (без участия пользователя) генерировать гипотезы о закономерностях, существующих в данных, и строить модели, позволяющие количественно оценить степень взаимного влияния исследуемых факторов на основе имеющейся информации.

Потребность в адаптивных информационных системах возникает в тех случаях, когда поддерживаемые ими проблемные области постоянно развиваются. В связи с этим адаптивные системы должны удовлетворять ряду специфических требований, а именно:

адекватно отражать знания проблемной области в каждый момент времени;

быть пригодными для лёгкой и быстрой реконструкции при изменении проблемной среды.

Адаптивные свойства информационных систем обеспечиваются за счёт интеллектуализации их архитектуры. Ядром таких систем является постоянно развиваемая модель проблемной области, поддерживаемая в специальной базе знаний – репозитории. Ядро системы управляет процессами генерации или переконфигурирования программного обеспечения.

В процессе разработки адаптивных информационных систем применяется оригинальное или типовое проектирование. Оригинальное проектирование предполагает разработку информационной системы с «чистого листа» на основе сформулированных требований. Реализация этого подхода основана на использовании систем автоматизированного проектирования, или CASE-технологий (Designer 2000, Silver Run, Natural Light Storm и др.).

При типовом проектировании осуществляется адаптация типовых разработок к особенностям проблемной области. Для реализации этого подхода применяются инструментальные средства компонентного (сборочного) проектирования информационных систем (R/3, BAANIV, Prodis и др.).

Главное отличие подходов состоит в том, что при использовании CASE-технологии на основе репозитория при изменении проблемной области каждый раз выполняется генерация программного обеспечения, а при использовании сборочной технологии – конфигурирование программ и только в редких случаях – их переработка.

1.3. Технологии разработки экспертных систем Технология создания интеллектуального программного обеспечения существенно отличается от разработки традиционных программ с использованием известных алгоритмических языков (табл. 1.1).

1.1. Отличия систем искусственного интеллекта от Характеристика решения Искомое решение Удовлетворительное Оптимальное Рассмотрим отработанные на сегодняшний день элементы технологии создания ИИС на примере разработки экспертных систем. Этот выбор обусловлен тем, что ЭС получили весьма широкое распространение во многих сферах человеческой деятельности, а технологии их создания имеют универсальный характер и не требуют аппаратных реализаций.

Экспертными системами называют сложные программные комплексы, аккумулирующие знания специалистов в конкретных предметных областях и тиражирующие этот эмпирический опыт для консультаций менее квалифицированных пользователей [4].

В самых первых ЭС не учитывалось изменение знаний, используемых в процессе решения конкретной задачи. Их назвали статическими ЭС. Типичная статическая ЭС содержит следующие основные компоненты:

рабочую память, называемую также базой данных;

решатель (интерпретатор);

систему объяснений;

компоненты приобретения знаний;

интерфейс с пользователем.

База знаний ЭС предназначена для хранения долгосрочных данных, описывающих рассматриваемую область, и правил, описывающих целесообразные преобразования данных этой области.

База данных (рабочая память) служит для хранения текущих данных решаемой задачи.

Решатель (интерпретатор) формирует последовательность применения правил и осуществляет их обработку, используя данные из рабочей памяти и знания из БЗ.

Система объяснений показывает, каким образом система получила решение задачи и какие знания при этом использовались. Это облегчает тестирование системы и повышает доверие пользователя к полученному результату.

Компоненты приобретения знаний необходимы для заполнения ЭС знаниями в диалоге с пользователем-экспертом, а также для добавления и модификации заложенных в систему знаний.

К разработке ЭС привлекаются специалисты из разных предметных областей, а именно:

эксперты той проблемной области, к которой относятся задачи, решаемые ЭС;

инженеры по знаниям, являющиеся специалистами по разработке ИИС;

программисты, осуществляющие реализацию ЭС.

Эксперты поставляют знания в ЭС и оценивают правильность получаемых результатов. Инженеры по знаниям помогают экспертам выявить и структурировать знания, необходимые для работы ЭС, выполняют работу по представлению знаний, выбирают методы обработки знаний, проводят выбор инструментальных средств для реализации ЭС, наиболее пригодных для решения поставленных задач.

Программисты разрабатывают программное обеспечение ЭС и осуществляют его сопряжение со средой, в которой оно будет использоваться.

Любая ЭС должна иметь, по крайней мере, два режима работы.

В режиме приобретения знаний эксперт наполняет систему знаниями, которые впоследствии позволят ЭС самостоятельно (без помощи эксперта) решать определённые задачи из конкретной проблемной области. Эксперт описывает проблемную область в виде совокупности данных и правил. Данные определяют объекты, их характеристики и значения, существующие в области экспертизы. Правила определяют взаимные связи, существующие между данными, и способы манипулирования данными, характерные для рассматриваемого класса задач.

В режиме консультации пользователь ЭС сообщает системе конкретные данные о решаемой задаче и стремится получить с её помощью результат. Пользователи-неспециалисты обращаются к ЭС за результатом, не умея получить его самостоятельно, пользователиспециалисты используют ЭС для ускорения и облегчения процесса получения результата. Следует подчеркнуть, что термин «пользователь»

является многозначным, так как использовать ЭС могут и эксперт, и инженер по знаниям, и программист. Поэтому, когда хотят подчеркнуть, что речь идёт о том, для кого делалась ЭС, используют термин «конечный пользователь».

В режиме консультации входные данные о задаче поступают в рабочую память. Решатель на основе входных данных из рабочей памяти и правил из БЗ формирует решение. В отличие от традиционных программ компьютерной обработки данных ЭС при решении задачи не только исполняет предписанную последовательность операций, но и сама формирует её.

Существует широкий класс приложений, в которых требуется учитывать изменения, происходящие в окружающем мире за время исполнения приложения. Для решения таких задач необходимо применять динамические ЭС, которые наряду с компонентами статических систем содержат подсистему моделирования внешнего мира и подсистему связи с внешним окружением. Подсистема моделирования внешнего мира необходима для прогнозирования, анализа и адекватной оценки состояния внешней среды. Изменения окружения решаемой задачи требуют изменения хранимых в ЭС знаний, для того чтобы отразить временную логику происходящих в реальном мире событий.

Компонента связи с внешним миром актуальна для автономных интеллектуальных систем (роботов), а также для интеллектуальных систем управления. Связь с внешним миром осуществляется через систему датчиков и контроллеров.

Трудоёмкость разработки ИИС в значительной степени зависит от используемых инструментальных средств. Инструментальные средства для разработки интеллектуальных приложений можно классифицировать по следующим основным параметрам:

уровень используемого языка;

парадигмы программирования и механизмы реализации;

способ представления знаний;

механизмы вывода и моделирования;

средства приобретения знаний;

технологии разработки приложений.

Уровень используемого языка. Мощность и универсальность языка программирования определяет трудоёмкость разработки ЭС.

1. Традиционные (в том числе объектно-ориентированные) языки программирования типа С, C++ (как правило, они используются не для создания ЭС, а для создания инструментальных средств).

2. Специальные языки программирования (например, язык LISP, ориентированный на обработку списков; язык логического программирования PROLOG; язык рекурсивных функций РЕФАЛ и т.д.).

Их недостатком является слабая приспособленность к объединению с программами, написанными на языках традиционного программирования.

3. Инструментальные средства, содержащие многие, но не все компоненты ЭС (например, система OPS5, которая поддерживает продукционный подход к представлению знаний; языки KRL и FRL, используемые для разработки ЭС с фреймовым представлением знаний). Такое программное обеспечение предназначено для разработчиков, владеющих технологиями программирования и умеющих интегрировать разнородные компоненты в программный комплекс.

4. Оболочки ЭС общего назначения, содержащие все программные компоненты, но не имеющие знаний о конкретных предметных средах. Средства этого типа и последующего не требуют от разработчика приложения знания программирования. Примерами являются ЭКО, Leonardo, Nexpert Object, Kappa, EXSYS, GURU, ART, KEE и др.

В последнее время всё реже употребляется термин «оболочка», его заменяют более широким термином «среда разработки». Если хотят подчеркнуть, что средство используется не только на стадии разработки приложения, но и на стадиях использования и сопровождения, то употребляют термин «полная среда» (completeen vironment). Для поддержания всего цикла создания и сопровождения программ используются интегрированные инструментальные системы типа WorkBench, например KEATS [18], Shelly [16], VITAL [19]. Основными компонентами системы KEATS являются: ACQUIST – средства фрагментирования текстовых источников знаний, позволяющие разбивать текст или протокол беседы с экспертом на множество взаимосвязанных, аннотированных фрагментов и создавать понятия (концепты); FLIK – язык представления знаний средствами фреймовой модели; GIS – графический интерфейс, используемый для создания гипертекстов и концептуальных моделей, а также для проектирования фреймовых систем;

ERI – интерпретатор правил, реализующий процедуры прямого и обратного вывода; TRI – инструмент визуализации логического вывода, демонстрирующий последовательность выполнения правил; Tables – интерфейс манипулирования таблицами, используемыми для хранения знаний в БЗ; CS – язык описания и распространения ограничений;

TMS – немонотонная система поддержания истинности.

При использовании инструментария данного типа могут возникнуть следующие трудности:

а) управляющие стратегии, заложенные в механизм вывода, могут не соответствовать методам решения, которые использует эксперт, взаимодействующий с данной системой, что может привести к неэффективным, а возможно, и неправильным решениям;

б) способ представления знаний, используемый в инструментарии, мало подходит для описания знаний конкретной предметной области.

Большая часть этих трудностей разрешена в проблемно/предметно-ориентированных средствах разработки ИИС.

5. Проблемно/предметно-ориентированные оболочки и среды (не требуют знания программирования):

проблемно-ориентированные средства – предназначены для решения задач определённого класса (задачи поиска, управления, планирования, прогнозирования и др.) и содержат соответствующие этому классу альтернативные функциональные модули;

предметно-ориентированные средства – включают знания о типах предметных областей, что сокращает время разработки БЗ.

При использовании оболочек и сред разработчик приложения полностью освобождается от программирования, его основные трудозатраты связаны с формированием базы знаний.

Парадигмы программирования и механизмы реализации. Способы реализации механизма исполняемых утверждений часто называют парадигмами программирования. К основным парадигмам относят следующие:

процедурное программирование;

программирование, ориентированное на данные;

программирование, ориентированное на правила;

объектно-ориентированное программирование.

Парадигма процедурного программирования является самой распространённой среди существующих языков программирования (например, С и Pascal). В процедурной парадигме активная роль отводится процедурам, а не данным; причём любая процедура активизируется вызовом. Подобные способы задания поведения удобны для описаний детерминированной последовательности действий одного процесса или нескольких взаимосвязанных процессов.

При использовании программирования, ориентированного на данные, активная роль принадлежит данным, а не процедурам. Здесь со структурами активных данных связывают некоторые действия (процедуры), которые активизируются тогда, когда осуществляется обращение к этим данным.

В парадигме, ориентированной на правила, поведение определяется множеством правил вида «условие–действие». Условие задаёт образ данных, при возникновении которого действие правила может быть выполнено. Правила в данной парадигме играют такую же роль, как и операторы в процедурной парадигме. Однако если в процедурной парадигме поведение задаётся детерминированной последовательностью операторов, не зависящей от значений обрабатываемых данных, то в парадигме, ориентированной на правила, поведение не задатся заранее предписанной последовательностью правил, а формируется на основе значений данных, которые в текущий момент обрабатываются программой. Подход, ориентированный на правила, удобен для описания поведения, гибко и разнообразно реагирующего на большое многообразие состояний данных.

Парадигма объектного программирования в отличие от процедурной парадигмы не разделяет программу на процедуры и данные.

Здесь программа организуется вокруг сущностей, называемых объектами, которые включают локальные процедуры (методы) и локальные данные (переменные). Поведение (функционирование) в этой парадигме организуется путём пересылки сообщений между объектами.

Объект, получив сообщение, осуществляет его локальную интерпретацию, основываясь на локальных процедурах и данных. Такой подход позволяет описывать сложные системы наиболее естественным образом. Он особенно удобен для интегрированных ЭС.

Способ представления знаний. Наличие многих способов представления знаний вызвано стремлением представить различные типы проблемных сред с наибольшей эффективностью. Обычно способ представления знаний в ЭС характеризуют моделью представления знаний. Типичными моделями представления знаний являются правила (продукции), фреймы (или объекты), семантические сети, логические формулы. Инструментальные средства, имеющие в своём составе более одной модели представления знаний, называют гибридными.

Большинство современных средств, как правило, использует объектноориентированную парадигму, объединённую с парадигмой, ориентированной на правила. Одно из современных средств, позволяющее использовать целый ряд подходов, обеспечивающее поддержку программирования на основе правил, объектно-ориентированного и процедурного программирования – это язык CLIPS.

Язык CLIPS (название которого представляет собой сокращение от С Language Integrated Production System – продукционная система, интегрированная с языком С) был разработан с использованием языка программирования С в Космическом центре NASA/Джонсон.

Перед разработчиками этого языка была поставлена конкретная задача – обеспечить полную переносимость, низкую стоимость и простую интеграцию с внешними системами. Первоначально CLIPS обеспечивал поддержку только программирования на основе правил (отсюда происходит часть его обозначения как «продукционной системы»). Но уже в версии 5.0 языка CLIPS введена поддержка процедурного и объектно-ориентированного программирования.

Возможности логического вывода и представления, предоставляемые основанным на правилах языком программирования CLIPS, аналогичны возможностям языка OPS5, но являются более мощными.

По своей синтаксической структуре правила CLIPS весьма напоминают правила, применяемые в таких языках, как Eclipse, CLIPS/R2 и Jess, но CLIPS поддерживает только правила прямого логического вывода.

Язык программирования CLIPS, позволяющий использовать целый ряд подходов, обеспечивает поддержку программирования на основе правил, объектно-ориентированного и процедурного программирования.

Таким образом, сегодня CLIPS – это эффективное средство разработки экспертных систем.

Механизмы вывода и моделирования. В статических ЭС единственным активным агентом, изменяющим информацию, является механизм вывода экспертной системы. В динамических ЭС изменение данных происходит не только вследствие функционирования механизма исполняемых утверждений, но также в связи с изменениями окружения задачи, которые моделируются специальной подсистемой или поступают извне. Механизмы вывода в различных средах могут отличаться способами реализации следующих процедур.

1. Структура процесса получения решения:

построение дерева вывода на основе обучающей выборки (индуктивные методы приобретения знаний) и выбор маршрута на дереве вывода в режиме решения задачи;

компиляция сети вывода из специфических правил в режиме приобретения знаний и поиск решения на сети вывода в режиме решения задачи;

генерация сети вывода и поиск решения в режиме решения задачи, при этом генерация сети вывода осуществляется в ходе выполнения операции сопоставления, определяющей пары «правило– совокупность данных», на которых условия этого правила удовлетворяются;

в режиме решения задач ЭС осуществляет выработку правдоподобных предположений (при отсутствии достаточной информации для решения); выполнение рассуждений по обоснованию (опровержению) предположений; генерацию альтернативных сетей вывода; поиск решения в сетях вывода.

2. Поиск (выбор) решения:

направление поиска – от данных к цели, от целей к данным, двунаправленный поиск;

порядок перебора вершин в сети вывода – «поиск в ширину», при котором сначала обрабатываются все вершины, непосредственно связанные с текущей обрабатываемой вершиной G; «поиск в глубину», когда сначала раскрывается одна наиболее значимая вершина – G1 связанная с текущей G, затем вершина G1 делается текущей, и для неё раскрывается одна наиболее значимая вершина G2 и т.д.

3. Процесс генерации предположений и сети вывода:

режим – генерация в режиме приобретения знаний, генерация в режиме решения задачи;

полнота генерируемой сети вывода – операция сопоставления применяется ко всем правилам и ко всем типам указанных в правилах сущностей в каждом цикле работы механизма вывода (обеспечивается полнота генерируемой сети); используются различные средства для сокращения количества правил и (или) сущностей, участвующих в операции сопоставления; например, применяется алгоритм сопоставления или используются знания более общего характера (метазнания).

Механизм вывода для динамических проблемных сред дополнительно содержит: планировщик, управляющий деятельностью ЭС в соответствии с приоритетами; средства, гарантирующие получение лучшего решения в условиях ограниченности ресурсов; систему поддержания истинности значений переменных, изменяющихся во времени.

В динамических инструментальных средствах могут быть реализованы следующие варианты подсистемы моделирования:

система моделирования отсутствует;

существует система моделирования общего назначения, являющаяся частью инструментальной среды;

существует специализированная система моделирования, являющаяся внешней по отношению к программному обеспечению, на котором реализуется ЭС.

Средства приобретения знаний. В инструментальных системах они характеризуются следующими признаками:

1. Уровень языка приобретения знаний:

формальный язык;

ограниченный естественный язык;

язык пиктограмм и изображений;

ЕЯ и язык изображений.

2. Тип приобретаемых знаний:

данные в виде таблиц, содержащих значения входных и выходных атрибутов, по которым индуктивными методами строится дерево вывода;

специализированные правила;

общие и специализированные правила.

3. Тип приобретаемых данных:

атрибуты и значения;

классы структурированных объектов и их экземпляры, получающие значения атрибутов путём наследования.

Промышленная технология создания интеллектуальных систем включает следующие этапы:

исследование выполнимости проекта;

разработку общей концепции системы;

разработку и тестирование серии прототипов;

разработку и испытание головного образца;

разработку и проверку расширенных версий системы;

привязку системы к реальной рабочей среде.

Проектирование ЭС основано на трёх главных принципах:

1. Мощность экспертной системы обусловлена прежде всего мощностью БЗ и возможностями её пополнения и только затем – используемыми методами (процедурами) обработки информации.

2. Знания, позволяющие эксперту (или экспертной системе) получить качественные и эффективные решения задач, являются в основном эвристическими, эмпирическими, неопределёнными, правдоподобными.

3. Неформальный характер решаемых задач и используемых знаний делает необходимым обеспечение активного диалога пользователя с ЭС в процессе её работы.

Перед тем как приступить к разработке ЭС, инженер по знаниям должен рассмотреть вопрос, следует ли разрабатывать ЭС для данного приложения. Положительное решение принимается тогда, когда разработка ЭС возможна, оправданна, и методы инженерии знаний соответствуют решаемой задаче.

Чтобы разработка ЭС была возможной для данного приложения, необходимо выполнение, по крайней мере, следующих требований:

существуют эксперты в данной области, которые решают задачу значительно лучше, чем начинающие специалисты;

эксперты сходятся в оценке предлагаемого решения, так как в противном случае будет невозможно оценить качество разработанной ЭС;

эксперты способны вербализовать (выразить на естественном языке) и объяснить используемые ими методы, иначе трудно рассчитывать на то, что знания экспертов будут «извлечены» и заложены в ЭС;

решение задачи требует только рассуждений, а не действий;

задача не должна быть слишком трудной (т.е. её решение должно занимать у эксперта несколько часов или дней, а не недель или лет);

задача хотя и не должна быть выражена в формальном виде, но всё же должна относиться к достаточно «понятной» и структурированной области, т.е. должна существовать возможность выделения основных понятий, отношений и способов получения решения задачи;

решение задачи не должно в значительной степени опираться на «здравый смысл» (т.е. широкий спектр общих сведений о мире и о способе его функционирования, которые знает и умеет использовать любой нормальный человек), так как подобные знания пока не удаётся в достаточном количестве заложить в системы искусственного интеллекта.

Приложение соответствует методам ЭС, если решаемая задача обладает совокупностью следующих характеристик:

задача может быть естественным образом решена посредством манипулирования символами (с помощью символических рассуждений), а не манипулирования числами, как принято в математических методах и в традиционном программировании;

задача должна иметь эвристическую, а не алгоритмическую природу, т.е. её решение должно требовать применения эвристических правил. Для задач, которые могут быть гарантированно решены (при соблюдении заданных ограничений) с помощью формальных процедур, существуют более эффективные подходы, чем технологии ЭС.

При разработке ЭС, как правило, используется концепция быстрого прототипа, суть которой заключается в том, что разработчики не пытаются сразу построить конечный продукт. На начальном этапе они создают прототип (возможно, не единственный) ЭС, удовлетворяющий двум противоречивым требованиям: умение решать типичные задачи конкретного приложения и незначительные время и трудоёмкость его разработки. При выполнении этих условий становится возможным параллельно вести процесс накопления и отладки знаний, осуществляемый экспертом, и процесс выбора (разработки) программных средств, выполняемый инженером по знаниям и программистами. Для удовлетворения указанным требованиям при создании прототипа используются разнообразные инструментальные средства, ускоряющие процесс проектирования.

Традиционная технология реализации ЭС включает шесть основных этапов (рис. 1.3): идентификацию, концептуализацию, формализацию, выполнение, тестирование, опытную эксплуатацию [11].

Рис. 1.3. Этапы разработки экспертных систем На этапе идентификации определяются задачи, подлежащие решению, цели разработки, эксперты и типы пользователей.

На этапе концептуализации проводится содержательный анализ проблемной области, выявляются используемые понятия и их взаимосвязи, определяются методы решения задач.

На этапе формализации выбираются инструментальные средства и способы представления всех видов знаний, формализуются основные понятия, определяются способы интерпретации знаний, моделируется работа системы, оценивается адекватность системы зафиксированных понятий, методов решения, средств представления и манипулирования знаниями рассматриваемой предметной области.

На этапе выполнения осуществляется заполнение базы знаний.

В связи с тем, что основой ЭС являются знания, данный этап является одним из самых важных и самых трудоёмких. Процесс приобретения знаний разделяют на извлечение знаний в диалоге с экспертами; организацию знаний, обеспечивающую эффективную работу системы, и представление знаний в виде, «понятном» ЭС. Процесс приобретения знаний осуществляется инженером по знаниям на основе анализа деятельности эксперта по решению реальных задач. Проблемы приобретения знаний подробно описаны в главе 4.

На этапе тестирования эксперт и инженер по знаниям в интерактивном режиме с использованием диалоговых и объяснительных средств проверяют компетентность ЭС. Процесс тестирования продолжается до тех пор, пока эксперт не решит, что система достигла требуемого уровня компетентности.

На этапе опытной эксплуатации проверяется пригодность ЭС для конечных пользователей. Полученные результаты могут показать необходимость существенной модификации ЭС.

Процесс создания ЭС не сводится к строгой последовательности перечисленных выше этапов. В ходе разработки приходится неоднократно возвращаться на более ранние этапы и пересматривать принятые там решения.

Инструментальные средства различаются в зависимости от того, какую технологию разработки ЭС они допускают. Можно выделить, по крайней мере, четыре подхода к разработке ЭС:

подход, базирующийся на поверхностных знаниях;

структурный подход;

подход, основанный на глубинных знаниях;

смешанный подход, опирающийся на использование поверхностных и глубинных знаний.

Поверхностный подход применяется для сложных задач, которые не могут быть точно описаны. Его сущность состоит в получении от экспертов фрагментов знаний, релевантных решаемой задаче. При этом не предпринимается попыток систематического или глубинного изучения области, что предопределяет использование поиска в пространстве состояний в качестве универсального механизма вывода.

Обычно в ЭС, использующих данный подход, в качестве способа представления знаний выбираются правила. Условие каждого правила определяет образец некоторой ситуации, в которой правило может быть выполнено. Поиск решения состоит в выполнении тех правил, образцы которых сопоставляются с текущими данными. При этом предполагается, что в процессе поиска решения последовательность формируемых таким образом ситуаций не оборвётся до получения решения, т.е. не возникнет неизвестной ситуации, которая не соответствует ни одному правилу. Данный подход с успехом применяется к широкому классу приложений, но оказывается неэффективным в тех случаях, когда задача может структурироваться или для её решения может использоваться некоторая модель.

Структурный подход к построению ЭС предусматривает структуризацию знаний проблемной области. Его появление обусловлено тем, что для ряда приложений применение техники поверхностных знаний не обеспечивает решения задачи. Структурный подход к построению ЭС во многом похож на структурное программирование. Однако применительно к ЭС речь идёт не о том, чтобы структурирование задачи было доведено до точного алгоритма (как в традиционном программировании), а предполагается, что часть задачи решается с помощью эвристического поиска. Структурный подход в различных приложениях целесообразно сочетать с поверхностным или глубинным.

При глубинном подходе компетентность ЭС базируется на модели той проблемной среды, в которой она работает. Модель может быть определена различными способами (декларативно, процедурно). Необходимость использования моделей в ряде приложений вызвана стремлением исправить недостаток поверхностного подхода, связанный с возникновением ситуаций, не описанных правилами, хранящимися в БЗ. Экспертные системы, разработанные с применением глубинных знаний, при возникновении неизвестной ситуации способны самостоятельно определить, какие действия следует выполнить, с помощью некоторых общих принципов, справедливых для данной области экспертизы.

Глубинный подход требует явного описания структуры и взаимоотношений между различными сущностями проблемной области.

В этом подходе необходимо использовать инструментальные средства, обладающие возможностями моделирования: объекты с присоединёнными процедурами, иерархическое наследование свойств, активные знания (программирование, управляемое данными), механизм передачи сообщений объектам (объектно-ориентированное программирование) и т.п.

Смешанный подход в общем случае может сочетать поверхностный, структурный и глубинный подходы. Например, поверхностный подход может применяться для поиска адекватных знаний, которые затем используются некоторой глубинной моделью.

1. Охарактеризуйте основные направления исследований, проводимые в области искусственного интеллекта.

2. Приведите известные вам примеры применения интеллектуальных систем в различных проблемных областях.

3. Перечислите признаки характерные для интеллектуальных информационных систем.

4. Назовите основные функции, присущие ИИС и способы их реализации.

5. Сформулируйте основные отличия систем искусственного интеллекта от обычных программных средств.

6. Дайте краткую характеристику систем с интеллектуальным интерфейсом, экспертных систем, самообучающихся систем и адаптивных информационных систем.

7. Перечислите основные типы систем с интеллектуальным интерфейсом и дайте им краткую характеристику.

8. Перечислите основные типы ЭС и дайте им краткую характеристику.

9. Перечислите основные типы самообучающихся информационных систем и дайте им краткую характеристику.

10. Перечислите основные типы адаптивных информационных систем и дайте им краткую характеристику.

11. Перечислите и охарактеризуйте основные компоненты статических экспертных систем.

12. Поясните отличие динамических экспертных систем от статических.

13. Охарактеризуйте экспертную систему по следующим параметрам: типу приложения, стадии существования, масштабу, типу проблемной среды, типу решаемой задачи.

14. Расскажите о подходах, применяемых к построению экспертных систем.

15. Назовите типы задач, которые решаются с применением ЭС.

Приведите примеры.

16. Назовите специалистов, которые привлекаются для разработки экспертных систем, и поясните их функции.

17. Назовите парадигмы программирования и дайте их краткую характеристику.

18. Назовите типичные модели представления знаний в экспертных системах.

19. Расскажите об основных характеристиках инструментальных средств, предназначенных для разработки интеллектуальных информационных систем.

20. Назовите известные вам языки программирования и соответствующие им парадигмы программирования.

21. Перечислите этапы промышленной технологии создания интеллектуальных систем.

22. Опишите основные технологические этапы разработки экспертных систем: идентификацию, концептуализацию, формализацию, выполнение, тестирование, опытную эксплуатацию.

23. Расскажите о механизмах вывода в экспертных системах.

24. Расскажите, что вы знаете о языке CLIPS.

25. Приведите пример конкретной экспертной системы, используя для её характеристики признаки, которые приведены в данной главе.

1. Амамия, М. Архитектура ЭВМ и ИИ / М. Амамия, Ю. Танака. – М. : Мир, 1993.

2. Андрейчиков, А.В. Компьютерная поддержка изобретательства (методы, системы, примеры, применения) / А.В. Андрейчиков, О.Н. Андрейчикова. – М. : Машиностроение, 1998.

3. Буров, К. Обнаружение знаний в хранилищах данных / К. Буров // Открытые системы. – 1999. – № 5, 6.

4. Гаврилова, Т.А. Базы знаний интеллектуальных систем / Т.А. Гаврилова, В.Ф. Хорошевский. – СПб. : Питер, 2000.

5. Зарипов, Р.X. Машинный поиск вариантов при моделировании творческого процесса / Р.X. Зарипов. – М. : Наука, 1983.

6. Искусственный интеллект: Справочник. В 3-х кн. Кн. 1: Системы общения и экспертные системы / под ред. Э.В. Попова. – М. : Радио и связь, 1990.

7. Поспелов, Г.С. Искусственный интеллект – основа новой информационной технологии / Г.С. Поспелов. – М. : Наука, 1988.

8. Искусственный интеллект: Справочник. В 3-х кн. Кн. 3: Программные и аппаратные средства / под ред. В.А. Захарова, В.Ф. Хорошевского. – М. : Радио и связь, 1990.

9. Ларичев, О.И. Системы, основанные на экспертных знаниях:

история, современное состояние и некоторые перспективы / О.И. Ларичев // Седьмая национальная конференция по искусственному интеллекту с международным участием : сб. науч. тр. – М. : Изд-во физико-математической литературы, 2000.

10. Масалович, А.И. От нейрона к компьютеру / А.И. Масалович // Журнал доктора Добба. – 1992. – № 1.

11. Статические и динамические экспертные системы : учеб. пособие / Э.В. Попов, И.Б. Фоминых, Е.Б. Кисель, М.Д. Шапот. – М. :

Финансы и статистика, 1996.

12. Тельное, Ю.Ф. Интеллектуальные информационные системы в экономике : учеб.пособие / Ю.Ф. Тельное. – М. : СИНТЕГ, 1998.

13. Финн, В.К. Правдоподобные рассуждения в интеллектуальных системах типа ДСМ / В.К. Финн // Итоги науки и техники. Сер.

«Информатика». Т. 15. Интеллектуальные информационные системы. – М. : ВИНИТИ, 1991.

14. Цуриков, В.М. Проект «Изобретающая машина» – интеллектуальная среда поддержки инженерной деятельности / В.М. Цуриков // Журнал ТРИЗ. – 1991.– № 21.

15. Элти, Дж. Экспертные системы: концепции и примеры / Дж. Элти, М. Кумбс ; пер. с англ. – М. : Финансы и статистика, 1987.

16. Bouchet, С. SHELLY: An integrated workbench for KBS development / С. Bouchet, С. Brunet, A. Anjewierden // Proc. of 9th Int. Workshop Expert Syst. and their Appl. – France, Avignon, 1989. – No. 1.

17. Durkin, J. Expert Systems: a view of the field / J. Durkin // IEEE Expert. – 1996. – No. 2.

18. Motta, E. Methodological foundations of KEATS, the knowledge Engineer's Assistant / E. Motta, Т. Rajan, J. Dominigue, M. Eisenstadt // Knowledge Acquisition. – 1991. – No. 3.

19. VITAL: A methodology-based workbench for KBS life cycle Support // ESPRIT – II Project 5365, 1990.

Особенностью интеллектуальных систем является способность решать слабоструктурированные и плохо формализованные задачи.

Эта способность основана на применении различных методов моделирования рассуждений для обработки символьной информации. Традиционным подходом к построению механизмов рассуждения является использование дедуктивного логического вывода на правилах (rulebased reasoning), который применяется в экспертных системах продукционного и логического типа (см. главу 1). При таком подходе необходимо заранее сформулировать весь набор закономерностей, описывающих предметную область. Альтернативный подход основан на концепции обучения по примерам (case-based reasoning). В этом случае при построении интеллектуальной системы не требуется заранее знать обо всех закономерностях исследуемой области, но необходимо располагать достаточным количеством примеров для настройки разрабатываемой адаптивной системы, которая после обучения будет способна получать требуемые результаты с определённой степенью достоверности. В качестве таких адаптивных систем применяются искусственные нейронные сети.

Искусственная нейронная сеть (ИНС) – это упрощённая модель биологического мозга, точнее нервной ткани [2, 5, 9, 12]. Естественная нервная клетка (нейрон) состоит из тела (сомы), содержащего ядро, и отростков – дендритов, по которым в нейрон поступают входные сигналы. Один из отростков, ветвящийся на конце, служит для передачи выходных сигналов данного нейрона другим нервным клеткам. Он называется аксоном. Соединение аксона с дендритом другого нейрона называется синапсом. Нейрон возбуждается и передаёт сигнал через аксон, если число пришедших по дендритам возбуждающих сигналов больше, чем число тормозящих.

Сеть ИНС представляет собой совокупность простых вычислительных элементов – искусственных нейронов, каждый из которых обладает определённым количеством входов (дендритов) и единственным выходом (аксоном), разветвления которого подходят к синапсам, связывающим его с другими нейронами. На входы нейрона поступает информация извне или от других нейронов. Каждый нейрон характеризуется функцией преобразования входных сигналов в выходной (функция возбуждения нейрона). Нейроны в сети могут иметь одинаковые или разные функции возбуждения. Сигналы, поступающие на вход нейрона, неравнозначны в том смысле, что информация из одного источника может быть более важной, чем из другого. Приоритеты входов задаются с помощью вектора весовых коэффициентов, моделирующих синаптическую силу биологических нейронов.

Модель искусственного нейрона (рис. 2.1) представляет собой дискретно-непрерывный преобразователь информации. Информация, поступающая на вход нейрона, суммируется с учётом весовых коэффициентов wi, сигналов хi, i = 1,.., n, где n – размерность пространства входных сигналов. Потенциал нейрона определяется по формуле Рис. 2.1. Схема кибернетической модели нейрона Рис. 2.2. Функции переноса искусственных нейронов:

а – линейная; б – ступенчатая; в – сигмоидальная Взвешенная сумма поступивших сигналов (потенциал) преобразуется с помощью передаточной функции f (Р) в выходной сигнал нейрона Y, который передается другим нейронам сети, т.е. Y = f (Р). Вид передаточной (активационной) функции является важнейшей характеристикой нейрона. В общем случае эта функция может быть ступенчатой (пороговой), линейной или нелинейной (рис. 2.2). Пороговая функция пропускает информацию только в том случае, если алгебраическая сумма входных сигналов превышает некоторую постоянную величину Р*, например:

Пороговая функция не обеспечивает достаточной гибкости ИНС при обучении. Если значение вычисленного потенциала не достигает заданного порога, то выходной сигнал не формируется, и нейрон «не срабатывает». Это приводит к снижению интенсивности выходного сигнала нейрона и, как следствие, к формированию невысокого значения потенциала взвешенных входов в следующем слое нейронов.

Линейная функция Y = kP дифференцируема и легко вычисляется, что в ряде случаев позволяет уменьшить ошибки выходных сигналов в сети, так как передаточная функция сети также является линейной.

Однако она не универсальна и не обеспечивает решения многих задач.

Определённым компромиссом между линейной и ступенчатой функциями является сигмоидальная функция переноса Y = 1 / 1 + e kp, которая удачно моделирует передаточную характеристику биологического нейрона (рис. 2.2, в) Коэффициент k определяет крутизну нелинейной функции: чем больше k, тем ближе сигмоидальная функция к пороговой; чем меньше k, тем она ближе к линейной. Подобно ступенчатой функции она позволяет выделять в пространстве признаков множества сложной формы, в том числе невыпуклые и несвязные. При этом сигмоидальная функция, в отличие от ступенчатой, не имеет разрывов. Она дифференцируема, как и линейная функция, и это качество можно использовать при поиске экстремума в пространстве параметров ИНС.

Тип функции переноса выбирается с учётом конкретной задачи, решаемой с применением нейронных сетей. Например, в задачах аппроксимации и классификации предпочтение отдают логистической (сигмоидальной) кривой. Нейронная сеть представляет собой совокупность искусственных нейронов, организованных слоями. При этом выходы нейронов одного слоя соединяются с входами нейронов другого.

В зависимости от топологии соединений нейронов ИНС подразделяются на одноуровневые и многоуровневые, с обратными связями и без них. Связи между слоями могут иметь различную структуру.

В однолинейных сетях каждый нейрон (узел) нижнего слоя связан с одним нейроном верхнего слоя. Если каждый нейрон нижнего слоя соединён с несколькими нейронами следующего слоя, то получается пирамидальная сеть. Воронкообразная схема соединений предполагает связь каждого узла верхнего слоя со всеми узлами нижнего уровня.

Существуют также древовидные и рекуррентные сети, содержащие обратные связи с произвольной структурой межнейронных соединений. Чтобы построить ИНС для решения конкретной задачи, нужно выбрать тип соединения нейронов, определить вид передаточных функций элементов и подобрать весовые коэффициенты межнейронных связей [1, 2, 5 – 7, 12].

При всём многообразии возможных конфигураций ИНС на практике получили распространение лишь некоторые из них. Классические модели нейронных сетей рассмотрены ниже.

Теоретические основы нейроматематики были заложены в начале 1940-х гг. Попытки построить машины, способные к разумному поведению, были в значительной мере вдохновлены идеями «отца кибернетики» Норберта Винера, который писал в своей знаменитой работе «Кибернетика или управление и связь в животном и машине», что все машины, претендующие на «разумность», должны обладать способностью преследовать определённые цели и приспосабливаться, т.е. обучаться. Идеи Винера были применены Дж. Маккалохом и У. Питтсом, которые разработали собственную теорию деятельности головного мозга [3], основанную на предположении, что функционирование компьютера и мозга сходно. К главным результатам их работы относятся следующие:

модель нейрона в виде простейшего процессорного элемента, который вычисляет значение переходной функции от скалярного произведения вектора входных сигналов и вектора весовых коэффициентов;

конструкция нейронной сети для выполнения логических и арифметических операций;

предположение о том, что нейронная сеть способна обучаться, распознавать образы, обобщать полученную информацию.

В формализме Дж. Маккалоха и У. Питтса нейроны имеют пороговую функцию перехода из состояния в состояние. Каждый нейрон в сети определяет взвешенную сумму состояний всех других нейронов и сравнивает её с порогом, чтобы определить своё собственное состояние.

Аппаратная реализация ИНС на основе пороговых элементов, оперирующих двоичными числами, оказалась чрезвычайно трудной из-за высокой стоимости электронных элементов в то время. Самые совершенные системы тогда содержали лишь сотни нейронов, в то время как нервная система муравья содержит более 20 тыс.

Серьёзное развитие нейрокибернетика получила в трудах американского нейрофизиолога Ф. Розенблата, который предложил свою модель нейронной сети в 1958 г. и продемонстрировал созданное на её основе электронное устройство, названное перцептроном [8]. Розенблат Ф. ввёл возможность модификации межнейронных связей, что сделало ИНС обучаемой. Первые перцептроны были способны распознавать некоторые буквы латинского алфавита. Впоследствии модель перцептрона была значительно усовершенствована, а наиболее удачным её применением стали задачи автоматической классификации.

Алгоритм обучения перцептрона включает следующие шаги.

1. Системе предъявляется эталонный образ.

2. Если результат распознавания совпадает с заданным, весовые коэффициенты связей не изменяются.

3. Если ИНС неправильно распознаёт результат, то весовым коэффициентам даётся приращение в сторону повышения качества распознавания.

Теоретический анализ перцептрона, проведённый М. Минским и С. Пейпертом [4], показал его ограниченные возможности, поскольку не всегда существует такая комбинация весовых коэффициентов, при которой заданное множество образов будет распознаваться правильно.

Причина этого недостатка состоит в том, что однослойный перцептрон реализует линейную поверхность, разделяющую пространство эталонов, вследствие чего происходит неверное распознавание образов в случаях, когда задача не является линейно сепарабельной. Для решения таких проблем предложены модели многослойных перцептронов, способные строить ломаную границу между распознаваемыми образами. Несмотря на то, что перцептрон Розенблата имел невысокие возможности обучения, разработка этой концепции привлекла внимание исследователей к проблеме ИНС и привела к созданию более «разумных» интеллектуальных систем.

Многослойные сети. В многослойных сетях устанавливаются связи только между нейронами соседних слоёв, как показано на рис. 2.3.

Каждый элемент может быть соединён модифицируемой связью с любым нейроном соседних слоёв, но между элементами одного слоя связей нет. Каждый нейрон может посылать выходной сигнал только в вышележащий слой и принимать входные сигналы только с нижерасположенного слоя. Входные сигналы подаются на нижний слой, а выходной вектор сигналов определяется путём последовательного вычисления уровней активности элементов каждого слоя (снизу вверх) с Рис. 2.3. Схема многослойного перцептрона использованием уже известных значений активности элементов предшествующих слоёв. При распознавании образов входной вектор соответствует набору признаков, а выходной – распознаваемым образам.

Скрытый слой (один или несколько) предназначен для отражения специфики знаний. В таких сетях обычно используются передаточные сигмоидальные функции.

Структура нейронной сети определяется типом, например 25–10–5, т.е. двадцать пять узлов находится в первом слое, десять – в скрытом и пять – в выходном. Определение числа скрытых слоёв и числа нейронов в каждом слое для конкретной задачи является неформальной проблемой, при решении которой можно использовать эвристическое правило: число нейронов в следующем слое в два раза меньше, чем в предыдущем [10, 14].

Выше отмечалось, что простой перцептрон с одним слоем обучаемых связей формирует границы областей решений в виде гиперплоскостей. Двухслойный перцептрон может выполнять операцию логического И над полупространствами, образованными гиперплоскостями первого слоя весов. Это позволяет формировать любые выпуклые области в пространстве входных сигналов. С помощью трёхслойного перцептрона, используя логическое ИЛИ для комбинирования выпуклых областей, можно получить области решений произвольной формы и сложности, в том числе невыпуклые и несвязные. То, что многослойные перцептроны с достаточным множеством внутренних нейроподобных элементов и соответствующей матрицей связей в принципе способны осуществлять любое отображение вход–выход, отмечали ещё М. Минский и С. Пейперт, однако они сомневались, что для таких процедур можно открыть мощный аналог процедуры обучения простого перцептрона. В настоящее время в результате возрождения интереса к многослойным сетям предложено несколько таких процедур. Одной из них является алгоритм обратного распространения ошибки, который будет рассмотрен ниже.

Рекуррентные сети. Они содержат обратные связи, благодаря которым становится возможным получение отличающихся значений выходов при одних и тех же входных данных. Наличие рекуррентных нейронов позволяет ИНС накапливать знания в процессе обучения.

Рекуррентные сети (рис. 2.4) являются развитием модели Хопфилда на основе применения новых алгоритмов обучения, исключающих попадание системы в локальные минимумы на поверхности энергетических состояний. Важной особенностью рекуррентных сетей является их способность предсказывать существование новых классов объектов.

Рис. 2.4. Схема рекуррентной нейронной сети Модель Хопфилда. Работы американского биофизика Дж. Хопфилда положили начало современному математическому моделированию нейронных вычислений [11]. Ему удалось привлечь к анализу нейросетевых моделей мощный математический аппарат статистической физики. В результате была сформулирована математическая модель ассоциативной памяти на нейронной сети с использованием правила Д. Хебба для модификации весовых коэффициентов. Это правило основано на простом предположении: если два нейрона возбуждаются вместе, то сила связи между ними возрастает; если они возбуждаются порознь, то сила связи между ними уменьшается.

Сеть Хопфилда строится с учётом следующих условий:

все элементы связаны со всеми;

wji = wij – прямые и обратные связи симметричны;

wii = 0 – диагональные элементы матрицы связей равны нулю, т.е. исключаются обратные связи с выхода на вход одного нейрона.

Для однослойной нейронной сети со связями типа «все ко всем»

характерна сходимость к одной из конечного множества равновесных точек, которые являются локальными минимумами функции энергии, отражающей структуру всех связей в сети. Введённая Хопфилдом функция вычислительной энергии нейронной сети описывает поведение сети через стремление к минимуму энергии, который соответствует заданному набору образов. В связи с этим сети Хопфилда могут выполнять функции ассоциативной памяти, обеспечивая сходимость к тому образу, в область притяжения которого попадает начальный паттерн (образец) активности нейронов сети.

Этот подход привлекателен тем, что нейронная сеть для конкретной задачи может быть запрограммирована без обучающих итераций.

Веса связей вычисляются на основе вида функции энергии, сконструированной для решаемой задачи.

Развитием модели Хопфилда является машина Больцмана, предложенная и исследованная Дж. Е. Хинтоном и Р. Земелом [5, 7, 12] для решения комбинаторных оптимизационных задач и задач искусственного интеллекта. В ней, как и в других моделях, нейрон имеет состояния (1,0), межнейронные связи представлены весовыми коэффициентами, а каждое состояние сети характеризуется определённым значением функции консенсуса (аналог функции энергии). Максимум функции консенсуса соответствует оптимальному решению задачи.

Сети Хопфилда получили применение на практике в основном как реализации подсистем более сложных систем. Они имеют определённые недостатки, ограничивающие возможности их применения:

предположение о симметрии связей между элементами, без которой нельзя ввести понятие энергии;

нейронная сеть – это устройство для запоминания и обработки информации, а не устройство минимизации энергии. Экономия энергии играет в этих процессах вспомогательную роль;

сети Хопфилда поддерживают множество лишних, неэффективных, иногда дублирующих друг друга связей. В реальных нервных системах такие связи не поддерживаются, так как их реализация требует определённых затрат. В биологических нервных системах происходит освобождение от лишних связей за счёт их структуризации. При этом вместо организации связей «всех ко всем» используется многослойная иерархическая система связей.

Самоорганизующиеся сети Т. Кохонена [15]. Идея сетей с самоорганизацией на основе конкуренции между нейронами базируется на применении специальных алгоритмов самообучения ИНС. Сети Кохонена обычно содержат один (выходной) слой обрабатывающих элементов с пороговой передаточной функцией. Число нейронов в выходном слое соответствует количеству распознаваемых классов. Настройка параметров межнейронных соединений проводится автоматически на основе меры близости вектора весовых коэффициентов настраиваемых связей к вектору входных сигналов в эвклидовом пространстве.

В конкурентной борьбе побеждает нейрон, имеющий значения весов, наиболее близкие к нормализованному вектору входных сигналов.

Кроме того, в самоорганизующихся сетях возможна классификация входных образцов (паттернов). На практике идея Кохонена обычно используется в комбинации с другими нейросетевыми парадигмами.

При построении модели ИНС прежде всего необходимо точно определить задачи, которые будут решаться с её помощью. В настоящее время нейросетевые технологии успешно применяются для прогнозирования, распознавания и обобщения.

Первым этапом построения нейросетевой модели является тщательный отбор входных данных, влияющих на ожидаемый результат.

Из исходной информации необходимо исключить все сведения, не относящиеся к исследуемой проблеме. В то же время следует располагать достаточным количеством примеров для обучения ИНС. Существует эмпирическое правило, которое устанавливает рекомендуемое соотношение X между количеством обучающих примеров, содержащих входные данные и правильные ответы, и числом соединений в нейронной сети: X < 10.

Для факторов, которые включаются в обучающую выборку, целесообразно предварительно оценить их значимость, проведя корреляционный и регрессионный анализ, и проанализировать диапазоны их возможных изменений.

На втором этапе осуществляется преобразование исходных данных с учётом характера и типа проблемы, отображаемой нейросетевой моделью, и выбираются способы представления информации. Эффективность нейросетевой модели повышается, если диапазоны изменения входных и выходных величин приведены к некоторому стандарту, например [0,1] или [–1,1].

Третий этап заключается в конструировании ИНС, т.е. в проектировании её архитектуры (число слоёв и число нейронов в каждом слое). Структура ИНС формируется до начала обучения, поэтому успешное решение этой проблемы во многом определяется опытом и искусством аналитика, проводящего исследования.

Четвёртый этап связан с обучением сети, которое может проводиться на основе конструктивного или деструктивного подхода. В соответствии с первым подходом обучение ИНС начинается на сети небольшого размера, который постепенно увеличивается до достижения требуемой точности по результатам тестирования. Деструктивный подход базируется на принципе «прореживания дерева», в соответствии с которым из сети с заведомо избыточным объёмом постепенно удаляют «лишние» нейроны и примыкающие к ним связи. Этот подход даёт возможность исследовать влияние удалённых связей на точность сети. Процесс обучения нейронной сети представляет собой уточнение значений весовых коэффициентов и для отдельных узлов на основе постепенного увеличения объёма входной и выходной информации.

Началу обучения должна предшествовать процедура выбора функции активации нейронов, учитывающая характер решаемой задачи. В частности, в трёхслойных перцептронах на нейронах скрытого слоя применяется в большинстве случаев логистическая функция, а тип передаточной функции нейронов выходного слоя определяется на основе анализа результатов вычислительных экспериментов на сети. Индикатором обучаемости ИНС может служить гистограмма значений межнейронных связей [13].

На пятом этапе проводится тестирование полученной модели ИНС на независимой выборке примеров.

Важнейшим свойством нейронных сетей является их способность к обучению, что делает нейросетевые модели незаменимыми при решении задач, для которых алгоритмизация является невозможной проблематичной или слишком трудоёмкой. Обучение нейронной сети заключается в изменении внутренних параметров модели таким образом, чтобы на выходе ИНС генерировался вектор значений, совпадающий с результатами примеров обучающей выборки. Изменение параметров нейросетевой модели может выполняться разными способами в соответствии с различными алгоритмами обучения. Парадигма обучения определяется доступностью необходимой информации. Выделяют три парадигмы:

обучение с учителем (контролируемое);

обучение без учителя (неконтролируемое);

смешанное обучение.

При обучении с учителем все примеры обучающей выборки содержат правильные ответы (выходы), соответствующие исходным данным (входам). В процессе контролируемого обучения синаптические веса настраиваются так, чтобы сеть порождала ответы, наиболее близкие к правильным.

Обучение без учителя используется, когда не для всех примеров обучающей выборки известны правильные ответы. В этом случае предпринимаются попытки определения внутренней структуры поступающих в сеть данных с целью распределить образцы по категориям (модели Кохонена).

При смешанном обучении часть весов определяется посредством обучения с учителем, а другая часть получается с помощью алгоритмов самообучения.

Обучение по примерам характеризуется тремя основными свойствами: ёмкостью, сложностью образцов и вычислительной сложностью. Ёмкость соответствует количеству образцов, которые может запомнить сеть. Сложность образцов определяет способности нейронной сети к обучению. В частности, при обучении ИНС могут возникать состояния «перетренировки», в которых сеть хорошо функционирует на примерах обучающей выборки, но не справляется с новыми примерами, утрачивая способность обучаться.

Рассмотрим известные правила обучения ИНС.

Правило коррекции по ошибке. Процесс обучения ИНС состоит в коррекции исходных значений весовых коэффициентов межнейронных связей, которые обычно задаются случайным образом. При вводе входных данных запоминаемого примера (стимула) появляется реакция, которая передаётся от одного слоя нейронов к другому, достигая последнего слоя, где вычисляется результат. Разность между известным значением результата и реакцией сети соответствует величине ошибки, которая может использоваться для корректировки весов межнейронных связей. Корректировка заключается в небольшом (обычно менее 1%) увеличении синаптического веса тех связей, которые усиливают правильные реакции, и уменьшении тех, которые способствуют ошибочным. Это простейшее правило контролируемого обучения (дельта-правило) используется в однослойных сетях с одним уровнем настраиваемых связей между множеством входов и множеством выходов. При этом на каждом k-м шаге для j-го нейрона вес i-й связи вычисляется по формуле w jik = w ji (k 1) + w jik, где w jik = jk x jik, jk = T jk R jk, T jk – известное (правильное) значение выхода j-го нейрона; R jk – рассчитанное значение выхода j-го нейрона; x jik – величина сигнала на i-м входе; – коэффициент скорости обучения.

Оптимальные значения весов межнейронных соединений можно определить путём минимизации среднеквадратичной ошибки с использованием детерминированных или псевдослучайных алгоритмов поиска экстремума в пространстве весовых коэффициентов. При этом возникает традиционная проблема оптимизации, связанная с попаданием в локальный минимум.

Правило Хебба [7]. Оно базируется на следующем нейрофизиологическом наблюдении: если нейроны по обе стороны синапса активизируются одновременно и регулярно, то сила их синаптической связи возрастает. При этом изменение веса каждой межнейронной связи зависит только от активности нейронов, образующих синапс. Это существенно упрощает реализацию алгоритмов обучения.

Обучение методом соревнования. В отличие от правила Хебба, где множество выходных нейронов может возбуждаться одновременно, в данном случае выходные нейроны соревнуются (конкурируют) между собой за активизацию. В процессе соревновательного обучения осуществляется модификация весов связей выигравшего нейрона и нейронов, расположенных в его окрестности («победитель забирает всё»).

Метод обратного распространения ошибки. Он является обобщением процедуры обучения простого перцептрона с использованием дельта-правила на многослойные сети [2, 6, 10]. В данном методе необходимо располагать обучающей выборкой, содержащей «правильные ответы», т.е. выборка должна включать множество пар образцов входных и выходных данных, между которыми нужно установить соответствие. Перед началом обучения межнейронным связям присваиваются небольшие случайные значения. Каждый шаг обучающей процедуры состоит из двух фаз. Во время первой фазы входные элементы сети устанавливаются в заданное состояние. Входные сигналы распространяются по сети, порождая некоторый выходной вектор. Для работы алгоритма требуется, чтобы характеристика вход–выход нейроподобных элементов была неубывающей и имела ограниченную производную. Обычно для этого используют сигмоидальные функции. Полученный выходной вектор сравнивается с требуемым (правильным).

Если они совпадают, то весовые коэффициенты связей не изменяются.



Pages:     || 2 | 3 |


Похожие работы:

«Сведения об учебно-методической и иной документации, разработанной образовательной организацией для обеспечения образовательного процесса по 110201.65 Агрономия № Наименование Наименование учебно-методических, пп дисциплины по учебному методических и иных материалов (автор, место плану издания, год издания, тираж) ГЭС.Ф.1 Иностранный язык 1. Учебно-методический комплекс по дисциплине Иностранный язык Краснодар, 2011 г. 2. Учебно-методическое пособие для студентов биологических и с/х...»

«Пособие по обучению социальных адвокатов: опыт и методические рекомендации Ашгабат 2007 Авторы сборника Благодарность За программой социальных адвокатов стоят юристы и преподаватели, благодаря знаниям, преданности и упорной работе которых стало возможно развитие проекта. Выражаем признательность всем нашим преподавателям и авторам сборника за вклад в создание и реализацию программы. Особая благодарность Жаклин Фостер, Кристине Теффт и Франку Хеспе, инициативе и организационным способностям...»

«LOGO О деятельности руководителя ОУ по планированию и реализации мероприятий, составляющих нормативно-правовое и организационное сопровождение внедрения ФГОС ОО Пиндюрина Р.Е., директор МОУ гимназии №19 им. Н.З. Поповичевой г. Липецка Первоочередные действия в управленческой деятельности по введению Стандарта: обеспечение нормативно-правовой базы, регулирующей введение ФГОС ОО разработка комплекса организационно-методических мероприятий подготовка и совершенствование кадрового ресурса внедрение...»

«Алтайская государственная педагогическая академия Научно-педагогическая библиотека Бюллетень новых поступлений 2014 год январь Барнаул 2014 1 В настоящий “Бюллетень” включены книги, поступившие во все отделы научной библиотеки. “Бюллетень” составлен на основе записей электронного каталога. Записи сделаны в формате RUSMARC с использованием программы “Руслан”. Материал расположен в систематическом порядке по отраслям знаний, внутри разделов – в алфавите авторов и заглавий. Записи включают полное...»

«ГОСУДАРСТВЕННЫЙ РЕЕСТР НОВЫХ МЕДИЦИНСКИХ ТЕХНОЛОГИЙ МИНИСТЕРСТВО ЗДРАВООХРАНЕНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ ГОСУДАРСТВЕННЫЙ РЕЕСТР НОВЫХ МЕДИЦИНСКИХ ТЕХНОЛОГИЙ ОФИЦИАЛЬНОЕ ИЗДАНИЕ 3 ВЫПУСК Под редакцией члена-корреспондента РАМН, профессора, д.м.н., Первого заместителя министра здравоохранения Российской Федерации А.И.ВЯЛКОВА. Реестр составлен Управлением научно-исследовательских медицинских учреждений Минздрава России: С.Б.Ткаченко (профессор, д.м.н.) Н.В.Пыжевой Н.М.Крестовской Т.Ф.Куракиной...»

«Муниципальное бюджетное общеобразовательное учреждение г. Мурманска средняя общеобразовательная школа № 21 СОГЛАСОВАНО УТВЕРЖДАЮ _30_ августа_ 2012 01 сентября_2012 Протокол №1 МС МОУ СОШ № 21 Приказ № 185 Зам. директора по УВР Директор МОУ СОШ _/Булакова С.В./ / Чемеркина И.И./ Программа рассмотрена на заседании МО учителей Художественного воспитания и физического развития МОУ СОШ № 21 Протокол № 1 от 30 августа 2012 года Руководитель МО (Карпенко Н.С.) Рабочая учебная программа по технологии...»

«Министерство образования и науки Российской Федерации Государственное образовательное учреждение высшего профессионального образования Самарский государственный архитектурно-строительный университет Российская экологическая академия Самарское региональное отделение Т.Н. Соснина БИОСФЕРА анализ стоимостных параметров Учебное пособие Самара 2004 УДК 574+ 502.5 Биосфера (анализ стоимостных параметров): Учеб. пособие /Т.Н. Соснина; Самарск. гос. арх.-строит. ун-т. Самара, 2004. 192 с. ISBN 5 - 9585...»

«Г. И. Завойских, П. А. Протас ТЕХНОЛОГИЯ И ОБОРУДОВАНИЕ ЛЕСНЫХ СКЛАДОВ Учебно-методическое пособие по курсовому и дипломному проектированию для студентов специальности 1-46 01 01 Лесоинженерное дело Минск БГТУ 2006 Учреждение образования БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ Г. И. Завойских, П. А. Протас ТЕХНОЛОГИЯ И ОБОРУДОВАНИЕ ЛЕСНЫХ СКЛАДОВ Учебно-методическое пособие по курсовому и дипломному проектированию для студентов специальности 1-46 01 01 Лесоинженерное дело Минск...»

«Международная Лига развития науки и образования (Россия) Международная ассоциация развития науки, образования и культуры России (Италия) НОУ ВПО Институт управления (г. Архангельск) -ЯРОСЛАВСКИЙ ФИЛИАЛ Учебно-методические материалы по дисциплине Ценообразование для студентов специальности 080109 Бухгалтерский учет, анализ и аудит ЯРОСЛАВЛЬ ИНСТИТУТ УПРАВЛЕНИЯ 2012 СОДЕРЖАНИЕ: 1 Цели изучения дисциплины и ее место в учебном процессе. 3 (пояснительная записка) 2. Требования к уровню освоения...»

«Ганкин В. Ю. и Ганкин Ю. В. XXI век Общая химия 2-уровневое учебное пособие 2-ое издание 2012 2 БЛАГОДАРНОСТИ Мы в долгу перед многими, кто вносил предложения, высказывал критику и другим образом участвовал в создании этой книги. Настоящим выражаем нашу самую сердечную благодарность: Виталию Аронову, Ирине Ганкин-Сигал, Александру Горштейну, Людмиле Коломеец, Сергею Крюкову, Владимиру Кузнецову, Ольге Куприяновой, Алексею Лезникову, Якову Мазур, Игорису Мисюченко, Марине Ноженко, Софи Перлин,...»

«МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ ГРАЖДАНСКОЙ АВИАЦИИ Кафедра аэродинамики, конструкции и прочности летательных аппаратов Ефимов В.В. МЕТОДИЧЕСКИЕ УКАЗАНИЯ к выполнению курсового проекта по дисциплине КОНСТРУКЦИЯ И ПРОЧНОСТЬ ЛЕТАТЕЛЬНЫХ АППАРАТОВ Часть I ОБЪЕМ, СОДЕРЖАНИЕ И ОФОРМЛЕНИЕ ПРОЕКТА для студентов специальности 160901 всех форм обучения Москва – 2008 2 Рецензент д-р техн. наук, профессор Ципенко В.Г. Ефимов В.В. Методические указания к выполнению курсового проекта по...»

«МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ ГИДРОМЕТЕОРОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ Кафедра экономики и менеджмента МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО ВЫПОЛНЕНИЮ КУРСОВЫХ РАБОТ ПО ДИСЦИПЛИНЕ АНАЛИЗ И ДИАГНОСТИКА ФИНАНСОВО-ХОЗЯЙСТВЕННОЙ ДЕЯТЕЛЬНОСТИ ПРЕДПРИЯТИЯ для студентов, обучающихся по специальности 080507 Менеджмент организации и 080502 Экономика и...»

«МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ ГРАЖДАНСКОЙ АВИАЦИИ Л.И. Карпова ОТЕЧЕСТВЕННАЯ ИСТОРИЯ ПОСОБИЕ к изучению дисциплины и планы семинарских занятий Часть 2 для студентов 1 курса специальности 030602 дневного обучения Москва – 2004 Тема 6. Россия в начале ХХ в. (2ч) Вопросы 1. Социально-экономическое развитие Российской империи в конце XIX – начале XX веков. 2. Революция 1905-1907 годов. 3. Столыпинская политика модернизации и ее результаты. Методические рекомендации...»

«ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ АЛТАЙСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ХИМИЧЕСКИЙ ФАКУЛЬТЕТ КУРСОВЫЕ И ВЫПУСКНЫЕ КВАЛИФИКАЦИОННЫЕ РАБОТЫ ПО СПЕЦИАЛЬНОСТИ ХИМИЯ методические рекомендации БАРНАУЛ • 2005 УДК 54(079) ББК 74.580.286р30 + 24р30 К 937 Р е ц е н з е н т ы : Н.Г. Базарнова, докт. хим. наук, профессор В.С. Смородинов, канд. хим. наук, доцент Катраков И. Б. Курсовые и выпускные квалификационные работы по...»

«В.В. Коротаев, А.В. Краснящих ТЕЛЕВИЗИОННЫЕ ИЗМЕРИТЕЛЬНЫЕ СИСТЕМЫ Учебное пособие X Санкт-Петербург 2008 МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ, МЕХАНИКИ И ОПТИКИ В.В. Коротаев, А.В. Краснящих ТЕЛЕВИЗИОННЫЕ ИЗМЕРИТЕЛЬНЫЕ СИСТЕМЫ Учебное пособие Санкт-Петербург УДК 621.397 + 681. В.В. Коротаев, А.В. Краснящих. Телевизионные измерительные системы / Учебное пособие. – СПб:...»

«СОДЕРЖАНИЕ 1. Общие положения 1.2. Нормативные документы для разработки ООП 1.3. Общая характеристика вузовской основной образовательной программы высшего профессионального образования (бакалавриат) 1.4 Требования к абитуриенту 2. Характеристика профессиональной деятельности выпускника ООП бакалавриата 2.1. Область профессиональной деятельности выпускника: 2.2. Объекты профессиональной деятельности бакалавров 2.3. Виды профессиональной деятельности бакалавров 2.4. Задачи профессиональной...»

«С.В. Ковалёв ЭКОНОМИЧЕСКАЯ МАТЕМАТИКА Допущено Учебно-методическим объединением вузов по университетскому политехническому образованию в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлению 220700 Организация и управление наукоемкими производствами, специальности 220701 Менеджмент высоких технологий, а также для студентов инженерно-экономических специальностей УДК 51(075.8) ББК 22.1я73 К56 Рецензенты: Ю.Г. Одегов, д-р экон. наук, проф., Г.Г. Руденко, д-р...»

«ДЕПАРТАМЕНТ ОБРАЗОВАНИЯ ГОРОДА МОСКВЫ Государственное бюджетное образовательное учреждение высшего профессионального образования города Москвы МОСКОВСКИЙ ГОРОДСКОЙ ПСИХОЛОГО-ПЕДАГОГИЧЕСКИЙ УНИВЕРСИТЕТ ОТЧЕТ О САМООБСЛЕДОВАНИИ Государственного бюджетного образовательного учреждения высшего профессионального образования города Москвы Московский городской психолого-педагогический университет Аналитическая записка и результаты анализа показателей деятельности образовательной организации высшего...»

«Книги с приложением CD-ROM (естественно-научные, медицина, экономика) 53 А 333 Федорова В.Н. Медицинская и биологическая физика. Курс лекций с задачами : учебное пособие / В.Н. Федорова, Е.В. Фаустов. – Москва : ГЭОТАР-Медиа, 2010. - 592 с. + 1 CD-Rom. 54 (035) К 836 Кротов Ю.А. Предельно допустимые концентрации химических веществ в окружающей среде : справочник / Ю.А. Кротов. - 2-е изд., доп. – Санкт-Петербург : Профессионал, 2003. - 430 с. + 1 CD-Rom. 575 (07) О 28 Общая генетика :...»

«Харьковский национальный университет имени В. Н. Каразина С. В. Ельцов, Н. А. Водолазкая ФИЗИЧЕСКАЯ И КОЛЛОИДНАЯ ХИМИЯ Харьков 2005 1 Физическая и коллоидная химия aE УДК 541.8 + 541.18 Ельцов С. В., Водолазкая Н. А. Физическая и коллоидная химия: учебное пособие. Харьков, 2005. 239 с. Учебное пособие по физической и коллоидной химии предназначено для студентов биологических, медицинских и других нехимических специальностей университетов. В нем изложены основы химической термодинамики, учение о...»






 
2014 www.av.disus.ru - «Бесплатная электронная библиотека - Авторефераты, Диссертации, Монографии, Программы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.