WWW.DISS.SELUK.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА
(Авторефераты, диссертации, методички, учебные программы, монографии)

 

Pages:     || 2 |

«НЕЙРОСЕТЕВЫЕ АЛГОРИТМЫ АНАЛИЗА ПОВЕДЕНИЯ РЕСПОНДЕНТОВ ...»

-- [ Страница 1 ] --

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

«Пермский государственный гуманитарно-педагогический университет»

На правах рукописи

Сичинава Зураби Иродиевич

НЕЙРОСЕТЕВЫЕ АЛГОРИТМЫ АНАЛИЗА

ПОВЕДЕНИЯ РЕСПОНДЕНТОВ

Специальность 05.13.01 – Системный анализ, управление и обработка информации (в технике и технологиях) Диссертация на соискание ученой степени кандидата технических наук

Научный руководитель:

доктор технических наук, профессор Леонид Нахимович Ясницкий Пенза Оглавление ВВЕДЕНИЕ

ГЛАВА 1. АЛГОРИТМЫ РАБОТЫ ПОЛИГРАФА: КРАТКАЯ ИСТОРИЯ,

ОПИСАНИЕ, ИСПОЛЬЗОВАНИЕ, ПРОБЛЕМЫ И ВОЗМОЖНЫЕ ПУТИ ИХ

РЕШЕНИЯ

ОПРЕДЕЛЕНИЕ И ИСТОРИЯ ВОЗНИКНОВЕНИЯ ПОЛИГРАФА............... 1. 1.1.1 Термины и определения

1.1.2. Прототипы полиграфа и его алгоритмов

1.2 СОВРЕМЕННЫЕ ПОЛИГРАФЫ И ПРАКТИКА ИХ ПРИМЕНЕНИЯ................ 1.2.1. Виды и принцип действия полиграфов

1.2.2. Классическая схема работы с полиграфом

1.2.3. Выводы: мнение диссертанта

СУЩЕСТВУЮЩИЕ АЛГОРИТМЫ ЭКСПЕРТНОЙ ОЦЕНКИ ПОЛИГРАММ И

1.3.

ИХ АНАЛИЗ

ПРОБЛЕМЫ И ПРЕДЛАГАЕМОЕ НАПРАВЛЕНИЕ ИХ РЕШЕНИЯ............ 1.4.

ВЫВОДЫ

1.5.

ГЛАВА 2. МАТЕРИАЛЬНО-ТЕХНИЧЕСКАЯ, МЕТОДОЛОГИЧЕСКАЯ И

ПРОГРАММНО-ИНСТРУМЕНТАЛЬНАЯ БАЗА ДЛЯ СОЗДАНИЯ

НЕЙРОСЕТЕВЫХ АЛГОРИТМОВ АНАЛИЗА ПОВЕДЕНИЯ РЕСПОНДЕНТОВ

ПОЛИГРАФНЫЙ ЭПОС-

АППАРАТ КАК МАТЕРИАЛЬНО-ТЕХНИЧЕСКАЯ

2.1.

БАЗА ДЛЯ СОЗДАНИЯ НЕЙРОСЕТЕВОЙ СИСТЕМЫ ОЦЕНКИ ПОЛИГРАММ......

2.1.1 Технические возможности полиграфного аппарата ЭПОС-7

2.1.2 Возможности программного обеспечения системы ЭПОС-7

2.1.3. Заключительные замечания

НЕЙРОСЕТЕВЫЕ ТЕХНОЛОГИИ КАК МЕТОДОЛОГИЧЕСКАЯ БАЗА ДЛЯ

2.2.

СОЗДАНИЯ АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ ОЦЕНКИ ПОЛИГРАММ......... Свойства нейронных сетей, обеспечивающие объективность и эффективность 2.2. разрабатываемых алгоритмов оценки полиграмм

2.2.2. Теорема существования

2.2.3 Проектирование персептронов

2.2.4 Алгоритм применения метода нейросетевого математического моделирования

НЕЙРОЭКСПЕРТНЫЙ АЛГОРИТМ ПОСЛЕДОВАТЕЛЬНОГО ОБНАРУЖЕНИЯ

2. И ИСКЛЮЧЕНИЯ ВЫБРОСОВ ИЗ СТАТИСТИЧЕСКИХ ВЫБОРОК.

2.4 СТРУКТУРА ИССЛЕДУЕМОЙ В РАБОТЕ СИСТЕМЫ

2.5

ГЛАВА 3. РАЗРАБОТКА НЕЙРОСЕТЕВЫЕХ АЛГОРИТМОВ

АНАЛИЗА ПОВЕДЕНИЯ РЕСПОНДЕНТОВ

3.1 ПОСТАНОВКА ЗАДАЧИ

3.2 ИНДИВИДУАЛЬНО-НАСТРАИВАЕМЫЙ НЕЙРОСЕТЕВОЙ АЛГОРИТМ......... 3.2.1 Постановка задачи

3.2.2 Проектирование сети

3.2.3 Обучение и тестирование сети

3.2.4 Формула, реализующая алгоритм работы нейросети

3.3 УНИВЕРСАЛЬНЫЙ НЕЙРОСЕТЕВОЙ АЛГОРИТМ

3.3.1 Постановка задачи

3.3.2 Проектирование сети

3.3.3.Обучение и тестирование сети

3.3.4 Формула, реализующая алгоритм работы нейросети

3.4 УНИВЕРСАЛЬНО-АНКЕТНЫЙ НЕЙРОСЕТЕВОЙ АЛГОРИТМ

3.4.1 Постановка задачи

3.4.2 Проектирование сети

3.4.3 Обучение и тестирование сети

3.4.4 Формула, реализующая алгоритм работы нейросети

3.5 ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ ПОСТРОЕНИЯ НЕЙРОННЫХ СЕТЕЙ ДЛЯ

ПОЛИГРАФНЫХ АППАРАТОВ.

3.5.1 Основные возможности и особенности программы «ЗС».

3.5.2 Порядок работы с программой «ЗС»

ВЫВОДЫ

3. ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИОННОЙ РАБОТЫ

СПИСОК ЛИТЕРАТУРЫ

ПРИЛОЖЕНИЕ

ВВЕДЕНИЕ

Актуальность темы исследования Психофизиологические исследования с использованием полиграфа в правоохранительных органах, а также в ряде других организаций, проводятся в России с 1976 года, в мире – с 1950-х гг. Однако постоянно возникает вопрос об адекватной оценке полученных в ходе данных исследований результатов. Существующие полиграфные аппараты не отличаются высокой точностью. Так, система экспертной оценки (диагностики) полиграмм широко применяемого в органах МВД России полиграфного аппарата ЭПОС-7 имеет погрешность 30%, вследствие чего в судебно-следственной практике случаются ошибки.

Создание и применение надежных полиграфных аппаратов является актуальным также и в связи с проблемами предотвращения терроризма, борьбы с коррупцией, раскрытия экономических, политических и другого рода преступлений.

По мнению известных полиграфологов А.М. Петрова, А.П. Сошникова, А.В. Четина и др. причины ненадежности современных полиграфных аппаратов состоят в том что:

1. Большинство полиграфных аппаратов работают по жестко детерминированным алгоритмам и поэтому не учитывают индивидуальные физиологические особенности опрашиваемого человека (респондента);

2. Многие полиграфные аппараты требуют трудоемкой настройки на респондентов, что осложняет их практическое применение;



3. При работе на полиграфных аппаратах специалисты-полиграфологи обычно не доверяют результатам работы существующих алгоритмов оценки полиграмм, привлекая различные психологические методики, свой собственный опыт и интуицию. Поэтому результат полиграфного опроса во многом зависит от квалификации и моральных качеств полиграфолога, т.е. от так называемого «человеческого фактора».

Актуальность диссертационной работы заключается в создании алгоритмов оценки полиграмм, направленных на устранение указанных недостатков.

Цель исследования Целью исследования является разработка нейросетевых алгоритмов системного анализа информации, получаемой в результате опроса на полиграфном аппарате, обеспечивающих минимальную погрешность заключений при минимальном времени полиграфного опроса.

Для достижения этой цели необходимо было решить следующие задачи:

1. Разработать алгоритм конвертации данных, считываемых с датчиков традиционного полиграфного аппарата, в формат, используемый при проектировании нейронных сетей.

2. Разработать алгоритм обнаружения и исключения выбросов из статистической информации, снимаемой с датчиков полиграфного аппарата.

3. С целью снижения трудоемкости применения нейросетевых полиграфных аппаратов разработать алгоритм выявления и исключения параметров, не оказывающих существенного влияние на степень достоверности заключений.

4. Разработать нейросетевые алгоритмы оценки полиграмм и исследовать их эффективность для решения конкретных классов задач.

5. Реализовать все разработанные алгоритмы в виде программного пакета, предназначенного для моделирования нейронных сетей, системного анализа информации и поддержки принятия решений в задачах инструментальной детекции лжи.

Объектом исследования является система данных, получаемых при экспертном опросе респондентов, поступающих с датчиков полиграфного аппарата и анкет.

Предметом исследования являются методы и алгоритмы системного анализа и обработки информации, снимаемой с респондента, предназначенные для поддержки принятия решений об истинности или ложности его ответа.

Методы исследования Для решения поставленных задач использовались методы системного анализа, в частности – нейросетевые методы, методы математической статистики, теории эксперимента, а также методы графического представления и обработки результатов вычислительных экспериментов.

Соответствие паспорту специальности Результаты исследования соответствуют пунктам 4, 5, 13 паспорта научной специальности 05.13.01.

Научная новизна работы заключается в следующем.

1. Разработан нейроэкспертный алгоритм последовательного обнаружения и исключения выбросов из статистической информации, отличающийся от известных своей нейросетевой базой, а потому применимый в тех случаях, когда не выполняется закон нормального распределения статистических данных. Применение алгоритма позволяет не только повысить точность нейросетевых моделей, но и расширяет круг задач, для которых успешное применение нейросетевых технологий вообще возможно.

2. Разработан нейросетевой алгоритм оценки полиграмм, названный индивидуально-настраиваемым. Его принципиальное отличие от традиционных алгоритмов оценки полиграмм состоит в том, что в его основе лежит нейронная сеть, обучаемая непосредственно на опрашиваемом респонденте, что позволяет учитывать индивидуальные особенности именно его организма, в результате чего обеспечивается низкая погрешность полиграфных заключений.

3. Разработан нейросетевой алгоритм оценки полиграмм, названный универсальным. Его отличие от предыдущего алгоритма состоит в том, что обучение нейронной сети осуществляется предварительно на примерах, сформированных на множестве различных респондентов, и потому при опросе конкретного респондента не требуется дополнительных настроек, за счет чего сокращается время полиграфного опроса, однако при этом увеличивается погрешность полиграфных заключений.

4. Разработан нейросетевой алгоритм оценки полиграмм, названный универсально-анкетным. Отличие универсально-анкетного алгоритма от предыдущих состоит в том, что информация в нейронную сеть подается не только с датчиков, снимающих физиологические параметры респондента, но и с заранее подготовленных анкет, характеризующих особенности его организма. Данная модификация нейросетевого алгоритма позволила получить синергетический эффект: существенно сократить время полиграфного обследования при незначительном увеличении погрешности заключений полиграфного аппарата. В связи с этим данный алгоритм рекомендуется для применения в большинстве случаев полиграфного тестирования как альтернатива традиционным алгоритмам, тогда как предыдущие два нейросетевых алгоритма рекомендуется для применения в крайних случаях: универсальный алгоритм – для быстрых скрининговых обследований больших масс респондентов, а индивидуально-настраиваемый – в особо ответственных случаях, когда требуется низкая погрешность полиграфных заключений, а время полиграфного опроса значения не имеет.

Практическая значимость состоит в создании программного пакета, используемого для интеллектуальной поддержки принятия решений, который позволяет повысить точность экспертных заключений, уменьшает роль человеческого фактора, снижает необходимость привлечения опытных специалистов-полиграфологов и позволяет применять полиграфные аппараты пользователям, не имеющим специальной квалификации.

На защиту выносятся:

1. Нейроэкспертный алгоритм последовательного обнаружения и исключения посторонних выбросов из статистической информации при проектировании нейронных сетей.

2. Индивидуально-настраиваемый нейросетевой алгоритм оценки полиграмм.

3. Универсальный нейросетевой алгоритм оценки полиграмм.

4. Универсально-анкетный нейросетевой алгоритм оценки полиграмм.

5. Программная реализация всех алгоритмов – программный пакет, предназначенный для моделирования нейронных сетей, системного анализа информации и поддержки принятия решений в задачах инструментальной детекции лжи.

Реализация результатов работы Результаты диссертационной работы использованы известной фирмойразработчиком полиграфных аппаратов – Центром прикладной психофизиологии (г.Москва) в процессе совершенствования методик психофизиологических опросов, в частности, выявлении значимых физиологических параметров, оказывающих влияние на точность и качество заключений при использовании полиграфов.

Кроме того, основные результаты и положения диссертационной работы внедрены в учебном процессе Пермского государственного национального исследовательского университета и Пермского государственного гуманитарно-педагогического университета.

Получено свидетельство о регистрации электронного ресурса «Программный продукт, предназначенный для проектирования нейронных сетей "ЗС"», выданное Сичинава З.И. Объединенным Фондом электронных ресурсов «Наука и образование» Института научной и педагогической информации Российской Академии Образования, зарегистрированное под № 20.02.2012.

Достоверность научных положений, выводов и практических результатов, сформулированных в диссертации, обеспечивается корректным использованием теории нейронных сетей, регистрацией разработанного программного пакета, а также подтверждается результатами тестирования нейронных сетей на реальных данных – результатах полиграфных опросов заключенных следственных изоляторов Пермского края.

Апробация работы Основные положения и результаты диссертационной работы докладывались и обсуждались на российских и международных научно-технических конференциях:

- Международной научно-методической конференции, посвященной 90летию высшего математического образования на Урале (г.Пермь 2006 г.) «Актуальные проблемы математики, механики, информатики»;

- Первой Всероссийская конференции студентов, аспирантов и молодых ученых (г. Москва 6-8 апреля 2006 г.) «Искусственный интеллект: философия, методология, инновации»;

- Международной научно-практической конференция (г. Пенза, Пензенский ун-т, Научный Совет РАН по методологии искусственного интеллекта, 1-6 июля 2008 г.) «Перспективные технологии искусственного интеллекта»;

- Третьей Всероссийской конференции студентов, аспирантов и молодых ученых, (г. Москва 11-13 ноября 2009 г.) «Искусственный интеллект: философия, методология, инновации»;

- Всероссийской научно-практической конференции (г. Пермь 12 марта 2010 г.) «Современные проблемы математики и ее прикладные аспекты»;

- Всероссийской научно-практической конференции (г. Пермь, 12–15 октября 2010г.) «Актуальные проблемы механики, математики, информатики»;

- Всероссийской научно-практическая конференция с международным участием "Актуальные проблемы механики, математики, информатики", посвященная 50-летнему юбилею механико-математического факультета ПГУ (г. Пермь 2010г.);

- Международной научно-практической конференции (г. Воронеж 2010г.) «Интеллектуальные технологии в образовании, экономике и управлении».

Публикации По теме диссертации опубликовано 17 работ, из них 4 статьи в журналах, входящих в перечень ВАК РФ, одна монография. Зарегистрирован электронный ресурс в объединенном фонде электронных ресурсов «Наука и образование» Института научной и педагогической информации Российской Академии Образования.

Все результаты, составляющие основное содержание диссертации, и выносимые на защиту положения получены и сформулированы диссертантом самостоятельно. Работы [14, 16, 33, 39-42, 46, 67-70] опубликованы в соавторстве с научным руководителем, которому принадлежат постановка задачи и разработка концепций решения проблем. Работы [14, 16, 33, 67-68] опубликованы в соавторстве с главным полиграфологом Пермского края, полковником МВД А.М. Петровым, и с заместителем директора Центра прикладной психофизиологии (г.Москва) А.П. Сошниковым, у которых автор получал многочисленные консультации по полиграфному делу, полиграммы с результатами полиграфных обследований реальных заключенных, а также результаты следственных и судебных решений, необходимых для обучения и тестирования нейронных сетей. Монография [46] опубликована совместно с аспирантом Ф.М. Черепановым, с помощью компьютерной программы которого была произведена вербализация обученных нейронных сетей и получены математические формулы, облегчающие процесс переноса готовых алгоритмов из одной программной среды в другую. Работы [14-16, 42] опубликованы совместно с аспирантами А.Н. Зибатовой и С.Л. Ясницким, выполнявшими работы по сбору статистической информации и ее первоначальной обработке.

Программный пакет «ЗС» [37], реализующий все предлагаемые в диссертации алгоритмы, разработан диссертантом самостоятельно.

Структура и объем диссертации Диссертация состоит из введения, трех глав, заключения, списка литературы из 109 наименований и приложения. Основное содержание диссертации включает текст и 30 рисунков общим объемом 101 с. Список литературы и приложения занимают 14 с.

ГЛАВА 1. АЛГОРИТМЫ РАБОТЫ ПОЛИГРАФА: КРАТКАЯ ИСТОРИЯ, ОПИСАНИЕ, ИСПОЛЬЗОВАНИЕ, ПРОБЛЕМЫ И ВОЗМОЖНЫЕ ПУТИ ИХ РЕШЕНИЯ

1.1 Определение и история возникновения полиграфа 1.1.1 Термины и определения Полиграф (по английски polygraph - это слово происходит от греческих слов — много и — писать, синонимы: детектор лжи, лайдетектор) — многоканальный осциллограф, позволяющий одновременно записывать показания нескольких физиологических функций организма (например, параметров дыхания, сердечно-сосудистой активности, сопротивления кожи и т.д.), а также, при наличии необходимости и возможности, других физиологических параметров с последующим представлением результатов регистрации этих параметров в аналоговом или цифровом виде, предназначенном для оценки достоверности сообщнной информации [80].

Полиграммой называется непрерывная синхронная графическая запись динамики регистрируемых в ходе проверки физиологических процессов, размещенная на бумажном (чернильно-пишущий полиграф) или электронном (экран монитора компьютерного полиграфа) носителе [6, 29].

На основании динамики регистрируемых в ходе проверки физиологических процессов общая структура полиграммы состоит из трех компонентов:

1) реакций;

2) артефактов;

Под реакцией понимают «заметное (в условиях осуществляемого наблюдения) изменение динамики регистрируемого физиологического процесса в ответ на предъявленный в ходе проверки стимул: вопрос, предмет, изображение предмета» [29].

В области инструментальной детекции лжи специалист имеет дело с быстротекущими реакциями, т. е. с такими реакциями, длительность которых не превышает 20 – 25 секунд.

Следующим структурным компонентом полиграммы является фон, т. е.

«относительно стабильное протекание физиологических процессов в организме человека, пребывающего в состоянии покоя» [29].

В практике полиграфных проверок состояние покоя — это «состояние сидящего человека, которому не задают вопросов». Фон представляет собой «условную физиологическую норму, свойственную конкретному человеку в отсутствие дестабилизирующих воздействий, влияний или факторов» [29].

Под артефактом понимают «заметное по сравнению с фоном изменение динамики регистрируемого физиологического процесса непосредственно не связанное с предъявленным в ходе проверки стимулом, а обусловленное действием иных экзогенных (внешних) и эндогенных (внутренних) факторов»

[29].

К экзогенным факторам, как правило, относятся неожиданные резкие звуки (звонок телефона, шум в коридоре, стук в дверь и т. д.), а также предметы интерьера, активизирующие непроизвольное внимание респондента.

К эндогенным факторам обычно относятся произвольные или непроизвольные движения респондента, внезапные болевые ощущения организмического характера (например, резь в желудке), ощущения физиологического дискомфорта (жажда, изжога, позыв на мочеиспускание и т. д.), а также непроизвольно вторгающиеся в фокус сознания ассоциации и произвольно вызванные в сознании аффективно насыщенные образы.

По каналам кожно-гальванической реакции и плетизмограммы артефакты вызываются преимущественно форсированным вдохом (выдохом), кашлем, чиханием, макро и микродвижениями тела респондента (контроль за которыми осуществляется при помощи датчика тремора), резкими неожиданными звуками, аффективно насыщенными образами и следовыми ассоциациями.

1.1.2. Прототипы полиграфа и его алгоритмов Человечество на протяжении всей своей истории пыталось научиться отличать правду и ложь. В эпоху первобытнообщинного строя эффективность деятельности отдельных членов племени определял вождь. Проявление трусости, приводившее к гибели членов сообщества, карались смертью или изгнанием из племени. Жестокость наказания заставляла провинившегося использовать все средства для своей защиты, включая ложь. По-видимому, тогда и возникла принципиальная необходимость отделять ложь от правды.

В глубокой древности на Востоке в качестве детектора лжи широко использовалась рисовая мука. В основе данного метода лежали следующие наблюдения. Было замечено, что в период сильного страха во рту прекращается выделение слюны. Для оценки этого состояния, в рот подозреваемого вкладывалась рисовая мука. Если через определенное время она оказывалась сухой, то подозреваемого считали виновным. Данный алгоритм "детекции лжи" считался более совершенным, чем субъективная оценка вождя племени.

Однако заметим, что сухость во рту может быть вызвана не только боязнью расплаты за совершенное преступление, а просто страхом, вызванным боязнью самой процедуры.

Более "информативным" был алгоритм детектора лжи с использованием осла. Процедура "тестирования" заключалась в следующем. В полутемном помещении привязывали осла, предварительно смазав ему хвост краской.

Подозреваемому давалось задание: зайти в помещение и погладить осла по хвосту. Если осел закричит – значит, респондент виновен.

Создатели данного алгоритма были убеждены, что человек, совершивший преступление побоится гладить осла, – вдруг он закричит. Следовательно, руки останутся чистыми.

Более жесткий алгоритм выявления правды использовали в древней Спарте. Спартанские юноши, прежде чем попасть в специальные школы, проходили определенный отбор. Юношу ставили на скале над обрывом и спрашивали, боится ли он. Ответ всегда был отрицательный. Но правду или ложь сказал юноша, определяли по цвету лица. Если юноша был бледен, то это означало, что он лгал, и его сбрасывали со скалы.

В Древнем Риме с помощью аналогичного алгоритма отбирали телохранителей. Кандидату задавали провокационные вопросы. Если он краснел, его брали в охрану. Считалось, что если человек краснеет при предъявлении ему провокационных вопросов, он не будет участвовать в заговорах.

В африканских племенах при определении "виновного" использовали свой метод. Колдун совершал специальный танец вокруг подозреваемых.

Интенсивно обнюхивая, колдун по насыщенности запаха тела делал заключение о том, кто из подозреваемых виновен в совершении расследуемого преступления.

На ближнем востоке еще в глубокой древности использовали показатели пульса подозреваемого. В качестве информативных признаков брались изменения в частоте пульса и особенности пульсации артерии. Метод использовался для выявления неверных жен и установлении личности любовника. Алгоритм проверки был предельно прост. Следователь прикладывал палец к артерии, а далее подозреваемой в измене женщине задавались вопросы с названием имен мужчин, теоретически могущих вступить с ней в интимную связь.

В результате сильного эмоционального напряжения, в качестве реакции на имя любовника у женщины резко изменялись частота пульса и кровенаполнение артерии.

Существовал алгоритм использования тремора. Испытуемым давали в руки очень хрупкое яйцо птицы и проводили допрос на предмет совершения ими преступления. У кого скорлупа лопалась, того и считали виновным.

В период, охватывающий первобытнообщинный строй и более поздний – каменный и бронзовый век, низкий уровень цивилизации не мог способствовать созданию мощных технических средств для определения участия подозреваемого в совершении преступления. Уровень цивилизации, эпоха в которой она существовала, накладывала отпечаток на системы получения информации и алгоритмы определения "правды" и "лжи" [6].

1.2 Современные полиграфы и практика их применения 1.2.1. Виды и принцип действия полиграфов Полиграфные аппараты по способу фиксации принять классифицировать на:

- аналоговые полиграфы (перьевые, чернильно-пишущие, традиционные), в которых запись данных производится на диаграммной бумаге (зарубежные модели: Lafayette-761, Stoelting-80506 и др.);

- цифровые полиграфы (компьютерные) – запись осуществляется на электронном носителе с помощью персонального компьютера (зарубежные модели: Lafayette-LX4000, Stoelting-86225; отечественные: Диана, Эпос, Поларг и др.).

В течение развития полиграфного дела [2, 3, 12, 17, 47, 52-54, 57-59, 71, 76, 81-86, 88, 90-91, 95-99, 101-102, 105-107] было множество попыток выявления наиболее значимых физиологических параметров человека, используя которые можно делать заключения об истинности или ложности ответа обследуемого человека. В наше время для регистрации физиологических данных используются следующие датчики: верхнего (грудного) и нижнего (брюшного) дыхания; сердечнососудистой активности, в том числе: пульса, кровенаполнения сосудов и/или артериального давления; электропроводимости кожи (сопротивления кожи, кожно-гальванические реакции кожи).

Для обработки сигналов, поступающих с датчиков разработаны различные варианты программного обеспечения, позволяющего считывать сигналы, обрабатывать их статистическими методами, представлять в удобной графической форме – в виде полиграмм.

Одновременный контроль указанных физиологических процессов в ходе психофизиологического исследования является строго обязательным: согласно существующим нормам [4, 6, 31, 32], исключение из контроля хотя бы одного из этих процессов делает процедуру проверки на полиграфе невалидной.

Остальные датчики, включаемые в комплектность разных моделей полиграфов, несут вспомогательную функцию. Так, датчики тремора (двигательной активности) и голоса могут использоваться для фиксации артефактов: движения обследуемого и внешних шумовых помех соответственно. Голосовой датчик (микрофон) также может использоваться для более точной фиксации моментов вопроса-ответа и для записи фонограммы опроса.

Современный компьютерный полиграф представляет собой переносной персональный компьютер с сенсорным блоком и датчиками съма информации. Полиграф определяет не ложь или правду, а реакцию человека на задаваемые экспертом-полиграфологом вопросы. В понятие «реакция» входит много критериев, свойственных человеческому организму, таких как частота пульса, изменение дыхания (количество дыхательных движений за определенный промежуток времени, его глубина) и артериального давления.

В существующем виде полиграф представляет собой точный прибор, достоверно отражающий психофизиологическое состояние организма человека-респондента.

Согласно общепринятому среди полиграфологов мнению [4, 5, 13, 31, 32, 34, 50], при опросе респондента следует учитывать многие нюансы. А именно, в процессе тестирования задавать вопросы респонденту необходимо таким образом, чтобы воздействовать избирательно и вызывать наиболее сильную эмоциональную реакцию лишь в строго ограниченных случаях, подлежащих однозначному объяснению. Таким образом, очень важным считается как сам процесс опроса, так и однозначность задаваемых вопросов.

Как показывает статистика, правильность выводов, сделанных на основе современных полиграфов, не отличается высокими показателями: степень их достоверности составляет 70—75% [32, 68]. Это и есть проблема, на решение которой направлена данная диссертационная работа.

1.2.2. Классическая схема работы с полиграфом Для работы полиграфа необходимо наличие респондента и датчиков, которые регистрируют физиологические показатели, а также компьютерного модуля делающего соответствующие выводы на основании данных с датчиков.

Основная трудность при полиграфной проверке заключаются в том, что человек помещается в необычные для него условия. Он должен сесть в кресло, его подключают к датчикам, все это вызывает у респондента «лишнее»

возбуждение. Известны случаи, когда человек приходит к врачу измерить давление, и сразу реагирует повышением давления на сам факт, что давление будет измеряться. Аналогично при полиграфной проверке возникает обстановочный рефлекс, который опытные полиграфологи стараются снять.

В ходе проверки оператор спокойным голосом задает опрашиваемому заранее сформулированные вопросы. Причем они формулируется таким образом, что на них требуются только односложные ответы («да» или «нет»).

Между вопросами делают паузы 10—15 секунд. Они необходимы для исчезновения реакций на предыдущие вопросы и восстановления уровня психофизической активности.

Основной частью испытаний является постановка вопросов, но важное значение имеет и сама процедура проверки [72, 73]. Как уже отмечалось, достоверность результатов проверки с помощью полиграфа в значительной степени зависит не только от вопросов, но и от созданных специалистомполиграфологом условий полиграфной проверки.

Наибольшее количество времени уходит на составление вопросов и на подготовку процедуры проверки.

Первый этап – это предварительное интервью. Оно считается обязательным компонентом процедуры проверки на полиграфе. В ходе интервью человека знакомят с деталями предстоящей работы с ним в кабинете, одновременно создается определенная психологическая атмосфера. Предварительное интервью чем-то напоминает инструкцию, которую дает психолог в любых экспериментах, направленных на выявление общих показателей. Создать необходимую психологическую атмосферу и выявить общее физиологическое и психологическое состояние проверяемого человека на момент испытаний – такова задача предварительного интервью или собеседования.

Следующая стадия, вторая, обычно проводится непосредственно за предварительным интервью или сразу после регистрации реакций на первую серию вопросов. Рекомендуется начинать со стимулирующего теста. Он сводится к идентификации определенной карточки с цифрой или словом, который проверяемый выбирает из общей колоды.

Например, дается трехзначное число. Опрашиваемому предлагается выбрать какое-то и положить карточку в карман. Стимулирующий тест во всех случаях проводится под видом теста признания вины и проверяющий наглядно демонстрирует проверяемому способность полиграфа указывать выбранную карточку. Стимулирующий тест имеет целью убедить объект проверки в точности показаний прибора; больше дифференцировать его реакции на различные вопросы во время испытания.

После стимулирующего теста самая главная процедура – вопросы в любой последовательности, в любом виде. Дальше начинается завершающая часть работы с проверяемым, когда ему показывается запись и вместе с ним разбираются ее результаты. На этой стадии у проверяемого могут проходить такие признания, которых раньше не удавалось получить. Беседа с проверяемым по результатам записи, по мнению опытных полиграфологов, имеет исключительно важное значение для всей процедуры проверки на полиграфе [31, 32, 50].

Такова классическая схема работы с полиграфом.

1.2.3. Выводы: мнение диссертанта Инструкции, подобные приведенной выше, в разных, мало отличающихся между собой вариантах приводятся в обширной литературе, посвященной полиграфному делу [2, 4, 29, 31, 32, 52]. Опытные полиграфологи делятся с начинающими своим опытом, наблюдениями, ноу-хау.

По мнению же диссертанта, все эти советы и рекомендации свидетельствуют об огромной роли человеческого фактора. Об объективных же математических методах и алгоритмах получения заключений на основании обработки полиграмм компьютером (без участия, или при минимальном участии полиграфолога) обычно говорится весьма скромно. Наоборот, полиграфологам рекомендуется не доверять результатам автоматической обработки и диагностики полиграмм существующими математическими (компьютерными) алгоритмам. Например, в книге авторитетных полиграфологов С.И.Оглоблина и А.Ю. Молчанова [29] откровенно говорится: «Профессиональный полиграфолог обязан уметь проводить анализ полиграмм вручную, экспертно (желательно, на основе полиграмм, распечатанных на бумажном носителе) и ни при каких обстоятельствах не опираться в своих выводах исключительно на компьютерную обработку результатов проведенной им проверки».

По-видимому, причиной столь негативного отношения полиграфологов к математическим алгоритмам диагностики полиграмм, является их низкая точность, являющаяся следствием устаревшей методологической основы.

Существующие алгоритмы экспертной оценки полиграмм и их анализ В настоящее время существует множество алгоритмов обработки информации, получаемой с датчиков полиграфного аппарата [29, 81, 84, 85, 89].

Они реализованы в виде программ, позволяющих считывать сигналы, обрабатывать их статистическими методами, представлять в удобной графической форме – в виде полиграмм. Назовем их сервисными алгоритмами первого уровня. В настоящей диссертационной работе сервисные алгоритмы первого уровня не рассматриваются и не исследуются.

Существуют методы математической обработки полиграмм, результатом которой являются некоторые интегральные характеристики, на основании которых полиграфологом делается экспертная оценка – заключение об истинности ответа респондента. Назовем их сервисными алгоритмами второго уровня. Этот класс алгоритмов в диссертационной работе также не рассматривается.

В современных полиграфных аппаратах, кроме того, существуют алгоритмы, позволяющие делать экспертные оценки самостоятельно – на основании результатов обсчета полиграмм, выполняя сравнение полученных интегральных значений со средними статистическими значениями, заложенными в алгоритмах, либо другими способами, о которых речь пойдет далее. Именно такие алгоритмы (их называют экспертными) рассматриваются и анализируются в настоящей диссертационной работе.

Вот некоторые из наиболее распространенных алгоритмов обработки информации, получаемой с датчиков полиграфного аппарата.

POLYSCORE® (Windows®-based), разработан Лабораторией прикладной физики (APL) Университета Джона Хопкинса, применяется для компьютерной обработки данных полученных в ходе проверок на детекторе лжи.

POLYSCORE® реализует алгоритм анализа физиологической информации на основе метода статистических сравнений.

Identifi реализует обсчет полиграмм используя трехбальную или семибальную систему. Полиграфолог может выбрать для анализа значимые вопросы для сравнения их с более слабыми смежными сравнительными вопросами (Weaker Adjacent Comparison Questions) или предшествующими сравнительными вопросами (Preceding Comparison Questions).

Этот полиграфный алгоритм обсчитывает много различных типов обследований на детекторе лжи, включая скрининговые проверки нанимаемого на работу персонала. Identifi позволяет полиграфологу выбрать автоматический или экспертный обсчет полиграмм.

Алгоритм обработки данных OSS (Objective Scoring System) - цифровой метод обсчета, разработанный для доказательных целей. Детектор лжи, использующий алгоритм OSS дает возможность оценивать точность обследований на детекторе лжи. Система обработки данных OSS важна в суде, представляя собой эмпирическую основу для результатов анализа и подтверждая достоверность выводов полиграфологов. OSS используется с компьютерными полиграфами производства Lafayette Instrument Company и продается отдельно от LXSoftware [74, 75].

Согласно [29] экспертная оценка полиграмм может осуществляться тремя способами:

1) посредством качественного (визуального) анализа;

Качественная (визуальная, ручная) экспертная оценка заключается в том, что специалист анализирует зарегистрированную на полиграмме динамику физиологических процессов, опираясь лишь на собственный субъективный опыт.

К достоинству качественной системы оценки следует отнести возможность обработки полиграмм в предельно короткие сроки.

Главным же недостатком качественной оценки полиграмм является ее выраженный субъективизм. Достоверность принятого решения (особенно в том случае, если информативные признаки реакций выражены незначительно или носят неустойчивый характер) находится в прямой зависимости от профессиональной квалификации, опыта и интуиции полиграфолога.

2) путем балльного анализа;

Система стандартизованной балльной экспертной оценки полиграмм была предложена выдающимся американским специалистом в области «детекции лжи» Кливом Бакстером в 1960 году. Суть ее заключается в том, что выявленным в результате обследования реакциям по определенной системе правил присваиваются числовые оценки – баллы, которые затем сравниваются с пороговыми значениями, на основании чего ставится диагноз об истинности, ложности, либо о неопределенности результатов обследования респондента. Балльная оценка в значительной степени устраняет субъективизм качественной системы оценки и вносит в процесс анализа полученных результатов элементы стандартизации, что позволяет проконтролировать процесс принятия решения полиграфологом и установить интервал «непринятия решения», т. е. интервал неопределенности.

Таким образом, к достоинствам балльной оценки относятся стандартизация (нейтрализация субъективизма) и быстрота принятия решения. Основным недостатком балльной системы оценки является «объективный» субъективизм при обработке канала дыхания и кардиоканала.

В настоящее время наиболее употребительными являются три системы балльной оценки:

- трехбалльная оценка Института полиграфа Министерства обороны США;

- семибалльная оценка Клива Бакстера;

- трехбалльная оценка полиграфной школы КГБ СССР.

3) при помощи метрического анализа.

Метрическая экспертная оценка была разработана специалистами полиграфной школы КГБ СССР в 80-е годы прошлого века и является на сегодняшний день наиболее надежной системой анализа полиграмм в силу того, что, по заявлению разработчиков «практически полностью исключает элементы субъективизма в процессе принятия решения специалистомполиграфологом» [29].

Суть метрического анализа заключается в том, что на основе выделенного на контрольных тестах симптомокомплекса с определенными информативными параметрами реакций (как правило, это амплитудно-частотные параметры), производится расчет вероятности возникновения выявленного симптомокомплекса на значимые стимулы в проверочных тестах. Затем (путем простого ранжирования интегральных показателей стимулов проверочных тестов) устанавливаются ситуационно значимые (в рамках темы проверки) стимулы и принимается решение в пользу обвинительной или оправдательной версии.

Метрический анализ полиграмм базируется на принципах параметрической математической статистики с применением критерия Стьюдента.

Основными достоинствами метрической оценки, по мнению ее создателей [29] являются:

-минимизация субъективизма при анализе результатов полиграфной проверки;

-возможность расчета статистически обоснованной вероятности вынесения обвинительной или оправдательной версии.

Основными недостатками данной системы оценки полиграмм (в случае ручного варианта обсчета) являются ее относительная трудоемкость и значительные временные затраты. Однако, согласно рекламным заявлениям, «с появлением спецпрограммы «ФЕМИДА», входящей в комплектацию профессионального КП «ПОЛАРГ» и позволяющей производить метрическую оценку в полуавтоматическом режиме, указанные недостатки были в существенной степени устранены» [29].

По мнению авторов метрической системы оценки ее применение наиболее целесообразно «при проведении судебной психофизиологической экспертизы (полиграфной проверки в строгих процессуальных рамках), а также в тех случаях, когда «цена» (социальная значимость) проверки объективно высока» [29].

1.4. Проблемы и предлагаемое направление их решения В течение развития полиграфного дела было множество попыток выявления наиболее значимых физиологических параметров человека, используя которые можно делать заключения об истинности или ложности ответа обследуемого человека. В наше время большинством полиграфологов наибольшее значение придается следующим физиологическим параметрам:

– верхнее дыхание (грудное), число вдохов в минуту;

– нижнее дыхание (брюшное), число вдохов в минуту;

– амплитуда дыхания, амплитуда;

– кожно-гальванические реакции 1-го уровня, число колебаний в минуту;

– кожно-гальванические реакции 2-го уровня, число колебаний в минуту;

– кожно-гальванические реакции, амплитуда;

– фотоплетизмограмма, частота;

– фотоплетизмограмма, амплитуда;

– кровенаполнение, скорость кровенаполнения сосудов;

Для снятия значений этих параметров созданы универсальные датчики, а для обработки сигналов, поступающих с датчиков разработаны различные варианты сервисного программного обеспечения (первого и второго уровней), позволяющего считывать сигналы, обрабатывать их статистическими методами, представлять в удобной графической форме – в виде полиграмм, а также в виде критериев, используемых полиграфологами для экспертной оценки полиграмм.

Существует три вида экспертной оценки полиграмм:

- Качественная экспертная оценка заключается в том, что полиграфолог вручную, без привлечения каких-либо компьютерных программ, опираясь только на свой собственный субъективный опыт, анализирует полиграммы и делает заключение об истинности или ложности показаний респондента.

- Система стандартизованной балльной экспертной оценки заключается в том, что выявленным в результате обследования реакциям присваиваются числовые оценки – баллы, которые затем сравниваются с пороговыми значениями, на основании чего ставится диагноз об истинности, ложности, либо о неопределенности результатов обследования респондента.

- Метрическая экспертная оценка заключается в том, что на основе выделенного на контрольных тестах симптомокомплекса с определенными информативными параметрами реакций производится расчет вероятности возникновения выявленного симптомокомплекса на значимые стимулы в проверочных тестах. Затем, путем ранжирования интегральных показателей стимулов проверочных тестов устанавливаются ситуационно стимулы и делается вывод о результатах обследования респондента.

Недостатки указанных алгоритмов общеизвестны [31, 32, 68]:

Большинство алгоритмов являются жестко детерминированными, вследствие чего не учитывают индивидуальные физиологические особенности опрашиваемого человека (респондента) и поэтому в принципе не могут обеспечить высокой точности заключений. Наиболее прогрессивные алгоритмы – балльные и метрические, имеют высокую трудоемкость и не избавлены от субъективизма – влияния человеческого фактора.

В результате всего этого, в многочисленных руководствах и инструкциях полиграфологам рекомендуется не доверять результатам компьютерной диагностики полиграмм существующими алгоритмами, а ограничиваться ручными экспертными оценками.

Причиной негативного отношения полиграфологов к математическим алгоритмам экспертной оценки полиграмм является их субъективизм и низкая точность и ненадежность, что, по мнению диссертанта, явилось следствием применения устаревших методологических основ.

Выход из сложившейся ситуации диссертант видит в применении более современной методологической основы для построения алгоритмов диагностики полиграмм, а именно – в применении аппарата нейросетевых технологий. Обширный мировой опыт создания алгоритмов принятия решений на базе нейронных сетей и, в частности, опыт Пермской научной школы искусственного интеллекта [62] показывает, что нейросетевые алгоримы исключительно объективны и во многих случаях позволяют добиться высокой степени точности диагностики моделируемых процессов.

Они объективны в силу принципа своего действия, в силу того, что знания в них закладываются не отдельными субъективными экспертами, а выявляются автоматически из проверенного эмпирического материала, который сам по себе объективен и от человеческих факторов не зависим.

Как показал анализ литературных и интернет-источников, попытки применения нейросетевых технологий в полиграфном деле встречаются в ряде зарубежных стран. Так, в книге авторов John E. Angus и Patrick F. Castelaz [82] описывается эксперимент по анализу физиологических параметров с помощью нейросетей на небольшом количестве респондентов. Получена неплохая точность заключений, 87% для ответа «правда», 93% для ответа «ложь», но эти результаты получены на ограниченном количестве экспериментов (56 экспериментов), причем большинство из них были с ответом «правда». Авторы делают вывод, что такой метод имеет перспективы, но для окончательных выводов необходимо большее количество экспериментов.

На сайте [77] описывается анализ неверабального поведения человека с использованием нейросетевых технологий. Достигается точность прогноза до 80%.

На сайте [78] описывается нейросетевой детектор лжи с использование нечетких сетей. К сожалению, информация носит рекламный характер. О точности прогноза и проведенных экспериментах данных не приводится.

На сайте [79] описывается программа для борьбы с мошенничеством в банковской сфере с помощью нейросетей. Но информация также носит рекламный характер.

Таким образом, идея применения нейросетевых технологий в полиграфном деле, как говорится, «витает в воздухе», но до серьезных научных исследований и, тем более, до практического применения, дело пока не доходит.

Ничего не говорится о решении проблемы субъективизма современных способов детекции лжи.

Другой альтернативной методологической основой, по мнению диссертанта, могли бы быть технологии многомерного регрессионного анализа.

Регрессионные модели тоже избавлены от субъективизма экспертов, однако, как убедительно показывает опыт Пермской научной школы искусственного интеллекта [60-62], а также ряд поисковых исследований, выполненных курсовиками и дипломниками при участии и под руководством автора диссертационной работы, регрессионные модели, как правило, значительно уступают нейросетевым моделям в точности постановки диагнозов. Поэтому в диссертационной работе данное возможное направление решения сформулированных выше проблем, не рассматривается.

ВЫВОДЫ

1. Существующие алгоритмы диагностики (экспертной оценки) полиграмм обладают низкой точностью, что является следствием устаревшей методологической основы.

2. При работе на полиграфных аппаратах специалисты-полиграфологи обычно тщательно перепроверяют результаты полиграфного тестирования, привлекая различные психологические методики, свой собственный опыт и интуицию. Таким образом, результат полиграфного опроса, как правило, субъективен и во многом зависит от так называемого «человеческого фактора».

3. В алгоритмах работы полиграфов слабо применяется математический аппарат при выявлении различных артефактов (помех).

4. Выход из сложившейся ситуации диссертант видит в применении более современной методологической основы для построения алгоритмов диагностики полиграмм, а именно – в применении аппарата нейросетевых технологий.

ГЛАВА 2. МАТЕРИАЛЬНО-ТЕХНИЧЕСКАЯ, МЕТОДОЛОГИЧЕСКАЯ

И ПРОГРАММНО-ИНСТРУМЕНТАЛЬНАЯ БАЗА ДЛЯ СОЗДАНИЯ

НЕЙРОСЕТЕВЫХ АЛГОРИТМОВ АНАЛИЗА ПОВЕДЕНИЯ РЕСПОНДЕНТОВ

Полиграфный аппарат ЭПОС-7 как материальнотехническая база для создания нейросетевой системы оценки полиграмм 2.1.1 Технические возможности полиграфного аппарата ЭПОС- Как отмечалось ранее, автор диссертационной работы принципиально отказался от использования традиционных экспертных алгоритмов обработки полиграмм, противопоставив им нейросетевые технологии. Однако для получения обучающих и тестирующих примеров им была использована система датчиков полиграфного аппарата ЭПОС-7 вместе с сервисными алгоритмами обработки сигналов первого и второго уровней.

Компьютерный полиграф ЭПОС-7 является дальнейшим развитием полиграфных систем серии ЭПОС, впервые вышедших на рынок в 1996 году. К настоящему времени полиграфы серии ЭПОС применяются в более чем центрах психофизиологического тестирования МВД, Минобороны, Минюста, ФПС России, других федеральных ведомствах.

Основные достоинства полиграфа ЭПОС-7:

1. традиционный набор датчиков для снятия физиологических параметров [4, 6, 31, 32];

2. точное и наглядное представление физиологических характеристик;

3. удобный и понятный интерфейс.

Комплектация полиграфа ЭПОС-7:

кожно-гальванической реакции сердечно-сосудистой активности Конструкция полиграфа ЭПОС-7 позволяет регистрировать шесть физиологических характеристик изображенных на рис. 2. Грудное дыхание.

Брюшное дыхание.

Кожногальваническая реакция.

Сердечнососудистая активность.

Тремор.

Рис. 2.1. Физиологические характеристики регистрируемые 2.1.2 Возможности программного обеспечения системы ЭПОС- Программное обеспечение системы ЭПОС-7 позволяет:

1. подготовить и провести тестирование, а также осуществить анализ результатов по наиболее используемым форматам однозадачных и многозадачных тестов методики контрольных вопросов – Matte, You, SKY, Exploratory, и двум тестам методики пика напряжения – Виновных знаний и Поискового;

2. хранить, архивировать и дезархивировать результаты тестирования и обработки данных (рис. 2.2);

3. распечатывать полиграммы тестирования и результаты автоматической и экспертной обработки данных (Рис.2.3);

4. регулировать параметры регистрации физиологических данных, а также менять их по окончании тестирования для получения наиболее наглядной, удобно анализируемой полиграммы;

5. создавать, накапливать в базе данных и быстро готовить к практическому использованию вопросы и тесты для проведения тестирования по различным видам правонарушений и кадровым проверкам;

6. пользоваться наглядным представлением результатов автоматизированной обработки физиологических данных алгоритмом "EPOSCOR"(Рис.

2.4-2.5), являющийся русифицированным аналогом рассмотренного выше зарубежного алгоритма «POLYSCORE»;

Рис. 2.4. Программа предоставляет возможность использования алгоритма " EPOSCOR " для автоматизированной оценки стресса при ответах на 7. формировать протокол тестирования с исходными параметрами и обоснованием выводов о степени искренности проверяемого при ответах на вопросы;

8. в любой момент осуществлять экспресс-оценку состояния вегетативной нервной системы респондента.

Рис. 2.5. Выводы по результатам обработки данных тестирования алгоритмом "EPOSCOR" отображены в наглядной форме Для проведения исследований настоящей диссертационной работы наиболее удобным представлением результатов обработки сигналов датчиков было их представление в числовом виде, как показано на рис. 2.6.

Рис. 2.6. Представление результатов исследования 2.1.3. Заключительные замечания Система датчиков полиграфного аппарата ЭПОС-7 и его сервисное программное обеспечение может быть использовано в качестве материальнотехнической базы для разработки нейросетевой системы оценки полиграмм по следующим причинам:

- Система датчиков полиграфного аппарата ЭПОС-7 обеспечивает съем необходимого минимума физиологических параметров, традиционно используемых в большинстве полиграфных аппаратов [4, 6, 31, 32].

- Сервисное программное обеспечение первого и второго уровней системы ЭПОС-7 позволяет представить результаты съема физиологических параметров в удобном для последующего нейросетевого использования в виде таблицы рис. 2.6.

В заключение отметим, что другие полиграфные аппараты, например ПОЛАРГ и ДИАНА, тоже могли бы быть использованы в качестве материально-технической базы для наших исследований и разработок, но для диссертанта полиграфный аппарат ЭПОС-7 оказался наиболее доступным.

Нейросетевые технологии как методологическая база для создания автоматизированной системы оценки полиграмм Аппарат нейросетевых технологий сравнительно молод и его пока еще нельзя назвать широко распространенным и общепризнанным как в России, так и за рубежом. В России, в таких городах, как Снежинск, Новосибирск, Красноярск, Пенза, Пермь, Москва, Петербург, существуют научные школы искусственного интеллекта, различающиеся своими подходами, опытом, наработками, ноу-хау.

Автор диссертационной работы причисляет себя к Пермской научной школе (www.PermAi.ru). Поэтому в настоящем разделе излагается взгляд на нейросетевые технологии, их теоретические основы и приемы создания нейросетевых интеллектуальных систем в ракурсе, характерном именно для Пермской школы.

Теоретический материал этого раздела использован в следующем разделе диссертации при разработке программного инструментария «ЗС», созданном автором диссертации специально для нейросетевого моделирования на основе полиграфного аппарата ЭПОС-7, а в третьей главе диссертации с использованием этого материала описана процедура создания нейросетевых алгоритмов оценки полиграмм.

Свойства нейронных сетей, обеспечивающие объективность и эффективность разрабатываемых алгоритмов оценки полиграмм Рассмотренные в первой главе диссертационной работы технологии создания алгоритмов оценки полиграмм (в т.ч. метод статистических сравнений, балльная и метрическая системы), предполагают предварительное закладывание знаний экспертов-полиграфологов в создаваемые алгоритмы, в результате чего такие алгоритмы способны учитывать только эти субъективные экспертные знания. Закономерности же, порожденные индивидуальными особенностями организма конкретного опрашиваемого человека, такие алгоритмы учитывать, не способны (или способны учитывать только в том виде, в каком рекомендуют эксперты, создавшие балльную и метрическую системы и заложившие пороговые значения оценки критериев согласно своему собственному опыту, мнению и интуиции), в результате чего они обладают невысокой точностью заключений. Так, согласно литературным данным [32, 68], погрешность заключений широко используемого в России полиграфного аппарата ЭПОС-7 достигает 30%.

Отсутствием субъективизма и объективностью автоматического (без помощи экспертов) выявляемых знаний отличаются математические модели, полученные с помощью нейросетевых и регрессионных технологий [7-11, 18, 19, 23-28, 30, 35, 36, 48-49, 51, 55, 60-66, 87, 92-94, 100, 103-104, 108-109].

Задача выявления скрываемой информации с помощью полиграфа характеризуется несколькими входными параметрами, влияющими на результат, и одним выходным параметром, кодирующим степень достоверности сообщаемой информации. Нейронные сети позволяют одновременно работать практически с любым количеством разнородных входных и выходных параметров. В отличие от регрессионных моделей, для их качественного обучения требуется существенно меньше статистической информации о предметных областях. С другой стороны, нелинейности, заимствованные из наблюдений за работой нейронов мозга и заложенные в нейронные сети, позволяют с помощью нейросетевых технологий выявлять и выстраивать функциональные зависимости, аппроксимация которых средствами регрессионного анализа часто представляется проблематичной.

Наконец, нейронные сети обладают свойством интуиции, на которое обращено внимание в работах [60-62, 65-66]. Это свойство, понимаемое как способность делать правильные выводы и заключения на основе логически неполной информации, является весьма полезным при решении поставленной в диссертационной работе задачи.

Вследствие всего изложенного наиболее перспективными на сегодняшний день представляются именно нейросетевые технологии, в частности, основанные на многослойных персептронах с сигмоидными активационными функциями, наиболее развитые, опробованные и применяемые как во всем мире, так и в Пермской научной школе искусственного интеллекта (www.PermAI.ru).

К этому выводу привели также многочисленные исследования возможностей применения для построения алгоритмов оценки полиграмм нейронных сетей других архитектур, таких как сети Кохонена, Хемминга и Хопфилда, а также радиально-базисных сетей, выполненные в курсовых, дипломных и магистерских работах студентов под руководством и при участии автора диссертационной работы.

2.2.2. Теорема существования В жизни встречается множество практически важных задач, решить которые можно методом математического моделирования, т.е. путем построения некоторой сложной функции, осуществляющей преобразование вектора входных параметров X в вектор выходных параметров Y. Одной из таких задач является задача построения алгоримов оценки полиграмм, где в качестве вектора X выступают физиологические параметры, снимаемые с респондента в тот момент, когда ему задают вопрос, а выходной вектор Y содержит информацию позволяющую сделать заключение о реакции респондента на этот вопрос.

Универсальным инструментом построения функции, выполняющей преобразование вектора входных параметров X в вектор выходных параметров Y, являются нейросетевые технологии.

Как известно [23, 24, 60], важнейшее место в теории нейронных сетей занимает теорема Арнольда – Колмогорова – Хехт-Нильсена. В ее основе лежат публикации академиков А.Н.Колмогорова [20] и В.И.Арнольда [1]. Им удалось доказать, что любая непрерывная функция аргументов f ( x1, x2,...,xn ) всегда может быть представлена в виде суммы непрерывных функций одного аргумента: f1 ( x1 ) f 2 ( x2 )... f n ( xn ). Профессором Калифорнийского университета Р.Хехт-Нильсеном [93] теоремы Арнольда – Комогорова были переработаны применительно к нейронным сетям. Было доказано, что для любого множества пар, различающихся между собой входными и выходными векторами произвольной размерности, существует двухслойный персептрон с сигмоидными активационными функциями и с конечным числом нейронов, который для каждого входного вектора X q формирует соответствующий ему выходной вектор Dq.

Таким образом, была доказана принципиальная возможность построения нейронной сети, выполняющей преобразование, заданное любым множеством различающихся между собой обучающих примеров, и установлено, что такой универсальной нейронной сетью является двухслойный персептрон, т.е. персептрон с одним скрытым слоем, причем активационные функции его нейронов должны быть сигмоидными.

Теорема Арнольда – Колмогорова – Хехт-Нильсена имеет очень важное для практики следствие в виде формулы [93, 94], с помощью которой можно определять необходимое количество синаптических весов нейронной сети:

где N y – количество нейронов выходного слоя; Q – число элементов множества обучающих примеров; N w – необходимое число синаптических связей; N x – количество нейронов входного слоя.

Оценив с помощью этой формулы необходимое число синаптических связей N w, можно рассчитать необходимое число нейронов в скрытых слоях.

Например, число нейронов скрытого слоя двухслойного персептрона будет равно 2.2.3 Проектирование персептронов Как следует из теорем Арнольда – Колмогорова – Хехт-Нильсена, для построения нейросетевой модели любого сколь угодно сложного объекта достаточно использовать персептрон с одним скрытым слоем сигмоидных нейронов, число которых определяется формулами (2.1), (2.2). Однако в практических реализациях персептронов, как количество слоев, так и число нейронов в каждом из них часто отличаются от теоретических. Иногда целесообразно использовать персептроны с большим количеством скрытых слоев.

Строгой теории выбора оптимального количества скрытых слоев и нейронов в скрытых слоях пока не существует. На практике чаще всего используются персептроны, имеющие один или два скрытых слоя, причем количество нейронов в скрытых слоях обычно колеблется от N x / 2 до 3N x.

При проектировании персептронов необходимо понимать, что персептрон должен не только правильно реагировать на примеры, на которых он обучен, но и уметь обобщать приобретенные знания, т.е. правильно реагировать на примеры, которых в обучающем множестве не было. Чтобы оценить способность нейронной сети к обобщению, помимо обучающего множества примеров L (см. рис. 2.7) в рассмотрение вводят некоторое количество тестовых примеров, образующих тестирующее множество T. Примеры тестирующего множества относятся к той же самой предметной области, но в процессе обучения не участвуют.

После обучения вычисляют среднеквадратичную (или максимальную) ошибку нейронной сети как разницу между прогнозным вектором Y и желаемым вектором D. Причем ошибку, вычисленную на примерах обучающего множества L, называют ошибкой обучения и обозначается L, а ошибку, вычисленную на примерах тестирующего множества T – ошибкой обобщения или тестирования и обозначают T.

Обучающее Примеры предметной области Рис. 2.7. Деление примеров предметной области на обучающее множество L, тестирующее множество T и подтверждающее множество P Обратим внимание, что ошибка обучения L вычисляется на тех примерах предметной области, на которых сеть обучалась. Ошибка же обобщения T вычисляется на примерах той же предметной области, но которые сеть никогда «не видела». Поэтому ошибки L и T имеют разную природу и, соответственно, разный характер поведения. При увеличении числа нейронов скрытых слоев персептрона N ошибка обучения L обычно падает, тогда, как ошибка обобщения T сначала падает, а затем, начиная с некоторого оптимального количества нейронов скрытого слоя N N0, возрастает. Характерные кривые зависимости ошибок обучения и обобщения от числа нейронов скрытых слоев персептрона приведены на рис. 2.8.

Рис. 2.8. Характерные зависимости ошибки обучения L и ошибки обобщения (тестирования) T от количества нейронов скрытых слоев Свойство нейронных сетей терять способность к обобщению при чрезмерном увеличении числа нейронов скрытых слоев называют переобучением, или гиперразмерностью.

Итак, существуют некоторые практические рекомендации по проектированию персептронов, т.е. по выбору числа входных нейронов, числа выходных нейронов, количества скрытых слоев, количества нейронов в скрытых слоях, виду активационных функций.

1. Число входных нейронов персептрона должно совпадать с количеством входных параметров, т.е. – с размерностью вектора X, который определен условиями решаемой задачи.

2. Число нейронов выходного слоя должно совпадать с количеством выходных параметров, т.е. – с размерностью выходного вектора D, что также определено условиями задачи.

3. Число скрытых слоев персептрона, согласно теоремам Арнольда – Колмогорова – Хехт-Нильсена, должно быть не менее одного, причем нейроны в скрытых слоях должны иметь сигмоидную активационную функцию.

4. Число нейронов в скрытых слоях может быть приближенно оценено по формулам (2.1), (2.2), однако его желательно уточнять для каждой конкретной задачи путем построения кривых рис. 2.8 и определения с помощью них оптимального числа нейронов скрытых слоев N 0.

В наиболее ответственных случаях наряду с обучающим множеством L и тестирующим множеством T в рассмотрение вводят еще одно множество примеров, называемое подтверждающим и обозначают его буквой P (см. рис.

2.8). Примеры этого множества также относятся к рассматриваемой предметной области, однако ни в обучении, ни в тестировании сети они не участвуют. Поэтому ошибка прогнозирования P, вычисленная на примерах подтверждающего множества P, является наиболее объективной оценкой качества нейросетевой математической модели.

2.2.4 Алгоритм применения метода нейросетевого математического моделирования В работах [61, 62] сформулирован примерный алгоритм применения метода нейросетевого математического моделирования, блок-схема которого приведена на рис. 2.9. Этот алгоритм использован в следующей главе диссертации при построении нейросетевых алгоритмов оценки полиграмм.

Этап 1. Постановка задачи.

На этом этапе определяются цели моделирования, устанавливаются входные и выходные параметры модели, устанавливается структура (состав и длина) входного вектора X, и выходного вектора D.

В качестве компонент входного вектора X важно выбрать значимые параметры, т.е. те, которые оказывают существенное влияние на результат. Если есть сомнения в значимости того или иного входного параметра, то его лучше включить во входной вектор, рассчитывая, что в последующем с помощью создаваемой нейросети можно будет оценить степень его влияния на результат и, если она окажется слабой, то этот параметр в последующем исключить.

Выходной вектор D формируется таким, чтобы его компоненты давали возможность получить ответы на все поставленные вопросы.

5. Проверка и оптимизация сети 6. Исследование и прогнозирование Рис. 2.9. Укрупненная блок-схема алгоритма применения метода нейросетевого математического моделирования Компоненты входного вектора X и выходного вектора D представляют собой числа. Это могут быть значения каких-либо величин, например, электропроводность кожи, артериальное давление, частота пульса и др. Это могут быть также числа, кодирующие наличие или отсутствие каких-либо признаков, например, единица, если пол мужской и двойка, если пол женский.

В нашем случае компонентами входного вектора X являются физиологические параметры и характеристики респондента, принимаемые во внимание при формировании выходного вектора D, кодирующего информацию об истинности или ложности ответа респондента: 1 – ответ истинный; 0 – ответ ложный.

Этап 2. Формирование примеров.

На этом этапе формируется содержимое входных и выходных векторов.

В результате создается множество пар X q – Dq ( q 1,...,Q ). Каждая такая пара составляет пример, характеризующий предметную область.

Компоненты векторов X q и Dq в нашем случае формируются в ходе стимуляционного тестирования и анкетирования респондентов.

Значения компонент вектора X q, могут иметь самый разнообразный характер. Это могут быть числа с различными диапазонами изменений, могут быть количественные и качественные характеристики, такие как рост и вес респондента, могут быть даты, содержащие число, месяц, год рождения, цвет волос, знак зодиака и др. Поскольку нейросеть в состоянии обрабатывать только числа, то вся нечисловая информация должна быть закодирована в числовом виде.

Числовую информацию, приготовленную для нейросетевой обработки, необходимо масштабировать, т.е. выровнять диапазоны изменения величин, например, ограничив их интервалом [-1,1]. Сделать это можно с помощью простейшего линейного преобразования:

где xn и ~n – значения исходного и масштабированного n -го параметра предметной области, подаваемого на n -й входной нейрон нейросети;

xn min, xn max – реальный диапазон изменения n -го параметра; A, B – приемлемый диапазон изменения входных сигналов, например A 1, B 1.

Все множество примеров разбивают на обучающее L и тестирующее T (см. рис. 2.7). Обычно объем тестирующего множества выбирают не менее 10% от обучающего. Какой необходим минимальный объем обучающего множества, зависит от задачи. Для расчета минимально допустимого объема обучающего множества иногда используют эмпирическую формулу [11]:

Q 7 N x 15, в которой N x – количество входных параметров нейросетевой модели. Однако в практике применения нейросетевых технологий встречались случаи, когда для решения задачи хватало и десяти обучающих примеров.

В особо ответственных случаях рекомендуется помимо обучающего множества L и тестирующего множества T, формировать еще и подтверждающее множество P из примеров, принадлежащих той же самой предметной области, но не пересекающееся ни с множеством L, ни с множеством P (см. рис. 2.7).

Этап 3. Проектирование сети.

Структура персептрона выбирается из следующих соображений.

Число входных нейронов N x должно быть равно размерности входного вектора X.

Число выходных нейронов N y должно быть равно размерности выходного вектора D.

Число скрытых слоев, согласно теореме Арнольда – Колмогорова – Хехт-Нильсена, должно быть не менее одного. На последующих этапах число скрытых слоев может корректироваться, если это позволит улучшить качество работы сети.

Число нейронов в скрытых слоях рассчитывается с помощью формул (2.1), (2.2). На последующих этапах число нейронов в скрытых слоях может корректироваться, если это позволит улучшить качество работы сети.

Активационные функции скрытых нейронов, согласно теореме Арнольда – Колмогорова – Хехт-Нильсена, рекомендуется задать сигмоидными, однако в дальнейшем, их вид может быть изменен, если это позволит улучшить качество работы сети.

При корректировке структуры персептрона следует иметь в виду, что увеличение скрытых нейронов обычно позволяет добиться меньшей ошибки обучения, однако чрезмерное их увеличение приводит к эффекту гиперразмерности – потере обобщающих свойств сети, выражающемуся в возрастании ошибки обобщения.

Этап 4. Обучение сети.

Обучение сети – очень важный, но не окончательный этап создания нейросетевой математической модели. Цель обучения – подобрать синаптические веса wij так, чтобы на каждый входной вектор X q множества обучающих примеров сеть выдавала вектор Yq, минимально отличающийся от заданного выходного вектора Dq. Эта цель достигается путем использования алгоритмов обучения нейронной сети. Характерная кривая обучения – зависимость ошибок обучения от числа эпох обучения, приведена на рис. 2.10, а.

Рис. 2.10. Характерные кривые зависимости ошибок обучения от числа эпох в случае, когда сеть обучается успешно (а), и когда процесс обучения не дает Но может случиться так, что сеть не захочет обучаться – ошибка обучения с увеличением числа эпох не будет стремиться к нулю (рис. 2.10, б).

Причинами этого нежелательного явления могут быть следующие.

1-я причина. Недостаточное количество скрытых слоев и скрытых нейронов.

2-я причина. Наличие в обучающем множестве противоречащих друг другу примеров. Например, одним и тем же входным параметрам соответствуют разные заключения полиграфного аппарата.

3-я причина. Попадание в локальный минимум.

4-я причина. Слишком большая скорость обучения.

При увеличении скорости обучения из-за слишком большого шага теряется устойчивость и итерационный процесс обучения может разойтись.

Этап 5. Проверка и оптимизация сети.

Проверка обобщающих свойств сети (иногда этот этап называют тестированием сети) производится на тестирующем множестве примеров, т.е.

на тех примерах, которые не были использованы при обучении сети. Результаты тестирования полезно представить графически в виде гистограммы, на которой значения желаемых выходов персептрона ( Dq ) можно сопоставить с действительными (прогнозными) ( Yq ), т.е. теми, которые вычислил персептрон. Пример такой гистограммы приведен на рис. 2.11.

Рис. 2.11. Пример гистограммы, показывающей соотношение желаемых выходов сети с прогнозными Если разница между компонентами желаемого выходного вектора тестирующего множества примеров Dq и прогнозными значениями Yq окажется незначительной, то можно переходить к следующему этапу 6, не выполняя оптимизацию сети. Однако чтобы лишний раз убедиться в адекватности разрабатываемой нейросетевой математической модели, полезно вернуться на этап 2 и те примеры, которые были тестирующими, (либо часть тестирующих примеров) включить в обучающее множества, а часть примеров, бывших обучающими, сделать тестирующими. После этого снова повторить этапы 3, 4, 5.

Если погрешность обобщения сети окажется неприемлемо большой, надо попытаться оптимизировать сеть. Оптимизация сети состоит в подборе наиболее подходящей для данной задачи структуры сети – количества скрытых слоев, количества скрытых нейронов, количества синаптических связей, вида и параметров активационных функций нейронов. В некоторых нейропакетах предусмотрена автоматическая оптимизация сети. Но иногда бывает полезно выполнить оптимизацию вручную, построив график зависимости погрешности обобщения T от числа скрытых нейронов (рис. 2.8) и других параметров персептрона, и выбрав с помощью этих графиков структуру сети, обеспечивающую минимальную погрешность обобщения.

При выборе оптимальной структуры сети следует помнить, что цель оптимизации сети состоит в минимизации погрешности обобщения T, но не погрешности обучения L. Именно по величине погрешности обобщения судят о качестве сети, о ее обобщающих и, следовательно, прогностических свойствах. Погрешность же обучения – это всего лишь промежуточный результат. Желательно, чтобы она была небольшой, но добиваться ее минимального значения вовсе не обязательно и даже вредно, поскольку, как это видно из графиков рис. 2.8, приводит к эффекту переобучения, т.е. росту погрешности обобщения.

Понятно, что оптимизация нейронной сети подразумевает многократные возвраты назад – на этапы 4, 3, 2, 1.

После оптимизации сети, ее обобщающие свойства рекомендуется проверить на примерах подтверждающего множества P. Дело в том, что в процессе оптимизации сеть могла приспособиться к примерам тестирующего множества. А если эти примеры по каким-либо причинам не характерны для всей предметной области, то на других примерах, которых не было ни в тестирующем, ни в обучающем множествах, она может дать неожиданно большую ошибку прогнозирования. Для исключения такого явления, и чтобы окончательно убедиться, что сеть имеет хорошие обобщающие свойства не только на тестирующем множестве примеров, вычисляют ошибку прогноза сети P на подтверждающем множестве, т.е. на тех примерах, которые ни в обучении, ни в тестировании не участвовали.

Результатом оптимизации и проверки сети является готовая к использованию нейросетевая математическая модель предметной области – интеллектуальная информационная система.

Этап 6. Исследование модели, прогнозирование.

Путем проведения вычислительных экспериментов над математической нейросетевой моделью достигаются цели моделирования, находятся ответы на все поставленные вопросы. Например, могут быть решены такие задачи, как выявление закономерностей предметной области, выявление наиболее значимых параметров, оказывающих влияние на результат моделирования. В нашем случае прогнозом нейросетевой математической модели является результат анализа поведения конкретного респондента – заключение об истинности или ложности его ответа.

Нейроэкспертный алгоритм последовательного обнаружения и исключения выбросов из статистических выборок.

Пермской научной школой искусственного интеллекта на протяжении последних пятнадцати лет предпринимались попытки изобретения новых принципов построения и функционирования нейронных сетей. Осваивались пропагандируемые другими научными школами нейросетевые парадигмы неклассического типа. Однако до сих пор не нашлось практически значимых задач, для решения которых неклассические нейросети оказались бы более эффективны, чем персептроны с сигмоидными активационными функциями, изобретенные в середине прошлого столетия.

У нас сложилось твердое убеждение, что, вне зависимости от применяемых нейросетевых парадигм, попытки разработки адекватной нейросетевой математической модели могут быть успешными, только в том случае, если одновременно выполняются следующие условия:

1. При постановке задачи учтено достаточное количество признаков (входных параметров модели), оказывающих влияние на результат моделирования.

2. Сформировано достаточно репрезентативное множество примеров поведения предметной области (наблюдений).

3. Во множестве наблюдений не содержатся конфликтные (противоречащие друг другу) примеры.

4. Во множестве наблюдений не содержится выбросов, либо они незначительны, либо их количество мало по сравнению с общим количеством примеров.

Как известно, под выбросами понимаются примеры поведения предметной области, по каким-либо причинам выпадающие из общих закономерностей этой предметной области. Другими словами – это наблюдения, не удовлетворяющие закономерностям, которым подчиняется подавляющее большинство примеров поведения исследуемой предметной области. Причинами появления выбросов могут быть: не достаточно чисто проведенный эксперимент, ошибки измерений, сбои приборов и оборудования, искажения информации при формировании множества обучающих примеров.

С целью преодоления указанных трудностей автором предложен и реализован специальный алгоритм, названный нейроэкспертным алгоритмом последовательного обнаружения и исключения выбросов из статистических выборок. Идея алгоритма основана на том факте, что, если выбросов в обучающем множестве сравнительно немного, и, если нейронная сеть имеет сравнительно небольшое число степеней свободы (небольшое количество синаптических весов), то после применения процедуры обучения нейронная сеть на примерах, являющихся выбросами, как правило, показывает более высокую погрешность обучения, чем на примерах, не являющихся выбросами.

Используя этот эмпирический факт, алгоритм обнаружения и исключения выбросов предлагается в виде блок-схемы, представленной на рис. 2.12.

1. Разбить множество наблюдений на обучающее ( L ), тестирующее ( T ) и подтверждающее ( P ) в отношении 80% : 15% : 5% минимальное и максимальное количество скрытых нейронов двухслойного персептрона 3. Рассчитать число скрытых нейронов двухслойного персептрона, предназначенного для выявить пример, для которого ошибка обучения нейросети о имеет максимальное значение 5. Предоставить информацию о выявленном примере специалисту и согласовать возможное 6а. Удалить выявлен- 6б. Пометить пример, как неподленый пример из мно- жащий удалению и выявить слежества L T дующий по величине о пример 7. Разбить очищенное множество L T на обучающее 8. Обучить и протестировать нейросеть, вычислив ошибку тестирования T на множестве T. Результат тестирования изобразить графически 9. Повторять пока кривая T (t ) не перестанет снижаться 10. Вычислить ошибку сети P на подтверждающем множестве P Рис. 2.12. Блок-схема нейроэкспертного алгоритма последовательного Согласно этой блок-схеме алгоритм включает следующие пункты:

1. Разбить множество примеров поведения предметной области на обучающее ( L ), тестирующее (T ) и подтверждающее ( P ) в отношении 80% :

15% : 5%.

2. Для множества примеров L T, пользуясь формулами следствия теоремы Арнольда – Колмогорова – Хехт-Нильсена, рассчитать минимальное и максимальное количество скрытых нейронов двухслойного персептрона:

Здесь: N min и N max – минимальное и максимальное количество скрытых нейронов; N w min и N w max – минимальное и максимальное количество сил синаптических связей; N x – количество нейронов входного слоя; N y – количество нейронов выходного слоя; Q – число элементов множества L T.

3. Рассчитать число скрытых нейронов двухслойного персептрона, предназначенного для выявления посторонних выбросов с помощью предлагаемой в настоящей диссертационной работе эмпирической формулы:

в которой – эмпирический коэффициент, значение которого, в первом приближении принимается, например, равным 0,1.

4. Обучить нейронную сеть на множестве L T и выявить пример, для которого ошибка обучения нейросети о имеет максимальное значение.

5. Предоставить информацию о выявленном примере специалисту в исследуемой предметной области и согласовать с ним вопрос о возможности удаления данного примера из множества L T.

6. В зависимости от решения эксперта: либо удалить выявленный пример из множества L T и перейти к следующему п.7, либо пометить его, как неподлежащий удалению, выявить следующий по величине о пример и перейти на п.5.

7. Разбить очищенное множество L T на обучающее L и тестирующее T в отношении 85% : 15%.

8. Обучить и протестировать нейросеть, вычислив ошибку тестирования T на множестве T. Результат тестирования изобразить графически как на рис. 2.13.

9. Повторять пп. 2 – 8, пока кривая на рис. 2.13 не перестанет снижаться.

10. Вычислить ошибку сети P на подтверждающем множестве P.

Рис. 2.13. Примерные зависимости погрешности тестирования T от эмпирического коэффициента и от числа итераций n по пп. 2 – 8 предлагаемого алгоритма Как видно из рисунка 2.13, качество получаемой таким способом нейронной сети зависит от значения коэффициента. В приведенном на рисунке примере оптимальное значение коэффициента оказалось равным 0,1. Это значит, что любое отклонение от этого оптимального значения коэффициента в сторону увеличения, или в сторону уменьшения, приводит к росту ошибки тестирования сети T (а также P ). Как показали численные эксперименты, данное значение коэффициента 0,1 является оптимальным только для рассматриваемого в диссертационной работе класса задач. Для других же предметных областей оптимальное значение коэффициента может отличаться от 0,1, однако, как правило, не выходит за рамки интервала [0; 0,2]. В любом случае, оно может быть уточнено путем построения кривых, аналогичных кривым рисунка 2.13.

Применение предлагаемого алгоритма обнаружения и исключения посторонних выбросов при создании нейросетевого детектора лжи позволило снизить погрешность нейронных сетей от 20 до 80% в зависимости от используемой статистической выборки и используемого нейросетевого алгоритма.

Необходимо отметить, что попытки построения нейросетевых моделей, без предварительной очистки статистической информации от выбросов с помощью предлагаемого алгоритма, в некоторых случаях, вообще не приводили к положительным результатам, т.е. погрешности нейронных сетей не удавалось снизить до сколько-нибудь приемлемых для практического применения значений.

Структура исследуемой в работе системы На рисунке 2.14 представлена схема взаимодействия элементов исследуемой в диссертационной работе системы. Элементами этой системы являются: респондент; анкета; датчики полиграфного аппарата; алгоритмы обработки сигналов первого и второго уровней; нейронная сеть; специалистполиграфолог.

Как показано на схеме, информация снимается с респондента двумя путями: с помощью датчиков полиграфного аппарата и путем предварительного заполнения анкет. Информация, полученная с датчиков, обрабатывается алгоритмами первого и второго уровней полиграфного аппарата, после чего подается на входы нейронной сети. Информация с анкет сразу подается на входы нейронной сети. Нейронная сеть, вычисляет результат, используемый специалистом-полиграфологом для интеллектуальной поддержки решения об истинности или ложности ответа респондента. Задача системного анализа состоит в том, чтобы обеспечить минимальную погрешность заключений при минимальном времени полиграфного обследования респондента.

То есть критериями системного анализа являются:

1. Погрешность заключений;

2. Время полиграфного обследования респондента.

Рис. 2.14. Структура исследуемой системы, элементами которой являются: респондент; анкета; датчики полиграфного аппарата; алгоритмы обработки сигналов первого и второго уровней; нейронная сеть; специалистполиграфолог

ВЫВОДЫ

1. Нейронные сети персептронного типа являются инструментом, обладающим качествами, необходимыми для устранения недостатков существующих алгоритмов анализа полиграмм, указанных в главе 1. Нейросетевые технологии приняты в качестве методологической базы создания алгоритмов оценки полиграмм.

2. В качестве материально-технической базы для разработки нейросетевых алгоритмов оценки полиграмм принят полиграфный аппарат ЭПОС- и его программное сервисное обеспечение первого и второго уровней.

3. Разработан нейроэкспертный алгоритм последовательного обнаружения и исключения выбросов из статистической информации, отличающийся от известных тем, что в его основе лежит нейронная сеть, спроектированная с использованием формул следствия из теорем Арнольда – Колмогорова – Хехт-Нильсена, а также предложенной в диссертации эмпирической формулы. За счет своей нейросетевой основы, в отличие от существующих алгоритмов, предлагаемый алгоритм применим в тех случаях, когда не выполняется закон нормального распределения статистических данных. Применение алгоритма позволяет не только снизить погрешность нейросетевых моделей, но и расширяет круг задач, для которых успешное применение нейросетевых технологий вообще возможно.

ГЛАВА 3. РАЗРАБОТКА НЕЙРОСЕТЕВЫЕХ АЛГОРИТМОВ

АНАЛИЗА ПОВЕДЕНИЯ РЕСПОНДЕНТОВ

3.1 Постановка задачи Целью диссертационной работы является разработка нейросетевых алгоритмов системного анализа информации, получаемой в результате опроса на полиграфном аппарате (в частности – алгоритмов оценки полиграмм), лишенных указанных во введении и в первой главе диссертации недостатков.

Отличие нового подхода состоит в отказе от использования известных экспертам закономерностей и правил, традиционно закладываемых в анализирующие программы. Эти правила в неявном виде автоматически должны формироваться самой компьютерной программой в ходе обмена информацией между прибором и обследуемым человеком-респондентом. Компьютерная программа, являясь системой искусственного интеллекта, должна сама извлекать и формализовать в виде правил закономерности организма респондента, автоматически настраиваться на его индивидуальные физиологические особенности, отсеивать возможные артефакты. Применение такой программы в конечном итоге должно сократить объем и время работы специалиста-полиграфолога, уменьшить влияние «человеческого фактора», увеличить степень достоверности заключений полиграфного аппарата.

3.2 Индивидуально-настраиваемый нейросетевой алгоритм Создание нейронной сети осуществлялось согласно методике представленной на рис. 2.9.

3.2.1 Постановка задачи Идея алгоритма состоит в настройке полиграфа под каждого респондента для того чтобы учесть его индивидуальные особенности. В качестве входного вектора X используются сигналы, снимаемые с датчиков штатного полиграфного аппарата ЭПОС-7, а в качестве выходного вектора (в данном случае – скаляра) d – сигнал, кодирующий заключение полиграфного аппарата («1 – истина» или «0 – ложь»), формируемый полиграфологом.

Множество обучающих примеров формировалось в результате предъявления обследуемому человеку стимуляционных тестов. В этом случае полиграфолог задавал вопросы, ответы на которые ему были известны. С респондентов (заключенных пермской городской тюрьмы) во время ответов с помощью штатных датчиков полиграфа «ЭПОС-7» снимались физиологические параметры, которые формировали входной вектор X J. Каждому респонденту задавалось 20-30 вопросов.

Требуемый (желаемый) выходной сигнал персептрона d формировал полиграфолог, сопоставляя ответы респондента с тем, что ему заранее известно: d 1, если ответ правдивый, и d 0, если ответ ложный.

После обучения нейронная сеть подвергается тестированию на примерах, которых в обучающем множестве не было. На каждом таком примере нейросеть вырабатывает выходной сигнал y. Оценка разницы между действительным y и желаемым d значениями выходных сигналов нейросети, вычисляемая по известной формуле В этой формуле m – номер тестирующего примера, M – их количество.

Таким образом, в качестве входных векторов персептрона X q (где q – номер примера: q 1,...,Q ) были использованы те же наборы параметров, что и в традиционно применяемом в следственной практике контактном полиграфном аппарате ЭПОС-7:

x1 – верхнее дыхание (грудное), число вдохов в минуту;

x2 – нижнее дыхание (брюшное), число вдохов в минуту;

x3 – амплитуда дыхания, амплитуда;

x4 – кожно-гальванические реакции 1-го уровня, число колебаний в минуту;

x5 – кожно-гальванические реакции 2-го уровня, число колебаний в минуту;

x6 – кожно-гальванические реакции, амплитуда;

x7 – фотоплетизмограмма, частота;

x8 – фотоплетизмограмма, амплитуда;

x9 – кровенаполнение, скорость кровенаполнения сосудов.

Масштабирование входных параметров производилось по методике, описанной во второй главе диссертации с помощью формулы (2.3).

Согласно сложившейся практике обучения и тестирования нейронных сетей множество примеров предметной области разбивалось на обучающее и тестирующее (см. рис. 2.7). Всего было сформировано обучающее множество около 900 примеров (по 25-30 обучающих примеров для каждого респондента) и 300 тестирующих примеров (по одному на каждого респондента).

3.2.2 Проектирование сети Число входных нейронов проектируемой нейросети было равно девяти, на выходе был использован один нейрон. Для того чтобы получить нейобходимое количество внутренних слоев и нейронов в них были выполнены следующие действия:

1. Необходимое число синаптических связей N w было предварительно оценено с помощью формулы (2.1). Вычисления по этой формуле производились при значениях:

N x 9 – количество нейронов входного слоя;

N y 1 – количество нейронов выходного слоя;

Q 30 – число элементов множества обучающих примеров для одного респондента.

В результате было получено:

2. Согласно формуле (2.2) было примерно оценено необходимое число нейронов в скрытых слоях N : 1 N 5.

3. Активационные функции скрытых нейронов, были заданы сигмоидными.

3.2.3 Обучение и тестирование сети Обучение и тестирование нейронной сети проводилось на примерах, подтвержденных следственными или судебными решениями.

Обучение нейронной сети проводилось с помощью алгоритма обратного распространинея ошибки [7, 18, 51, 104]. При обучении нейросети обычно использовались следующие параметры: скорость обучения 0,08, количество эпох 3000.

В ходе работ по созданию индивидуально-настраиваемого алгоритма была выполнена оптимизация нейронной сети. В качестве критерия оптимальности использовалось условие минимума среднеквадратичной ошибки тестирования T, заданной формулой (3.1). Минимизация функции T осуществлялась путем варьирования количества скрытых слоев, количества нейронов в скрытых слоях, типов активационных функций нейронов.

Результатом оптимизации явилась слоистая нейронная сеть с девятью нейронами входного слоя, одним нейроном выходного слоя, и с одним скрытым слоем, включающем пять сигмоидных нейронов. Упрощенная схема полученной нейросети представлена на рис. 3.1.

Рис. 3.1. Упрощенная схема нейронной сети, реализующей индивидуальнонастраиваемый алгоритм Обученная и оптимизированная нейросеть тестировалась на примерах, не вошедших в обучающее множество. Каждому респонденту был задан только один тестирующий вопрос. Результаты тестирования для 90, 100 и респондентов приведены на рис. 3.2-3.3 в виде гистограмм, показывающих значение погрешности – разницы между желаемым и действительным выходными значениями сети, для каждого респондента. Таким образом, в ходе экспериментов всего было создано и протестировано 90, 100 и 110 нейронных сетей, индивидуально настроенных на каждого респондента.

Рис. 3.2. Результаты, полученные при тестировании нейронной сети, реализующей индивидуально - настраиваемый алгоритм для 90 экспериментов. Среднее значение погрешности 3,38%.

Рис. 3.3. Результаты, полученные при тестировании нейронной сети, реализующей индивидуально - настраиваемый алгоритм для 100 экспериментов. Среднее значение погрешности 3,37%.

Рис. 3.4. Результаты, полученные при тестировании нейронной сети, реализующей индивидуально - настраиваемый алгоритм для 110 экспериментов. Среднее значение погрешности 3,37%.

Как видно на рис. 3.2-3.4 уменьшение или увеличение количества экспериментов на 10%, по отношению к 100 экспериментам, не приводило к изменению погрешности более чем на 0,1%,поэтому мы будем брать за основу значение погрешности, полученное при 100 экспериментах. Соответственно среднее значение погрешности для этого алгоритма 3,37%.

Таким образом, предлагаемый способ, с одной стороны, позволяет проводить обследование с учетом индивидуальных особенностей организма опрашиваемого человека, что существенно повышает степень объективности и качества выяснения истины, а с другой – этот способ требует больших трудозатрат (около трех суток на каждого респондента). Поэтому его можно рекомендовать только для сложных случаев, когда затраты на длительную подготовку обучающих множеств оправданы.

После обучения и тестирования нейронной сети опрашиваемому человеку можно задать вопрос, ответ на который заранее не известен. Нейронная сеть выдаст сигнал y, кодирующий степень истинности ответа, данного опрашиваемым человеком: если сигнал y оказывается близким к единице, то ответ считается истинным, а если к нулю – то ложным. Причем, поскольку нейронная сеть каждый раз обучается на физиологических реакциях, формируемых конкретным опрашиваемым человеком, то ее заключение объективно учитывает индивидуальные особенности организма именно этого человека.



Pages:     || 2 |


Похожие работы:

«из ФОНДОВ РОССИЙСКОЙ ГОСУДАРСТВЕННОЙ БИБЛИОТЕКИ Душкина, Майя Рашидовна 1. Взаимосв язь структуры Я-концепции ребенка и специфики внутрисемейнык отношений 1.1. Российская государственная Библиотека diss.rsl.ru 2003 Душкина, Майя Рашидовна Взаимосвязь структуры Я-концепции ребенка U специфики внутрисемейнык отношений [Электронный ресурс]: Дис.. канд. псикол. наук : 19.00.07.-М.: РГЕ, 2003 (Из фондов Российской Государственной библиотеки) Педагогическая псикология Полный текст:...»

«Семененко Григорий Михайлович КРИМИНОЛОГИЧЕСКАЯ ХАРАКТЕРИСТИКА И ПРЕДУПРЕЖДЕНИЕ УМЫШЛЕННОГО УНИЧТОЖЕНИЯ ИЛИ ПОВРЕЖДЕНИЯ ЧУЖОГО ИМУЩЕСТВА ДИССЕРТАЦИЯ на соискание ученой степени кандидата юридических наук 12.00.08 — уголовное право и криминология; уголовно-исполнительное право Научный руководитель :...»

«vy vy из ФОНДОВ РОССИЙСКОЙ ГОСУДАРСТВЕННОЙ БИБЛИОТЕКИ Макшанов, Сергей Иванович 1. Психология тренинга в профессиональной деятельности 1.1. Российская государственная библиотека diss.rsl.ru 2002 Макшанов, Сергей Иванович Психология тренинга в профессиональной деятельности [Электронный ресурс]: Дис.. д-ра психол. наук : 19.00.03 - М. : РГБ, 2002 (Из фондов Российской Государственной Библиотеки) Психология труда; инженерная психология Полный текст: http://diss.rsl.ru/diss/02/0000/020000726.pdf...»

«УДК 517.984 Ишкин Хабир Кабирович О классах возмущений спектрально неустойчивых операторов 01.01.01 – Вещественный, комплексный и функциональный анализ ДИССЕРТАЦИЯ на соискание ученой степени доктора физико-математических наук Научный консультант д. ф.-м. н., проф. З. Ю. Фазуллин Уфа – 2013 Содержание Введение........................»

«Когут Екатерина Викторовна ПОЛОЖЕНИЕ ЖЕНЩИН В ПАЛЕОЛОГОВСКОЙ ВИЗАНТИИ Специальность 07.00.03 – Всеобщая история (Средние века) Диссертация на соискание ученой степени кандидата исторических наук Научный руководитель Бибиков Михаил Вадимович, доктор исторических наук, профессор Москва — Оглавление Введение 1...»

«ПЕРЕВОЗЧИКОВА ЕЛЕНА ГЕННАДЬЕВНА ФОРМИРОВАНИЕ ТАРИФОВ НА ПЕРЕВОЗКИ КРУПНОГАБАРИТНЫХ И ТЯЖЕЛОВЕСНЫХ ГРУЗОВ Специальность: 08.00.05 – Экономика и управление народным хозяйством (ценообразование) ДИССЕРТАЦИЯ на соискание учёной степени кандидата экономических наук Научный руководитель : к.э.н., проф. Маховикова Г.А....»

«Быстров Дмитрий Олегович АОРТОКОРОНАРНОЕ ШУНТИРОВАНИЕ НА РАБОТАЮЩЕМ СЕРДЦЕ БЕЗ ИСКУССТВЕННОГО КРОВООБРАЩЕНИЯ У БОЛЬНЫХ СО СНИЖЕННОЙ ФРАКЦИЕЙ ВЫБРОСА ЛЕВОГО ЖЕЛУДОЧКА 14.01.26 - сердечно-сосудистая хирургия Диссертация на соискание ученой степени кандидата медицинских наук Научный руководитель : доктор...»

«ИЗ ФОНДОВ РОССИЙСКОЙ ГОСУДАРСТВЕННОЙ БИБЛИОТЕКИ Зиновьева, Эльвира Валерьевна Школьная тревожность и ее связь с когнитивными и личностными особенностями младших школьников Москва Российская государственная библиотека diss.rsl.ru 2006 Зиновьева, Эльвира Валерьевна Школьная тревожность и ее связь с когнитивными и личностными особенностями младших школьников : [Электронный ресурс] : Дис. . канд. психол. наук : 19.00.01. ­ М.: РГБ, 2006 (Из фондов Российской Государственной Библиотеки)...»

«ЗЕЛЕНСКАЯ Анаит Владимировна ДЕРМАТОПРОТЕКТОРНЫЕ СВОЙСТВА СОЧЕТАНИЯ РЕАМБЕРИНА И РЕКСОДА НА ФОНЕ САХАРНОГО ДИАБЕТА, ОСЛОЖНЕННОГО ЭКЗОГЕННОЙ ГИПЕРХОЛЕСТЕРИНЕМИЕЙ (экспериментальное исследование) 14.03.06 - фармакология, клиническая фармакология Диссертация на соискание ученой степени...»

«ХВОРОСТИН Денис Владимирович СКРЫТЫЕ КОМПОНЕНТЫ СМЫСЛА ВЫСКАЗЫВАНИЯ: ПРИНЦИП ВЫЯВЛЕНИЯ 10.02.19 — теория языка ДИССЕРТАЦИЯ на соискание ученой степени кандидата филологических наук Научный руководитель : доктор филологических наук, профессор Л. А. Шкатова Челябинск — 2006 ОГЛАВЛЕНИЕ ВВЕДЕНИЕ ГЛАВА 1. Имплицитное содержание высказывания как предмет...»

«ИЗ ФОНДОВ РОССИЙСКОЙ ГОСУДАРСТВЕННОЙ БИБЛИОТЕКИ Алейникова, Ольга Алексеевна Оптимизация конструкций теплозащитных пакетов одежды с объемными материалами Москва Российская государственная библиотека diss.rsl.ru 2007 Алейникова, Ольга Алексеевна.    Оптимизация конструкций теплозащитных пакетов одежды с объемными материалами  [Электронный ресурс] : дис. . канд. техн. наук  : 05.19.04. ­ Шахты: РГБ, 2007. ­ (Из фондов Российской Государственной Библиотеки). Технология швейных изделий...»

«Панфилова Ольга Витальевна ОЦЕНКА АДАПТИВНОСТИ КРАСНОЙ СМОРОДИНЫ К АБИОТИЧЕСКИМ ФАКТОРАМ СЕВЕРО-ЗАПАДА ЦЕНТРАЛЬНО-ЧЕРНОЗЕМНОГО РЕГИОНА 06.01.05- селекция и семеноводство сельскохозяйственных растений Диссертация на соискание ученой степени кандидата сельскохозяйственных наук Научный руководитель : кандидат с. - х. наук О.Д....»

«АНИСИМОВ Андрей Павлович Молекулярно-генетические механизмы образования и функциональная значимость капсулы Yersinia pestis 03.00.07 - микробиология Диссертация на соискание ученой степени доктора медицинских наук Саратов, Оболенск - 1999 2 СОДЕРЖАНИЕ Стр. ПЕРЕЧЕНЬ СОКРАЩЕНИЙ, УСЛОВНЫХ ОБОЗНАЧЕНИЙ, СИМВОЛОВ,...»

«ПАНЧЕНКО Алексей Викторович МАРКШЕЙДЕРСКАЯ ОЦЕНКА УСТОЙЧИВОСТИ КРИВОЛИНЕЙНОГО В ПЛАНЕ БОРТА КАРЬЕРА Специальность 25.00.16 – Горнопромышленная и нефтегазопромысловая геология, геофизика, маркшейдерское дело и геометрия недр Научный руководитель : доктор технических наук...»

«vy vy из ФОНДОВ РОССИЙСКОЙ ГОСУДАРСТВЕННОЙ БИБЛИОТЕКИ Соломатина, Татьяна Борисовна 1. Социальная адаптация студенческой молодежи в процессе профессиональногообразования 1.1. Российская государственная библиотека diss.rsl.ru 2002 Соломатина, Татьяна Борисовна Социальная адаптация студенческой молодежи в процессе профессиональногообразования [Электронный ресурс]: Дис.. канд. пед. наук : 13.00.08 М.: РГБ, 2002 (Из фондов Российской Государственной Библиотеки) Теория и методика профессионального...»

«Ефимов Артем Александрович РАЗРАБОТКА СТАТИСТИЧЕСКИХ МОДЕЛЕЙ ДЛЯ ПРОГНОЗА КОЭФФИЦИЕНТА ПОДВИЖНОСТИ НЕФТИ В РАЗЛИЧНЫХ ФАЦИАЛЬНЫХ УСЛОВИЯХ (на примере башкирских залежей Пермского края) 25.00.12 – Геология, поиски и разведка нефтяных и газовых месторождений Диссертация на соискание ученой степени кандидата...»

«Бутенко Светлана Викторовна ВВЕДЕНИЕ ПОТРЕБИТЕЛЯ В ЗАБЛУЖДЕНИЕ КАК АБСОЛЮТНОЕ ОСНОВАНИЕ ДЛЯ ОТКАЗА В ПРЕДОСТАВЛЕНИИ ПРАВОВОЙ ОХРАНЫ ТОВАРНОМУ ЗНАКУ 12.00.03 – гражданское право; предпринимательское право; семейное право; международное частное право ДИССЕРТАЦИЯ на соискание ученой степени кандидата юридических...»

«Дьячкова Екатерина Юрьевна Устранение дефектов кости верхней и нижней челюсти с помощью материала Коллост Стоматология 14.01.14г. Диссертация на соискание ученой степени кандидата медицинских наук Научный руководитель : Д.м.н., профессор Медведев Ю.А. Москва 2014 Список сокращений НАН- нижний альвеолярный нерв ОАС- ороантральное соустье ТКФ- трикальций-фосфат ХОГ-...»

«АСТАШКОВ Николай Павлович ПОВЫШЕНИЕ УСТОЙЧИВОСТИ АСИНХРОННЫХ МАШИН НА ОСНОВЕ МИКРОПРОЦЕССОРНОЙ СИСТЕМЫ УПРАВЛЕНИЯ ЭЛЕКТРОПРИВОДОМ Специальность 05.13.06 – Автоматизация и управление технологическими процессами и производствами (промышленность) ДИССЕРТАЦИЯ на соискание ученой степени...»

«Рубцов Владимир Спартакович Раннее выявление и эндоскопическое удаление колоректальных полипов в амбулаторно-поликлинических условиях 14.01.17 – хирургия диссертация на соискание ученой степени кандидата медицинских наук Научный руководитель : доктор медицинских наук, профессор Чалык Ю.В. Саратов – 2014 ОГЛАВЛЕНИЕ ВВЕДЕНИЕ.. ГЛАВА 1. ОБЗОР...»






 
2014 www.av.disus.ru - «Бесплатная электронная библиотека - Авторефераты, Диссертации, Монографии, Программы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.