«28 июня 2011 года г. Москва СБОРНИК МАТЕРИАЛОВ КОНФЕРЕНЦИИ Рязань 2011 Бизнес-аналитика. Использование аналитической платформы Deductor в учебном процессе вуза: сборник материалов II Межвуз. науч.-практ. конф. – Рязань: ...»
II МЕЖВУЗОВСКАЯ НАУЧНО-ПРАКТИЧЕСКАЯ
КОНФЕРЕНЦИЯ
«БИЗНЕС-АНАЛИТИКА. ИСПОЛЬЗОВАНИЕ
АНАЛИТИЧЕСКОЙ ПЛАТФОРМЫ DEDUCTOR
В УЧЕБНОМ ПРОЦЕССЕ ВУЗА»
28 июня 2011 года
г. Москва
СБОРНИК МАТЕРИАЛОВ КОНФЕРЕНЦИИ
Рязань 2011
Бизнес-аналитика. Использование аналитической платформы Deductor в учебном процессе вуза: сборник материалов II Межвуз. науч.-практ. конф. – Рязань: ООО «Лаборатория баз данных», 2011. – 120 с.
В сборник материалов II Межвузовской научно-практической конференции «Бизнес-аналитика. Использование аналитической платформы Deductor в учебном процессе вуза», проводимой BaseGroup Labs совместно с РГАУ-МСХА имени К.А.
Тимирязева, включены работы преподавателей, активно использующих аналитическую платформу Deductor, из ряда вузов и организаций городов Москва, Ахтубинск, Нижний Новгород, Барнаул, Тула, Волжский, Омск, Чебоксары, Ровно, Омск, Уфа, Харьков.
Включенные в сборник статьи разделены на две секции: 1) опыт преподавания дисциплин с использованием аналитической платформы Deductor; 2) актуальные задачи бизнес-аналитики и их решение методами Data Mining.
Организационно-программный комитет конференции Арустамов А.И., директор BaseGroup Labs;
Ахметов Р.Г., д.э.н., профессор, декан экономического факультета РГАУ-МСХА им. К.А. Тимирязева;
Паклин Н.Б., к.т.н., руководитель образовательных проектов BaseGroup Labs;
Гатаулин А.М., д.э.н., чл. – корр. РАСХН, РГАУ-МСХА им. К.А. Тимирязева;
Филатов А.И., к.э.н., профессор, зав. кафедрой экономической кибернетики РГАУ-МСХА им. К.А. Тимирязева;
Карпузова В.И., к.э.н., доцент, РГАУ-МСХА им. К.А. Тимирязева;
Скрипченко Э.Н., к.э.н., профессор, РГАУ-МСХА им. К.А. Тимирязева;
Чернышева К.В., к.э.н., доцент, РГАУ-МСХА им. К.А. Тимирязева.
Материалы публикуются а авторской редакции Ответственный редактор сборника материалов конференции:
кандидат технических наук
Н.Б. Паклин e-mail: [email protected] © ООО «Лаборатория баз данных»,
СОДЕРЖАНИЕ
Приветственное словоСЕКЦИЯ «ОПЫТ ПРЕПОДАВАНИЯ ДИСЦИПЛИН С ИСПОЛЬЗОВАНИЕМ АНАЛИТИЧЕСКОЙ ПЛАТФОРМЫ DEDUCTOR»
Карпузова В.И., Скрипченко Э.Н., Чернышева К.В. Компетентностный подход в обучении магистров по направлению «Менеджмент»профиля «Информационное обеспечение управления АПК» с использованием аналитической платформы Deductor Настащук Н.А. Обучение бакалавров направления подготовки 080100 «Экономика» основам оперативного анализа данных Титов А.П. Проблемы применения аналитических программных комплексов в учебном процессе высшего учебного заведения Красникова С.А. Использование аналитической платформы Deductor на практических занятиях по дисциплине «Методы аналитической обработки данных» Казаков Ю.М., Тищенко А.А., Казаков С.Ю. Опыт использования аналитической платформы Deductor на кафедре «Компьютерные технологии и системы» Мальцева А.В. О перспективах использования современных информационных технологий в практике исследований и обучения в социально-культурной сфере (на примере аналитической платформы Deductor) Шамсутдинова Т.М. Об опыте использования платформы Deductor в учебном процессе Башгосагроуниверситета
СЕКЦИЯ «АКТУАЛЬНЫЕ ЗАДАЧИ БИЗНЕС-АНАЛИТИКИ И ИХ
РЕШЕНИЕ АЛГОРИТМАМИ DATA MINING»
Абруков В.С., Троешестова Д.А. Создание баз знаний в задачах прикладной физики Болотова Л.С., Боев Б.В., Иваненко И.Ю. Гибридные системы поддержки принятия решений на основе методов интеллектуального анализа данных Галаев С.А., Потюпкин А.Ю. О некоторых технических приложениях методов Data Mining в области применения и эксплуатации ракетно-космической техники Махныткина О.В. Решение задач оценки компетентности студента с использованием интеллектуального анализа данных Машинцов Е.А., Найденов А.А. Использование Deductor для оценки продолжительности жизни в отдельном регионе Мороз О.А. Применение методов интеллектуального анализа данных в мониторинге и оценке инновационной активности организаций промышленности Бондарь И.А., Назарова С.А. Информационная модель хранилища данных кафедры вуза Прокопенко Н.Ю., Родионова C.В., Чубченко М.Н. Информационно-аналитическая система мониторинга состояния водных ресурсов Нижегородского региона Рыбанов А.А., Зайчук О.А. Использование АП Deductor для анализа результатов и планирования профориентационной работы вуза Хомич С.В. Некоторые подходы к прогнозированию спроса на продукцию предприятие с использование АП Deductor Татаринов В.В., Скударев М.А. Прогнозирование российской статистики пожаров на 2011 годПРИВЕТСТВЕННОЕ СЛОВО
28 июня 2011 года на базе кафедры экономической кибернетики Российского государственного аграрного университета – МСХА им. К.А.Тимирязева (г. Москва) прошла II Межвузовская научно-практическая конференция «Бизнес-аналитика. Использование аналитической платформы Deductor в учебном процессе вуза».
Это ежегодное мероприятие делается как для существующих преподавателей вузов-партнеров BaseGroup Labs, использующих аналитическую платформу Deductor в учебном процессе, так и для новых представителей высших учебных заведений, желающих ознакомиться с образовательной инициативой BaseGroup Labs. К конференции проявляют интерес руководители структурных подразделений вузов, заведующие кафедрами, деканы, преподаватели, желающие применять современные информационно-аналитические системы при обучении студентов – будущих прикладных информатиков, специалистов по информационным системам, экономистов, финансистов, математиков. Впервые очный съезд был успешно проведен в июне 2009 года в формате семинара, в 2010 году прошла вторая встреча на базе института информационных и инновационных технологий НОУ «Международная академия бизнеса и управления».
В 2011 году в работе конференции приняли участие 47 участников из 27 вузов России, Украины и Белоруссии, в том числе 18 вузовпартнеров BaseGroup Labs. 28 человек приехали для очного участия в конференции, наибольшее число было из Москвы, но также присутствовали преподаватели из Санкт-Петербурга, Екатеринбурга, Твери и Нижнего Новгорода.
По тематике присланных докладов и обсуждаемым вопросам можно выделить следующие направления работы конференции.
1. Опыт преподавания дисциплин с использованием аналитической платформы Deductor.
2. Прикладные и исследовательские работы преподавателей и студентов, выполненные на аналитической платформе Deductor.
3. Актуальные задачи бизнес-аналитики и их решение алгоритмами Data Mining.
4. Формирование программ учебных дисциплин, связанных с анализом данных.
Работа конференции началась с приветственного слова организационно-программного комитета: д.э.н., профессор, декан экономического факультета РГАУ-МСХА Ахметов Р.Г., д.э.н., чл.-корр. РАСХН, РГАУМСХА им. К.А. Тимирязева Гатаулин А.М., к.э.н., профессор, зав. кафедрой экономической кибернетики РГАУ-МСХА им. К.А. Тимирязева Филатов А.И.
Доклад к.э.н., доцента кафедры экономической кибернетики РГАУМСХА Карпузовой Веры Ивановны был первым. Она рассказала об особенностях преподавания дисциплин, связанных с анализом данных и Data Mining в частности. На кафедре экономической кибернетики применяется идея сквозного обучения студентов: знания подаются последовательно, от простого к сложному. Сначала учащихся знакомят с основами проектирования и работы с OLTP-системами и информационными системами управления предприятием. И только затем студентов знакомят с принципами работы систем поддержки принятия решений, в частности, с аналитической платформой Deductor.
С докладом выступил руководитель образовательных проектов компании BaseGroup Labs, кандидат технических наук Николай Паклин.
Он рассказал о проблемах учебных программ таких направлений как прикладная информатика и математические методы в экономике. Во многих вузах сильно сокращены часы по предметам, связанным с анализом данных, в связи с переходом на бакалавриат. В докладе также прошедшие за последний год, а именно:
вышла в свет 2-е издание книги «Бизнес-аналитика», выпущен сборник трудов материалов конференции, проведен конкурс дипломных работ, выбран лучший вуз-партнер 2010 года, алгоритмам». Выдвинута инициатива Следующий доклад сделал к.т.н., доцент Андреев В.К. из Академии Народного Хозяйства и Государственной Службы (г. Москва). Он также использует в учебном процессе магистрантов аналитическую платформу Deductor, для чего была продемонстрирована программа соответствующей дисциплины. Для успешной сдачи экзамена студентам необходимо в полной мере освоить как теоретические, так и практические материалы, подготовить реферат на одну из тем, в той или иной мере затрагивающей анализ данных, а также выполнить зачетную задачу.
Первая часть конференции завершилась докладом профессора Академии экономической безопасности МВД РФ (г. Москва) Горбенко А.О. Аналитическая платформа Deductor в этом вузе используется для обучения студентов-курсантов, будущих профессионалов по борьбе с экономическими преступлениями.
Вторая часть конференции была открыта докладом профессора МГТУ МИРЭА, д.т.н. Болотовой Л.С. Она затронула вопрос создания гибридной системы поддержки принятия решения, для которой была использована аналитическая платформа Deductor. В частности, профессор Болотова Людмила Сергеевна показала структуру хранилища данных, карты Кохонена с выделенными кластерами городов мира по степени эпидемиологической опасности. Как и в прошлом году, в конце информационного сообщения были озвучены пожелания разработчикам аналитической платформы.
Завершающим докладчиком стал Белов В.С., к.т.н., профессор Института компьютерных технологий Московского государственного университета экономики, статистики и информатики (МЭСИ).
После докладов был проведен круглый стол, на котором преподаватели обменялись мнениями о проблемах преподавания дисциплин по бизнес-аналитике, доступности отечественного программного обеспечения, формой и содержанием проведения олимпиад по бизнес-аналитике, вопросами стыковки бакалаврских и магистерских программ по информационно-аналитическим системам.
Перед закрытием конференции самые активные преподаватели вузов-партнеров уходящего учебного года были награждены грамотами BaseGroup Labs: Карпузова В.И., Скрипченко Э.Н., Чернышева К.В., Прокопенко Н.Ю., Болотова Л.С., Александрова В.А.
Компания BaseGroup Labs выражает благодарность руководству экономического факультета Российского государственного аграрного университета – МСХА им. К.А. Тимирязева (г. Москва) и лично доценту, к.э.н. Карпузовой Вере Ивановне, профессору Скрипченко Эльвире Николаевне за помощь в организации и проведении конференции.
СЕКЦИЯ
«ОПЫТ ПРЕПОДАВАНИЯ ДИСЦИПЛИН
С ИСПОЛЬЗОВАНИЕМ
АНАЛИТИЧЕСКОЙ ПЛАТФОРМЫ DEDUCTOR»
КОМПЕТЕНТНОСТНЫЙ ПОДХОД В ОБУЧЕНИИ МАГИСТРОВ
ПО НАПРАВЛЕНИЮ «МЕНЕДЖМЕНТ» ПРОФИЛЯ
«ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ УПРАВЛЕНИЯ АПК» С
ИСПОЛЬЗОВАНИЕМ АНАЛИТИЧЕСКОЙ ПЛАТФОРМЫ
DEDUCTOR
Карпузова В.И., доцент, Скрипченко Э.Н., профессор, Российский государственный аграрный университет Компетентностный подход является отличительной чертой Федерального государственного образовательного стандарта высшего профессионального образования (ФГОС ВПО) третьего поколения.Компетентность – это совокупность компетенций, то есть наличие знаний и опыта, необходимых для эффективной деятельности в определенной предметной области.
Под компетенцией понимается способность применять знания, умения, успешно действовать на основе практического опыта при решении поставленных задач.
Согласно ФГОС ВПО третьего поколения на кафедре экономической кибернетики экономического факультета РГАУ-МСХА имени К.А.
Тимирязева открыта магистратура по направлению «Менеджмент» профиля «Информационное обеспечение управления АПК».
Основной образовательной программой подготовки магистров данного профиля предусматривается ориентация выпускников на экспертно-аналитическую, организационно-управленческую, научноисследовательскую, педагогическую и методическую профессиональную деятельность.
Виды профессиональной деятельности магистра обеспечиваются соответствующими компетенциями, взаимосвязи между которыми приведены в таблице 1.
Компетенции формируются при изучении дисциплин учебного плана подготовки магистра. Учебный план включает общенаучный и профессиональный циклы, которые представлены базовой и вариативной частями.
Дисциплины базовой части носят общепрофессиональный характер. Дисциплины вариативной части определяют профиль подготовки магистра.
Вариативная часть учебного плана подготовки магистров профиля «Информационное обеспечение управления АПК» в университете включает следующие дисциплины: «Основы информационного обеспечения управления отраслями АПК»; «Информационные системы в управлении»; «Интеллектуальные системы и технологии»; а также курсы по выбору: «Стандартизация и безопасность информационных систем», «Интернет-технологии в бизнесе», «Базы и хранилища данных информационных систем»; «Прикладной системный анализ», «Математические методы в информационных системах», «Математические методы стратегического планирования».
Компетенции магистра по направлению «Менеджмент»
Способен управлять организациями, подразделениями, группами (командами) сотрудников, проектаПК-1 ми и сетями Организационно- Умеет использовать современные методы управлеуправленческая ния корпоративными финансами для решения страПК-3 тегических задач Способен разрабатывать программы организационного развития и изменений и обеспечивать их реалиПК-4 зацию Способен использовать количественные и качественные методы для проведения научных исследоваПК-5 ний и управления бизнес-процессами Владеет методами экономического анализа поведения экономических агентов и рынков в глобальной Аналитическая деяПК-6 среде тельность Способен обобщать и критически оценивать результаты, полученные отечественными и зарубежными Способен обосновывать актуальность, теоретическую и практическую значимость избранной темы НаучноПК-10 научного исследования исследовательская методическая дея- Способен разрабатывать учебные программы и метельность тодическое обеспечение для преподавания управПК-14 ленческих дисциплин Все дисциплины вариативной части подготовки магистров, как следует из таблицы 2, взаимосвязаны с профессиональными компетенциями.
Для формирования профессиональных компетенций аналитической деятельности в качестве программного обеспечения указанных дисциплин в университете используются системы поддержки принятия управленческих решений, в том числе и Deductor компании BaseGroup Labs.
Матрица взаимосвязи модульных дисциплин и практик ООП «Информационное обеспечение управления отраслями АПК» с компетенциями магистра по управления АПК Информационные системы в управлении Интеллектуальные системы и технологии Прикладной системный анализ системах планирования Стандартизация и безопасность информационных систем Интернет-технологии в бизнесе Базы и хранилища ных систем Аналитическая платформа Deductor применяется в университете с 2006 года, а Deductor Studio Professional (профессиональная версия платформы, рабочее место аналитика) – с 2010 года.
Для проведения лабораторных занятий разработаны учебные пособия с реализацией интерактивного способа обучения («сквозная задача») средствами Deductor Studio. Изложенные в пособиях задания обеспечивают выполнение разнообразных функций, включающих сбор данных из различных источников, преобразование и загрузку их в хранилище, хранение информации, получение отчетности, создание произвольных запросов, многомерный анализ и др.
Разбираются разные способы наполнения хранилища данных: путем импорта данных из приложений MS Access и MS Excel, а также выгрузки в Deductor Studio Pro условно-постоянной и переменной информации непосредственно из справочников, документов и регистров накопления семантического слоя программного комплекса 1С: Предприятие 8.Х.
При использовании Deductor Studio Academic рассматривается способ наполнения хранилища путем импорта данных приложений MS Access и MS Excel, сохраненных в текстовом формате.
Приводится технология работы по визуализации данных с помощью диаграмм, гистограмм, OLAP-кубов, деревьев решений, таблицы сопряженности, самоорганизующейся карты Кохонена и др.
Таким образом, реализуется профессиональная компетенция ПК- «Способен использовать количественные и качественные методы для проведения научных исследований и управления бизнес-процессами».
Задания по кластеризации экономических объектов разными методами способствуют формированию компетенции ПК-6 «Владеет методами экономического анализа поведения экономических агентов и рынков в глобальной среде».
Компетенция ПК-7 «Владеет методами стратегического анализа»
обеспечивается выполнением заданий по прогнозированию временных рядов, построению деревьев решений и др.
Согласно учебному пособию выполнение заданий оформляется в виде отчетов.
Итак, выполнение всех заданий учебного пособия направлено также на формирование компетенции ПК-8 «Способен готовить аналитические материалы для управления бизнес-процессами и оценки их эффективности».
Следует подчеркнуть, что данные проведенного магистрантами анализа с использованием аналитической платформы Deductor становятся знаниями для принятия обоснованного управленческого решения.
В перспективе планируется применение аналитической платформы Deductor в комплексе с системами управления предприятиями и электронного документооборота в учебном процессе и научных исследованиях.
Использование аналитической платформы возможно и при реализации других магистерских программ.
Таким образом, использование в учебном процессе новых информационных и телекоммуникационных технологий, включая аналитическую платформу Deductor, обеспечивает качественное преподавание дисциплин, повышает привлекательность их для магистрантов, и тем самым реализуется задача подготовки специалистов для современного информационного общества в соответствиии с государственным образовательным стандартом третьего поколения.
ОБУЧЕНИЕ БАКАЛАВРОВ НАПРАВЛЕНИЯ ПОДГОТОВКИ
080100 «ЭКОНОМИКА» ОСНОВАМ ОПЕРАТИВНОГОАНАЛИЗА ДАННЫХ
Омский государственный университет путей сообщения, г. Омск На сегодняшний день применение оперативного анализа данных в экономике и бизнесе обусловлено его эффективностью, быстротой и наглядностью. В этой связи, оперативный анализ данных является неотъемлемой составляющей аналитической деятельности специалиста обозначенной области и должен найти свое место при подготовке будущих экономистов в условиях современного информационного общества.Рассмотрим один из возможных путей обучения основам оперативного анализа будущих специалистов в области экономики и бизнеса.
Одним из видов профессиональной деятельности бакалавра направления подготовки 080100 «Экономика» является аналитическая деятельность, заключающаяся в осуществлении следующих операций по отношению к обработке и анализу экономической информации:
· поиск информации по полученному заданию, сбор и анализ данных, необходимых для проведения конкретных экономических расчетов;
· обработка массивов экономических данных в соответствии с поставленной задачей, анализ, оценка, интерпретация полученных результатов и обоснование выводов;
· подготовка информационных обзоров, аналитических отчетов.
Кроме того, в федеральном государственном стандарте высшего профессионального образования (ФГОС ВПО) 080100 «Экономика» отмечено [5], что выпускник должен обладать следующими профессиональными компетенциями в области аналитической деятельности:
· способностью осуществлять сбор, анализ и обработку данных, необходимых для решения поставленных экономических задач;
· способностью выбрать инструментальные средства для обработки экономических данных в соответствии с поставленной задачей, проанализировать результаты расчетов и обосновать полученные выводы;
· способностью на основе описания экономических процессов и явлений строить стандартные теоретические и эконометрические модели, анализировать и содержательно интерпретировать полученные результаты;
· способностью анализировать и интерпретировать финансовую, бухгалтерскую и иную информацию, содержащуюся в отчетности предприятий различных форм собственности, организаций, ведомств и использовать полученные сведения для принятия управленческих решений;
· способностью анализировать и интерпретировать данные отечественной и зарубежной статистики о социально-экономических процессах и явлениях, выявлять тенденции изменения социально-экономических показателей;
· способностью, используя отечественные и зарубежные источники информации, собрать необходимые данные проанализировать их и подготовить информационный обзор и/или аналитический отчет;
· способностью использовать для решения аналитических и исследовательских задач современные технические средства и информационные технологии.
На сегодняшний день одним из современных и эффективных информационных средств реализации аналитической деятельности в области экономики и бизнеса является технология OLAP (Online Analytical Processing, оперативный анализ данных), основное назначение которой заключается в проведении оперативной аналитической обработки информации с целью поддержки принятия управленческих решений. Технология OLAP предоставляет конечному бизнес-пользователю средства для формирования и проверки гипотез о свойствах экономических данных или отношениях между ними на основе разнообразных запросов к базе данных [1, 2].
Обучение основам оперативного анализа данных предлагается в рамках дисциплины «Информационные системы и базы данных», которая входит в вариативную часть математического цикла (Б.2) дисциплин основной образовательной программы подготовки бакалавров данного направления. В рамках этого направления подготовки выделяют следующие профили: «Бухгалтерский учёт, анализ и аудит», «Мировая экономика» и «Финансы и кредит». Обучение этому виду анализа средствами OLAP-технологии является весьма актуальным и необходимым для студентов указанных профилей, поскольку большинство современных автоматизированных экономических, в частности бухгалтерских, информационных систем в составе своего функционала имеют возможность построения аналитического отчета с помощью средств OLAPтехнологии. Также здесь следует дополнить, что эти системы относят к классу ERP-систем (Enterprise Resource Planning System, система планирования ресурсов предприятия) и получили название Business Intelligence средств [3, 4].
Именно, наличие аналитических компонент в составе функциональных подсистем Business Intelligence средств обеспечивают формирование аналитической отчетности в режиме реального времени, которая в дальнейшем является основой большинства управленческих решений.
Приведем некоторые из них: Microsoft Dynamics AX (в прошлом — Axapta), Microsoft Dynamics NAV (в прошлом — Navision), Парус, БЭСТ и др. Существенным недостатком перечисленных систем является их высокая стоимость и, как следствие этого, невозможность вузов приобрести даже учебную версию подобных программных средств в условиях внедрения концепции перевода учебного процесса вуза на свободное программное обеспечение.
Однако необходимо помнить, что вуз не может обеспечить выпускника знаниями и умениями работать в тех Business Intelligence средств, которые востребованы именно на сегодняшний момент времени, что обусловлено постоянным совершенствованием подобных средств и появлением новых их видов и версий. В этом случае необходимо обеспечить студента такой суммой знаний, умений и навыков, которая позволит ему в дальнейшем, будучи уже на рабочем месте, применять оперативный анализ данных средствами любого средства Business Intelligence.
Одним из вариантов программных средств Business Intelligence является аналитическая платформа Deductor Academic компании BaseGroup Labs – технологическая платформа для создания законченных аналитических решений и предназначена только для образовательных целей.
Аналитическая платформа Deductor Academic позволяет осуществить обучение бакалавров направления подготовки 080100 «Экономика» основам оперативного анализа данных, так как реализует суть OLAPтехнологии в полном объеме, предоставляя конечному пользователю следующие для этого функциональные возможности:
1. построение хранилища данных;
2. построение гиперкуба1 (т.е. специально структурированные данные, иначе называемые OLAP-кубами) на основе его структурных элементов – меры и измерения;
3. агрегирование анализируемых данных посредством соответствующих функций;
4. построение единообразной структуры аналитического отчета;
5. единообразная визуализация полученных данных сформированного аналитического отчета.
При этом, хотелось бы отметить следующий методический прием:
Гиперкубы предназначены для построения аналитических отчетов, которые могут иметь произвольное сочетание измерение и мер прежде чем изучать оперативный анализ средствами аналитической платформы Deductor Academic, студентам рекомендуется освоить основы оперативного анализа экономической информации посредством таких информационных технологий обработки числовой информации как «Сводная таблица», «Консолидация» и «Итоги» в рамках общедоступной электронной таблицы MS Excel.
Рассмотрим небольшой практический пример изучения основ оперативного анализа в рамках аналитической платформы Deductor. Для этого предлагается на занятиях использовать базу данных «Борей» (которая входит в состав интегрированного офисного пакета MS Office), содержащую историю продаж за некоторый период и имеющий следующий состав таблиц:
· Поставщики – содержит информацию о поставщиках.
· Клиенты – содержит информацию о клиентах.
· Сотрудники – содержит информацию о сотрудниках фирмы · Товары - содержит информацию о товарах.
· Типы – содержит информацию о товарной группе товара.
· Заказано – содержит информацию о заказе.
· Заказы – содержит историю заказов товаров.
· Доставка – содержит информацию о доставке.
Задание: сформируйте OLAP-куб (т.е. аналитический отчет) согласно варианту задания и ответьте на вопросы, представленные ниже.
Вопросы распределены по вариантам в таблице 1.
1. Какая товарная группа имеет максимальное количество продаж?
2. Какой товар имеет максимальную сумму продаж?
3. Пять самых продаваемых товаров по выходным (суббота, воскресенье).
4. Семь самых продаваемых товаров.
5. Два самых популярных товаров в каждой товарной группе.
6. Товары, дающие 50% объёма продаж.
7. Товары, дающие 50% прибыли продаж.
8. Постоянные покупатели в каждой товарной группе.
В заключении следует отметить, что обучение бакалавров направления подготовки 080100 «Экономика» основам оперативного анализа данных средствами аналитической платформы Deductor Academic позволяет обеспечить выпускника необходимой суммой знаний, умений и навыков применения OLAP-технологии и в других системах Business Intelligence.
Распределение вопросов по вариантам Литература 1. Андрейчиков А. В. Интеллектуальные информационные системы / А. В. Андрейчиков, О. Н. Андрейчикова. – М.: Финансы и статистика, 2004. – 424 с.
2. Информационные системы и технологии в экономике и управлении: учеб. для студентов вузов / С.-Петерб. гос. ун-т экономики и финансов; под ред. В. В. Трофимова. – М.: Высшее образование, 2009. – 480 с.
3. Настащук Н. А. Некоторые аспекты использования Business Intelligence средств в профессиональной подготовке студентов специальности «Прикладная информатика в экономике» / Н. А. Настащук // Экономика, статистика и информатика. Вестник УМО. – 2008. – № 2. – C. 69-70.
4. Настащук Н. А. Системный подход к использованию Business Intelligence средств в экономических исследованиях / Н. А. Настащук // Информационная среда вуза: материалы XIV Междунар. науч.-техн. конф. – Иваново, 2007. – С. 302-305.
5. Федеральный государственный образовательный стандарт высшего профессионального образования по направлению подготовки 080100 «Экономика» [Электронный ресурс]. Режим доступа: http://umd.udsu.ru/FGOS_VPO/FGOS_fail/080100.htm.
ПРОБЛЕМЫ ПРИМЕНЕНИЯ АНАЛИТИЧЕСКИХ
ПРОГРАММНЫХ КОМПЛЕКСОВ В УЧЕБНОМ ПРОЦЕССЕ
ВЫСШЕГО УЧЕБНОГО ЗАВЕДЕНИЯ
Титов А.П., заведующий кафедрой информационных технологий, Московский финансово-юридический университет – МФЮА, г. Москва Аналитические программные средства находят все большее применение в организационно-экономической сфере. Опыт практического применения аналитических программных комплексов показывает, что для крупных организаций их применение при решении проблем обеспечения принятия оптимальных решений становится жизненно необходимым. Для предприятий среднего и мелкого бизнеса это зависит от уровня образования их руководителей и менеджеров.Основные направления в обучении задаются Государственным образовательным стандартом высшего профессионального образования (ГОС ВПО).
В соответствии с ГОС ВПО, при подготовке магистров по направлениям прикладной информатики, информационной бизнес-аналитики, информационного менеджмента должны изучаться информационные технологии анализа бизнес-процессов, интеллектуальные информационные системы и технологии, компьютерные методы статистического анализа и прогнозирования, многокритериальные системы поддержки принятия решений, основы создания и развития информационно-логических, информационно-семантических и информационно-аналитических систем.
Из всех направлений подготовки экономистов, в соответствии с ГОС ВПО, имеется только одна магистерская программа – 521602 «Математические методы анализа экономики», которая предназначена для подготовки высококвалифицированных сотрудников аналитических служб фирм, банков и страховых компаний, экспертных отделов органов государственного управления, научных институтов и высших учебных заведений.
По остальным направлениям подготовки магистров в ГОС ВПО декларируется необходимость изучения аналитики экономических процессов, однако в составе дисциплин нет разделов (дидактических единиц), определяющих необходимость изучения информационных технологий анализа бизнес-процессов с применением соответствующих аналитических программных комплексов.
В Московской финансово-юридической академии аналитические программные комплексы, в том числе и Deductor, применяются для анализа бизнес-процессов при изучении дисциплин «Информационных системы» и «Информационные технологии» (в различных сферах деятельности), «Компьютерное моделирование в экономике», «Интеллектуальные информационные системы», «Бизнес-аналитика», «Автоматизация экономических расчетов», «Имитационное моделирование процессов», «Макроэкономическая статистика», «Математические методы в экономике», «Математическое моделирование в менеджменте», «Финансовая математика» и другие.
Однако во многих из них изучение методики применения программных комплексов бизнес-аналитики осуществляется в рамках разделов (дидактических единиц), задаваемых ГОС ВПО и поэтому имеет по ряду дисциплин в большей степени ознакомительный характер. Этого явно недостаточно для формирования у студентов навыков в решении задач бизнес-анализа на всех уровнях управления в организационноэкономической сфере.
Отсюда следует, что необходимы новые ГОС ВПО, имеющие отдельные дисциплины или дисциплины с разделами (дидактическими единицами), явно определяющие изучение основ бизнес-анализа построения информационно-логических и математических моделей деятельности предприятий (организаций) и отдельных бизнес-процессов с применением современных аналитических интеллектуальных программных комплексов для студентов всех специальностей.
Анализ ГОС ВПО различных направлений подготовки магистров и бакалавров показывает, что наилучшим образом указанным задачам подготовки магистров, бакалавров и специалистов отвечает дисциплина СД.Ф.03 «Бизнес-аналитика» ГОС ВПО по специальности 080508 – «Информационный менеджмент», квалификация – менеджер, которую целесообразно дополнить некоторыми разделами из дисциплины СД.Ф.02 «Базы данных и базы знаний».
В подобного рода дисциплине четко должны быть определены разделы (дидактические единицы), регламентирующие изучение систем поддержки управленческих решений (DSS/BI) и бизнес-аналитики (BA), их функции (идентификацию, моделирование, прогнозирование, оптимизацию решений, анализ чувствительности и др.), методы и технологии бизнес-аналитики (OLAP -, DM-технологии и др.), системы визуализации данных и решений, генераторы отчетов, методики обнаружения нового знания в хранилищах данных (KDD), модели поиска нового знания, регрессии, прогнозирования временных рядов, кластеризации, ассоциации, последовательности, систем управления моделями (MMS) и знаниями (KMS), аналитических приложений в корпоративных информационных системах, развитие систем бизнес-аналитики, платформы бизнесинтеллекта (Business Intelligence, BI), оценку эффективности систем бизнес-аналитики, управление эффективностью бизнеса (BPM) (компоненты, стандарты), методология проектирования баз данных и знаний, математических моделей, системы и технологии искусственного интеллекта, инструментальные средства и технологии их построения, информационные технологии поддержки принятия решений и управления – в целом, с применением аналитических интеллектуальных программных комплексов, математических моделей и систем искусственного интеллекта.
Включение в состав ГОС ВПО подготовки специалистов, бакалавров и магистров всех сфер деятельности дисциплины, реализующей в комплексе весь спектр информационных технологий поддержки принятия решений, с выделением на её изучение в течение учебного года не менее 148 часов (за счет ликвидации множества дублирующих дисциплин) и современной технической базы, позволит решить проблему обеспечения принятия оптимальных решений в организационноэкономической сфере.
С данной точки зрения аналитические программные комплексы должны совершенствоваться в направлении увеличения количества параметров многомерного анализа и уровня адекватности математического аппарата реальным, многосторонним бизнес-процессам для повышения точности и долгосрочности прогнозирования развития процессов и ситуаций, и их оптимизации в интересах предприятий и организаций.
Аналитические программные комплексы не должны развиваться самостоятельно, а создаваться с расчетом на слияние с другими интеллектуальными средствами, имитационными математическими моделями, многокритериальными системами поддержки принятия решений, системами искусственного интеллекта и др.
Только в этом случае возможно образование интегрированных комплексов поддержки принятия оптимальных решений, причем как в интересах достижения стратегических целей, так и в интересах своевременного, достаточно быстрого и адекватного реагирования на изменения внешних условий в процессе управления деятельностью предприятий и организаций.
ИСПОЛЬЗОВАНИЕ АНАЛИТИЧЕСКОЙ ПЛАТФОРМЫ
DEDUCTOR НА ПРАКТИЧЕСКИХ ЗАНЯТИЯХ ПО ДИСЦИПЛИНЕ
«МЕТОДЫ АНАЛИТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ»
Красникова С.А., старший преподаватель, Национальный исследовательский ядерный университет «МИФИ», В современных условиях процесс формирования компетенций будущих инженеров по специальности «Автоматизированные системы обработки информации и управления» невозможно себе представить без изучения студентами возможностей современных программных продуктов. Наряду с теоретическими знаниями у выпускников должны формироваться навыки использования, как специализированных систем обработки данных, так и универсальных платформ, применимых для анализа данных различного происхождения.В программу подготовки по специальности «Автоматизированные системы обработки информации и управления» входит изучение дисциплины «Методы аналитической обработки данных». Цель данного курса – дать студентам целостное представление о современных методах, технологиях и инструментальных средствах аналитической обработки данных.
В курсе рассматриваются вопросы обработки данных, представленные тремя направлениями: построение запросов и отчетов на детализированных данных, формирование и анализ агрегированных данных, поиск закономерностей в «сырых» данных.
Первый раздел, рассматриваемый в рамках курса, знакомит студентов с основными понятиями изучаемой области знаний, обозначается роль и место методов и технологий аналитической обработки данных в информационном обеспечении различных предметных областей.
Второй раздел посвящен изучению сферы детализированных данных и инструментальных средств создания запросов и генерации отчетов Querying&Reporting. В рамках данного раздела рассматриваются такие вопросы как: поиск информации, реляционные СУБД и язык манипулирования реляционными данными, информационно-поисковые системы, средства доступа к данным и генераторы отчетов, встроенные средства обработки данных генераторов отчетов, словари данных.
В третьем разделе рассматривается сфера агрегированных данных и OLAP-системы. Студенты получают представление о концептуальном многомерном представлении информации, изучают архитектуру OLAPсистем, знакомятся со специальными многомерными СУБД, расширяют свои знания по реляционные технологии и их применимости в многомерном анализе. В результате изучения раздела у студентов формируется комплексный взгляд на собранную в хранилище данных информацию и возможность ее обработки и анализа с использованием инструментальных средств аналитических платформ.
Четвертый раздел ориентирован на изучение сферы поиска закономерностей в данных и модели и методы Data Mining. Изучение данного раздела связано с такими вопросами как: методы интеллектуального анализа данных, поиск функциональных и логических закономерностей в накопленной информации, построение моделей и правил, прогнозирование, стандарты Data Mining, тенденции в области построения систем аналитической обработки данных.
Теория каждого раздела дисциплины подкреплена практическими занятиями в виде лабораторных работ, выполняя которые студенты изучают реализацию определенных методов обработки данных в инструментальных средах. Так, для закрепления теоретического материала третьего и четвертого разделов курса (OLAP и Data Mining) на лабораторных работах применяется отечественная аналитическая платформа Deductor компании BaseGroup Labs.
Выбор данного инструментального средства для поддержки практических занятий курса был обусловлен следующими факторами:
· функциональность платформы Deductor полностью удовлетворяет поставленным задачам курса: на базе данного инструмента могут быть изучены как концепции представления данных в OLAP-системах, так реализация математических методов, способных выявить в исследуемых данных закономерности различных видов (ассоциации, классификации, кластеризации);
· интуитивно понятный интерфейс и русскоязычная справка по системе обеспечивает быстрый старт при использовании платформы Deductor на лабораторных работах;
· наличие готовых тестовых данных и демонстрационных примеров способствует быстрому освоению основных приемов работы в среде Deductor;
· наглядность представления результатов анализа с использованием различных способов визуализации помогает студентам интерпретировать полученные закономерности даже для малознакомых предметных областей;
· наличием бесплатной образовательной версии системы для использования в учебных целях – Deductor Academic.
Все вышеперечисленные факторы делают инструмент весьма привлекательным для его применения в учебном процессе.
Лабораторный практикум включает несколько блоков лабораторных работ, каждый из которых связан с изучением определенного аспекта анализа данных:
1. Исследование агрегированных данных;
2. Ассоциативные правила;
3. Классификация данных;
4. Кластеризация данных.
В свою очередь каждый блок включает изучение определенных математических методов и их реализацию в аналитической платформе Deductor. В первом блоке, «Исследование агрегированных данных», изучаются базовые приемы работы с инструментом «Импорт данных», а также универсальные методы обработки: очистка и трансформация данных, способы визуализации данных.
Практическое задание каждой лабораторной работы состоит из двух разделов. Первый раздел предполагает выполнение студентом пошагового сценария работы с инструментом, а второй раздел содержит индивидуальное творческое задание.
Сценарий первого блока практических заданий при выполнении лабораторной работы блока «Исследование агрегированных данных» выглядит следующим образом.
Студентам предлагается подготовить данные для анализа и исследовать их:
· для данных из файла/файлов (например, Credit.txt) настроить кубов для OLAP-анализа данных в соответствии с представленными ниже описаниями;
· для визуализации результатов анализа использовать табличное (куб) и графическое представления (кросс-диаграмма).
Приведем описание нескольких отчетов.
1. Отчет для анализа зависимости между суммой кредита, целью кредита, полом клиента и его уровнем образования. Измерения: цель кредита, пол клиента, уровень образования. Факт: сумма кредита.
2. Отчет, отображающий зависимость между размером кредита (преобразовать непрерывные данные в дискретные), гражданским состоянием, наличием квартиры, загородного дома, земельного участка и решением о выдаче кредита. Измерения: размер кредита, гражданское состояние, наличие квартиры, загородного дома, земельного участка.
Факт: решение о выдаче кредита.
При формировании данных отчетов студент осваивает сценарии работы в среде Deductor и его основные возможности.
Далее студент получает индивидуальное творческое задание, выполняя которое он закрепляет полученные знания и практические навыки. Студенту предлагается для данных из файла (файл и его описание выдается преподавателем) описать и настроить 5 кубов для OLAPанализа. Описание должно включать: название куба; краткое описание назначения (что с его помощью будет проанализировано); перечень измерений; перечень мер (фактов); для визуализации результатов анализа используется табличное (куб) и графическое представления (кроссдиаграмма).
На защите лабораторной работы студент должен ответить на теоретические вопросы, а также проинтерпретировать полученные результаты, как по общей части работы, так и по индивидуальному заданию.
Таким образом, при выполнении лабораторного практикума на базе платформы Deductor студенты закрепляют теоретические знания по методам аналитической обработки данных и приобретают навыки применения современного программного продукта, поддерживающего данные методы.
ОПЫТ ИСПОЛЬЗОВАНИЯ АНАЛИТИЧЕСКОЙ
ПЛАТФОРМЫ DEDUCTOR НА КАФЕДРЕ
«КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ И СИСТЕМЫ»
Казаков Ю.М., доцент, Тищенко А.А., доцент, Брянский государственный технический университет, г. Брянск В настоящее время информатизация всех отраслей народного хозяйства и развитие информационных систем является одним из прогрессивных и перспективных направлений в науке и технике. В связи с этим непрерывно растет потребность в квалифицированных специалистах, способных успешно работать в области науки и техники, включающей в себя совокупность средств, способов и методов человеческой деятельности, направленных на создание и применение систем сбора, передачи, обработки, хранения и накопления информации.Кафедра «Компьютерные технологии и системы» основана в Брянском государственном техническом университете в 2003 году и ведет подготовку по 4 направлениям: «Информатика и вычислительная техника», профиль «Системы автоматизированного проектирования»; «Информационные системы и технологии»; «Информационная безопасность автоматизированных систем»; «Информационная безопасность», профиль «Организация и технология защиты информации». Также имеется и магистерская подготовка по данным направлениям.
При подготовке специалистов большое место занимает получение ими знаний по сбору и анализу различных данных, использованию математических методов и подходов к принятию решений в сфере своей профессиональной деятельности. Процессы информатизации, затронувшие различные отрасли деятельности, рост объема информации привели к тому, что для принятия адекватного, обоснованного анализа специалистам во всех областях, а особенно в области разработки, внедрения и защиты информационных технологий, требуется сбор и обработка большого количества информации.
Для решения данных задач достаточно эффективно применяются информационно-аналитические системы, которые позволяют хранить, обрабатывать и анализировать большие объемы данных, поддерживающие оба направления анализа данных: оперативный и интеллектуальный анализы данных.
Оперативный (OLAP) анализ позволяет извлекать из всего объема данных информацию необходимую конкретному лицу, по конкретному вопросу, за короткий промежуток работы информационноаналитической системы.
Интеллектуальный анализ данных (Data Mining) использует современный математический аппарат, например нейронные сети, генетические алгоритмы, нечеткая логика, и позволяет выявлять в наборе данных неочевидные закономерности.
В настоящее время большую актуальность при подготовке специалистов, особенно в области информатизации, приобретает, с одной стороны, теоретическое и практическое овладение современным математическим аппаратом, как оперативного, так и интеллектуального анализа данных, а с другой – умение работать с информационно-аналитическими системами или платформами, позволяющих автоматизировать данные анализы.
Для решения таких задач на кафедре «Компьютерные технологии и системы» используют следующие подходы к обучению.
1. Включение в учебный план подготовки студентов полноценных курсов лекций по сбору и анализу данных, а именно: Модели и методы интеллектуального анализа данных; Интеллектуальные информационные систем;, Нейросетевое информационное моделирование; Модели и методы анализа проектных решений; Методы принятия решений.
2. Внедрение в учебные дисциплины лабораторных и практических занятий, в ходе которых на основе сбора и анализа экспериментальных данных решаются конкретные задачи в определенной предметной области: Управление данными; Промышленная логистика; Организация и управление службой защиты информации; Средства и системы технического обеспечения обработки, хранения и передачи информации; Банки и базы данных, Компьютерные технологии в инженерном деле; Управление в социальных и экономических системах 3. Знакомство с имеющимися на российском рынке информационно-аналитическими системами.
4. Проведение анализа данных с использованием аналитической платформы Deductor.
5. Самостоятельное использование системы Deductor при решении практических задач, встающих в ходе выполнения курсовых и дипломных работ. Например: Курсовая работа по теме «Создание искусственной нейронной сети (самоорганизующаяся карта Кохонена) для прогнозирования котировок акций Сбербанка и ВТБ» (выполнена магистрантом Ю.Ю. Малаховой).
6. Научно-исследовательская работа со студентами.
Для успешного обучения важно сочетать теоретические знания с практической реализацией знаний при решении конкретных задач. Анализ данных сегодня невозможно проводить без специализированных пакетов программ, реализующих хранение данных, их структуризацию, визуализацию, математический аппарат для выявления закономерностей, программного инструмента, реализующего соответствующий математический метод. На российском рынке имеется большое количество аналитических систем, которые в той или иной степени позволяют анализировать данные с использованием как традиционных статистических методов, так и современных математических инструментов интеллектуального анализа данных. Но как показал обзор имеющихся систем, часть из них дорогие или тяжелые для восприятия студентами, часть не имеют комплексного подхода к анализу данных, и использует только какой-то определенный математический аппарат, например, пакет Statistiсa использует только традиционный статистический анализ.
В итоге в качестве универсальной среды для анализа данных была выбрана отечественная разработка –Deductor. Deductor является аналитической платформой, т.е. основой для создания законченных прикладных решений. Реализованные в Deductor технологии позволяют на базе единой архитектуры пройти все этапы построения аналитической системы: от создания хранилища данных до автоматического подбора моделей и визуализации полученных результатов.
Deductor предоставляет аналитикам инструментальные средства, необходимые для решения самых разнообразных аналитических задач:
корпоративная отчетность, прогнозирование, сегментация, поиск закономерностей – эти и другие задачи, где применяются такие методики анализа, как OLAP и Data Mining. Deductor является идеальной платформой для создания систем поддержки принятий решений.
Реализованная в Deductor архитектура позволяет добиться максимальной гибкости при создании законченного решения. Благодаря данной архитектуре можно собрать в одном аналитическом приложении все необходимые инструменты анализа и реализовать автоматическое выполнение подготовленного сценария.
Технологическая платформа включает средства, позволяющие максимально сократить сроки разработки, быстро создавать и выводить на рынок новые прикладные решения и быстро адаптировать их в соответствии с изменяющимися требованиями учебного процесса.
Для создания законченного решения достаточно получить данные, определить сценарий обработки и задать место для экспорта полученных результатов. Наличие мощного набора механизмов обработки и визуализации позволяет двигаться по шагам, от наиболее простых способов анализа к более мощным.
Deductor объединяет все необходимые для анализа инструменты, представляет пользователям огромные возможности:
· мощная аналитическая платформа;
· современные самообучающиеся механизмы анализа;
· единое хранилище данных;
· единый пользовательский интерфейс для любых механизмов · пакетное выполнение сценариев обработки;
· удаленная аналитическая обработка;
· отделение работы аналитика от конечного пользователя.
Кроме рассмотренных выше возможностей плюсом аналитической платформы Deductor является наличие различных методических материалов, объясняющих как теоретические понятия и подходы к анализу данных, так и механизмы построения практических решений в аналитической платформе, а также бесплатно распространяемая учебная версия и возможность обучения преподавательского состава. Это позволяет студентам освоить в должной мере данный программный продукт.
Практика преподавания теоретических основ анализа данных и решения конкретных задач с помощью аналитической системы Deductor на кафедре «Компьютерные технологии и системы» выявило ряд проблем, которые следует учитывать при подготовке будущих специалистов по выпускаемым кафедрой направлениям.
Во-первых, следует уделять особое внимание базовым дисциплинам, таким как общий курс математики, теория вероятностей и математической статистики, так как они являются фундаментом для изучения интеллектуального анализа данных. Пробелы в данных курсах могут стать отталкивающим факторам при начале обучения и практическом применении аналитической платформы Deductor.
Во-вторых, аналитическая платформа не решает задачи аналитика, а является всего лишь мощным программным инструментом, помогающим решать практические задачи, поэтому для правильной постановки задачи и интерпретации необходимы математические знания и навыки компьютерной реализации различных результатов анализа данных, и возможности по использованию того или иного метода при решении конкретной задачи.
В заключении подчеркнем, что преподавателям необходимо мотивировать студентов к изучению современных методов и инструментов анализа данных в качестве конкурентного преимущества при поиске работы по специальности в будущем, несмотря на некоторую сложность теоретических и прикладных аспектов данного направления. А для более детальной проработки знаний и практического использования методов и программной реализации следует активнее внедрять в курсовое и дипломное проектирование решение конкретных практических задач с использованием аналитической платформы Deductor.
Несмотря на данные проблемы, опыт преподавания показывает, что студенты, мотивированные на получения современных знаний в области информационных технологий и инструментов проведения перспективного интеллектуального анализа данных готовы обучаться, использовать все возможности платформы Deductor и творчески подходить к решению различных задач.
О ПЕРСПЕКТИВАХ ИСПОЛЬЗОВАНИЯ СОВРЕМЕННЫХ
ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ В ПРАКТИКЕ
ИССЛЕДОВАНИЙ И ОБУЧЕНИЯ В СОЦИАЛЬНО-КУЛЬТУРНОЙ
СФЕРЕ (НА ПРИМЕРЕ АНАЛИТИЧЕСКОЙ ПЛАТФОРМЫ
Алтайский государственный университет, г. Барнаул Современный этап развития научного знания характеризуется активным внедрением информационных технологий. Для естественных и технических наук очевидно даже деление этих технологий на традиционные и современные, а в некоторых случаях на новейшие. Науки гуманитарные таким богатством подходов в этом смысле не отличаются, но все же неуклонно двигаются в этом направлении. Актуальным представляется рассмотрение примеров использования некоторых современных информационных технологий для решения прикладных задач социальнокультурной сферы.Диапазон определений понятий «технология» и «информационная технология» достаточно широк, остановимся на тех из них, которые используются в литературе по социологическим и политическим исследованиям. Например, «технологию можно определить как объединенную в общую систему и обеспечивающую большую эффективность той или иной деятельности совокупность разнородных компонентов: знаний, методов, операций и правил, а также энергетических сырьевых, технических, кадровых и прочих ресурсов» [1, с. 14] или: «Информационная технология – это совокупность знаний о способах автоматизированной переработки информации с использованием ЭВМ для автоматизации… деятельности» [2, с. 11]. По функциональным признакам, для обеспечения исследовательской деятельности в социально-культурной сфере выделяют информационно-аналитические и информационно-прогнозные технологии [3, с. 39]. Остановимся подробнее на первой разновидности информационных технологий применительно к конкретному примеру программного продукта. Очевидно, что первоочередной целью являются сбор, обработка и анализ информации об исследуемом объекте, с возможностью принятия взвешенного решения.
Эволюция технологий в этой области давно шагнула за пределы привычных пакетов статистической обработки данных, таких как SPSS, AcaStat, RealStat, Да-система, Статистика и др. Конец XX в. ознаменовался стремительным ростом объемов информации, накопленной на различных носителях, соответственно возросли потребности научного и бизнес-сообществ по использованию различных комбинаций таких данных в сочетании в том числе и с имеющимися архивными электронными базами данных. Объемы роста цифровой информации, прогнозируемые Агентством IDC к 2010 г., составят тысячи экзабайт (1 экзабайт = байт, или миллиард гигабайт) [4]. Появились аналитические платформы, позволяющие создавать комплексные прикладные решения (еще их называют законченными прикладными решениями) в области анализа данных. Их преимуществом является возможность использования наборов интегрированных между собой инструментов бизнес-анализа [5]. В аналитических платформах успешно реализуются новые парадигмы анализа больших объемов данных: Data Mining (интеллектуальный анализ данных), Data Warehousing (хранилища данных), Knowledge Discovery in Databases (извлечение знаний из баз данных) [6]. Все перечисленные способы анализа объединяются общим принципом обнаружения ранее неизвестных, нетривиальных, практически полезных и доступных интерпретаций знаний.
В настоящее время развитие этой области информационных технологий отличается высокой конкурентной средой, поскольку разработка ведется несколькими лабораториями, представляющими на рынок собственные продукты. К наиболее известным производителям аналитических платформ относятся BaseGroup Labs и их продукт Deductor, существующий в линейке лицензий от Academic до Enterprise и Professional; Business Objects с одноименным продуктом; IBM с Cognos; SAS с SAS Enterprise Miner и Forecast Server; Oracle с Oracle BI.
Применение аналитических платформ в практике анализа данных в социально-культурной сфере перспективно. При подготовке специалистов данного профиля на факультете социологии АлтГУ кафедрой математических методов в социальных науках используется продукт Deductor Academic компании BaseGroup Labs.
Литература 1. Яковлев, И.Г. Информационно-аналитические технологии и политическое консультирование/ И.Г. Яковлев// Полис. – 1998. – 2. Уткин, В.Б. Информационные системы и технологии в экономике/ В.Б. Уткин, К.В. Балдин. - М., 2005.
3. Боришполец, К.П. Методы политических исследований: Учебное пособие/К.П. Боришполец. – М., 2005.
4. Левкович-Маслюк, Л. Великие раскопки и великие вызовы/ Л.
Левкович-Маслюк // Компьютера. [Электронный ресурс]. – Режим доступа: http://www.computerra.ru/features/311656/ 5. Резниченко А. Аналитические платформы в «магическом квадрате» Gartner. [Электронный ресурс]. – Режим доступа:
www.docflow.ru/analytic 6. www.basegroup.ru
ОБ ОПЫТЕ ИСПОЛЬЗОВАНИЯ ПЛАТФОРМЫ DEDUCTOR
В УЧЕБНОМ ПРОЦЕССЕ БАШГОСАГРОУНИВЕРСИТЕТА
Башкирский государственный аграрный университет, г. Уфа Кафедрой информатики и информационных технологий Башкирского государственного аграрного университета проводится ряд занятий, связанных с обучением студентов навыкам интеллектуального анализа данных. В частности, такие занятия предусмотрены в курсе «Интеллектуальные информационные системы» на специальности 080801 Прикладная информатика (в экономике) и для направления подготовки бакалавров 230700 Прикладная информатика.При этом для развития у студентов умения и навыков извлечения знаний кафедрой предусмотрены следующие лабораторные работы с использованием Deductor Studio Academic.
1. «Знакомство с системой Deductor Studio. Построение деревьев 2. «Анализ данных с использованием нейронной сети».
3. «Кластеризация данных с использованием самоорганизующихся 4. «Использование системы Deductor Studio для комплексного В лабораторной работе «Знакомство с системой Deductor Studio.
Построение деревьев решений» рассматривается общее понятие интеллектуальной «добычи» данных Data Mining, описываются возможности платформы Deductor по интеллектуальному анализу данных, изучаются общие принципы создания и применения деревьев решений.
В ходе выполнения работы студентам предлагается ознакомиться с демопримерами интеллектуального анализа данных в системе Deductor Studio, проанализировать пример построения дерева решений в данной системе, рассмотреть, как меняется число правил в зависимости от разного процента отсечения ветвей дерева.
Далее студентам предлагается выполнить задания для самостоятельной работы, при этом провести анализ полученных данных, выявить наиболее значимые атрибуты для принятия решения.
В работе «Анализ данных с использованием нейронной сети» даются понятия искусственного нейрона и нейронных сетей, приводятся принципы построения нейросетей средствами системы Deductor Studio.
Далее рассматривается пример использования нейронных сетей при решении задачи оптимизации. В ходе реализации данного примера студенты должны подготовить файл с исходными данными и импортировать его в систему. Далее с использованием мастера обработки им нужно создать пользовательскую модель для расчета общей прибыли торговой организации. Для нахождения оптимальной стратегии продаж, обеспечивающей наибольшую прибыль, необходимо использовать узел «Нейросеть». На основе построенной нейросетевой модели студентам предлагается провести интерпретацию результатов, позволяющую сделать заключение об оптимальной стратегии продаж для торговой организации.
Работа «Кластеризация данных с использованием самоорганизующихся карт Кохонена» включает рассмотрение таких вопросов, как понятие кластеризации данных, принципы построения самоорганизующихся карт Кохонена в системе Deductor. При этом дается пример применения кластерного анализа на основе самоорганизующихся карт Кохонена и предлагаются задания для самостоятельного выполнения. При этом необходимо провести анализ полученных данных, выявить взаимосвязи между наиболее значимыми атрибутами для принятия решения.
В лабораторной работе «Использование системы Deductor Studio для комплексного анализа данных» рассматривается пример анализа экономической информации. Комплексный анализ данных при этом включает в себя кластерный анализ (с использованием самоорганизующихся карт Кохонена), построение нейронной сети (с использованием узла «Нейросеть») и построение дерева решений (при помощи узла «Дерево решений»).
Студентам предлагается реализовать следующие этапы анализа данных:
· на основании открытой статистической отчетности сформировать набор данных, содержащий ряд основных социальноэкономических показателей для заданных экономических объектов;
· с использованием инструмента анализа «Карта Кохонена» системы Deductor Studio Academic провести кластерный анализ данных, в результате которого выявить группы объектов с различным уровнем социально-экономических показателей;
· с использованием инструмента анализа «Нейросеть» построить нейронную сеть, позволяющую проанализировать влияние отдельных факторов на отнесение объекта к тому или иному кластеру. При обучении нейронной сети необходимо использовать результаты кластерного анализа данных в виде самоорганизующихся карт Кохонена;
· построить дерево решений, показывающее условия принадлежности объекта к определенной группе. В результате анализа данных выявить наиболее значимые факторы для принятия решения об отнесении объекта к определенному кластеру.
Для закрепления знаний по работе с системой Deductor Studio студентам предлагаются следующие вопросы для самоконтроля знаний:
· Что понимают под термином Data mining?
· Приведите примеры технологий, относящихся к методам Data · Какие средства интеллектуального анализа экономической информации реализованы в системе Deductor Studio?
· Охарактеризуйте понятие деревьев решений.
· Что представляет собой правило дерева решений?
· Из каких этапов состоит процесс построения дерева решений в · Охарактеризуйте понятие искусственного нейрона.
· Что понимают под обучением нейронной сети?
· Приведите примеры задач, решаемых нейросетевыми методами.
· Как вызвать инструмент анализа «Нейросеть» Мастера обработки системы Deductor?
· Из каких шагов состоит процесс построения и обучения нейросети в системе Deductor?
· Перечислите основные способы отображения нейронной сети в · Что понимают под кластеризацией данных?
· Приведите примеры задач, решаемых с использованием кластерного анализа.
· Что представляет собой алгоритм функционирования самоорганизующихся карт Кохонена?
· В чем заключается процесс обучения самоорганизующейся карты?
· Как вызвать инструмента анализа «Карта Кохонена» в системе · Перечислите основные этапы построения самоорганизующейся карты в системе Deductor Studio.
В курсе «Интеллектуальные информационные системы» студенты также выполняют курсовую работу, связанную с проектированием базы знаний экспертной системы. Для извлечения знаний из данных им предлагается использовать методы интеллектуального анализа данных, в том числе и с применением Deductor Studio.
Таким образом, можно заключить, что платформа Deductor предоставляет широкие возможности по обучению студентов навыкам интеллектуального анализа данных. Данная платформа может быть использована и в ходе аудиторной работы, и при организации самостоятельной работы студентов.
СЕКЦИЯ
«АКТУАЛЬНЫЕ ЗАДАЧИ
БИЗНЕС-АНАЛИТИКИ И ИХ РЕШЕНИЕ
АЛГОРИТМАМИ DATA MINING»
СОЗДАНИЕ БАЗ ЗНАНИЙ
В ЗАДАЧАХ ПРИКЛАДНОЙ ФИЗИКИ
Абруков В.С., профессор, Троешестова Д.А., доцент, Чувашский государственный университет имени И.Н.Ульянова, Постановка задачи. Во многих научных и научнопроизводственных организациях России, а также за рубежом, долгое время занимавшихся исследованием различных физических процессов, накоплено много экспериментальных данных. Перед исследователями возникает вопрос: можно ли их обобщить и на этой основе представить в виде многофакторных количественных моделей, позволяющих обобщать ранее полученные экспериментальные результаты, предсказывать на этой основе закономерности явлений ранее не исследованных систем или для ранее не исследованных условий? Еще более важным вопросом является следующий: какие системы необходимо использовать для реализации требуемых характеристик физического явления в заданных технических условиях? Аналогичные вопросы стоят в области нанотехнологий.Таким образом, мы поставили задачу, заключающуюся в сборе и обработке экспериментальных данных, представлении их в виде многофакторных вычислительных моделей, позволяющих обобщать ранее полученные экспериментальные данные и предсказывать на этой основе закономерности исследуемых физических явлений ранее не исследованных систем или для ранее не исследованных условий. Объектами исследования были: горение конденсированных систем (КС), вибрационное горение (ВГ) газов, а также новый продукт нанотехнологий – линейноцепочечный углерод с внедренными в него различными химическими элементами (ЛЦУ).
В качестве методов решения данных задач были выбраны средства Data Mining, в частности искусственные нейронные сети.
Использовались как собственные экспериментальные данные, так и экспериментальные результаты, опубликованные в России.
Методы исследования. Data Mining – комплекс современных средств предобработки данных, их анализа и моделирования [1-4]. Data Mining включает в себя такие средства, как: методы очистки данных и подготовки их к анализу, факторный и корреляционный анализ, деревья решений, искусственные нейронные сети (ИНС) [2, 3, 4], самоорганизующиеся карты Кохонена [4]. С точки зрения создания многофакторных вычислительных моделей, ИНС, которые могут рассматриваться как универсальные аппроксиматоры многомерных функций, играют главную роль. Остальные средства служили нам для предобработки данных и для их предварительного анализа.
Основы применения средств Data Mining приведены в [1-4]. Ряд примеров использования Data Mining в научных и прикладных исследованиях приведены в работах авторов [5-8]. В работе [5] – для построения вычислительных моделей при решении прямых и обратных задач оптики на основе неполных данных об изображении, в частности на основе измерения оптического сигнала всего в одной точке плоскости изображения («одноточечное измерение»); в [6] – для предсказания формы волны на свободной поверхности жидкости (задача цунами); в [7] – для создания моделей социальных явлений; в [8] – для создания модели перехода от медленного горения к детонации при различных условиях эксперимента.
Методики применения средств Data Mining, разработанные авторами, приведены на Интернет-сайте электронной библиотеки Чувашского государственного университета [9] и на Интернет-сайте [10].
Безгазовые конденсированные системы (самораспространяющийся высокотемпературный синтез): модели «Температурные профили волны горения». Задача непосредственного определения температурного профиля в волне горения безгазовых КС относится к трудным экспериментальным задачам. В первую очередь это связано с трудностями применения термопар (наиболее распространенный метод определения температуры) при очень высоких температурах и градиентах температуры, реализующихся в волне горения. Эти измерения требуют очень тщательной организации эксперимента, очень трудоемки и дороги.
Полученные нами ИНС-модели позволяют обобщать ранее полученные многомерные данные и на этой основе интерполировать и экстраполировать их, то есть получать интересующие исследователя многомерные данные без проведения экспериментов.
Для построения моделей нами была использована аналитическая платформа Deductor [4].
Схема построения моделей была следующая.
Сначала были оцифрованы температурные профили в волне горения безгазовых КС-смесей порошков Ti, B, Fe и ферроборных сплавов Fe-nB с титаном, отличающиеся содержанием железа в КС и начальной температурой образца. Затем была выбрана соответствующая собранной базе данных архитектура ИНС и проведено ее обучение (рис. 1). Обучение заключалось в том, что различные наборы значений расстояния от поверхности горения, для различных типов системы, содержания железа в них и начальной температуры подавались на входной слой ИНС, а соответствующие значения температуры устанавливались в выходном слое ИНС и с помощью известного метода обучения ИНС – метода «обратного распространения ошибки» [4] – создавалась вычислительная ИНС модель горения.
Эта модель представляет собой модель типа «чёрного ящика». Полученный «чёрный ящик» может использоваться для определения (прогнозирования) температурного профиля в волне горения безгазовой КС примерно такого же типа, для которого была собрана база данных следующим образом. Тип системы, содержание железа в ней и начальная температура устанавливаются во входном слое ИНС, там же указывается произвольное (или интересующее исследователя) значение расстояния от поверхности горения. После этого «черный ящик» мгновенно вычисляет соответствующие значение температуры, а также профиль температуры в целом (автоматически перебирая равномерно распределенные значения расстояния от поверхности горения в пределах значений имеющихся в обучающей базе данных).
Рис. 1. Структура ИНС, использованная при получении ИНС-модели «Температурные профили волны горения» для безгазовых КС – смесей порошков Ti, B, Fe и ферроборных сплавы Fe-nB с титаном Ниже представлены результаты и их обсуждение.
В обучающей базе данных было 217 строк – наборов вышеуказанных величин. База данных была проверена с помощью узла-обработчика Deductor в группе очистки данных «Выявление дубликатов и противоречий».
Рис. 2. Профиль температуры в волне горения безгазовой КС – смеси порошков Ti, B, Fe при содержании железа – 62%, начальной температуре 20 С. Эти значения, расстояние расстояния от поверхности горения x и соответствующее значение температуры (T) отображены Рис. 3. Зависимость температуры в волне горения (на расстоянии от поверхности горения x = –0,15 мм) от содержания железа (для безгазовой КС – смеси порошков Ti, B, Fe при начальной температуре образца 20 С) Рис. 4. Зависимость температуры в волне горения (на расстоянии от повехности горения x= –0,15 мм) от типа системы (для безгазовой КС) при начальной температуре образца 20 С) Рис. 5. Зависимость температуры в волне горения (на расстоянии от поверхности горения x = –0,15 мм) от начальной температуры образца (степени предварительного нагрева) для безгазовой КС-смеси порошков Ti, B, Fe при содержании железа – 62 % Достоинством построенной модели является то, что они позволяет без эксперимента определить температуру в любой точке волны горения и профиль температуры в волне горения в целом для различных составов, содержания железа в системе и начальной температуры системы.
Были получены также другие модели для безгазовых конденсированных систем. Модель 1: скорость горения системы титан-бор (Ti+2B) как трехмерная функция относительной исходной плотности системы, размера частиц титана и начальной температуры. Модель 2: скорость горения системы железо-ванадий (Fe-V) как двумерная функция плотности системы и типа системы. Модель 3: максимальная температура волны горения безгазовых систем как двумерная функция начальной температуры системы и ее типа.
Заключение. В статье представлены результаты исследований возможностей создания баз знаний в области физики горения и нанотехнологий с помощью средств Data Mining.
Целью работы было создание комплекса вычислительных моделей горения конденсированных систем и вибрационного горения газов, обобщающих экспериментальные данные, и, на их основе, баз знаний в области горения, а также создание методологических основ для разработки вычислительных моделей и баз знаний в других областях научных исследований, в частности в области нанотехнологий.
Полученные результаты показывают хорошие перспективы применения средств Data Mining для достижения поставленной цели и решения разнообразных задач моделирования горения конденсированных систем, вибрационного горения, а также свойств продуктов нанотехнологий.
Средства Data Mining позволяют существенно увеличить значение полученных ранее экспериментальных результатов, а также получать новые «экспериментальные» результаты и выявлять новые неизвестные ранее закономерности.
Мы полагаем, что Data Mining будут рассматриваться в будущем как хорошее средство анализа многомерных экспериментальных функций, как средство обобщения и прогнозирования закономерностей процессов горения, связей между переменными задачи.
Полученные вычислительные модели, объединенные в общую аналитическую платформу, можно рассматривать как удобную в использовании базу знаний закономерностей исследуемых объектов, содержащую в себе в компактном виде большое количество разнообразной информации об объекте и обеспечивающую быстрый доступ к ней в удобном графическом виде. Она способна легко адаптироваться к новым экспериментальным данным (дообучаться). Часть ее в виде ИНС-моделей можно представить как своеобразный специализированный компактный инженерный калькулятор, позволяющий мгновенно производить требуемые вычисления характеристик горения конденсированных систем и вибрационного горения, состава топлива, способов влияния на режим горения.
Стоит также отметить интересную роль, которую могут иметь полученные модели в учебном процессе. Обобщая закономерности экспериментальных данных, данные модели позволяют в компактном виде наглядно продемонстрировать особенности механизма горения конденсированных систем, механизма возникновения и прекращения вибрационного горения.
Помимо чисто научных, прикладных и учебных задач, полученные модели позволят облегчить решение и практически важных задач. Современные электронные технологии позволяют создавать копии обученных искусственных нейронных сетей в виде микропроцессоров (чипов), мгновенно обрабатывающих поступающие входные сигналы и выдающих управляющие решения (выходные сигналы). Поэтому искусственные нейронные сети могут рассматриваться как очень перспективное средство для решения задач управления и создания систем управления процессом горения.
Таким образом, в настоящее время Data Mining можно рассматривать как мощное средство, поддерживающее тесное взаимодействие эксперимента, теории, компьютерного моделирования и инженерных расчетов.
Литература 1. Дюк В., Самойленко А. Data mining: учебный курс. – СПб: Питер, 2001. – 368 с.
2. Круглов В.В., Борисов В.В. Искусственные нейронные сети. – М.: Горячая линия – Телеком, 2002. – 382 с.
3. Neural Networks for Instrumentation, Measurement and Related Industrial Applications. Proceedings of the NATO Advanced Study Institute on Neural Networks for Instrumentation, Measurement, and Related Industrial Applications (9-20 October 2001, Crema, Italy) / ed. by Sergey Ablameyko, Liviu Goras, Marco Gori and Vincenzo Piuri, IOS Press, Series 3: Computer and Systems Sciences, 2003, Vol. 185, Amsterdam.
4. Аналитическая платформа Deductor: www.basegroup.ru.
5. Abrukov V.S. Artificial Neural Networks and Inverse Problems of Optical Diagnostics / V.S. Abrukov, D.A. Troeshestova, R.A. Pavlov, P.V. Ivanov // Proceedings of the 6th International Conference on Intelligent System Design and Applications. Jinan.
China. 2006, October 16-18. – P. 850-855.
6. Abrukov V.S., Schetinin V.G., Troeshestova D.A., Deltsov P.V.
Perspectives for Decision of Some Hydrodynamical Problems by Neural Networks Models and Methods. / V.S. Abrukov, V.G.
Schetinin, D.A. Troeshestova, P.V. Deltsov // Proceedings of the Hydrodynamics» / Ed. by G.G. Cherny, M.P. Tulin, A.G. Terentiev, V.V. Serebryakov, Cortana Corporation, USA – Russia. Washington – Cheboksary, 2002. – P. 391-394.
7. Абруков В.С., Николаева Я.Г., Макаров Д.Н., Сергеев А.А., Карлович Е.В. Применение средств интеллектуального анализа данных (Data Mining) для исследования неполно определенных систем // Вестник Чувашского университета. – 2008. – № 2. – С.
8. Abrukov V.S. Application of Artificial Neural Networks for Solution of Scientific and Applied Problems for Combustion of Energetic Materials / V.S. Abrukov, D.A. Troeshestova, A.S. Chernov et al // Advancements in Energetic Materials and Chemical Propulsion / Ed.
By Kenneth K. Kuo and Juan Dios Rivera, Begell House Inc. of Redding, USA. Connecticut. – 2007. – P. 268-283.
9. Абруков В. С. Методика создания баз знаний в области вибрационного горения средствами Data Mining [Электронный ресурс]: презентация. – Чебоксары, 2009. Режим доступа:
http://library.chuvsu.ru/inform_res/tech_lib/downloads/ABRUKOVvibrgorenie.zip.
10.Абруков В. С. Методика создания баз знаний в области горения энергонасыщенных конденсированных систем средствами Data Mining [Электронный ресурс]: презентация. – Чебоксары, 2009.
Режим доступа:
http://library.chuvsu.ru/inform_res/tech_lib/downloads/ABRUKOVgorenieKS.zip.
11.Абруков В. С. Применение искусственных нейронных сетей при решении научных и прикладных задач [Электронный ресурс]:
Метод. пособие к курсу лекций «Искусственные нейронные сети»: презентация. – Чебоксары, 2009. Режим доступа:
http://library.chuvsu.ru/inform_res/tech_lib/downloads/AbrukovKazan-2005.zip.
12. Методическое пособие: Методика применения средств Data Mining. Режим доступа: http://www.chuvsu.ru/2008/proekt.html.
ГИБРИДНЫЕ СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ
НА ОСНОВЕ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА
ДАННЫХ
Болотова Л.С, профессор, Московский институт радиотехники, электроники и автоматики (Технический университет), Боев Б.В., зав. лаб. эпидемиологической кибернетики НИИЭМ им Н.Ф.Гамалеи РАМН, Иваненко И.Ю., студент, Московский институт радиотехники, электроники и автоматики (Технический университет), Как известно, термин «Гибридная система» (ГС) предполагает отказ от взгляда на объект исследования как на простую однородную сущность и принятие понимания её сложности, составности и неоднородности. Термин «гибрид» понимается как система, состоящая из двух или более интегрированных подсистем, каждая из которых имеет различные языки представления знаний, информации и методы решения. Применительно к системам поддержки принятия решений (СППР) это означает:
· естественную интеграцию различных парадигм моделирования;
· сращивание информации различной модальности (символьной, текстовой, картографической, и т.п.);
· интеграцию различных типов моделей представления знаний;
· интеграцию различных методов и моделей решения подзадач;
· «безшовную» интеграцию знаний и традиционной обработки;
· применение различных типов инструментальных программных В данном случае под СППР понимается система, обладающая интеллектом, сравнимым с интеллектом человека по качеству принимаемых решений. Этому требованию, на наш взгляд, соответствует наиболее общее определение: гибридная интеллектуальная система (ГИС) есть система, в которой для решения задачи используется более одного метода имитации интеллектуальной деятельности человека.
противодействия эпидемиям. В её структуре задействованы следующие парадигмы:
· искусственный интеллект (ИИ);
· аналитические модели на основе нелинейных дифференциальных уравнений;
· традиционная обработка информации.
В рамках парадигмы ИИ используются:
· экспертные системы (ЭС);
· метод ситуационного анализа и проектирования модели предметной области;
· искусственные нейронные сети.
В рамках парадигмы Data Mining используются методы:
· проектирования Хранилищ Данных;
· классификации на основе дерева решений;
· кластеризации на основе самоорганизующихся карт Кохонена;
· ассоциации.
инструментальные средства:
· программа работы с матрицами авиатрафика пассажирских перевозок;
· аналитическая платформа Deductor;
· программа прогнозирования эпидемии на основе уравнений Кермака-МакКендрика;
· система нечёткого моделирования;
· инструментальная система «Помощник Эксперта»;
· инструментальная экспертная система «Решатель проблем».
Последние две в списке системы применялись для построения модели предметной области противодействия эпидемиям, главным образом, для проявления социального контекста принимаемых решений.
За основу моделирования процесса распространения эпидемий был взят пассажиропоток воздушного транспорта, как наиболее быстрый для переноса вирусов в планетарном масштабе, а в качестве примера эпидемии рассмотрен грипп. Основными её составляющими являются:
· подсистема сбора и анализа информации о воздушных полетах;
· БД городов мира с необходимыми характеристиками;
· подсистема прогнозирования хода эпидемии гриппа;
· система поддержки принятия решений и выдачи рекомендаций по выбору мер противодействия эпидемии;
· база нечётких знаний (БНЗ), включающая правила оценки эпидемиологической опасности территории (города, района и т.п.).
Структура системы для противодействия эпидемиям гриппа (СПЭГ), а также подсистема сбора и анализа информации о воздушных полетах; БД городов мира с необходимыми характеристиками, включая результаты интеллектуального анализа данных, были подробно рассмотрены в работах [2, 3, 5, 6]. Поэтому в данном докладе мы рассмотрим остальные подсистемы.
Разработано множество моделей разной сложности, описывающих динамику распространения эпидемии. Так, в модели SIR среди населения выделяются три группы людей: те, кто восприимчив к заражению (S); те, кто был заражен и в состоянии распространять болезнь восприимчивым людям (I); те, кто выздоровел от болезни и невосприимчив к последующему перезаражению (R). Смена состояний людей является односторонней, только S I R. Возможно дополнение модели ещё двумя группами людей, у которых болезнь находится в инкубационном периоде (Е) и умерших (F). Существует два фундаментальных параметра модели – (ежедневная норма инфекции) и (норма восстановления).
Они являются параметрами, которые управляют тем, насколько быстро люди переходят в группы I и R [1, 4, 7]. В этой модели все расчеты по анализу и прогнозу эпидемического процесса выполняются на основе соответствующими начальными условиями эпидемии. Модель SIR описывается дифференциальными уравнениями Кермака-Мак Кендрика:
Обозначения: – ежедневная норма инфекции; – норма восстановления. Как уже говорилось, смена состояний людей является односторонней, т.е. S I R, но возможно дополнение состоянием Е (инкубационный период) и F (летальный исход).
Из уравнений видно, что если часть населения в зараженной группе первоначально увеличивается (то есть, f 0 при t = 0), то эпидемия началась. Переход между эпидемией и неэпидемическим распространением болезни происходит, когда = 0. Одновременно анализ второго уравнения показывает, что этот переход наступает, когда. Аналогично, пик эпидемии происходит, когда S =, а показатель изменения зараженной группы прекращает увеличиваться и начинает уменьшаться [1, 4].
Существует еще один способ представления этой модели. В нем сделан упор на практические аспекты распространения. К примеру, вводится контактное число, где = является одним из самых важных параметров, определяющих динамику распространения болезни.
У контактного числа есть легко понимаемая интерпретация: среднее число восприимчивых членов населения, среди которых зараженный распространяет болезнь к тому, как долго этот человек сам находился в зараженной группе. Последует ли эпидемия при определенных начальных условиях, может быть рассмотрено с точки зрения контактного числа. Опытным путем установлено, что переход между эпидемическими и неэпидемическими состояниями происходит, когда численность населения в восприимчивой группе обратно контактному номеру. Можно ввести меру восстановления, которую можно представить продолжительностью болезни [1, 4].
Основным компонентом системы противодействия эпидемиям является сама модель эпидемии. В зависимости от прогноза может проводиться изоляция зараженных, блокировка путей передачи заболевания, вакцинация медперсонала, вакцинация восприимчивой части населения или вакцинация всего населения.
В настоящее время СППР СПЭГ реализована как прототип ЭС, задачей которой является выработка рекомендаций ЛПР. Система строит свои рассуждения исходя из своей БЗ и основываясь на входных данных (рис. 1).
В случае подозрения на возникновение эпидемии в СППР вводятся данные о городе, числе инфицированных, подверженных заражению, лиц в инкубационном периоде, умерших, а также коэффициенты для расчета прогноза. Система выводит на экран:
· рекомендуемое действие;
· масштаб его выполнения;
· рекомендации по поводу ресурса больниц;
· объяснение выданной рекомендации;
· список городов, которые необходимо уведомить о вероятности На данном этапе реализации СППР может давать рекомендации следующих основных типов действий, список которых может и будет расширяться:
· профилактика;
· вакцинация:
Возможен масштаб выполнения действий для:
соответствующей подготовке исходных данных.
Основные модули СППР:
· обработчик входных данных, отвечающий за преобразование входных данных в формат, понятный программе;
· управляющий модуль СППР, отвечающий за получение данных и дальнейшую их передачу к модулям – обработчикам;
· модули, реализующие задачи прогнозирования и нечеткого Модуль анализа авиатрафика ScopeMachine отвечает за анализ БД авиаперелетов. Формат данных в ней предопределен форматом, выдаваемым подсистемой анализа трафика пассажиров воздушного транспорта. На основе анализа базы находятся города, связанные с рассматриваемым и выдается рекомендация: «Необходимо уведомить следующие города о возможности возникновения эпидемии: (список городов)», рис. 2.
Рис. 2. Окно для расчёта трафика авиапассажиров Представление знаний в СППР выполнено в виде нечётких правил, а в качестве аппарата их интерпретации, естественно, применяется аппарат нечеткой логики, как наиболее соответствующей характеру знаний экспертов эпидемиологов. При таком представлении экспертам не нужно вводить в БЗ, например, процентные соотношения зараженного населения. Вместо этого достаточно задать этот факт числом, по которому система самостоятельно определит соответствующее нечёткое множество: low (низкое число зараженных); medium (среднее число зараженных); high (высокое число зараженных). Соответствующие этим множествам функции принадлежности (характеристические функции) приведены на рис. 3.
В этом окне пользователю выводятся графики функций для различных состояний. На каждом графике вертикальной чертой обозначается введенное значение. График «solution» показывает решение системы.
Правила НБЗ имеют стандартный синтаксис: IF (условие) [OR (условие)] THEN (переменная) IS (значение). Ниже приведен фрагмент правил БНЗ:
RULE 1 : IF incub IS low OR infect IS low THEN solution IS profilactics;
RULE 2 : IF incub IS low AND infect IS med THEN solution IS vaccination;
RULE 3 : IF incub IS med AND infect IS low THEN solution IS vaccination;
RULE 4 : IF infect IS med THEN solution IS vaccination;
RULE 5 : IF infect IS med AND liable IS low THEN solution IS vaccination;
RULE 6 : IF liable IS med THEN solution IS profilactics;
RULE 7 : IF liable IS high THEN solution IS vaccination;
RULE 8 : IF liable IS low AND recover is low THEN solution IS vaccination;
RULE 9 : IF recover IS low THEN solution IS vaccination;
RULE 10 : IF recover IS med and dead is low THEN solution IS vaccination;
RULE 11 : IF liable IS low and dead is low THEN solution IS vaccination;
RULE 12 : IF dead IS med THEN solution IS quarantine;
RULE 13 : IF dead IS high THEN solution IS quarantine.
Рис. 3 Окно функций принадлежности нечётких множеств При работе с программой пользователь заполняет поля «Город», «Число свободных мест в больницах», «Число человек в инкубационном периоде», «Число инфицированных», «Число восприимчивых к заражению», «Число выздоровевших», «Число погибших», «Доля инфекции», «Коэффициент восстановления» (рис. 4).
Управляющий модуль – ядро СППР для противодействия эпидемиям. Он ответственен за обработку входных данных и дальнейшее распределение их по функциональным модулям системы, затем – за обработку возвращенных данных и выдачу их пользователю (рис. 5).
Это основной модуль для получения рекомендаций. На основе данных о численности населения в различных состояниях, БНП выдается рекомендация относительно действия и необходимого масштаба применения этого действия (например, действие – вакцинация, масштаб – город).
Рис. 4. Окно для представления исходных данных Рис. 5. Структура управляющего модуля Модуль расчета прогнозов (SIRMachine) на основе данных пользователя (ЛПР) выводит текущее состояние эпидемии, прогноз её дальнейшего развития и необходимый ресурс для размещения больных (рис 6).
На рис. 7 показан прогноз, когда можно ожидать окончания эпидемии относительно текущей ситуации – это 60-й день.
Модуль вывода рекомендаций (Recommendation Builder) используется управляющим модулем (Operating module) и собирает результаты работы всех функциональных модулей, а затем выдает их пользователю в виде окна с отображенными рекомендациями (рис. 8).
Рис. 6. Текущее состояние эпидемии Рис. 7. Прогноз развития эпидемии Рис.8. Окно рекомендаций для решения «Карантин»
В окне рекомендаций пользователю выводятся:
· рекомендуемое действие – профилактика, вакцинация или · масштаб действия – район, город или область;
· рекомендации относительно ресурса больниц;
· список городов для уведомления о вероятности эпидемии;
· SIR-данные: состояние эпидемии, контактное число и среднюю продолжительность заболевания;
· примененные для вывода решения нечеткие правила.
В заключение подчеркнём следующее.
1. Разработанный прототип прошёл испытания для различных типов решений и показал:
· адекватность принимаемых решений реальным;
· гибкость модели и возможность формирования различных конфигураций на её основе;
· открытость для расширений для: БНП; новых типов решений;
новых территориальных уровней;
· возможности расширения предметной области учёта социальной сферы развития эпидемий;
· возможность применения для противодействия другим типам эпидемий, кроме гриппа.
В последнем случае необходима смена модели прогнозирования развития эпидемии.
2. В настоящее время в РФ отсутствует специальная служба для систематического наблюдения и сбора необходимой информации от различных служб, участие которых необходимо для организованного и эффективного противодействия эпидемиям. Считаем, что на основе данного прототипа может быть создан проект информационного обеспечения такой службы с указанием:
· перечня необходимых БД;
· исследуемых параметров;
· структуры хранилища данных;
· технологии разработки полноценной СППР для поддержки службы противодействия эпидемиям.
Литература 1. Боев Б.В. Современный этап математического моделирования в эпидемиологии инфекционных заболеваний // Сборник научных трудов «Эпидемиологическая кибернетика: модели, информация, эксперименты» – М., 2010. – С. 6 -12.