WWW.DISS.SELUK.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА
(Авторефераты, диссертации, методички, учебные программы, монографии)

 

На правах рукописи

САРАПАС Владимир Викторович

Алгебраические методы синтеза алгоритмов

классификации элементов временных рядов

Специальность 05.13.17 – теоретические основы

информатики

Автореферат

диссертации на соискание учёной степени

кандидата физико-математических наук

Москва – 2010

Работа выполнена на кафедре теоретической информатики и дискретной математики математического факультета Московского педагогического государственного университета

Научный руководитель:

член-корреспондент РАН, доктор физико-математических наук, профессор РУДАКОВ Константин Владимирович

Официальные оппоненты:

доктор физико-математических наук СМЕТАНИН Юрий Геннадьевич кандидат физико-математических наук, доцент ГУРОВ Сергей Исаевич

Ведущая организация:

Московский физико-технический институт (государственный университет)

Защита состоится 11 марта 2011 г. в 16 часов на заседании диссертационного совета Д 212.154.32 при Московском педагогическом государственном университете по адресу: 107140, г. Москва, ул.

Краснопрудная, д. 14, математический факультет МПГУ, ауд. 301.

С диссертацией можно ознакомиться в библиотеке Московского педагогического государственного университета: 119992, Москва, ул. Малая Пироговская, д. 1.

Автореферат разослан « » 20_ г.

Ученый секретарь диссертационного совета МУРАВЬЁВА О.В.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы исследования. Создание и исследование систем распознавания образов является трудоёмкой теоретической и технической задачей, необходимость её решения возникает в различных областях. Одним из направлений теории распознавания образов является алгебраический подход, включающий в себя методы построения проблемноориентированных теорий синтеза корректных алгоритмов распознавания образов на базе параметрических семейств операторов.

Алгебраический подход возник в результате исследований, в которых соответствующие решаемым задачам алгоритмы преобразования информации строились в контексте отсутствия подходящих математических моделей конкретных ситуаций.

Академик РАН Ю.И. Журавлёв в 70-х годах XX века заложил основы алгебраического подхода к синтезу корректных алгоритмов распознавания образов. Алгебраический подход к проблеме распознавания образов позволил по-новому и эффективно решать многие задачи классификации, прогнозирования и, вообще говоря, задачи преобразования информации.

В основу алгебраического подхода легла идея выбирать некоторые алгоритмы из эвристических семейств и, используя подходящие корректирующие операции над ними, получать оптимальные алгоритмы для решаемых задач. Необходимо подчеркнуть, что вышеупомянутая идея активно использовалась и используется различными группами исследователей (Н.Г. Белецкий, В.С. Казанцев, В.Д. Мазуров, Л.А.

Растригин, Р.Х. Эренштейн и др.). В основополагающих работах Ю.И.

Журавлёва по алгебраическому подходу к распознаванию образов помимо использования и развития этой идеи были введены такие важные понятия алгебраического подхода, как регулярность и полнота.

При дальнейших исследованиях были получены важные результаты для многих семейств алгоритмов и корректирующих операций над ними (А.Р. Ашуров, Ю.И. Журавлёв, И.В. Исаев, В.В. Краснопрошин, К.В.

Рудаков, В.В. Рязанов и др.). В итоге всех вышеперечисленных исследований алгебраический подход стал общетеоретической базой для решения задач распознавания и используемых при этом математических конструкций и методов.

Отметим, что применение алгебраических конструкций было обосновано на базе принятия некоторых дополнительных метрических и статистических гипотез. Исследования первого типа проводились Ю.И.

Журавлёвым и его учениками, а исследования второго типа, для которых был создан специальный тонкий математический аппарат, были проведены академиком РАН В.Л. Матросовым. Им были устранены некоторые внешние противоречия между статистической теорией и алгебраическим подходом.

Основополагающие идеи академика РАН Ю.И. Журавлёва развил в своих трудах член-корреспондент РАН К.В. Рудаков. Он разработал алгебраическую теорию универсальных и локальных ограничений для алгоритмов распознавания, чем расширил границы применимости идей алгебраического подхода. Им была исследована проблема разрешимости и регулярности задач классификации и получен общий необходимый и достаточный критерий регулярности, который для отдельных конкретных систем универсальных ограничений сводится к легко проверяемым на практике условиям. Также К.В. Рудаковым были получены критерии полноты для моделей алгоритмов как на общем уровне, так и для конкретных систем универсальных ограничений; выявлены критерии полноты для моделей алгоритмических операторов и семейств корректирующих операций и сформулировано понятие корректности семейств решающих правил.

При решении многих прикладных задач часто возникает необходимость выделения внутри временного ряда так называемых трендов.

Как правило, трендом называют интервал временного ряда, не содержащий точек экстремума. Задачи выделения трендов временных рядов находятся в центре многих отраслей науки и прикладных сфер.



подразумевается решение задачи классификации, в которой каждой точке ряда сопоставляется номер класса из заранее определенного множества классов или, говоря иначе, метка из фиксированного словаря разметки.

Анализ распределенных во времени элементов требует применения комплексных решений, что и обеспечивают алгебраические методы синтеза алгоритмов классификации. Алгебраический подход как способ построения проблемно-ориентированных теорий синтеза корректных алгоритмов распознавания образов на базе параметрических семейств операторов, позволяет построить такую теорию над предметной областью, объектами изучения которой будут являться обучаемые алгоритмы выделения трендов, семейства алгоритмов и операции над ними.

В рамках алгебраического подхода К.В. Рудаков и Ю.В. Чехович разработали общую теорию задач с теоретико-множественными ограничениями. Также была разработана специализация этой теории для решения задач синтеза алгоритмов, описывающих отображения из пространства начальных информаций – конечных множеств точек на плоскости – во множество финальных информаций – множество конечных наборов «меток» – слов в конечном алфавите., то есть алгоритмов выделения трендов временных рядов.

При этом не были построены конкретные примеры моделей, удовлетворяющие разработанной теории. Поэтому построение, теоретическое и экспериментальное исследование таких семейств оставалось нерешённой актуальной задачей. В реферируемой диссертации такие модели предложены, а также проведено их теоретическое и экспериментальное исследование.

Объектом исследования являются методы алгебраического подхода к решению задач синтеза обучаемых алгоритмов выделения трендов временных рядов.

Предмет исследования составили параметрические семейства алгоритмов, семейства корректирующих операций и решающих правил для задач синтеза обучаемых алгоритмов выделения трендов временных рядов.

Целью данной работы является синтез и исследование параметрических семейств алгоритмов классификации элементов временных рядов, допускающих минимум ошибок на прецедентах и удовлетворяющих наборам дополнительных ограничений. Для достижения указанной цели в работе поставлены и решены следующие задачи:

1) конкретизировать основные принципы и методы алгебраического подхода для задач выделения трендов;

2) построить параметрические модели алгоритмов классификации элементов временных рядов, задать семейства корректирующих операций над этими алгоритмами и семейства решающих правил;

3) исследовать построенные параметрические модели алгоритмов классификации элементов временных рядов;

4) разработать соответствующее программное обеспечение;

5) провести серию экспериментов и сделать необходимые выводы.

Методы исследования. В настоящей работе использовались методы алгебраического подхода к распознаванию образов, теории задач с теоретико-множественными ограничениями, теории оптимизации, системного анализа, для проведения экспериментов использовались специально разработанные программные средства.

Научная новизна исследования обусловлена тем, что в его рамках созданы новые модели алгоритмов, проведён их анализ с помощью аппарата теории задач с теоретико-множественными ограничениями и тем, что впервые разработана программа для синтеза обучающихся алгоритмов выделения трендов временных рядов.

Теоретическая значимость обусловлена, прежде всего, тем, что впервые для анализа моделей алгоритмов используется теория задач с теоретико-множественными ограничениями. Данное исследование развивает и дополняет алгебраическую теорию синтеза обучаемых алгоритмов выделения трендов временных рядов.

Практическая значимость заключается в том, что результаты работы могут быть использованы в дальнейших научных исследованиях, посвящённых проблеме выделения трендов временных рядов, а также в возможности использования результатов исследования в таких практических сферах, как экономика, астрономия, медицинская диагностика, геологический анализ.

Основные положения, выносимые на защиту:

1) семейства фильтрующих алгоритмов выделения трендов временных рядов полны при системе локальных аксиом;

2) семейство фильтрующих алгоритмов с переменным параметром выделения трендов временных рядов полно при расширенной системе 3) алгебраическая коррекция результатов работы семейств алгоритмов в сплит-модели позволяет добиться улучшения результатов классификации;

4) результаты экспериментального исследования демонстрируют практическую применимость разработанных конструкций.

Апробация работы. Результаты диссертационного исследования и его отдельные положения были представлены в докладах и выступлениях на кафедре теоретической информатики и дискретной математики Московского педагогического государственного университета, в отделе «Интеллектуальные системы» Вычислительного центра имени А.А.

Дородницына РАН, обсуждались на научно-практической конференции преподавателей, аспирантов и сотрудников математического факультета МПГУ (Москва, 2007, 2008), заседаниях круглого стола молодых ученых по приоритетным направлениям развития науки (Москва, 2007, 2008), Девятой международной научно-практической конференции «Высокие технологии, исследования, промышленность» (Санкт-Петербург, 2010), XI Всероссийской научно-практической конференции студентов, аспирантов и молодых учёных с международным участием «Молодежь и наука XXI века» (Красноярск, 2010), II Международной научно-практической конференции «Наука и современность – 2010» (Новосибирск, 2010). По теме диссертации опубликовано пять работ, в том числе одна в журнале, включённом в список ВАК.

Структура диссертации соответствует логике научного исследования, определяется его целью и основными задачами: работа (общим объёмом страниц) состоит из введения, трёх глав, заключения, списка литературы и приложения. Библиография включает 103 наименования научной литературы.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении даётся общая характеристика работы: обосновывается актуальность темы диссертации, выбор объекта и предмета исследования, раскрывается его научная новизна, теоретическая и практическая значимость, определяются цель и задачи, а также положения, выносимые на защиту;

характеризуется общая методологическая база работы.

В первой главе рассматриваются общие вопросы задач распознавания и классификации в рамках алгебраического подхода.

О постановке задачи распознавания имеет смысл говорить тогда, когда применение классических математических методов и построение формальных теорий чем-либо осложнено или вовсе невозможно. Располагая информацией о классах, благодаря параметризации моделей алгоритмов распознавания, можно синтезировать корректные алгоритмы для некоторых узких подклассов задач, при отсутствии точной модели изучаемых объектов и явлений. Важно отметить, что использование достаточно «богатых»

многопараметрических моделей влечёт за собой обычно трудноразрешимую проблему поиска глобально оптимального алгоритма, причём часто получается так, что при использовании более «бедной» модели, в рамках которой легко отыскать оптимальный алгоритм, возможно получение более точного решения задачи распознавания, чем при использовании локальноэкстремального алгоритма из «богатой» сложноустроенной модели.

В контексте алгебраического подхода к синтезу корректных алгоритмов распознавания образов, классификации и прогнозирования в первой главе диссертации рассматривается класс задач, характеризующийся наличием явным образом заданных теоретико-множественных ограничений на множество допустимых ответов алгоритма.

В соответствии с теорией члена-корреспондента РАН К.В. Рудакова, опишем задачу классификации в виде задачи синтеза алгоритма преобразования информации. Будем рассматривать некоторое множество S = {S }, элементы которого называются объектами. Описания объектов D(S ) образуют пространство начальных информаций Ii = {D( S ) S S}, элементы которого обозначаются I i, так что Ii = {I i }.

В первой главе рассматривается задача синтеза алгоритмов A, реализующих отображения из пространства начальных информаций Ii в пространство финальных информаций I f = {I f }. Далее мы не будем различать алгоритмы и реализуемые ими отображения. Решение синтезируется в рамках модели алгоритмов M, где M { A A : Ii I f }.

Задачи определяются структурными информациями I s, выделяющими из M подмножества допустимых отображений, обозначаемые M[ I s ]. Любой алгоритм A, реализующий произвольное допустимое отображение, называется корректным для задачи, определяемой структурной информацией I s, и является ее решением.

Конструкции алгебраического подхода к проблеме синтеза корректных алгоритмов основаны на использовании «промежуточного» по отношению к Ii и I f пространства оценок I e = {I e }. При этом корректные алгоритмы синтезируются на базе эвристических информационных моделей, т.е.

параметрических семейств отображений из Ii в I f, представляющих собой специальные суперпозиции алгоритмических операторов (отображений из Ii в I e ) и решающих правил (отображений из I e в I f, p – арность решающего правила).

Модели M определяются моделями алгоритмических операторов M 0, Для синтеза корректных алгоритмов используются также множества F корректирующих операций, определённых над множеством отображений M *. Корректирующие операции F, рассматриваемые в настоящей работе, индуцируются операциями F над пространством оценок I e :

где I i пробегает пространство начальных информаций Ii, алгоритмические операторы B1,..., B p – произвольные отображения из Ii в I e, и F – операция над I e.

Схема построения модели алгоритмов M представлена на следующей коммутативной диаграмме:

При зафиксированном пространстве возможных начальных информаций Ii и пространстве финальных информаций I f любую из задач определяет соответствующая структурная информация I s, являющаяся системой ограничений, которые выделяют из M * подмножество допустимых для задачи отображений M[ I s ]. Прецедентные ограничения, то есть наборы пар вида (( I i, I 1 ),..., ( I iq, I q )), сопровождаемые требованием A( I ik ) = I k при k {1,..., q}, являются характерной частью структурной информации в рассматриваемых задачах. Кроме того, структурная информация может содержать и дополнительные ограничения на вид отображений, реализуемых корректными алгоритмами. Член-корреспондент РАН К.В. Рудаков предложил рассматривать прецедентные и дополнительные ограничения как абсолютно равноправные части структурной информации. Прецедентные и дополнительные к ним ограничения имеют принципиально важное отличие:

рассматривая алгоритм как «чёрный ящик» можно легко проверить, удовлетворяет ли он прецедентным ограничениям, однако осуществить такую проверку для дополнительных ограничений обычно невозможно.

В рамках алгебраического подхода преимущественно используется понятие регулярности, которое является обобщением понятия разрешимости.

Это обусловлено, прежде всего, тем, что объектами теоретического исследования являются не отдельные задачи, а классы в некотором смысле однородных задач. При таком подходе возможно из факта принадлежности конкретной задачи определённому классу делать выводы о её разрешимости методами, разработанными для данного класса задач. Другими словами, проблема регулярности задач синтеза корректных алгоритмов является обобщением проблемы разрешимости.

Пусть имеется разбиение множества Z изучаемых задач с общей системой универсальных ограничений на классы эквивалентности по некоторому отношению « »: Z1 Z 2 если задачи Z1 и Z 2 неразличимы в момент выбора и анализа модели алгоритмов.

Задача Z из множества Z называется регулярной, если она разрешима и разрешимы все задачи из класса эквивалентности по отношению « », в который она входит.

Задача Z из множества Z называется полной относительно семейства M отображений из Ii в I f, если в M содержатся допустимые отображения для всех задач из класса эквивалентности, содержащего Z ;

задача Z называется регулярной, если для нее существует семейство отображений M, относительно которого она полна.

Так как подклассы регулярных задач обычно меньше классов разрешимых задач, то требование полноты является более мягким, чем требование разрешимости для всех в принципе разрешимых задач, поэтому синтез полных моделей алгоритмов – как правило, более реальная на практике задача, нежели построение моделей для решения всех разрешимых задач.

Во второй главе ставится задача выделения трендов временных рядов, производится формализация этого класса задач, описываются методы их решения, доказывается полнота некоторых моделей алгоритмов.

В основу исследования были положены принципы алгебраического подхода к синтезу корректных алгоритмов выделения трендов с использованием теории задач с теоретико-множественными ограничениями.

Необходимо отметить, что решение задачи выделения трендов некоторого временного ряда достаточно сильно зависит от мнения эксперта и поэтому, как правило, не имеет единственного решения. Следовательно, представляется рациональным рассматривать алгоритмы выделения трендов, настраиваемых на определённый тип анализа.

В соответствии с теорией, изложенной в работах Ю.В. Чеховича, рассмотрим конечные наборы точек на плоскости S (v,t )R. Конечной S d = ( S 1,..., S d ) = ((t1, v1),..., (t d, v d )), где t R, v R, d 1. При этом значения t i, i = 1,..., d таковы, что t i < t i +1, либо t i t i +1, и если t i = t i +1, то v i < v i +1. В случае строгого неравенства будем называть конфигурацию однозначной, во втором случае – неоднозначной. Множество всех однозначных конфигураций определим как K = K d, а множество неоднозначных как K = K d. Очевидно, что K K. Мощностью конфигурации будем называть количество её точек.

Словарём разметки или множеством меток называется конечное множество M = {µ,..., µ r }, r 1.

Расширенным множеством меток или расширенным словарём разметки называется множество M = M {}, M, где - специальная метка, означающая «не размечено».

Например, разметка может быть такой: M = {min, max, down, up, plt}, где «min» - метка для обозначения точки минимума, «max» - точки максимума, «down» - точки убывания, «up» - точки возрастания, «plt» - точки плато.

Размеченным объектом называется пара ( S, µ ), где µ M.

Размеченной конфигурацией называется пара ( S d, µ d ), где S d K d для неоднозначной и S d K d для однозначной конфигураций, а µ d M d.

µ d называется разметкой или полной разметкой конфигурации S d. Если разметка µ d при этом называется частичной разметкой конфигурацией, конфигурации S d.

Алгоритмом разметки называется всякий алгоритм A, реализующий отображение A : C M такое, что для любого d 1 верно A( S d ) = µ d, где Аксиомами или правилами разметки называется набор = {,..., } эффективно вычислимых предикатов: : ( K d M d ) {0,1}.

Пусть фиксирована система аксиом разметки = {,..., }. Разметка µ d называется подходящей для S d, если ( S d, µ d ) = 1. Частичная разметка µ d M d называется подходящей для S d тогда и только тогда, когда существует полная подходящая разметка µ d, являющаяся продолжением µ d.

Система аксиом разметки = {,..., } является непротиворечивой тогда и только тогда, когда выполнено следующее условие:

мере одна конфигурация, для которой существует подходящая разметка.

Система аксиом разметки = {,..., } является независимой тогда и системы любой аксиомы существует хотя бы одна конфигурация и существует разметка этой конфигурации, являющаяся подходящей в смысле усеченного набора аксиом и неподходящей в смысле исходного набора.

Система аксиом разметки = {,..., } называется покрывающей тогда и только тогда, когда выполнено следующее условие:

S d µ d : ( S d, µ d ) = 1, то есть когда для любой конфигурации существует хотя бы одна подходящая разметка.

H = {( S i, µ i ) : S i K i ; µ i M i ; i = 1,..., q} называется набором прецедентов.

Задача Z выделения трендов заключается в синтезе подходящего алгоритма A, такого, что при всех i = 1,..., q полная разметка A( S i ) является продолжением разметки µ i, или, иначе говоря, такого, что выполнено условие:

Из того, что алгоритм A подходящий следует, что для всех i = A( S i ) выполнено условие: ( S i, i ) = 1.

Алгоритм A, удовлетворяющий условию (1) будем называть корректным для задачи Z.

Задача выделения трендов Z называется разрешимой тогда и только тогда, когда для нее существует подходящий корректный алгоритм A.

В данной главе рассматривается задача синтеза корректного алгоритма для разметки произвольных конфигураций. Для неё разработана сплитмодель, позволяющая практически решать задачу выделения трендов. Данная модель содержит в себе два параметрических семейства алгоритмов Al и Для проведения одной из серий экспериментов, которая будет описана ниже, был зафиксирован словарь разметки M = {min, max, non} и система из четырёх аксиом:

Первое параметрическое семейство алгоритмов Al является однопараметрическим с параметром, в результате его работы формируется новая конфигурация, полученная «вычёркиванием» некоторых точек исходной, это можно представить в виде ломаной с вершиной в некоторых точках конфигурации. Семейство устроено следующим образом:

1) фиксируется стартовая точка с индексом i = 1, она же отмечается как первая вершина ломаной;

2) задаётся k (начальное значение равно 2), через точки конфигурации с индексами i и i + k проводится прямая l ;

3) вычисляются расстояния d, где i < j < i + k, от точек с индексами j до прямой l ;

4) если все d, то k увеличивается на единицу и осуществляется переход к пункту 2, если в конфигурации остались нерассмотренные точки;

5) если хотя бы одно d >, то новой стартовой точкой становится точка с индексом i + k 1, она теперь рассматривается как точка с индексом i , она же отмечается как очередная вершина ломаной, k присваивается его начальное значение и осуществляется переход к пункту 2, если в конфигурации остались нерассмотренные точки;

6) последняя точка конфигурации отмечается как очередная вершина ломаной;

7) точки конфигурации, которые являются вершинами ломаной, размечаются в соответствии с их взаимным расположением, то есть, если «max», всем остальным точкам присваивается метка «non».

Второе параметрическое семейство A w имеет несколько параметров:

,,,...,, r 1, в рассматриваемом ниже случае r = 3 (по количеству меток в словаре разметки). Данное семейство устроено следующим образом:

1) для каждой точки конфигурации формируется вектор mi размерности, который будет заполняться значениями в процессе работы алгоритма;

фиксируется первых идущих подряд точек конфигурации;

среди зафиксированных точек проводится поиск минимума и максимума;

для найденных минимума и максимума в соответствующие векторы m добавляются метки «min» и «max», для остальных точек в векторы m добавляются метки «non»;

происходит смещение «окна» выделенных точек на точек вправо, если в конфигурации ещё остались нерассмотренные точки, таким образом, фиксируются очередные точек, осуществляется переход после того, как все точки конфигурации рассмотрены, и векторы m заполнены значениями меток, производится вычисление значений координат векторов w размерности 3 (по количеству меток в словаре разметки), которые сформированы для каждой точки конфигурации, по следующей схеме: первая координата – это произведение и количества меток «min» в соответствующем по индексу векторе mi, вторая – произведение и количества меток «max» и так далее.

7) в каждом векторе wi производится поиск максимального значения координаты и в соответствии с этим каждой точке конфигурации присваивается метка, т.е. если наибольшее значение имеет первая координата вектора w, то соответствующая точка размечается как «min», если наибольшее значение имеет вторая координата, то соответствующая точка размечается как «max» и так далее.

На основании вышеизложенного материала разработана компьютерная программа. В качестве входных данных используются наборы прецедентов, то есть КПК и разметки этих конфигураций экспертом, выходными данными является разметка алгоритма и некоторая статистическая информация. Схема работы этой программы приведена в рассматриваемой главе.

В соответствии с теорией, разработанной К.В. Рудаковым и Ю.В.

Чеховичем, в данной главе рассмотрены требования к семействам алгоритмов, выполнение которых обеспечивало бы полноту этих семейств.

формализации понятия теоретико-множественных ограничений.

Пусть I i – произвольный элемент пространства Ii. Положим значений корректных алгоритмов для начальной информации I i.

Определение 2.3.1. Множество Определение 2.3.2. Модель M называется -полной, если выполнены условия (2) и (3):

Определение 2.3.3. Семейство решающих правил M1 называется -полным, если существуют модель алгоритмических операторов M 0 и семейство Определение 2.3.4. При фиксированном -полном семействе решающих правил M1 семейство корректирующих операций F называется M1 полным, если существует модель алгоритмических операторов M 0 такая, Определение 2.3.5. При фиксированных -полном семействе решающих правил M1 и M1 -полном семействе корректирующих операций F модель алгоритмических операторов M 0 называется F M1 -полной, где при любом p из N 0 выполнено соотношение M1 {C C : I e I f }.

При этом для любого X I e оказывается, естественно, выполненным условие Определение 2.3.6. Пусть p N 0. Для произвольного I i из Ii множеством p (M1, I i ) называется пересечение в p -ой декартовой степени пространства решающих правил арности p :

Определение 2.3.7. Пусть p N 0. Для семейства M1 и элемента I i пространства Ii подмножество X ( I i ) пространства оценок I e называется допустимой p -проекцией, если выполнены условия (5) и (6):

Множество всех допустимых элемента I i обозначим p (M1, I i ).

Для произвольного I i из Ii введем множество (M1, I i ) функций выбора допустимых проекций:

где B(I e ) – множество всех подмножеств множества I e.

Для каждой функции выбора допустимых проекций из (M1, I i ) На приведённых выше определениях К.В. Рудакова и Ю.В. Чеховича базируются две предложенные ими следующие теоремы.

Теорема 2.3.1. При всех I i из Ii выполнено соотношение (7):

Теорема 2.3.2. (Критерий -полноты для семейств решающих правил).

Для -полноты семейства решающих правил M1 необходимо и достаточно, чтобы при любом I i из Ii было выполнено условие (8):

Далее во второй главе диссертации приведены определения и теоремы, сформулированные и доказанные автором данного исследования.

Рассмотрены так называемые фильтрующие алгоритмы выделения трендов временных рядов. Далее подразумевается использование словаря разметки {min, max, non}.

Определение 2.4.1. Назовём алгоритм разметки A фильтрующим с параметром, если результатом его работы является новая КПК S l и множество индексов Ind d.

Для фильтрующего алгоритма A имеем следующее (определение 2.3.6):

Теорема 2.4.1. Для A верно, что C (C 1 ( ( I i ))) = ( I i ).

Определение 2.4.2. Назовём алгоритм A (t ) фильтрующим с переменным параметром, если этот алгоритм является фильтрующим по определению 2.4.1 и использует новый параметр на каждой итерации.

Теорема 2.4.2. Семейство алгоритмов { A (t ) } полно.

В третьей главе диссертации проводится экспериментальное исследование методов синтеза алгоритмов выделения трендов, даётся описание проведённых экспериментов.

В этой главе рассматриваются результаты работы нашей программы на пяти различных КПК. Данные для конфигураций – курсы валют, опубликованные Центробанком РФ.

Далее во всех случаях под верной разметкой точки конфигурации алгоритмом подразумевается, что алгоритм разметил точку так же, как эксперт. В том случае, если эксперт не разметил точку конфигурации, то любая её разметка алгоритмом считается верной, если она удовлетворяет аксиомам разметки.

Первая КПК:

Первый базовый алгоритм верно разметил 84 из 96 точек КПК, функционал качества второго алгоритма, рассмотренный в пункте 5 описания параметрического семейства A w, равен 18,8, результат работы третьего результирующего алгоритма 89 из 96 верно размеченных точек, = 0,05.

Улучшение качества работы алгебраической композиции алгоритмов относительно первого базового здесь составляет 5,21%.

Вторая КПК:

Первый базовый алгоритм верно разметил 270 из 285 точек КПК, функционал качества второго алгоритма, рассмотренный в пункте 5 описания параметрического семейства A w, равен 26,5, результат работы третьего результирующего алгоритма 273 из 285 верно размеченных точек, = 0,55.

Улучшение качества работы алгебраической композиции алгоритмов относительно первого базового здесь составляет 1,05%.

Третья КПК:

Первый базовый алгоритм верно разметил 78 из 87 точек КПК, функционал качества второго алгоритма, рассмотренный в пункте 5 описания параметрического семейства A w, равен 14,6, результат работы третьего результирующего алгоритма 83 из 87 верно размеченных точек, = 0,05.

Улучшение качества работы алгебраической композиции алгоритмов относительно первого базового здесь составляет 5,74%.

Далее рассмотрим результаты экспериментов, полученные на наборах прецедентов, каждый из которых состоит из двух КПК.

Первый набор:

Первый базовый алгоритм верно разметил 159 из 183 точек набора, функционал качества второго алгоритма, рассмотренный в пункте 5 описания параметрического семейства A w, равен 30,5, результат работы третьего результирующего алгоритма 175 из 183 верно размеченных точек, = 0,35.

Улучшение качества работы алгебраической композиции алгоритмов относительно первого базового здесь составляет 8,74%.

Второй набор:

Первый базовый алгоритм верно разметил 652 из 719 точек набора, функционал качества второго алгоритма, рассмотренный в пункте 5 описания параметрического семейства A w, равен 89,8, результат работы третьего результирующего алгоритма 702 из 719 верно размеченных точек, = 0,15.

Улучшение качества работы алгебраической композиции алгоритмов относительно первого базового здесь составляет 6,95%.

Проведённые эксперименты показывают, что улучшение качества работы алгебраической композиции относительно первого базового алгоритма (отметим, что аналогичное улучшение наблюдается и относительно второго базового алгоритма) не зависит от размера КПК или их набора, а также от характера действий эксперта при их разметке (при условии, что разметка корректна с точки зрения используемых аксиом). Это позволяет говорить о получении стабильных результатов в контексте задачи синтеза обучаемых алгоритмов выделения трендов временных рядов.

Далее в этой главе рассматривается работа экспериментальной программы в схемах и графиках.

В заключении диссертации приведены основные результаты, полученные в работе.

В приложение вынесен исходный текст экспериментальной программы, разработанной автором диссертации и описанной во второй главе реферируемой работы.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

Построены эффективные в рамках рассматриваемого класса задач выделения трендов временных рядов параметрические семейства алгоритмических операторов, решающих правил и корректирующих операций.

Изложены требования к семействам алгоритмов, выполнение которых обеспечивает их полноту, доказаны теоремы о полноте.

Разработана сплит-модель, позволяющая практически решать задачу выделения трендов.

Разработана программа для синтеза обучаемых алгоритмов выделения трендов временных рядов на основе предложенной модели, описан принцип её работы.

Описаны серии проведённых экспериментов с использованием разработанной программы, на схемах подробно представлены принципы её работы. Сделаны выводы о результатах экспериментов.

Основное содержание диссертации отражено в работах:

1. Sarapas V.V. Experimental Study of Synthesis Methods of Algorithms of Trends Allocation. // Pattern Recognition and Image Analysis. A Journal of Russian Academy of Sciences. City of Dover: Pleiades Publishing, c/o МАИК «Наука / Interperiodica», 2010. Vol. 20. №2. P.

2. Сарапас В.В. Параметрические семейства алгоритмических операторов для решения задач выделения трендов. // Высокие технологии, международной научно-практической конференции. Санкт-Петербург:

Изд-во Политехнического университета, 2010. Т. 3. С. 124 – 125. – 0, 3. Сарапас В.В. О классификации элементов временных рядов. // Математика, информатика, физика и их преподавание. М.: МПГУ, 2009. С. 163 – 164. – 0,2 п.л.

4. Сарапас В.В. Алгебраический подход к задаче выделения трендов временных рядов. // Молодежь и наука XXI века. Материалы XI Всероссийской научно-практической конференции студентов, аспирантов и молодых учёных с международным участием.

Красноярск: Изд-во КГПУ, 2010. Т. 1. С. 229 – 233. – 0,5 п.л.

5. Сарапас В.В. Об алгебраических методах синтеза алгоритмов выделения трендов временных рядов. // Наука и современность – 2010.

Сборник материалов II Международной научно-практической конференции. Новосибирск: Изд-во «СИБПРИНТ», 2010. Ч. 3. С. 77 – 82. – 0,5 п.л.





Похожие работы:

«УДК 519.68; 681.513.7; 612.8.001.57; 007.51/.52 ЛОБИВ Игорь Васильевич ПРОГРАММНЫЕ СИСТЕМЫ ДЛЯ ИДЕНТИФИКАЦИИ И ЛОКАЛИЗАЦИИ ОБЪЕКТОВ В ИЗОБРАЖЕНИЯХ 05.13.11 – математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико математических наук Красноярск 2004 Работа выполнена в Институте систем информатики СО РАН Научный руководитель : Мурзин Федор Александрович, кандидат физико...»

«САГДЕЕВ МАРАТ НАИЛЕВИЧ РАЗРАБОТКА ТЕХНОЛОГИИ ПРОИЗВОДСТВА МЕХОВОЙ ОВЧИНЫ ОБЛАДАЮЩЕЙ АНТИСТАТИЧЕСКИМИ СВОЙСТВАМИ С ПРИМЕНЕНИЕМ ВЧ ПЛАЗМЫ 05.19.05 – Технология кожи и меха АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Казань – 2009 Работа выполнена на кафедре плазмохимических и нанотехнологий высокомолекулярных материалов Казанского государственного технологического университета Научный руководитель : доктор технических наук, профессор Абдуллин...»

«МОСКАЛЕНКО ДАРЬЯ НИКОЛАЕВНА ФЕНОМЕН СВОБОДЫ В СОЦИОКУЛЬТУРНОМ ПРОСТРАНСТВЕ ТРАНСФОРМИРУЮЩЕГОСЯ ОБЩЕСТВА 09.00.11 – Социальная философия АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата философских наук Ставрополь – 2014 Работа выполнена в федеральном государственном бюджетном образовательном учреждении высшего профессионального образования Пятигорский государственный лингвистический университет Научный руководитель : доктор философских наук, профессор Волова...»

«ЯКОВЛЕВ Александр Александрович ПРАВОВОЕ РЕГУЛИРОВАНИЕ ВОПРОСОВ ГРАЖДАНСТВА: СООТНОШЕНИЕ МЕЖДУНАРОДНОГО ПРАВА И ПРАВА РОССИЙСКОЙ ФЕДЕРАЦИИ Специальность 12.00.10 Международное право. Европейское право АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата юридических наук г. Казань 2003 Работа выполнена на кафедре международного права Института государства и права Тюменского государственного университета Научный руководитель : доктор юридических наук, профессор...»

«КОЗЛОВ ДМИТРИЙ ИГОРЕВИЧ СОВЕРШЕНСТВОВАНИЕ МЕТОДОВ ДИАГНОСТИРОВАНИЯ И НАНЕСЕНИЯ ПОЛИУРЕТАНОВЫХ ПОКРЫТИЙ НА ТРУБНЫЕ УЗЛЫ СЛОЖНОЙ КОНФИГУРАЦИИ Специальность – 25.00.19 – Строительство и эксплуатация нефтегазопроводов, баз и хранилищ АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Ухта – 2014 Работа выполнена на кафедре Проектирование и эксплуатация магистральных газонефтепроводов ФГБОУ ВПО Ухтинский государственный технический университет Научный...»

«Михаев Иван Михайлович СОЦИАЛЬНЫЕ УСЛОВИЯ ИЗМЕНЕНИЯ КАЧЕСТВА ТРУДОВЫХ РЕСУРСОВ НА СОВРЕМЕННОМ ЭТАПЕ В ПРИМОРСКОМ КРАЕ Специальность 22.00.04 – Социальная структура, социальные институты и процессы Автореферат диссертации на соискание ученой степени кандидата социологических наук Хабаровск – 2009 1 Работа выполнена в Государственном образовательном учреждении высшего профессионального образования Тихоокеанский государственный университет. Научный руководитель кандидат...»

«Чистяков Иван Владимирович Результаты нерадикальных оперативных вмешательств при немелкоклеточном раке легкого 14.01.17 – хирургия 14.01.12 – онкология АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата медицинских наук Санкт-Петербург 2012 г. Работа выполнена на кафедре госпитальной хирургии №1 и НИИ пульмонологии Государственного бюджетного образовательного учреждения высшего профессионального образования Санкт-Петербургский государственный медицинский...»

«Семикина Светлана Александровна ЭФФЕКТИВНОСТЬ АКТОВ АРБИТРАЖНЫХ СУДОВ 12.00.15 – гражданский процесс; арбитражный процесс АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата юридических наук Саратов – 2011 2 Работа выполнена в Государственном образовательном учреждении высшего профессионального образования Саратовская государственная академия права доктор юридических наук, профессор Научный руководитель : Григорьева Тамара Александровна доктор юридических наук,...»

«Лукашевич Дмитрий Александрович Распад СССР: историко-правовое исследование Специальность 12.00.01 – теория и история права и государства; история учений о праве и государстве Автореферат диссертации на соискание ученой степени кандидата юридических наук Москва – 2013 Диссертация выполнена в Московском государственном университете имени М.В. Ломоносова (юридический факультет) Научный руководитель : доктор юридических наук, профессор Новицкая Татьяна Евгеньевна Официальные...»

«КРИВОВА НАДЕЖДА РАШИТОВНА РАЗРАБОТКА И ИССЛЕДОВАНИЕ СИСТЕМЫ ЭКСПЛУАТАЦИИ КОЛЛЕКТОРОВ МНОГОПЛАСТОВЫХ МЕСТОРОЖДЕНИЙ С РАЗРЫВНЫМИ НАРУШЕНИЯМИ Специальность 25.00.17 – Разработка и эксплуатация нефтяных и газовых месторождений Автореферат диссертации на соискание ученой степени кандидата технических наук Тюмень – 2009 2 Работа выполнена в Государственном образовательном учреждении высшего профессионального образования Тюменский государственный нефтегазовый университет (ТюмГНГУ)...»

«НАУМОВ АЛЕКСАНДР ВИКТОРОВИЧ МЕЖМОЛЕКУЛЯРНЫЕ ВЗАИМОДЕЙСТВИЯ В МЕТАЛЛСОДЕРЖАЩИХ ПОЛИИЗОЦИАНАТАХ И ПОЛИУРЕТАНАХ 02.00.06–Высокомолекулярные соединения АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата химических наук Казань-2009 Работа выполнена в Государственном образовательном учреждении высшего профессионального образования Казанский государственный технологический университет (ГОУ ВПО КГТУ) доктор химических наук, профессор Научный руководитель : Давлетбаева...»

«АЛЬ-НОЗЕЙЛИ ХАЛЕД АЛИ САЛЕХ ОБОСНОВАНИЕ КЛИНИКО-ТАКТИЧЕСКИХ МЕРОПРИЯТИЙ ПРИ СПЕЦИАЛИЗИРОВАНОЙ ПОМОЩИ РАНЕНЫМ С ОГНЕСТРЕЛЬНЫМИ (ПУЛЕВЫМИ) ПЕРЕЛОМАМИ БЕДРА И ГОЛЕНИ 14.01.15 – Травматология и ортопедия АВТОРЕФЕРАТ диссертации на соискание учёной степени кандидата медицинских наук Москва – 2011 Работа выполнена в Государственном образовательном учреждении высшего профессионального образования Ростовский государственный медицинский университет Федерального агентства по...»

«ГАВРИЛОВ АНДРЕЙ СТАНИСЛАВОВИЧ Методологические аспекты оптимизации биосинтеза субстанций и конструирования составов твердых лекарственных форм 15.00.01–Технология лекарств и организация фармацевтического дела АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора фармацевтических наук Пермь, 2004 год 2 Работа...»

«СТРЕЛЕЦКИЙ Александр Владимирович ГЕОМЕХАНИЧЕСКОЕ ОБОСНОВАНИЕ УСТОЙЧИВОСТИ ГОРНЫХ ВЫРАБОТОК ПОД ЗАЩИТНЫМ ПЕРЕКРЫТИЕМ (НА ПРИМЕРЕ ЯКОВЛЕВСКОГО РУДНИКА) Специальность 25.00.20 – Геомеханика, разрушение горных пород, рудничная аэрогазодинамика и горная теплофизика Автореферат диссертации на соискание ученой степени кандидата технических наук Санкт–Петербург - 2013 Работа выполнена в федеральном государственном бюджетном образовательном учреждении высшего профессионального...»

«ГОНЧАРОВ Денис Викторович РЕЗОНАНСНЫЙ ТРАНСПОРТ ТОКА В СВЕРХПРОВОДЯЩИХ ПЕРЕХОДАХ Специальность 01.04.04 – физическая электроника АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук Mосква – 2005 г. Работа выполнена в Отделе микроэлектроники Научно-исследовательского института ядерной физики им Д. В....»

«Лощинина Юлия Николаевна Изучение особенностей течения и лечения гастроэзофагеальной рефлюксной болезни у лиц молодого возраста. 14.00.05 – Внутренние болезни автореферат диссертации на соискание ученой степени кандидата медицинских наук МОСКВА 2009 Работа выполнена на кафедре гастроэнтерологии Федерального Государственного Учреждения Учебнонаучный медицинский центр Управления делами Президента Российской Федерации Научный руководитель : Доктор медицинских наук, Минушкин Олег...»

«Бубенчиков Антон Анатольевич РАСЧЕТ ТЕМПЕРАТУРЫ И ПОТЕРЬ ЭЛЕКТРИЧЕСКОЙ ЭНЕРГИИ В САМОНЕСУЩИХ ИЗОЛИРОВАННЫХ ПРОВОДАХ ВОЗДУШНЫХ ЛИНИЙ ЭЛЕКТРОПЕРЕДАЧИ ЭЛЕКТРОЭНЕРГЕТИЧЕСКИХ СИСТЕМ Специальность 05.14.02 – Электрические станции и электроэнергетические системы АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук ОМСК 2012 Работа выполнена в Федеральном бюджетном образовательном учреждении высшего профессионального образования Омский государственный...»

«БЕРЕГОВОЙ АНТОН НИКОЛАЕВИЧ УВЕЛИЧЕНИЕ СТЕПЕНИ НЕФТЕИЗВЛЕЧЕНИЯ ПОЛИМЕРНЫМИ И ЭМУЛЬСИОННЫМИ СОСТАВАМИ ПРИ ЗАВОДНЕНИИ ПЛАСТОВ Специальность 25.00.17 – Разработка и эксплуатация нефтяных и газовых месторождений АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Бугульма-2010 Работа выполнена в Татарском научно-исследовательском и проектном институте нефти (ТатНИПИнефть) ОАО Татнефть им. В. Д. Шашина. Научный руководитель доктор технических наук,...»

«Серых Данила Витальевич ВСЕРОССИЙСКИЕ АРХЕОЛОГИЧЕСКИЕ СЪЕЗДЫ КАК ФОРМА ОРГАНИЗАЦИИ ОТЕЧЕСТВЕННОЙ АРХЕОЛОГИЧЕСКОЙ НАУКИ во второй половине XIX – начале XX вв. Специальность – 07.00.06 – археология Автореферат диссертации на соискание ученой степени кандидата исторических наук Ижевск 2006 Работа выполнена в государственном образовательном учреждении высшего профессионального образования Самарский государственный университет Научный руководитель – кандидат исторических наук,...»

«КАЧАЛОВА ИННА ВЛАДИМИРОВНА ПРАВО СОБСТВЕННОСТИ И ИНЫЕ ВЕЩНЫЕ ПРАВА ГРАЖДАН НА ЖИЛЫЕ ПОМЕЩЕНИЯ Специальность 12.00.03 – гражданское право; предпринимательское право; семейное право; международное частное право Автореферат диссертации на соискание ученой степени кандидата юридических наук Москва – 2006 Работа выполнена в Московском государственном университете имени М.В. Ломоносова (юридический факультет). - доктор юридических наук, доцент Научный руководитель Белов Вадим...»






 
2014 www.av.disus.ru - «Бесплатная электронная библиотека - Авторефераты, Диссертации, Монографии, Программы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.