Отзыв официального оппонента
на диссертацию Соловьева Анатолия Александровича «Методы распознавания аномальных событий
на временных рядах в анализе геофизических наблюдений» по специальности 25.00.10 – Геофизика,
геофизические методы поисков полезных ископаемых
на соискание ученой степени доктора физико-математических наук
Актуальность исследований. Объект и предмет исследований. Информационная революция, свидетелями которой мы являемся в настоящее время, ставит на повестку дня новые остро необходимые задачи обработки и анализа в реальном времени стремительно растущего потока данных измерений различного характера. Именно поэтому квалификационная работа А.А. Соловьева безусловно актуальна, поскольку объектом исследований является поток геофизических измерений разной природы, а предметом анализа таких наблюдений избран поиск аномалий естественного и техногенного происхождения.
Работа соответствует государственным программам Российской Федерации, а также целям и задачам международных проектов, направленным на формализованное и автоматизированное извлечение полезной геофизической информации. При этом часть работ, вошедших в диссертацию, проводилась при поддержке Программы фундаментальных исследований ОНЗ РАН № 7, грантов РФФИ, Программы сотрудничества между ИФЗ РАН и Парижским институтом физики Земли, Программы сотрудничества под эгидой GEOSS.
Цель и задачи исследований. Пожалуй главной целью представленной работы является развитие и алгоритмизация математических методов анализа потока измерений на примере временных рядов геомагнитных и других наблюдений, доступных для мониторинга геофизических полей в реальном времени. При этом теоретическим вопросам и практическим задачам обнаружения анамалий регистрации и распознавания экстремальных природных явлений в диссертации уделяется особое внимание. Проблема научно-состоятельного описания, классификации и поиска предвестников экстремальных событий рассматривается с позиций принципиального нового теоретического инструментария «нечёткой» математики. Такой подход позволил диссертанту полностью реализовать поставленные задачи и, в частности, получить достоверные результаты при анализе минутных, секундных и полусекундных магнитограмм, зарегистрированных наземными обсерваториями и искусственными спутниками Земли, которые уже нашли применение в практике работы межрегионального центра российско-украинского сегмента сети ИНТЕРМАГНЕТ. Причём, созданная автоматизированная система для распознавания техногенных аномальных событий в геомагнитных измерениях по эффективности и точности превосходит соответствующие алгоритмы, которые применяются в рамках стандарта программы ИНТЕРМАГНЕТ. Защищаемые положения диссертационной работы А.А. Соловьева научно-состоятельны, а её результаты докладывались на многих всероссийских и международных конференциях.
Автореферат соответствует содержанию диссертации и отражает ее в основных положениях, которые опубликованы (в том числе в рецензируемых научных изданиях).
Значимость полученных результатов для науки в целом определяется универсальностью подхода к решению практических задач проблемы поиска аномалий естественного и техногенного происхождения. Полученные А.А. Соловьевым теоретические результаты и разработанная на их основе методология практического применения очевидно не ограничена примерами, рассмотренными в диссертации, и может широко использоваться во многих областях естествознания.
Диссертация содержит 310 страниц машинописного текста, включая 132 иллюстрации и таблицу, состоит из введения, шести глав, заключения, четырех приложений и списка литературы из 163 наименований. По теме диссертации опубликованы 30 научных работ А.А. Соловьева с соавторами, из них 20 статей в изданиях, рекомендованных ВАК РФ. А.А. Соловьев имеет свидетельства о государственной регистрации программ для ЭВМ, которые использовались в работе и позволяют распознать выбросы и сгущения значений в потоке измерений.
Во Введении диссертантом дается краткая характеристика выполненной работы, раскрываются актуальность исследований, новизна предлагаемых решений, личный вклад автора и положения, выносимые на защиту.
В Главе 1 автором дается краткий исторический обзор и современное состояние проблемы распознавания аномальных событий во временных рядах измерений физических полей. В частности, довольно подробно описаны системы обнаружения сейсмических сигналов и статистические методы выделения аномалий в потоке измерений, возможности вейвлет-анализа как альтернативы использованию преобразования Фурье и нейронные сети как инструмент моделирования и прогнозирования временных рядов, а также современная система наблюдений за магнитным полем Земли ИНТЕРМАГНЕТ, принципы её работы и динамика территориального покрытия Земли с момента образования сети по настоящее время. Особое внимание в Главе уделено Российскому сегменту и возможностям его пополнения новыми обсерваториями и технологиями сбора и использования геомагнитных наблюдений, в том числе, для обнаружения быстрых вариаций внешнего происхождения, столь необходимых в космофизике и мониторинге «космической погоды». Наряду с обзором существующих индексов геомагнитной активности, даётся история наблюдений и исследования цунами, включая Российскую службу предупреждения, систему DART и возможности прогнозирования на основе раннего предупреждения о землетрясении. В завершение Главы формулируются обоснование и постановка задач диссертации, изложение которых во многом (а местами дословно) повторяет текст Введения.
В Главе 2 детально излагаются основные определения и элементы теории нечётких множеств, операции над ними, бинарные отношения и принципы дискретного математического анализа, ДМА.
Даётся описание используемых в работе алгоритмов распознавания выбросов (SP и SPs), скачков (JM) и прогнозирования цунами (RTFL) на основании нечётких множеств, неформальной логики и мер скачкообразности и аномальности, обильно иллюстрированное примерами обработки и анализа конкретных измерений. Приводятся краткие выводы, относящиеся к созданию эффективного и довольно универсального инструментария, позволяющего решать широкий круг задач, связанных с анализом временных рядов и распознаванием отраженных в них событий. Возможности разработанного метода ДМА проверены адаптированным использованием для распознавания аномальных событий на временных рядах магнитограмм, зарегистрированных на Земле и из космоса, и вариаций придонного давления воды, регистрируемых мировой сетью придонных датчиков гидростатического давления в открытом океане.
В Главе 3 приводятся результаты решения задачи распознавания аномальных событий техногенного происхождения алгоритмами дискретного математического анализа на магнитограммах, в том числе техногенных сбоев и выбросов на минутных магнитограммах (с частотой 1/60 Гц) системы ИНТЕРМАГНЕТ. Наряду с подробной формальной схемой обучения алгоритма SP в период пониженной геомагнитной активности даётся анализ результатов контрольных экспериментов, позволяющих оценить достоверность «внутреннего экзамена» отсутствием ошибок первого рода (типа «пропуск цели») и вероятностью ошибки второго рода (типа «ложная тревога») на уровне 2.5-5.5% в зависимости от детальности обучения. «Внешний (независимый) экзамен» алгоритма SP в период пониженной геомагнитной активности свидетельствует о вероятности ошибки первого рода на уровне 1% при вероятности ошибки второго рода в 9%, что следует признать успехом SP-диагностики техногенных сбоев и выбросов на минутных магнитограммах. Вероятности ошибок первого и второго рода для выборок в периоды повышенной магнитной активности ожидаемо выше и составили менее 0.2% и около 15%, соответственно, что свидетельствует об относительной универсальности и надёжности вычислительной схемы алгоритма SP. Технологический прорыв в наблюдениях магнитного поля Земли с частотою 1 Гц предопределило создание модификации алгоритма SP для работы с существенно возросшими массивами данных, SPs, и, ожидаемо, значительно большим числом выбросов. В результате многих итераций от «грубой» диагностики к всё более оптимальной удалось получить стабильные оценки «внутреннего экзамена» на уровне порядка 1.5% и 20% для вероятности ошибок первого и второго рода, соответственно. Любопытным является то обстоятельство, что результаты «внешнего экзамена», полученные на данных августа 2009 г. (вероятности 2% и менее 4%), выгодно отличаются от результатов, полученных на данных за июль 2009 г. (вероятности 11.8% и 12.7%), что свидетельствует об изменчивости эффективности диагностики выбросов по алгоритму SPs в разные периоды наблюдений. Автором довольно детально обсуждаются вопросы изменения эффективности и стабильности диагностики в случае использования отдельных компонент магнитного поля в качестве исходных данных. В конце Главы коротко приведены результаты использования модификации алгоритма SP при анализе магнитограмм с частотой 2 Гц со спутников GOES и сделаны выводы о том, что создание конкретной реализации дискретного анализа с помощью алгоритмов SP, его модификации SPs и JM могут помочь, а порой даже полностью заменить трудоёмкую работу специалистов на этапе предобработки, а также при определении и анализе выбросов на магнитограммах без потери эффективности распознавания при переходе к полуавтоматическому или полностью автоматическому режиму.
В Главе 4 описывается созданный при непосредственном и активном участии диссертанта российско-украинский центр геомагнитных данных на базе ГЦ РАН, который в настоящее время является ядром регионального сегмента ИНТЕРМАГНЕТ. Внедрение в работу центра автоматизированной алгоритмической системы предварительной обработки и контроля качества магнитных данных, построенной на базе алгоритмов SP, SPs и JM позволило оперативно осуществлять распознавание аномалий на магнитограммах с минимальным отставанием от режима реального мониторинга. Созданная база геомагнитных данных и реализованная система реляционного управления, обеспечивающая регистрацию, передачу и хранение данных в исходном и обработанном виде после автоматизированного распознавания техногенных аномалий в поступающем потоке данных, подготовку квазиокончательных данных, обеспечение интерактивного доступа к данным, визуализацию данных на видео-стенде значительно упростило доступ и возможности независимого анализа магнитограмм. Всё это выигрышно отличает созданный на базе ГЦ РАН центр в сравнении с зарубежными центрами геомагнитных данных. В двух последних разделах Главы приведены результаты решения задачи моделирования полной напряженности магнитного поля Земли на территории России в режиме, приближенном к реальному времени, и делаются выводы о том, что (i) создание центра геомагнитных данных на базе ГЦ РАН позволило объединить геомагнитные наблюдения России и Украины в единую межнациональную сеть, (ii) принятый оригинальный подход к хранению данных является важным преимуществом по сравнению с некоторыми официальными узлами сбора данных ИНТЕРМАГНЕТ и (iii) система реляционного управления обеспечивает более широкие возможности поиска, гибкость запросов любой сложности и высокое быстродействие их выполнения.
В Главе 5 диссертантом поставлена и решается задача распознавания магнитной активности методами ДМА с помощью нечёткой меры аномальности. Сразу заметим, что определение меры экстремальности (k) в алгоритме FLARS и вертикальной меры аномальности алгоритма FCARS (k) в Главе 2, а затем непоследовательное использование символа в параграфе «5.2. Апробация меры (t) оценки геомагнитной активности в реальном времени» для обозначения «вертикальной меры аномальности (t) (в дальнейшем просто мера аномальности)» может создать у читателя определённое замешательство или даже затруднение в понимании в общем-то простой математической конструкции.
Использование этой меры показало высокий уровень её соответствия классическим индексам геомагнитной активности (в частности, её корреляция с локальным трехчасовым индексом К оценена в 90%). Как справедливо замечено автором диссертации: «В общем случае мера (t) способна работать на минимальном промежутке времени, соответствующем временному шагу регистрации исходных данных», что является безусловным преимуществом в мониторинге быстро меняющегося магнитного поля Земли. На обильно иллюстрированных примерах анализа геомагнитных бурь продемонстрированы преимущества мониторинга геомагнитной активности с помощью меры аномальности в сравнении с классическими индексами. Действительно, анимация карт и гистограмм позволяют по-новому взглянуть на изучение и интерпретацию тонкой структуры и распределения геомагнитной активности в различных масштабах рассмотрения (от глобального до локального), что особенно привлекательно при анализе динамики изменения магнитного поля в высоких широтах.
В Главе 6 показаны возможности проблемно-ориентированных методов дискретного математического анализа в применении к распознаванию аномалий в данных, отличающихся от геомагнитных. А именно, даётся обоснование и формализованная постановка задачи распознавания сигналов P-волн и волн цунами по данным измерений системы DART-2. В Главе приводится описание оригинального разработанного для этой цели алгоритма RTFL и результаты его применения. По предварительной грубой оценке эффективности алгоритма в сравнении с результатами экспертного заключения вероятность пропуска цели составляет 5%, а вероятность ложной тревоги – 9.5%, что можно признать успехом реализации, очевидно, допускающей дальнейшее уточнение и оптимизацию.
В Заключении кратко суммированы основные результаты работы, к которым автор относит (i) создание на основе дискретного математического анализа нового оригинального метода распознавания и изучения аномальных событий на временных рядах различных геофизических измерений; (ii) разработку алгоритмов SP, SPs и JM, реализующих этот метод в виде автоматизированной системы, и формализацию критериев оценки эффективности результатов распознавания; (iii) создание и организацию работы российско-украинского регионального центра геомагнитных данных на базе ГЦ РАН, отличительной особенностью которого является внедрение автоматизированной системы распознавания техногенных аномалий, что существенно повышает достоверность магнитограмм в сравнении с другими центрами данных ИНТЕРМАГНЕТ; (iv) оригинальный новый метод мониторинга геомагнитной активности на основе данных всей сети станций ИНТЕРМАГНЕТ с использованием ДМА и ГИС-технологий; (v) реализацию в виде алгоритма RTFL распознавания аномальных событий по вариациям придонного давления воды, регистрируемых мировой сетью DART-2 в открытом океане, которое может служить основой для моделирования современных глобальных систем предупреждения о цунами.
Диссертация написана простым и ясным для понимания языком. Утверждения и выводы диссертанта научно-состоятельны. Изложение работы хорошо иллюстрировано и весьма убедительно как в своей теоретической части, изложенной с исключительной точностью математического языка, так и в представлении результатов исследований. К недостаткам работы можно отнести повторы некоторых формулировок и текстов, что, однако, служит дополнительным напоминанием об уже сказанном. Очевидно, что эти замечания не снижают общего положительного впечатления от диссертационной работы А.А. Соловьева.
Диссертация Соловьева Анатолия Александровича выполнена на актуальную тему, обладает научной новизной и содержит решения конкретных задач проблемы обработки и анализа в реальном