1
На правах рукописи
Дерябин Виктор Владимирович
ПОСТРОЕНИЕ МОДЕЛИ СЧИСЛЕНИЯ ПУТИ СУДНА
НА ОСНОВЕ НЕЙРОННОЙ СЕТИ
Специальность 05.22.19
«Эксплуатация водного транспорта, судовождение»
Автореферат
диссертации
на соискание учёной степени кандидата технических наук
Санкт-Петербург 2011 г.
2
Работа выполнена в федеральном государственном учреждении высшего профессионального образования «Государственная морская академия имени адмирала С.О Макарова» (ГМА им. адм. С.О. Макарова).
Научный руководитель: член-корреспондент РАН, доктор технических наук, профессор Сазонов Анатолий Ефимович
Официальные оппоненты: доктор технических наук Пелевин Александр Евгеньевич кандидат технических наук, доцент Афанасьев Борис Викторович
Ведущая организация: Институт проблем транспорта РАН
Защита состоится «17» октября_ 2011 года в 11 часов на заседании диссертационного совета Д 223.002.03 ГМА им. адм. С.О. Макарова по адресу: 199106, г. Санкт-Петербург, Косая линия, д.15а, ауд. 216.
С диссертацией можно ознакомиться в библиотеке ГМА им. адм. С.О.Макарова.
Автореферат разослан «» _ 2011 г.
Ученый секретарь диссертационного совета Д 223.002. кандидат технических наук, профессор Прокофьев В.А
Общая характеристика работы
Актуальность темы В последние двадцать лет в связи с появлением глобальных спутниковых навигационных систем («NAVSTAR», «ГЛОНАСС») интерес к изучению точности систем счисления пути судна заметно ослабел.
Одним из самых ранних исследований точности счисления, основанных на теории случайных процессов, можно назвать диссертацию Л.А. Земнухова. На основании обширного экспериментального материала – невязок счисления – для различных районов Мирового океана и разных типов судов, а также некоторых теоретических соображений автор приходит к выводу о зависимости СКП счислимых координат от режима движения судна и значений величин, характеризующих внешние факторы.
В диссертации В.И. Авраменко теоретически обосновывается и экспериментально подтверждается положение о том, что процесс изменения погрешности счисления во времени не приходится считать стационарным. Изменчивость невязок во времени зависит от изменения внешних факторов, действующих на судно. В исследовании также проводилась идентификация параметров системы в виде «судно - внешняя среда» на основе натурных наблюдений временных рядов невязок.
Задача определения координат места судна, в частности, полученных с использованием автономных навигационных систем, тесно связана с исследованием вопроса стабилизации судна на заданной траектории. В книге С.П. Дмитриева и А.Е.
Пелевина «Задачи навигации и управления при стабилизации судна на траектории»
рассматривается подход к решению задач управления с использованием моделей движения судов, в основе которых лежит система дифференциальных уравнений.
Как известно, спутниковые навигационные системы обладают рядом недостатков.
Среди них можно выделить неавтономность, невозможность использования в тех случаях, когда между спутниками системы и потребителем находится непрозрачная для радиоволн среда, значительный уровень шумов и возможные нарушения целостности системы.
Системы счисления пути судна могут оказаться единственными навигационными средствами определения координат в особых условиях, к которым можно отнести, например, боевые действия, при которых орбитальная группировка спутников будет уничтожена или произведена установка помех противником.
В случае наличия непрозрачной для радиоволн среды, автономные средства могут оказаться единственным источником навигационной информации.
Совместное использование информации от автономных и неавтономных навигационных систем также позволяет говорить о том, что такие системы обладают свойством целостности.
В связи с вышеизложенным, можно говорить об актуальности разработки алгоритмов обработки навигационной информации в системах счисления пути судна для повышения, во-первых, точности самих автономных систем, а, во-вторых, для улучшения целостности интегрированных навигационных систем, использующих информацию от спутниковых навигационных и автономных систем.
Процесс изменения погрешности счисления носит нелинейный характер.
Некоторые внешние факторы (например, параметры волнения) определяются с большими ошибками, что приводит к значительной неопределённости прогноза счислимых координат.
Нейронные сети обладают свойством нелинейности преобразования входного сиганала в выходной. Кроме того, использование их в условиях неопределённости может быть более эффективным по сравнению с существующими алгоритмами. Таким образом, задача прогноза счислимых координат при внешних воздействиях в полной мере соответствует этим двум условиям.
Цели и задачи исследования Основной задачей исследования является построение нейронной сети, прогнозирующей компоненты вектора относительной скорости центра тяжести судна в неподвижной географической системе координат при условии влияния ветра и волнения.
Объектом исследования является проверка способности синтезированной автором нейронной сети к прогнозу относительной скорости судна в неподвижной системе координат. При этом работа сети сравнивается с существующими алгоритмами, основанными на методах численного интегрирования дифференциальных уравнений.
Практическая значимость работы заключается в возможности использования нейросетевого алгоритма прогноза относительной скорости судна в существующих и проектируемых интегрированных навигационных системах.
Публикации. Основные положения диссертации изложены в четырёх печатных работах, опубликованных в изданиях, три из которых входят в перечень ВАК.
Научная новизна исследования заключается в следующем:
- осуществлено построение нейронной сети, прогнозирующей относительную скорость судна в условиях влияния внешних факторов - разработана методика обучения сети с использованием образцов, полученных в результате работы имитационной модели - произведено успешное обучение нейронной сети - предложена методика тестирования нейронной модели в отличие от работы имитационной модели Апробация результатов работы Основные результаты диссертационного исследования получили одобрение на научно-методических конференциях, конференциях профессорско-преподавательского состава ГМА им. адм. С.О.Макарова, заседании секции водного транспорта научного Совета по транспорту РАН. Также результаты работы были доложены на XIII Конференции молодых учёных «Навигация и управление движением». Созданная нейросетевая модель прогноза относительной скорости судна реализована в виде программного обеспечения в среде MATLAB 7.10.0. и принята к внедрению в учебный процесс по дисциплине «Автоматизация судовождения» на кафедре Автоматики и вычислительной техники ГМА им. адм. С.О.Макарова.
Структура диссертации диссертационного исследования изложены на 136 страницах, включая 24 рисунка. Список используемой литературы составляет 134 наименования.
В первой главе диссертации приводится краткий обзор технических средств счисления и существующих методов учёта внешних факторов.
Технические средства счисления определяют необходимость учёта тех или иных внешних факторов. В целях настоящей работы считается, что счисление пути ведётся на судне, оборудованном гирокомпасом и лагом, измеряющим продольную составляющую относительной скорости судна. В связи с этим необходимо учитывать ветер, волнение и течение как факторы, влияющие на точность определения текущего места судна.
Кроме того, инструментальные погрешности лага и гирокомпаса будут влиять на точность идентификации параметров модели судна, а также на точность прогноза относительной скорости в рабочем режиме нейронной модели. При моделировании псевдослучайных временных последовательностей указанных ошибок необходимо ориентироваться на предельные допустимые значения погрешностей, указанные, в частности, в резолюциях Международной Морской Организации.
Рассмотрены существующие методы учёта влияния ветра на точность счисления.
Данные методы можно условно разделить на две группы. К первой группе относятся навигационные способы, при которых угол дрейфа может быть измерен и принят к учёту в данный момент времени. Ко второй группе можно отнести расчётные методики определения угла дрейфа, основанные либо на результатах ранее проведённых статистических наблюдений (например, метод Н.Н. Матусевича), либо исходящие из информации, которая доступна a priori (например, способ С.И. Дёмина).
Перечисленные расчётные методы учитывают гидро- и аэродинамику конкретного судна, однако справедливы лишь для стационарного характера влияния ветра и не учитывают влияние волнения. Поэтому для построения имитационной модели скорости дрейфа судна эти методы, по нашему мнению, не вполне корректны.
Во второй главе анализируется погрешность определения счислимых координат места судна в условиях влияния внешних факторов.
Предлагается характеризовать точность значения некоторой приближённой величины границами её промежутка неопределённости, не учитывая при этом вид закона распределения этой величины. Если приближённая величина является функцией некоторого количества других приближённых величин, то возникает задача определения границ промежутка неопределённости этой величины, когда известны границы интервалов неопределённости независимых переменных. Приведён соответствующий алгоритм для класса дробно-рациональных функций на примере оценки точности решения системы двух линейных уравнений с двумя неизвестными. Указанный алгоритм применяется в дальнейшем при определении границ промежутков неопределённости коэффициентов дифференциального уравнения, прогнозирующего скорость дрейфа судна в условиях влияния внешних факторов.
Получены выражения для средних квадратических погрешностей (СКП) счислимых координат в их зависимости от величин внешних факторов. При этом производилась линеаризация СКП в точке математического ожидания величин, характеризующих внешние факторы, курса и скорости. Вид выражения СКП счислимых координат позволяет сделать вывод о том, что погрешность счисления зависит не только от СКП внешних факторов, курса и скорости, но и от математического ожидания этих величин, которые, в свою очередь, являются функциями времени. Следовательно, возможен нелинейный характер изменения СКП счислимого места.
При анализе методов оценки точности счислимых координат можно утверждать, что в настоящее время либо учитываются особенности конкретного района моря, либо нет. В первом случае необходимы априорные данные для конкретного района океана, которые находят отражение в соответствующем коэффициенте точности счисления.
Использование систем счисления в интегрированных навигационных системах (ИНС) оптимальных фильтров при обработке радионавигационных измерений. Корреляционная функция зависит от конкретного района моря, от характера воздействия внешних факторов и от физических параметров определённого судна.
В третьей главе рассматривается построение имитационной модели движения судна в условиях воздействия внешних факторов. Необходимость применения такой модели вызвана тем, что для обучения нейронной сети следует иметь достаточно полный набор образцов.
Для абсолютной скорости судна в неподвижной системе координат для некоторого момента плавания t справедливы соотношения:
где Vc - скорость судна по относительному лагу, dVc - погрешность определения относительной скорости, K c - курс судна по гирокомпасу, K - погрешность гирокомпаса,, - углы соответственно дифферента и крена судна, Voy1 - скорость дрейфа судна, Vт - скорость течения, K т - его направление.
Значения координат центра тяжести судна в той же системе координат получаем путём интегрирования соответствующих скоростей.
В выражении (1) скорость дрейфа судна Voy1 (t ) не подлежит измерению, поэтому возникает задача её оценки. Для этого необходимо рассмотреть дифференциальное уравнение, которое учитывает зависимость скорости дрейфа от внешних факторов.
Обращаясь к справочнику по теории корабля по редакцией Я.И. Войткунского, можно условиях воздействия внешних факторов может быть представлено в следующем виде:
где C Y, c 2 - коэффициенты, определяющие вязкостное трение; k11, k 22 - соответственно продольный и поперечный коэффициенты присоединённых масс; AL - приведённая парусности, A, - соответственно плотности атмосферного воздуха и воды, m -масса судна, Vox1 - продольная составляющая относительной скорости центра тяжести в системе координат, жёстко связанной с судном, Vr, r - скорость и курсовой угол кажущегося ветра соответственно, K - курс судна, FW - сила со стороны взволнованной поверхности моря, которая определяется следующим соотношением:
где h - высота волны, - её кажущийся период, при этом:
где - угол между направлением, противоположным бегу волн, и носовой частью диаметральной плоскости судна, - длина волны, T Tср - средняя осадка судна, L L - длина между перпендикулярами. Внутреннее интегрирование осуществляется в плоскости ватерлинии, внешнее - по осадке судна. При этом значения переменных интегрирования и ординаты y снимаются с теоретического чертежа.
Уравнение (2) носит название уравнение Риккати. Для его численного интегрирования в работе применяется метод ломаных Эйлера.
Если подводить итог относительно динамики судна, то можно сказать следующее:
1) подлежат учёту силы со стороны ветра и волнения (внешних факторов) 2) принимаются во внимание гидродинамические силы сопротивления инерционной и вязкостной (позиционные) природы 3) не учитываются силы, воздействующие на судно со стороны гребного винта и 4) не учитываются аэродинамические силы сопротивления Вводятся обозначения:
Значения коэффициентов k1,...,k 5 могут быть получены исходя из теоретических соображений. В работе производилось их уточнение с использованием алгоритма оптимизации «Global Search», входящего в состав среды MATLAB.
В качестве целевой функции выбираем сmax f (k1, k 2, k3, k 4, k5, Voy1 (0), V, K ) наибольшее значение модуля невязки на четырёхчасовом промежутке времени плавания по счислению. Начальные значения коэффициентов вычисляются из соображений теоретических. Применяя алгоритм получения промежутков неопределённости для дробно-рациональных функций, изложенный во второй главе, получаем границы начальной скорости дрейфа и инструментальных погрешностей лага и гирокомпаса также представляется возможным указать подобные границы.
Были проведены три натурных эксперимента для т/х «Инженер Плавинский» (в грузу).
В течение этих наблюдений на четырёхчасовом промежутке времени плавания фиксировались значения курса, скорости по лагу, истинных координат СНС «NAVSTAR»
(протокол NMEA-0183), внешних факторов (ветер, волнение и течение). Таким образом, имеется возможность вычисления максимума невязки для любого из опыта. Уточнение параметров производилось с использованием данных первого эксперимента.
Начальные и оптимальные значения параметров, а также диапазоны их возможных значений представлены в табл.1. Границы этих диапазонов были вычислены исходя из уточняемые коэффициенты.
Переменная Табл.1. Начальные и оптимальные значения переменных (система СИ) Получив уточнённый в ходе оптимизации вектор коэффициентов k1, k 2, k 3, k 4, k 5, теоретическими представлены в табл.2.
Табл.2. Максимумы модулей невязок теоретических и уточнённых траекторий Как следует из данной таблицы, для проведённых натурных наблюдений алгоритм глобальной оптимизации приводит к уточнению траекторий по сравнению с траекториями теоретическими.
Следует отметить, что и продольная составляющая относительной скорости Vox1 в действительности также является функцией внешних факторов, поэтому для построения дифференциальное уравнение для продольной скорости.
Таким образом, несмотря на расхождения координат, прогнозируемых при помощи имитационной модели, с координатами по GPS для трёх натурных наблюдений, можно считать, что данная модель отражает общую тенденцию движения координат центра тяжести судна в условиях воздействия внешних факторов и, следовательно, может быть использована в целях получения необходимого количества образцов для обучения нейронной сети.
В четвёртой главе излагается основное содержание работы: построение модели счисления на основе нейронной сети.
Предлагается использовать систему из двух нейронных сетей, прогнозирующую относительную скорость судна в неподвижной системе координат. Первая нейронная сеть (сеть №1) будет прогнозировать скорость дрейфа судна Voy1, а набор учебных данных будет формироваться в соответствии с уравнением Риккати (2). Вторая нейронная сеть (сеть №2) будет иметь входным сигналом величины, характеризующие кинематику судна, а на выходе – компоненты вектора относительной скорости судна в неподвижной системе координат. Общая схема системы представлена на рис.1.
Из теории нейронных сетей известно, что решение дифференциального уравнения (2) может быть представлено при помощи динамической нейронной сети, имеющей обратные связи. А точнее - нейронной сети, представляющей модель нелинейной авторегрессии с внешними входами (NARX). Определим сначала набор внешних входных сигналов X, необходимых для обучения сети №1.
скорость судна.
В качестве выходного сигнала выступает скорость дрейфа Y Voy1.
Поскольку сеть №1 является динамической, то определимся с числом в линиях единичных задержек. В нашем случае мы имеем дело с двумя линиями единичных задержек - по внешним входным величинам и по выходному сигналу, подаваемому по линии обратной связи на вход сети. Дискретность модели - 1 секунда. Число задержек для обеих линий выберем равным 15. Это означает, что сеть накапливает информацию о динамике системы за предыдущие 14 секунд, а выдаёт прогноз на 15-ую секунду. То есть нейронная сеть прогнозирует скорость дрейфа судна на шаг вперёд.
Теперь необходимо выбрать число слоёв и тип нейронов в них. Будем использовать двухслойную нейронную сеть. Первый слой содержит 15 нейронов с сигмоидальной функцией активации (рис. 2.), второй же слой состоит из одного нейрона, имеющего тождественную функцию активации. В системе MATLAB 7.10.0 необходимо создать объект класса «нейронная сеть». Общий вид нейросети представлен на рис.3.
Сеть №2 преобразует кинематические характеристики в компоненты относительной скорости (Vox, Voy ), поэтому целесообразно использовать сеть прямого распространения (FFBP). Сеть имеет два слоя. Первый слой содержит 20 нейронов, обладающих сигмоидальными функциями активации. Второй слой состоит из двух нейронов с тождественными функциями активации. Вектор входного сигнала имеет вид:
x 2 sin( K ), а вектор выходного сигнала Y ox. Схема нейронной сети представлена на рис.4.
Теперь необходимо сформировать учебный набор ( X, Y ) для последующего обучения сети. Понятие «учебный набор» образцов подразумевает качество и количество именно входных образцов. Выходные же определяются однозначно при помощи имитационной модели. Качество образцов подразумевает пространство возможных значений входного вектора, определяемое границами возможных значений его компонент, и распределение вектора по пространству, которое зависит от дискретности компонент и закона распределения, по которому происходит выборка составляющих вектора.
Определим сначала границы входного вектора Х сети №1. Для этого необходимо определить границы промежутков возможных значений величин, формирующих входной вектор. Кроме того, существует необходимость выбора дискретности этих возможных значений, поскольку слишком близкие значения, как показывает наша практика, могут осложнять процесс обучения нейронной сети. Второй, третий и четвёртый компоненты входного сигнала представляют собой функции исходных величин, поэтому, так как для получения их мы используем стохастический алгоритм, то существует вероятность, что после обучения в рабочем режиме входные величины x2, x3, x4 не будут принадлежать тем промежуткам, на которых сеть обучалась. А это приводит к существенной потере точности. Во избежание подобной ситуации, промежутки возможных значений некоторых величин, ответственных за формирование сигналов x2, x3 и x4, мы расширим, как это показано в диссертации.
Теперь мы имеем четыре конечных множества возможных значений компонент входного сигнала Х, хранящихся в оперативной памяти в виде векторов некоторой длины.
В системе MATLAB существует функция, позволяющая псевдослучайным образом генерировать натуральные числа от 1 до некоторого максимального заданного значения по закону равномерного распределения. Если в качестве этого значения выбрать число элементов вектора возможных значений соответствующей исходной величины, то применяя всякий раз данную функцию, мы получим псевдослучайное значение этой величины. Так создаётся псевдослучайная временная последовательность для каждой исходной величины. После переходим к соответствующей временной последовательности векторов входного сигнала { X }i 1n. Используя алгоритм решения уравнения Риккати (2), находим соответствующую последовательность выходного сигнала {Y }i 1n. Таким образом, набор учебных данных { X, Y }i 1n будет успешно сформирован.
Определив «качество» образцов для обучения, теперь необходимо выбрать их оптимальное количество. Несмотря на то, что в некоторых исследованиях по нейронным сетям предлагаются определённые формулы для оценки необходимого числа образцов, на практике эти методики не всегда работают. Поэтому в таком случае приходится обращаться к методу проб и ошибок. Экспериментально установлено, что нейронная сеть №1 обучается на образцах, если их число равно 20000.
Для нейронной сети №2 аналогичным образом определяются множества значений курса и скорости дрейфа. Число образцов для обучения было выбрано по методу проб и ошибок и составляет 10000. Меньшее число необходимых образцов по сравнению с их количеством для сети №1 можно, по-видимому, объяснить тем, что вторая сеть не имеет в своей структуре линий единичных задержек и, как следствие, имеет меньшее число свободных параметров (весов и порогов).
Сформировав множества учебных примеров для обеих сетей, можно теперь приступить к их обучению. Для обучения сетей использовался алгоритм регуляризации Байеса в комбинации с методом Левенберга-Марквардта, реализованный в среде MATLAB 7.10.0.
По завершении процесса обучения наибольшие значения модуля ошибки скорости дрейфа и модуля вектора погрешности относительной скорости для обученных сетей составили соответственно 5.7184104 м/c и 9.4254104 м/с в сравнении с выходными образцами из обучающей выборки.
После обучения нейронных сетей возникает задача проверки их работоспособности с использованием таких последовательностей входных и выходных сигналов, которые не применялись для обучения. Для проверки работы системы сетей необходимо последовательности системы и сравнить их с результатами, полученными с использованием имитационной модели.
Будем проверять работу сети №1, а затем всей системы в целом, не останавливаясь отдельно на тестировании сети №2, так как выход сети №1 служит одним из четырёх входов сети №2. Необходимость отдельного тестирования сети №1 вызвана тем, что появляется возможность оценки границ промежутка возможных значений её выхода, то есть скорости дрейфа Voy1.
Задача тестирования сети осложняется тем, что она работает во временной области, то есть необходимо сформировать именно временные последовательности входного сигнала.
При этом будем исходить из следующих двух принципов. Во-первых, при моделировании значение входной величины в любой момент времени не должно выходить за пределы того промежутка, значения из которого использовались для обучения сети. Во-вторых, необходимо учесть взаимосвязь между величинами во времени. В связи с этим можно предложить два этапа тестирования.
последовательности входных величин, не учитывая взаимосвязи между ними. С вероятностью 50% генерируются либо полностью стационарные сигналы, либо полностью хаотичные. В первом случае генератор псевдослучайных чисел равномерного распределения работает только один раз для всего промежутка времени плавания 4 часа, во втором - в каждый момент времени (с дискретностью 1с). При этом не учитываются взаимосвязи только между кажущимся периодом волнения, длиной волны, её курсовым углом и скоростью судна, хотя период в действительности и является функцией перечисленных величин. Во втором случае корреляция отсутствует полностью.
Второй этап призван учесть взаимозависимость между моделируемыми величинами, исходя из их физического смысла. Например, любое изменение курса неизбежно приведёт к изменению, скажем, курсового угла кажущегося ветра и т.д. Для решения данной задачи необходима некоторая имитационная модель поведения ветра, волнения и движения судна в данном районе океана.
Общая схема создания такой модели выглядит следующим образом: внутри диапазона реально возможных значений задаются последовательности курса и скорости судна, характеристик истинного ветра и волнения, затем мы переходим к относительным характеристикам последних двух факторов, применяя известные геометрические соотношения. Для расчёта кажущегося периода волнения будем использовать следующую формулу:
где с 2.43 - скорость распространения волны, а продольная относительная скорость V0 x1 берётся в узлах.
Также будем полагать, что максимально возможная крутизна волны h / не может быть более 0.2.
В рамках второго этапа рассматриваются также две схемы поведения внешних факторов: стационарная и нестационарная. Для построения первой вышеперечисленных принципов достаточно. А для получения последовательностей изменяющихся во времени курса, относительной скорости и внешних факторов можно поступить следующим образом.
Каждую такую величину как функцию времени представить в виде суммы нескольких гармонических функций, каждая из которых будет иметь различную амплитуду и период.
Для определённости будем рассматривать функции Например, продольная относительная скорость судна Vox1 (t ) может иметь существенные изменения до нескольких узлов на промежутке времени от нескольких минут до нескольких часов. В то же время, в условиях влияния волнения, скорость может изменяться, скажем, до 1 узла на промежутке времени от нескольких секунд до нескольких десятков секунд. В соответствии с этими соображениями необходимо использовать сумму двух синусов с соответствующими периодами и амплитудами. Фактически, мы используем несколько слагаемых ряда Фурье, которые существенным образом характеризуют поведение моделируемой величины во времени.
Также необходимо учесть связь между периодами изменения некоторых величин.
Например, высота волны явно зависит от скорости истинного ветра и будет иметь изменения, связанные с изменениями модуля истинного ветра.
Конечно, предложенную модель поведения ветра и волнения не приходится считать совершенной, однако она всё-таки учитывает взаимосвязь между внешними факторами и кинематическими характеристиками судна. Отклонения схемы от действительно возможного характера поведения внешних факторов во времени могут быть учтены на первом этапе проверки работы сети, а именно: когда величины, определяющие внешние факторы, абсолютно не взаимосвязаны между собой.
Принимая определённую дискретность соответствующих амплитуд и периодов для каждой моделируемой величины, можно составить множества амплитуд и периодов для каждой гармоники. Затем с использованием ГПСЧ равномерного распределения формируется набор этих характеристик и, следовательно, получаются некоторые реализации величин, необходимых для формирования входного сигнала X.
Таким образом, предлагаемая схема тестирования нейронной сети включает два этапа.
На первом этапе временная корреляция величин, необходимых для формирования входного сигнала, не учитывается. Второй этап учитывает взаимосвязь между величинами как друг с другом, так и во времени. На каждом этапе рассматривается как стационарный характер сигналов, так и меняющийся с течением времени. Оба этапа дополняют друг друга. В качестве критерия соответствия нейронной сети имитационной модели традиционно выбираем наибольшее значение модуля невязки на четырёхчасовом промежутке времени. Результаты тестирования представлены в табл. Сеть № Сеть №1 + № Табл.3. Результаты тестирования нейронной сети Таким образом, по результатам тестирования нейронной сети можно сделать вывод, что построенная система двух нейронных сетей в 2000 модельных ситуаций прогнозирует относительную скорость судна так, что расхождение прогнозируемых ею координат с координатами, полученными с использованием имитационной модели, не превосходит в невязке 138 метров за четыре часа плавания. Это означает, что нейронная сеть с высокой точностью заменяет алгоритм счисления, основанный на численном интегрировании уравнения (2).
Формируя для каждого из экспериментов, упомянутых в предыдущей главе, вектор входа X, выполним расчёт координат центра тяжести судна в неподвижной системе, применяя как нейронную сеть, так и имитационную модель. В серии трёх опытов наибольшее расхождение в невязке составило 2.2, 1.2 и 2.2 метра за четыре часа плавания по сравнению с координатами, полученными с использованием имитационной модели.
Таким образом, в проведённых натурных экспериментах нейронная сеть демонстрирует свою работоспособность в сравнении с имитационной моделью.
Синтезированная нейронная сеть работает в пространстве скоростей. Первая сеть преобразует силовые воздействия со стороны внешних факторов в скорость бокового дрейфа судна. Вторая сеть на выходе имеет компоненты вектора относительной скорости судна в неподвижной системе координат. Абсолютная скорость судна получается сложением относительной и скорости течения. Выбор архитектуры сетей во многом определяется ролью, которую они играют в модели счисления. Для обучения сетей необходимо сформировать учебный набор образцов с использованием имитационной модели. Количество и качество этих образцов определяется методом проб и ошибок.
Далее используется метод регуляризации Байеса применительно к задаче обучения сетей.
После окончания обучения возникает необходимость тестирования системы сетей, которое проходит в два этапа. На первом этапе взаимосвязь между величинами не учитывается, на втором предлагается определённая модель взаимосвязи между величинами. Результаты тестирования позволяют сделать вывод, что обученная нейронная сеть практически соответствует имитационной модели. Проверка сети с использованием входных сигналов натурных наблюдений также позволяет сделать вывод в пользу адекватности нейронной модели.
Пятая глава посвящена исследованию вопроса о влиянии погрешностей измерений величин, необходимых для формирования входного сигнала, на точность прогноза счислимых координат.
При моделировании погрешностей измерений мы идём по пути, аналогичному тому, как были получены меняющиеся во времени тестовые последовательности на втором этапе проверки нейронной сети в четвёртой главе.
Конечно, представление ошибок измерений внешних факторов в форме суммы нескольких членов ряда Фурье далеко не всегда соответствует реальному поведению погрешностей во времени, однако, мы не можем исключить наличие таких навигационных ситуаций, в которых указанные величины изменяются подобным образом. Понятие «навигационная ситуация» будет применяться и в дальнейшем, обозначая определённый набор курса, скорости и внешних факторов.
После того как мы научились моделировать временные последовательности ошибок измерений величин, необходимых для формирования входного сигнала, был поставлен следующий эксперимент.
нейросетевой модели. Выход обеих моделей будет незамедлительно вычислен. Включая ГПСЧ равномерного распределения, сгенерируем последовательности ошибок для каждой исходной величины. Перейдём к вектору входа X, который содержит погрешности в своих компонентах, вызванные ошибками измерений.
Для этого приближённого входа X вычислим траектории с использованием имитационной модели и нейронной сети. Естественно, они будут отличаться, во-первых, от траектории, которая получается с использованием истинного значения вектора X в имитационной модели, а, во-вторых, друг от друга. Наибольшее значение модуля невязки, вызванное погрешностью знания входных данных, при прогнозе с использованием имитационной модели обозначим символом сim, а с использованием нейронной сети - сnw.
Входные величины формируются в соответствии с принципами второго этапа тестирования нейронной сети, описанного в четвёртой главе. Будем рассматривать выходы нейронной сети и имитационной модели в условиях погрешностей измерений, и рассчитывать соответствующие траектории.
Было рассмотрено 1000 модельных ситуаций, в каждой из которых погрешности измерения скорости, характеристик ветра и волнения, в общем случае, были отличны от нуля на четырёхчасовом промежутке времени. Результаты получены следующие.
А. Решение дифференциального уравнения:
Наименьшее значение невязки сim : 135.5 м, наибольшее – 11.6 миль.
Б. Прогноз по нейронной сети:
Наименьшее значение невязки сnw : 135.4 м, наибольшее – 11.6 миль.
Среди рассмотренных ситуаций была такая, при которой невязка по нейросети сnw превосходила невязку по имитационной модели сim на 7.8 м, в то время как была и обратная ситуация: нейросеть оказывалась точнее на 23 метра. Это наибольшие отличия для невязки в условиях погрешностей измерений продольной скорости, курса, ветра и волнения в данном эксперименте. В среднем, нейронная сеть работает с точностью 2974. м, классическая модель - 2975.0 м.
Результаты данного моделирования говорят о том, что нейронная сеть и имитационная модель практически одинаково реагируют на влияние погрешностей измерений исходных величин: разница модуля невязки в обоих случаях не превосходит нескольких десятков метров на четырёхчасовом промежутке времени наблюдения.
В шестой главе предложен подход к планированию натурного эксперимента по проверке работоспособности нейронной сети.
Для полной проверки алгоритма требуется рассмотреть все возможные натурные навигационные ситуации, каждой из которых соответствуют определённые последовательности входных и выходных сигналов. Это не возможно, поэтому остаётся лишь использовать такие входные последовательности, которые приводят к максимальным значениям модуля невязки, принадлежащим одному из интервалов, на которые разбивается весь промежуток возможных значений невязок.
Воспользуемся имитационной моделью для оценки влияния относительной скорости дрейфа судна на точность счисления. Моделирование входных сигналов будем производить тем же методом, который использовался на втором этапе тестирования нейронной сети. Было рассмотрено 2776 модельных ситуаций. При этом наибольшее значение максимумов невязок, вызванных неучтённой скоростью дрейфа, на четырёхчасовом отрезке времени составило 11.5 миль. Наименьшее значение приблизительно равно 0 миль.
Весь диапазон возможных значений невязок разделим на 11 классов. Невязки первого класса принадлежат промежутку [0;1) мили, второго – [1;2) и т.д. Невязка 11- ого класса всегда более 10 миль. В качестве классификатора выступает имитационная модель.
Можно предложить следующую схему постановки эксперимента. В течение четырёх часов предполагается определённый вариант изменения курса судна и продольной составляющей относительной скорости. Характеристики же ветра и волнения в последовательности для относительных характеристик внешних факторов, которые, в свою очередь, применяются для расчёта входного сигнала, подаваемого к имитационной модели. Рассчитывается предварительная траектория движения судна относительно воды и наибольшее значение модуля невязки, вызванное неучтённой скоростью дрейфа. Если эта невязка принадлежит интересующему нас классу, то эксперимент имеет смысл проводить.
После принятия решения о проведении эксперимента необходимо по истечении четырёхчасового промежутка времени вычислить фактическое значение максимума модуля невязки с использованием точных координат от спутниковой радионавигационной системы и сведений о течениях для данного района моря.
В седьмой главе предлагается алгоритм оценки точности координат, прогнозируемых нейронной моделью.
В третьей главе был получен уточнённый набор коэффициентов k1, k 2, k 3, k 4, k5 при помощи алгоритма глобальной оптимизации «Global Search». Уточнение этих параметров проходило с использованием данных вида «вход-выход», точность получения которых ограничена. Для того чтобы учесть данный факт, необходимо варьировать эти данные в соответствии с представлениями о возможных погрешностях величин, формирующих пару «вход-выход». После каждой вариации необходимо вновь обучить нейронную сеть.
Пусть мы совершили n подобных вариаций, то есть получили n векторов коэффициентов {k1 (r ),..., k 5 (r )}r 1n. Значит, производя обучение для каждого такого вектора, мы будем иметь n обученных нейронных сетей, соответствующие свободные параметры которых будут отличными.
При построении модели, работающей в реальном времени, будем поступать следующим образом. Пусть в некоторый дискретный момент времени ti рассматривается прогноз скорости дрейфа по каждой из n нейронных сетей. Тогда мы будем иметь n, в общем случае, различных значений прогнозируемой скорости дрейфа {Voy1 (ti )}r 1 n, каждое из которых соответствует конкретной сети из набора. Так учитывается параметрическая неопределённость модели.
Теперь необходимо учесть и ту неопределённость прогноза скорости дрейфа, которая вызвана ошибками измерений текущих значений характеристик внешних факторов, курса и скорости. Для этого используются генераторы псевдослучайных чисел равномерного распределения на некотором промежутке времени. Множество из l таких наборов последовательностей характеризует точность измерения величин, необходимых для формирования входного сигнала. Можно рассмотреть теперь каждую из n нейронных сетей с каждым из l наборов псевдослучайных последовательностей в момент ti, получив {Voy,1j (ti )}r 1 n, координат на промежутке времени [0; ti ]. Теперь оценка дисперсии координат может быть посчитана для момента времени ti.
При практическом применении алгоритма возник вопрос о выборе n,l а также длины отрезка [0; ti ], поскольку эти характеристики ограничены быстродействием конкретного аппаратного обеспечения. При стремлении времени к бесконечности будет требоваться в больше и больше времени на рассмотрение псевдослучайных последовательностей. В качестве варианта обхода этой трудности было предложено перейти от модели целостной к модели приращений. При этом текущая координата – сумма координат всех предыдущих приращений. Показана также возможность вычисления дисперсии в некоторый дискретный момент времени. Величина дискретности выбрана равной шестидесяти секундам. Для параметров n, l приняты значения соответственно 10 и 15.
Имитационная модель использования нейронной сети в задаче прогнозирования координат с оценкой их точности была реализована в среде MATLAB. В этой модели предусмотрен ввод величин, которые необходимы для формирования входного сигнала, в режиме реального времени. Предусмотрена также возможность смены физических характеристик судна.
Основным результатом настоящей работы следует считать синтез нейронной сети, прогнозирующей относительную скорость судна в неподвижной системе координат в условиях воздействий ветра и волнения.
Для обучения данной сети необходимо иметь достаточно большое число образцов из интервала тех значений, с которыми приходится встречаться на практике. Последнее вызывает необходимость создания имитационной модели, которая давала бы то или иное представление о скорости дрейфа судна в условиях ветра и волнения.
С использованием известных из области судостроения и судовождения соотношений для внешних сил, воздействующих на судно, составлено дифференциальное уравнение Риккати. Вид данного уравнения, естественно, не является единственно возможным и может вызывать многочисленные дискуссии. Тем не менее, как показывают результаты проведённых натурных наблюдений, прогнозируемая траектория соответствует общей тенденции изменения координат, что говорит о возможности рассмотрения вышеупомянутого дифференциального уравнения в качестве имитационной модели дрейфа судна.
Для обучения сетей создаются наборы учебных данных. Метод регуляризации Байеса позволяет обучить нейронную сеть с необходимой точностью. После обучения система сетей проходит тестирование по специальной методике. Результаты последнего позволяют сделать вывод о том, что нейронная сеть заменяет имитационную модель с ошибкой, не превосходящей несколько десятков метров за четыре часа плавания. Работа сети также проверяется с использованием данных трёх натурных экспериментов.
Расхождение не превышает нескольких метров на четырёхчасовом промежутке времени плавания.
Предлагается проверка работы нейронной сети в таких навигационных ситуациях, которые можно было бы классифицировать по величине невязки, вызванной наличием неучтённой скорости дрейфа. В связи с этим рассмотрен алгоритм классификации внешних факторов и кинематических характеристик судна при проведении будущих натурных наблюдений.
Завершённость нейронной модели придаёт алгоритм применения псевдослучайных реализаций входных величин и последовательное рассмотрение нейронных сетей с различными свободными параметрами в режиме реального времени. При этом возможно получить оценку точности прогнозируемых при помощи модели координат в реальном времени с некоторой дискретностью.
Нейронная сеть, заменяющая уравнение Риккати, является не только альтернативой дифференциальной модели, но и обладает преимуществом нелинейности преобразования внешних факторов в скорость дрейфа судна, поскольку любой известный метод численного решения дифференциальных уравнений предполагает либо линеаризацию на определённых интервалах времени, либо ограничивается суммой первых нескольких членов некоторого ряда.
Настоящая работа представляет собой лишь один из начальных подходов по применению нейросетевых технологий в области алгоритмов счисления пути судна. Если говорить о перспективах развития настоящего исследования, то оно может протекать в двух различных, но всё-таки не противоположных направлениях.
Во-первых, необходимо стремиться к синтезу такой нейронной модели, которая бы:
а) работала в пространстве координат, а не скоростей б) обучалась на образцах, полученных по результатам натурных наблюдений Во-вторых, построение нейронной модели, проделанное в работе, открывает путь к созданию нейрорегулятора, позволяющего решить задачу создания адаптивной системы, которая обеспечивает стабилизацию судна на заданной траектории по информации от автономных навигационных систем.
По теме диссертации опубликованы следующие работы в изданиях, 1. Дерябин В.В. Оценка точности решения системы двух линейных уравнений с двумя неизвестными // Эксплуатация морского транспорта. – 2010. – № 3(61) – с.
2. Дерябин В.В. Построение модели счисления судна на основе нейронной сети // Эксплуатация морского транспорта. – 2010. – № 4(62) – с. 33 –40.
3. Дерябин В.В. Модель счисления пути судна в условиях воздействия внешних факторов // Эксплуатация морского транспорта. – 2011. – № 1(63) – с. 33 –39.
1. Дерябин В.В., Сазонов А.Е., О возможности применения нейронной сети при построении модели счисления пути судна // Научно-технический сборник Российского морского регистра судоходства. – Вып. 33. – СПб.: Российский морской регистр судоходства, 2010. – с. 229 - 246.