САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
На правах рукописи
Небосько Евгений Юрьевич
СИНТЕЗ АДАПТИВНЫХ РЕГУЛЯТОРОВ В ЗАДАЧАХ
ИНВАРИАНТНОСТИ И ОТСЛЕЖИВАНИЯ
01.01.09 Дискретная математика и математическая кибернетика
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата физико-математических наук
Санкт-Петербург 2010
Работа выполнена на кафедре теоретической кибернетики математикомеханического факультета Санкт-Петербургского государственного университета
Научный руководитель: доктор физико-математических наук, профессор Якубович Владимир Андреевич
Официальные оппоненты: доктор физико-математических наук, профессор Чурилов Александр Николаевич (Санкт-Петербургский государственный морской технический университет) кандидат физико-математических наук, Лихтарников Андрей Леонидович (Институт проблем машиноведения РАН)
Ведущая организация: Санкт-Петербургский государственный университет аэрокосмического приборостроения
Защита состоится " " 2011 г. в часов на заседании совета Д.212.232.29 по защите докторских и кандидатских диссертаций при СанктПетербургском государственном университете по адресу: 191011, Санкт-Петербург, наб. р. Фонтанки, 27, ауд. 311 (помещение ПОМИ РАН).
Адрес диссертационного совета: 198504, Санкт-Петербург, Ст. Петергоф, Университетский пр., 28.
С диссертацией можно ознакомиться в Научной библиотеке им. М. Горького Санкт-Петербургского государственного университета по адресу: 199034, СанктПетербург, Университетская наб., 7/9.
Автореферат разослан " " 20 г.
Ученый секретарь диссертационного совета Д.212.232. доктор физ.-мат. наук, профессор В. М. Нежинский
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Задачи инвариантности и отслеживания являются классическими задачами теории управления, имеют длинную историю и активно исследуются как математиками, так и инженерами вследствие их практической значимости. Указанные задачи изучались в работах Г.В. Щипанова, Ф.Р. Гантмахера, А.И. Кухтенко, М.В. Меерова, Я.Н. Ройтенберга, У.А. Уонэма, Б.М. Фрэнсиса, А. Линдквиста, В.А. Якубовича, А.В. Проскурникова и многих других авторов. В недавних статьях В.А. Якубовича и А.В. Проскурникова получено описание всех стабилизирующих регуляторов, решающих задачи инвариантности, отслеживания и более общие задачи соответствия выхода системы выходу эталонной модели. В данных работах параметры объекта считаются известными (в качестве неопределенности выступает внешнее воздействие или задающий сигнал). Исследование таких задач в случае неопределенных коэффициентов является актуальной задачей, поскольку параметры и внешние условия функционирования любой реальной системы, как правило, неизвестны или известны неточно.
Целью работы является получение условий существования адаптивных регуляторов в задачах инвариантности и отслеживания при неопределенных коэффициентах системы, а также их конструктивное описание.
Методы исследований включают теорию дифференциально-разностных уравнений, методы построения универсальных регуляторов, рассмотренные в работах В.А. Якубовича и А. В. Проскурникова, методы теории адаптивного управления, метод рекуррентных целевых неравенств, рассмотренные в работах В.А. Якубовича, В.Н. Фомина, В.А. Бондарко, В.И. Пономаренко и др.
Научную новизну работы составляют следующие результаты. Получены достаточные условия существования и конструктивное описание класса строго реализуемых адаптивных регуляторов, решающих задачи об инвариантности неопределенной системы управления, отслеживания произвольного неизвестного сигнала, соответствия выхода неопределенной системы выходу заданной эталонной модели.
Теоретическая и практическая ценность. В работе описываются конструктивные процедуры синтеза регуляторов, решающих задачи инвариантности, отслеживания, соответствия заданной модели для неопределенных систем, которые объединяют в себе теорию построения универсальных регуляторов, развитую в работах В.А. Якубовича, А.В. Проскурникова и др., с результатами теории адаптивного управления.
Полученные результаты могут быть использованы на практике для расчета и построения разнообразных систем управления (управление автономными транспортными средствами, автономными летающими аппаратами и др.), обеспечивающих повышение качества систем в условиях неопределенности.
Апробация работы. Полученные результаты докладывались и обсуждались на семинарах кафедры теоретической кибернетики и двух конференциях: Международном научно-техническом семинаре "Робототехника. Взгляд в будущее", С.-Петербург, 2010 г., XI-й Международной конференции "Устойчивость и колебания нелинейных систем управления"(конференции Пятницкого), Москва, 2010г.
Публикации. Основные результаты диссертации опубликованы в работах [1-5]. Работы [1-3] являются публикациями из перечня ВАК.
Работы [1,2,3,4] написаны в соавторстве. В этих работах Е.Ю. Небосько принадлежат формулировки и доказательства теорем о достижении цели управления, имитационное моделирование, В.А Якубовичу общие постановки задачи и указание методов их решения. В работах [1,2,3] А.В. Проскурникову принадлежит параметризация регуляторов, решающих указанные задачи при условии, что коэффициенты объекта известны.
Структура и объем работы. Диссертация объемом 82 страницы состоит из введения, 3 глав, заключения и списка литературы (74 наименования).
СОДЕРЖАНИЕ ДИССЕРТАЦИИ
Во введении обосновывается актуальность темы, ставятся задачи исследования и приводится краткое содержание работы по главам.Первая глава посвящена описанию основных задач и обзору известных результатов. В частности, изложены основные тезисы дискуссии вокруг работ Г.В. Щипанова.
Во второй главе рассматриваются задачи инвариантности и, как частный случай, задача стабилизации неопределенной системы.
В разделе 2.1 исследуется частный случай задачи инвариантности - задача стабилизации. В этом случае внешнее воздействие равно нулю. Для линейного неопределенного объекта в дискретном времени строится семейство регуляторов, которое посредством ограниченного управления обеспечивает ограниченность выхода системы сколь угодно малой постоянной.
Раздел 2.2 посвящен изучению задачи инвариантности в следующей постановке. Рассматривается объект управления вида где yt Rn, ut Rn, t Rl –выход, управляющее воздействие и измеряемое внешнее воздействие соответственно, A(), B(), F ()–матричные полиномы с вещественными коэффициентами размеров n n, n n, n l соответственно. Символ –оператор сдвига на шаг вперед yt = yt+1, A( )yt = A0 yt+dA + A1 yt+dA 1 + · · · + AdA yt. Предполагается, что det A0 0. Не ограничивая общности, считается, что A0 In – единичная матрица размерности n. Предполагается также, что deg A = dA > dB = deg B и dA > dF = deg F, dB dF. Внешнее воздействие t считается доступным измерению и ограниченным:
Коэффициенты полиномов A(), B(), F () в (1) считаются неизвестными, предполагается только минимальнофазовость объекта (1), т.е. устойчивость Требуется построить регулятор, который для любого (неизвестного заранее) внешнего воздействия t, удовлетворяющего (2) и любых начальных данных системы, обеспечивал бы свойство:
Закон управления строится на основе теоремы о параметризации всех линейных стабилизирующих регуляторов для объекта вида (1) с известными коэффициентами, обеспечивающих стремление выхода системы к нулю независимо от внешнего воздействия (Проскурников А.В., Якубович В.А. Задача об инвариантности системы управления//Доклады РАН, 2003, т.389, N6, с.742путем замены матричных полиномов A, B, F формируемыми указанным ниже образом оценками At, B t, F t, которые корректируются на каждом шаге. Именно, управление определяется из соотношения (уравнения регулятора) вида Здесь –произвольный устойчивый скалярный полином, rt – вещественный (n n)-матричный полином, такой что det rt 0, матричные полиномы соответствующих размерностей At, B t, F t –некоторые оценки полиномов A, B, F, построенные по наблюдениям y0, y1,..., yt+dA 1, 0, 1,..., t+dF и управлениям u0, u1,..., ut+dB.
Закон управления строится таким образом, чтобы при каждом t регулятор (4) являлся строго реализуемым (неупреждающим). Вводятся следующие определения. Под степенью скалярной рациональной функции f () = b()/a(), где a,b – полиномы, будем понимать число deg f = deg b deg a, под степенью рациональной матрицы – наибольшую из степеней элементов.
Регулятор вида D u = C y + F называется строго реализуемым (неупреждающим), если deg((D )1 C ) 0 и deg((D )1 G ) 0, т.е. все элементы матриц (D )1 ()C () и (D )1 ()G () – правильные рациональные функции. Только такие регуляторы имеют практический смысл. В формуле (5) полиномы и rt выбираются следующим образом. Пусть q = 2 deg A deg B 1. Берется произвольный устойчивый полином (), deg q. Пусть произвольный матричный полином степени deg, первые dA dB старших членов которого совпадают с соответствующими членами матричного полинома ()In. Матричный полином делится с остатком на At () (это можно сделать, так как At = In по предположению): = rt At + Qt, где deg Qt < deg A. Если при каждом t B0, старший коэффициент полинома B t (), невырожденная матрица, то регулятор (4), (5) с этими rt и строго реализуем.
Описывается следующее правило подбора коэффициентов матричных полиномов At, B t, F t, замыкающее систему (1), (4). Начальные оценки (для t = 0) берутся произвольно так, чтобы det B0 = 0. Пусть при некотором t (в момент времени t + dA ) известны некоторые оценки At, B t, F t полиномов A, B и F соответственно. Рассматривается для этого t целевое неравенство:
Вводятся обозначения:
Целевое неравенство (6) переписывается в виде:
Для подстройки вектора оценок t, используется следующий алгоритм типа "Полоска" (Фомин В.Н., Фрадков А.Л., Якубович В.А. Адаптивное управление динамическими объектами, М., Наука, 1981):
(6), будет обеспечивать цель управления (3).
В разделе 2.3 рассматривается задача об инвариантности для неопределенного скалярного объекта в непрерывном времени.
Раздел 2.4 иллюстрирует применение теоретических результатов к задаче управления автономным транспортным средством. Рассматривается автономное транспортное средство (АТС), например, автобус, движущееся c постоянной скоростью. Предполагается, что задана целевая траектория, которая геометрически представляет собой совокупность дуг окружностей и отрезков.
На АТС находится сенсор, измеряющий отклонения от заданной траектории.
Считается, что измеряется (или оценивается) кривизна траектории в точке, ближайшей к сенсору. Под кривизной подразумевается величина = R, где Rрадиус кривизны. Кривизна считается постоянной на каждом из промежутков между измерениями и рассматривается как (неизвестное заранее) измеряемое возмущение (t). Предполагается, что измерения проводятся в равноотстоящие моменты времени: tk = kh, h–период измерений. Целью управления является следование целевой траектории в смысле обеспечения достаточной малости величины отклонения сенсора от траектории в моменты измерений.
Движение АТС описывается системой уравнений Компоненты фазового вектора x имеют следующий физический смысл:
- угол между осью транспортного средства и вектором скорости (против часовой стрелки);
r- мгновенная угловая скорость поворота АТС вокруг центра тяжести (против часовой стрелки);
- угол между касательным вектором дороги в точке, ближайшей к центру тяжести и осью транспортного средства (против часовой стрелки);
y- расстояние от сенсора до дороги (по нормали, со знаком - в зависимости от того, с какой стороны дороги находится сенсор: слева- плюс, справа- минус).
В формуле (9) u – угол поворота передних колес или, то же самое, угол поворота руля,, как говорилось выше, кривизна дороги в точке, ближайшей к сенсору. Компоненты матриц A, B и F выражаются через физические параметры АТС, такие как масса, скорость, различные длины, коэффициенты жесткости, центральный момент инерции. Управление на каждом из промежутков принимается постоянным Производится стандартная процедура перехода от непрерывного объекта к дискретному объекту в форме пространства состояний и затем к дискретному объекту в форме вход-выход где yk = y(hk), uk = u(hk), k = (hk). Символ –оператор сдвига на шаг вперед yk = yk+1. A, b, f - скалярные полиномы. Следуя результатам раздела 2.2 строится семейство регуляторов обеспечивающих для объекта (11) и, следовательно, для объекта (9) выполнение условия На рисунках 1, 2 представлены результаты численных экспериментов по данной задаче для трех различных регуляторов из построенного класса в виде графиков отклонений от дороги и углов поворота руля (управляющих воздействий) как функций времени. Для первого регулятора выбрано R = 4, rk = 1, для второго rk = 1, а R()- устойчивый полином с корнями [0.5 0.2 0.1 0.01], параметры третьего регулятора имеют вид: rk = 1, а R()- устойчивый полином с корнями [0.7 0.2 0.1 0.01]. Из работы Ю. Аккермана (J. Ackermann, Рис. 1: Графики отклонений от дороги y для трех различных регуляторов (слева направо от первого к третьему).
Рис. 2: Графики углов поворотов руля (управлений) u для трех различных регуляторов (слева направо от первого к третьему).
J.Gudner, W.Sienel, R.Stainhauser, V.I.Utkin Linear and Nonlinear Controller Design for Robust Automatic Steering. IEEE Transactions on Control Systems Technology, vol. 3, № 1, march 1995, pp. 132-142) взяты численные значения физических параметров, которые соответствуют характеристикам реального городского автобуса O 305. Неизвестными параметрами считаются масса автобуса и его скорость. Известны только границы изменения этих параметров.
При проведении экспериментов в определенный момент времени (t = 20c) "истинные" значения массы и скорости резко меняются. Графики демонстрируют, что регуляторы успешно подстраиваются к неопределенным параметрам и обеспечивают выполнение цели управления.
В третьей главе рассматриваются задачи отслеживания и более общая задача соответствия эталонной модели, где выход системы должен "отслеживать" выход эталонной модели. В разделе 3.1 рассматривается объект управления вида (1), где yt Rn, ut Rn, t Rn –выход, управляющее воздействие и задающий сигнал соответственно, A(), B(), F ()–матричные полиномы с вещественными коэффициентами размеров n n, n n, n n соответственно. Как обычно, символ –оператор сдвига на шаг вперед yt = yt+1, A( )yt = A0 yt+dA +A1 yt+dA 1 +· · ·+AdA yt. Предполагается, что det A0 0. Не ограничивая общности, считается, что A0 In – единичная матрица размерности n. Предполагается также, что deg A = dA = dB = deg B и dA dF = deg F.
Задающий сигнал t считается доступным измерению и ограниченным:
Коэффициенты полиномов A(), B(), F () в (1) считаются неизвестными, предполагается только минимальнофазовость объекта (1), т.е. устойчивость матричного полинома B(): det B() = 0 при C, || 1.
Требуется построить регулятор, который при любом (неизвестном заранее) задающем воздействии t, удовлетворяющем (12) и любых начальных данных системы, обеспечивал бы свойство:
Закон управления, как и ранее, строится на основе теоремы о параметризации всех линейных стабилизирующих регуляторов для объекта вида (1) с известными коэффициентами, обеспечивающих стремление выхода системы к заданному сигналу путем замены матричных полиномов A, B, F формируемыми указанным ниже образом оценками At, B t, F t, которые корректируются на каждом шаге (Проскурников А.В., Якубович В.А.Синтез стабилизирующего регулятора в задаче отслеживания//Доклады РАН, 2005, т.404, N3, с.321Управление определяется из соотношения Здесь –произвольный устойчивый скалярный полином, rt – вещественный (n n)-матричный полином, такой что det rt 0, матричные полиномы соответствующих размерностей At, B t, F t –некоторые оценки полиномов A, B, F, построенные по предшествующим наблюдениям и управлениям. В формуле (15) полиномы и rt выбираются так, чтобы регулятор (14) являлся неупреждающим. Именно, пусть q = deg A. Берется произвольный устойчивый поq. Матричный полином I делится с остатком на At () лином (), deg I = rt At + Qt, где deg Qt < deg At. Если при каждом t B0, старший коэфt фициент полинома B t (), невырожденная матрица, то регулятор (14), (15) с этими rt и строго реализуем.
Система замыкается алгоритмом подстройки неизвестных параметров по правилу, описанному выше для задачи инвариантности. Установлен следующий результат.
Теорема 2. Пусть для объекта управления (1) выполнены все описанные предположения и пусть старший коэффициент полинома B() объекта (1)– неособая матрица. Тогда любой адаптивный регулятор вида (14), (8), с описанным выбором начальных оценок 0 и достаточно малым > 0 из (6), будет обеспечивать цель управления (13).
В разделе 3.2 рассматривается задача отслеживания полигармонических сигналов с известным спектром. Для объекта вида (1) предполагается, что сигнал t имеет вид где j произвольные (заранее неизвестные) комплексные векторные амплитуды, частоты j фиксированы (известны) и k = j + 2l, k = j, l Z. В отличие от предыдущего случая предполагается, что deg A = dA > dB = deg B и dA > dF = deg F. Цель управления имеет вид (13).
Закон управления выбирается в виде (Линдквист А., Якубович В.А. Универсальные регуляторы для оптимального отслеживания сигналов в линейных дискретных системах.// Доклады РАН. 1998. Т.361. N2. С.177–180, Проскурников А.В., Якубович В.А.Синтез стабилизирующего регулятора в задаче отслеживания//Доклады РАН, 2005, т.404, N3, с.321-325) Полиномы и rt выбираются следующим образом. Пусть q = dA dB + max(N, da 1). Берется произвольный устойчивый скалярный полином (), deg q. Пусть произвольный матричный полином степени d, первые dA dB старших членов которого совпадают с соответствующими членами матричного полинома I(). Матричный полином делится с остатком на At () (это можно сделать, так как At = In по предположению):
= rt At + Qt, где deg Qt < deg A. Матричный полином L() выбирается таt коэффициент полинома B t (), невырожденная матрица, то регулятор с такими и rt строго реализуем и уравнения (19) разрешимы при всех t.
Система замыкается алгоритмом подстройки неизвестных параметров по описанному выше правилу. Установлен следующий результат Теорема 3. Пусть для объекта управления (1) выполнены все описанные предположения и пусть старший коэффициент полинома B() объекта (1)– неособая матрица. Тогда любой адаптивный регулятор вида (17), (8), с описанным выбором начальных оценок 0 и достаточно малым > 0 из (6), будет обеспечивать цель управления (13).
В разделе 3.3 рассматривается задача соответствия эталонной модели. Рассмотрим объект управления вида (1), где yt Rn, ut Rn, t Rl –выход, управляющее воздействие и внешний сигнал соответственно, A(), B(), F ()– матричные полиномы с вещественными коэффициентами размеров nn, nn, n l соответственно. Как обычно, символ –оператор сдвига на шаг вперед yt = yt+1, A( )yt = A0 yt+dA + A1 yt+dA 1 + · · · + AdA yt. предполагается, что det A0 0. Не ограничивая общности, считается, что A0 In – единичная Внешний сигнал t считается доступным измерению и ограниченным:
Коэффициенты полиномов A(), B(), F () в (1) считаются неизвестными, предполагается только минимальнофазовость объекта (1), т.е. устойчивость Предполагается, что задана эталонная модель где Am – гурвицев матричный полином размера n n, Fm – произвольный матричный полином размера n l. Коэффициенты Am и Fm считаются известными. Пусть dAm = deg Am, dFm = deg Fm и dAm dFm dA dB.
Требуется построить регулятор, который для любого (неизвестного заранее) задающего воздействия t, удовлетворяющего (20) и любых начальных данных системы, обеспечивал бы свойство:
Управление выбирается в виде (Проскурников А.В., Якубович В.А. Линейные системы управления с эталонной моделью//Доклады РАН, 2007, т.415, N4, с.461-464) где коэффициенты полиномов Dt, C t, Gt имеют вид Полиномы и rt выбираются следующим образом.
Пусть q = max(2 deg Adeg B deg Am 1, 0). Берется произвольный устойчивый скалярный полином (), deg q. Выберем R = Am и соответственно обозначим dR = deg R = deg + deg Am. Пусть произвольный матричный полином степени dR, первые dA dB старших членов которого совпадают с соответствующими членами матричного полинома R(). Матричный полином делится с остатком на At () (это можно сделать, так как At = In по предположению): = rt At + Qt, где deg Qt < deg A. Если при каждом t B0, старший коэффициент полинома B t (), невырожденная матрица, то регулятор (23) с этими rt и строго реализуем.
Система замыкается алгоритмом подстройки неизвестных параметров по описанному выше правилу. Установлен следующий результат.
Теорема 4. Пусть для объекта управления (1) выполнены все описанные предположения и пусть старший коэффициент полинома B() объекта (1)– неособая матрица. Тогда любой адаптивный регулятор вида (23), (8), с описанным выбором начальных оценок 0 и достаточно малым > 0 из (6), будет обеспечивать цель управления (22).
Заключение.
1. Для многомерных дискретных неопределенных систем синтезировано широкое семейство адаптивных неупреждающих регуляторов, обеспечивающих инвариантность выхода системы управления от неизвестного заранее измеряемого внешнего воздействия.
2. Для многомерных дискретных неопределенных систем построено обширное семейство адаптивных регуляторов, обеспечивающих близость с произвольной наперед заданной точностью выхода системы управления к неизвестному заранее измеряемому задающему сигналу.
3. Для многомерных дискретных неопределенных систем получено конструктивное описанеие широкого семейства адаптивных регуляторов, обеспечивающих близость с произвольной наперед заданной точностью выхода системы управления выходу эталонной модели.
4. Найдены достаточные условия существования строго реализуемых (неупреждающих) регуляторов, решающих указанные задачи.
5. Проведены численные эксперименты для задачи автоматического управления автономным транспортным средством, иллюстрирующие применение теоретических результатов.
ОСНОВНОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ ОТРАЖЕНО В
СЛЕДУЮЩИХ РАБОТАХ:
Работы опубликованные в изданиях из перечня ВАК 1. Е. Ю. Небосько, А. В. Проскурников, В. А. Якубович Синтез адаптивного регулятора в задаче стабилизации неопределенного дискретного линейного объекта. //Доклады академии наук, 2009, том 426, №4, с. 464-467.2. Е. Ю. Небосько, А. В. Проскурников, В. А. Якубович Синтез адаптивного регулятора в задаче об инвариантности неопределенного дискретного линейного объекта. //Доклады академии наук, 2009, том 428, №6, с. 748-751.
3. Е. Ю. Небосько, А. В. Проскурников, В. А. Якубович Синтез адаптивного регулятора в задаче управления дискретной неопределенной линейной системой с эталонной моделью. //Доклады академии наук, 2010, том 433, №3, с. 1-4.
Другие работы по теме диссертации 4. Небосько Е. Ю., Якубович В. А. Адаптивные и универсальные регуляторы в задаче управления транспортным роботом. // Робототехника. Взгляд в будущее. Труды международного научно-технического семинара. СанктПетербург, 2010, с.224- 5. Е. Ю. Небосько Адаптивные регуляторы в задачах отслеживания для неопределенных дискретных линейных систем. //Устойчивость и колебания нелинейных систем управления. Тезисы докладов XI международной конференции. Москва, 2010, с.297-298.