«Импульсно-скользящие режимы дифференциальных включений с приложением к динамике механических систем с трением ...»
Федеральное государственное бюджетное образовательное
учреждение высшего профессионального образования
Иркутский государственный университет
Министерство образования и наук
и Российской Федерации
На правах рукописи
Пономарев Денис Викторович
Импульсно-скользящие режимы
дифференциальных включений
с приложением к динамике
механических систем с трением
Специальность 01.01.02 Дифференциальные уравнения, динамические системы и оптимальное управление Диссертация на соискание ученой степени кандидата физико-математических наук
Научный руководитель:
доктор физ.-мат. наук Финогенко Иван Анатольевич Иркутск – Содержание Введение 1 Импульсно-скользящие режимы 1.1 Предварительные сведения о решениях разрывных систем 1.2 Постановка задачи....................... 1.3 Общие свойства импульсно-скользящих режимов...... 1.4 Скользящие режимы дифференциальных включений с разрывными нелинейностями................. 1.5 Импульсно-скользящие режимы дифференциальных включений............................ 1.6 Линейный осцилятор с сухим трением............ 1.7 Импульсно-скользящие режимы дифференциальных включений с матрицей при производной........... 2 Изолированные импульсы и ломаные Эйлера 2.1 Постановка задачи и предварительные сведения об аппроксимациях Иосиды........................ 2.2 Включения с дельта-функциями, входящими в виде коэффициентов............................ 2.3 Включения с запаздыванием с дельта-функциями, входящими в виде коэффициентов................. 2.4 Аппроксимация ломаных Эйлера............... 3 Импульсно-скользящие режимы управляемых механических систем 3.1 Импульсно-скользящие режимы уравнений Лагранжа второго рода............................ 3.2 Принцип декомпозиции Е. С. Пятницкого для механических систем с сухим трением и импульсным воздействием 3.3 Двухзвенный манипулятор на шероховатой горизонтальной плоскости.......................... Заключение Список основных предположений Литература Введение Объект исследования В диссертации исследуется дифференциальное включение x F (t, x)+u с импульсным позиционным управлением, под которым понимается некоторый абстрактный оператор u p(t, x)t, сопоставляющий каждому состоянию объекта x и текущему моменту времени t сосредоточенный в нем импульс Дирака p(t, x)t и подразумевающий дискретную реализацию процесса управления в виде корректирующих импульсных воздействий на систему в точках направленного множества разбиений интервала управления. Реакцией системы на такое управление являются разрывные решения, которые образуют сеть так называемых ломаных Эйлера. В случае, когда в результате очередной коррекции фазовая точка объекта оказывается на некотором заданном многообразии (поверхности, или пересечении поверхностей), то сеть ломаных Эйлера называется импульсно-скользящим режимом.
Обзор литературы Дискретная реализация процесса импульсного позиционного управления в виде разрывных ломаных Эйлера используется в книге Н. Н. Красовского и А. И. Субботина [27] при исследовании игровых задач управления. В работах С. Т. Завалищина и А. Н. Сесекина [19; 20] позиционные импульсные управления возникают в вырожденных линейноквадратичных задачах оптимального управления. В литературе можно найти другие способы построения последовательностей скачков решений в вырожденных задачах оптимального управления и встретить такие термины как “импульсные скользящие”, “цикличные скользящие”, “скользящие” режимы [9–14; 28].
Разрывные траектории возникают при формализации многих задач теории управления, и этим вопросам посвящено огромное число работ.
Прежде всего это относится к исследованию систем, состояние которых может меняться скачкообразно при кратковременном интенсивном воздействии каких-либо сил. Такие ситуации имеют место в динамике космических аппаратов, механических систем с ударами и в других системах.
Существуют различные способы описания разрывных траекторий динамических систем. Один из них восходит к работе В. Д. Мильмана и А. Д. Мышкиса [35] и состоит в том, чтобы устанавливать правила, по которым происходит скачок траектории. Систематически этот подход развивается в книге [51] (см. также [34]).
Еще один путь описания решения дифференциального уравнения с -функцией Дирака в коэффициентах основан на предельном переходе в этом уравнении после замены в нем идеального импульса Дирака на последовательность его гладких, непрерывных или иных аппроксимаций.
Этот подход восходит к работе Я. Курцвейла [69], в которой правило скачка траектории, по сути, дает условие допустимости скачка через решение так называемого предельного уравнения (см. книгу В. А. Дыхты и О. Н. Самсонюк [16, с. 24]). Естественность такого аппроксимационного подхода для описания решений управляемых систем с импульсными воздействиями обосновывается в книге Н. Н. Красовского [26, с. 84-86]. Но следует отметить (см. [56, с. 34-37]), что при указанном подходе скачок траектории не является однозначно определенным и зависит от характера предельного перехода.
Сравнительный анализ различных подходов к изучению дифференциальных уравнений с обобщенными функциями содержится в книге [18, с. 143-146] (см. также обзорную статью [52]), где детально исследуется еще один класс так называемых аппроксимируемых решений, определяемых на предельных переходах на последовательностях абсолютно непрерывных аппроксимаций функций с ограниченной вариацией.
Что же касается ломаных Эйлера, то отдельный интерес представляет случай, когда в результате действия корректирующих импульсов предельные справа точки соответствующей интегральной кривой оказываются на некотором многообразии (пересечении гиперповерхностей).
В работах С. Т. Завалищина и А. Н. Сесекина исследован управляемый объект где x = (x1,..., xn ) состояние объекта, v(t) возмущение, u управляющее воздействие, определенное, как импульсное позиционное управление u p(t, x)t. Выражение p(t, x)t (“бегущий импульс”, см. [17, с. 215]), как обобщенная функция, смысла не имеет и означает лишь тот факт, что в системе (1) функционирует импульсное позиционное управление, подразумевающее дискретную реализацию “бегущего импульса” в виде последовательности корректирующих импульсов, сосредоточенных в точках разбиения h : t0 < t1 <... < tN = отрезка I. Результатом такой последовательной коррекции является ломаная Эйлера xh (·), по определению совпадающая на промежутках (tk, tk+1 ] с решением задач Коши где xh (t0 ) = x0. Множество всех ломаных Эйлера является сетью, направленной по убыванию d(h) = max {tk+1 tk : k = 0, N 1}. В случае, когда в результате действия корректирующего импульса в моменты времени tk предельная справа точка tk, x(tk + 0) интегральной кривой, соответствующей ломаной Эйлера, оказывается на некотором многообразии сеть ломаных Эйлера называется импульсно-скользящим режимом, а траектория r(t), предельная для равномерно сходящейся на промежутке (t0, ] последовательности ломаных Эйлера идеальным или предельным импульсно-скользящим режимом. Положим (t, x) = ( 1 (t, x),..., m (t, x)). В [18], [21] показано, что при весьма общих предположениях, начиная с момента t0 + 0, выполняется p t, r(t) = 0, а при при некотором дополнительном условии выполняется также t, r(t) = 0, t (t0, ], что означает наличие для предельных режимов эффекта скольжения по многообразию S. В [18; 21, теорема 2.1] методом эквивалентного управления получено также дифференциальное уравнение, которому удовлетворяет любой идеальный импульсно-скользящий режим r(t). В статьях [23; 24] эти результаты обобщены на случай возмущений, задаваемых мерами.
Отметим, что процессы типа скольжения возникают во многих задачах теории управления. Но в большей степени они, как и метод эквивалентного управления, являются атрибутом управляемых систем с разрывными позиционными управлениями (обратными связями) и теории разрывных систем в целом.
Теория дифференциальных уравнений с разрывной правой частью в настоящее время хорошо разработана и имеет многочисленные приложения. Она восходит к задачам классической механики, где более ста лет назад изучались движения механических систем с сухим трением (П. Пэнлеве [72], П. Аппель [5; 6]). Начало систематического изучения разрывных систем относится к шестидесятым годам прошлого столетия и связано с возникновением и развитием теории автоматического регулирования. Существенный толчок к этому дала дискуссия на 1-ом конгрессе ИФАК по докладу А. Ф. Филиппова [15]. В настоящее время такими уравнениями описывается большое количество задач в теории нелинейных колебаний, в теории управления и устойчивости движения [3; 4; 22; 25; 46–48; 64; 66–68].
Решения дифференциальных уравнений с разрывными правыми частями подразделяются на различные типы квазирешений [74], обобщенных решений, а также классифицируются по своим свойствам. В разных ситуациях и теориях могут использоваться различные понятия решения. Их сравнительный анализ можно найти в работах [29–31]. Под обобщенными решениями понимаются, как правило, решения тем или иным способом построенных дифференциальных включений или уравнений в контингециях, которые рассматривалась еще в тридцатые годы прошлого столетия в работах А. Маршо [70; 71] и С. К. Зарембы [75; 76].
Одним из наиболее употребительных и удобных в прикладных задачах стало определение обобщенного решения в смысле А. Ф. Филиппова [56]. Методы изучения систем управления с разрывными позиционными управлениями разработаны в работах М. А. Айзермана, Е. С. Пятницкого [1; 2]. Это направление они условно назвали физическим (в отличие от направления работ А. Ф. Филиппова, которое названо математическим). Из работ многих других ученых, посвященных, в основном, различным методам исследования качественного поведения разрывных систем, укажем на еще один содержательный и общий метод исследования разрывных управляемых систем метод эквивалентного управления, развитый в работах В. И. Уткина [54], который позволяет эффективно описывать движения по пересечению поверхностей разрыва позиционных управлений (разрывных обратных связей) системы вида где B(t, x) u(t, x) = u1 (t, x),..., um (t, x) является разрывным на поверхностях Sj = {(t, x) Rn+1 : j (t, x) = 0}, j = 1, m. Если для решения x(t) уравнения (3), определенного в каком-либо смысле методами теории дифференциальных уравнений с разрывной правой частью, выполняется условие t, x(t) S, то в общепринятой терминологии это решение называется скользящим режимом.
Наличие эффекта скольжения у идеального импульсно-скользящего режима уравнения (1) ставит естественный вопрос об его описании дифференциальным уравнением с разрывной правой частью, для которого он был бы обычным скользящим режимом. Данная работа направлена на решение именно этого вопроса в следующей постановке: требуется определить n m матрицу B(t, x) и найти такое управление u(t, x), чтобы идеальный импульсно-скользящий режим включения с позиционным импульсным управлением u p(t, x)t являлся скользящим режимом дифференциального включения на множестве S и реализовывался на некотором эквивалентном управлении ueq (t, x).
В данной работе используются определения решений разрывных систем в смысле Филиппова, Айзермана-Пятницкого и метод эквивалентного управления. Отметим одну особенность поставленной задачи. Многозначность F (t, x) в правой части включения (5) или (4) может возникать различными путями. Например, если система находится под действием возмущений v = v(t, x), точное значение которых в рамках заданных ограничений неизвестно, или если функция f (t, x) в системе (3) является разрывной по (t, x) и в точках разрыва доопределяется в смысле Филиппова. В этой ситуации эквивалентное управление для включения (5) возникает в виде многозначной функции.
Актуальность темы диссертации Круг задач, которые приводят к динамическим системам с разрывными позиционными управлениями, очень широк. Отметим задачи полной управляемости, слежения и стабилизации, которые решаются выводом системы на скользящий режим основной режим их функционирования. Эти задачи можно решать при помощи обычных разрывных позиционных управлений, которые обеспечивают движение системы в скользящем режиме на эквивалентном управлении, если оно удовлетворяет ограничениям на ресурсы управления. Если же этих ресурсов не хватает, то скользящий режим под действием обычных позиционных управлений прекращается и цель управления не достигается. Но, как видно из вышесказанного, эти же задачи могут решаться и на идеальном импульсноскользящем режиме. Поэтому представляет интерес комбинированное использование обычных позиционных управлений и импульсных позиционных управлений: в областях, где не хватает ресурсов обычных управлений, использовать импульсно-скользящие режимы.
Таким образом, исследуемые в диссертации задачи актуальны как для распространения методов импульсного позиционного управления на более широкий круг задач, так и для развития существующей теоретической базы для решения типичных задач теории разрывных систем управления.
Целью работы является исследование асимптотических свойств импульсно-скользящих режимов дифференциальных включений и изучение их взаимосвязей со скользящими режимами систем с разрывными позиционными управлениями.
Диссертация состоит из трех глав, заключения и списка литературы, включающего 76 наименований. Для удобства чтения приведен список основных предположений, которые фигурируют в формулировках лемм и теорем.
Первая глава посвящена исследованию импульсно-скользящих режимов дифференциальных включений и описанию их с помощью обычных скользящих режимов систем с разрывными нелинейностями сигнатурного типа и состоит из семи разделов.
Первый раздел носит вспомогательных характер и содержит необходимые предварительные сведения из теории дифференциальных уравнений с разрывной правой частью. Второй раздел содержит постановку исследуемой задачи. В третьем разделе изучены общие свойства последовательностей ломаных Эйлера, которые используются в дальнейшем.
В четвертом разделе рассматривается управляемая система (4), для которой ставится и решается задача поиска управления u и условий на него, при которых оно реализует движение по множеству S = {(t, x) Rn+1 : i (t, x) = 0, i = 1, m}, m n.
Вводятся обозначения: t (t, x) вектор-функция, каждая i-я компонента которой является частной производной i (t, x) по t; x (t, x) m n матрица Якоби, каждая i-я строчка которой представляет собой градиент функции i (t, x) по переменной x. Управление ищется в форме ца, удовлетворяющая равенству x (t, x)B(t, x) = Em для любой точки (t, x) S, Em единичная m m матрица. Функции ui (t, x) для любых (t, x) Si = {(t, x) Rn+1 : i (t, x) = 0} определяются равенством где Hi (t, x) 0 некоторые непрерывные функции, i = 1, m, sgn функция знака. Полагая u(t, x) = u1 (t, x),..., um (t, x), приходим к дифференциальному включению (5) с разрывными нелинейностями (6) в правой части.
Пусть Ui (t, x) отрезок, концами которого являются предельные значения функций ui (t, x) в каждой точке (t, x), i = 1, m. В точках непрерывности функции ui (t, x) множество Ui (t, x) состоит из одной точки значения этой функции. Через U (t, x) Rm обозначим множество векторов (1,..., um ), когда ui независимо друг от друга пробегают множества Ui (t, x). Тогда включение (5) запишется в виде управляемой системы Определение. Решением задачи (7), определенным на отрезке I = [t0, t0 +T ], называется пара x(t), u(t), состоящая из абсолютно непрерывной функции x(t) (траектории) и измеримой функции u(t) (управления), удовлетворяющих включениям (7) почти всюду на I.
В теореме 1.4.1 устанавливается существование решений включения (5) и управляемой системы (7).
Условие существования траектории включения (7), удовлетворяющего условию t, x(t) S, t [t0, t0 + T ] (скользящего режима), и управлений, на которых оно реализуется, ищется по схеме метода эквивалентного управления. В данной ситуации оно оказывается многозначным и определяется следующим образом. Для каждых (t, x) S обозначим:
U eq (t, x) = t (t, x) + x (t, x)F (t, x), Элементы ueq (t, x) множества U eq (t, x) называются эквивалентными управлениями, а отображение (t, x) U eq (t, x) многозначным эквивалентным управлением. В теореме 1.4.2 устанавливаются необходимые условия существования скользящего режима x(t) включения (5) в виде неравенства U eq t, x(t) =, и записывается управляемая система, траекторией которой является x(t).
Достаточные условия существования скользящих режимов и устойчивости множества S исследуются при помощи функции Ляпунова в теореме 1.4.3, которая является основным результатом четвертого раздела первой главы.
Теорема 1.4.3 используется далее при изучении включения, которому удовлетворяет идеальный импульсно-скользящий режим включения (4), но сформулированный в ней результат представляет также и самостоятельный интерес, так как системы, в которых одновременно присутствуют многозначные или разрывные характеристики (возмущения, сухое трение и др.) и разрывные позиционные управления, стабилизирующие систему, ранее не изучались.
В пятом разделе показывается связь между импульсно-скользящими режимами и скользящими режимами дифференциальных включений.
Основными являются теоремы 1.5.1 и 1.5.2.
В теореме 1.5.1 получены условия, при которых для включения (4) существует идеальный импульсно-скользящий режим, и любой идеальный импульсно-скользящий режим r(t) является траекторией управляемой системы с начальным условием r(t0 + 0) = x0 + p(t0, x0 ).
В теореме 1.5.2 получены условия, при которых любой идеальный импульсно-скользящий режим r(t) включения (4) является устойчивым скользящим режимом этого же включения с разрывным позиционным управлением u = B(t, x)(t, x), и траекторией управляемой системы (7) при условии, что r(t0 ) = x0 + p(t0, x0 ). В этих теоремах используется условие “сброса” (см. [18]) и интенсивность импульса имеет специальный вид p(t, x) = B(t, x)(t, x).
Отметим, что позиционное импульсное управление при весьма общих предположениях из раздела 2 формирует последовательности ломаных Эйлера для любой управляемой системы. Разрывное управление u(t, x) обладает универсальностью в том смысле, что сохраняет свою структуру для различных целевых множеств S и способно обеспечивать их стабилизацию. Но применимость управлений типа u(t, x) для реализации скользящих режимов имеет ограничения. В шестом разделе использование этих двух типов управлений рассматривается на содержательном примере управления движением линейного осциллятора с сухим трением. Здесь приведены результаты численных экспериментов, которые подтверждают аналитические исследования.
В седьмом разделе первой главы получены дифференциальные включения с разрывными позиционными управлениями для идеальных импульсно-скользящих режимов дифференциальных включений с матрицей при производной Для них установлены аналоги теорем из раздела 5. Эти результаты используются в третьей главе при исследовании режимов декомпозиции и импульсно-скользящих режимов для уравнений Лагранжа второго рода механических систем.
Во второй главе изучается дифференциальное включение с сосредоточенными в точках импульсами. Первый раздел носит постановочный и вспомогательный характер. В нем приводятся известные факты о непрерывных аппроксимациях Иосиды многозначных отображений.
Во втором разделе изучается включение где F : (, ) Rn Rn многозначное отображение с выпуклыми компактными значениями, g : (, ) Rn Rn непрерывное отображение, удовлетворяющее условию Липшица по переменной x, (t) -функция Дирака, сосредоточенная в момент t = 0. Включение вида (8) рассматривается, как идеализация включений где i (t) образуют последовательность непрерывных дельтаобразных функций, удовлетворяющих условиям (D1)–(D2) 1.
Уравнение, на основе которого осуществляется переход от задачи (9) к задаче (8) имеет вид где F (t, x) аппроксимация Иосиды для отображения F (t, x). Решения включения (9) и уравнений (10) понимаются в обычном смысле как Все основные условия, используемые в диссертации, собраны в разделе “Список основных предположений”.
абсолютно непрерывные функции, почти всюду удовлетворяющие (9) и (10) соответственно. Вводятся вспомогательные задачи Основным результатом второго раздела второй главы является теорема 2.2.1, в которой при соответствующих условиях устанавливается, что для любой последовательности решений xi (t) задач (9) при i + имеет место:
где u(t) и w(t) решения включений (11) и (13) соответственно.
Определение. Под обобщенным решением включения (9) будем понимать функцию x(t), которая является решением включения (11) на отрезке [t0, 0] и решением включения (13) на промежутке (0, t0 + T ] с начальным условием x(+0) = v(1), где v(t), t [0, 1] определена из уравнения (12).
В соответствии с этим определением теорема 2.2.1 обеспечивает существование и дает структуру обобщенных решений включения (8). Доопределение обобщенного решения x(t) в точке разрыва t = 0 пределом слева (который, очевидно, существует) является удобным для нас соглашением. Применительно к дифференциальным уравнениям система (12) называется предельной, а начальное условие x(+0) = v(1) (в нашей ситуации) условием допустимости скачка (см. [16, с. 24-25]).
Далее в следствии 2.2.1 устанавливается, что для обобщенных решений уравнения и включения (9) справедлива оценка вида где F (t, x) аппроксимация Иосиды многозначного отображения F (t, x), что также является новым и представляет самостоятельный интерес.
В третьем разделе мы меняем характер предельного перехода на последовательностях дельтаобразных функций и рассматриваем задачу Здесь включение (14) мы понимаем, как формальную запись для предела последовательности задач Вводятся вспомогательные задачи и доказывается теорема 2.3.1, в которой при определенных условиях устанавливается, что для любой последовательности решений xi (t) задач (15) при i + имеет место:
где u(t) и z(t) решения включений (16) и (17) соответственно.
С учетом теоремы 2.3.1 обобщенное решение включения (14) определяется следующим образом.
Определение. Под обобщенным решением включения (14) будем понимать функцию x(t), удовлетворяющую дифференциальному включению (16) на отрезке [t0, 0] и дифференциальному включению (17) на промежутке (0, t0 + T ] с начальным условием x(+0) = x(0) + p x(0).
В четвертом разделе мы полагаем, что функция p(t, x) не зависит от переменной t, и обозначаем ее p(x). Для разбиения h отрезка I вводится в рассмотрение задача и устанавливается, что ломаные Эйлера включения (4) являются обобщенными решениями задачи (18), начиная с точки t0 + 0. Это позволяет доказать основную теорему 2.4.1 этого раздела об аппроксимации ломаных Эйлера последовательностями задач с дельтаобразными функциями, а также с использованием аппроксимаций Иосиды в следствии 2.4.2.
Эти результаты некоторым образом определяют место ломаных Эйлера и импульсно-скользящих режимов в теории систем с разрывными траекториями.
В третьей главе рассматривается механическая система с n степенями свободы и с силами сухого трения в виде уравнений Лагранжа второго рода с начальным условием (t0, q0, q0 ). Здесь представляет интерес наличие в (19) разрывной по q функции QT (t, q, q) (обобщенные силы кулонова трения), непрерывной, положительно определенной при любых (t, q) I Rn матрицы A(t, q), которая в общем случае может отличаться от единичной матрицы, а также наличие управляющих сил u. Они могут быть разрывными позиционными управлениями или носить характер импульсного воздействия: u p(t, q, q)t.
Для механических систем движение по пересечению множеств Si = (t, q, q) : qi = i (t, q), i = 1, n, называется режимом декомпозиции (см. [49; 50]). Такие движения позволяют решать задачи слежения (движение по наперед заданной траектории), задачи стабилизации системы или задачи полной управляемости. В работе [49; 50] развита соответствующая теория (принцип декомпозиции) для уравнений Лагранжа второго рода (без учета сил трения) в рамках некоторых условий, которые предполагают наличие в системе ресурсов управления Hi (i = 1, n), достаточных для обеспечения режимов декомпозиции. Эти исследования продолжались в работах [33; 57; 58].
Режим декомпозиции есть не что иное, как скользящий режим исследуемой механической системы с разрывными позиционными управлениями. В первом разделе третьей главы исследуются общие условия, при которых идеальный импульсно-скользящий режим является режимом декомпозиции. Поэтому он может обеспечиваться импульсно-скользящими режимами с любой точностью. Однако, в тех областях, где достаточно ресурсов обычных обратных связей, движение может быть реализовано на разрывном позиционном управлении релейного типа и при этом будет устойчивым в том или ином смысле.
Во втором разделе третьей главы показана связь идеальных импульсно-скользящих режимов механической системы с множеством S, определяемым уравнением q = (t, q), со скользящими режимами системы (19) с двумя различными разрывными позиционными управляющими воздействиями. Для этих случаев получены условия на ресурсы управления, которые иллюстрируются нетривиальным примером двухзвенного манипулятора на шероховатой плоскости.
В Заключении сформулированы основные результаты диссертации.
Методы исследования. В работе используются методы теории дифференциальных уравнений с разрывной правой частью, теории дифференциальных включений, многозначного анализа и элементы теории динамических систем с разрывными траекториями и импульсными воздействиями.
Научная новизна. В работе сама постановка задачи об описании идеальных импульсно-скользящих режимов систем с импульсным позиционным управлением как скользящих режимов разрывных систем с разрывными позиционными управлениями является новой. Для этой задачи разработаны более общие, чем известные ранее, методы изучения импульсно-скользящих режимов дифференциальных включений с применением многозначного анализа. Так, многозначный аналог метода эквивалентных управлений ранее не использовался. Для изучения структуры обобщенных решений включений с сосредоточенными в точках импульсами новым является подход, основанный на непрерывных однозначных аппроксимациях Иосиды многозначных отображений, что позволяет эффективно использовать для исследований известные в теории дифференциальных уравнений с импульсами факты. Получены теоремы о взаимосвязях скользящих и импульсно-скользящих режимов дифференциальных включений, которые являются новыми также и для дифференциальных уравнений, которые являются частным случаем дифференциальных включений. Доказана новая теорема об аппроксимации импульсноскользящего режима системы последовательностями решений этой же системы с дельтаобразными непрерывными функциями в правой части.
На задачах управления механическими системами с сухим трением показана принципиальная возможность комбинированного использования позиционных импульсных и разрывных позиционных управлений в условиях, когда недостаточно ресурсов управления у последних.
Достоверность результатов. Все утверждения диссертации являются полностью доказанными с использованием хорошо известных и достоверных фактов теории дифференциальных уравнений с разрывной правой частью, теории дифференциальных включений и многозначного анализа. Они опубликованы в рецензируемых научных журналах и прошли обсуждение на научных конференциях и семинарах.
Теоретическая и практическая значимость. В диссертации развит новый подход к изучению импульсно-скользящих режимов систем, полученных в результате процедуры дискретизации импульсного позиционного управления, основанный на их описании системами с разрывными позиционными управлениями. Результаты диссертации являются дополнением существующей теоретической базы для решения прикладных задач, которые приводят к системам с позиционными разрывными и импульсными управлениями, и могут применяться для исследования динамики конкретных систем управления.
Соответствие диссертации паспорту научной специальности.
В диссертации рассмотрены дифференциальные включения с позиционным импульсным управлением и установлена взаимосвязь идеальных импульсно-скользящих режимов со скользящими режимами дифференциальных включений с разрывными позиционными управлениями. Полученные результаты применены к исследованию управляемых механических систем, представленных уравнениями Лагранжа второго рода.
Область исследований диссертации соответствует п. 4 “Динамические системы, дифференциальные уравнения на многообразиях” и п. 11 “Дифференциальные включения и системы вариационных неравенств” паспорта специальности 01.01.02 – дифференциальные уравнения, динамические системы и оптимальное управление.
Апробация работы. Исследования по теме диссертации проводились в рамках плановых тем НИР Института математики, экономики и информатики ФГБОУ ВПО “ИГУ”, проекта РФФИ 10-01-00132а и ФЦП “Научные и научно-педагогические кадры инновационной России” (проект № 2012–1.2.1–12–000–1001–011). Результаты диссертации были представлены на Всероссийской конференции “Математическое моделирование и вычислительно-информационные технологии в междисциплинарных научных исследованиях” (Иркутск, 2009, 2011), на XI Всероссийской конференции молодых ученых по математическому моделированию и информационным технологиям (Иркутск–Байкал, 2010), на XI Международной конференции “Устойчивость и колебания нелинейных систем управления” (Москва, конференция Пятницкого, 2010), на II Международной школе-семинаре “Нелинейный анализ и экстремальные задачи” (Иркутск, 2010), на Международной конференции “Колмогоровские чтения – V. Общие проблемы управления и их приложения” (Тамбов, ОПУна XV Байкальской международной школе-семинаре “Методы оптимизации и их приложения” (Иркутск–Байкал. Конференция памяти В. П. Булатова, 2011), на IV Международной конференции “Математика, ее приложения и математическое образование” (Улан-Удэ, 2011), на Международной конференции, посвященной 105-летию со дня рождения С. Л. Соболева “Дифференциальные уравнения. Функциональные пространства. Теория приближений” (Новосибирск, 2013), а также на конференциях и семинарах ИДСТУ СО РАН и на семинаре кафедры Дифференциальных уравнений и математического анализа ИМЭИ ФГБОУ ВПО “ИГУ”.
Публикации и личный вклад. По результатам диссертации опубликовано 12 работ. Основные результаты главы 1 опубликованы в статье [63], главы 2 в статьях [37; 45], главы 3 в статье [42], входящих в перечень рецензируемых журналов и изданий, рекомендованных ВАК Минобрнауки РФ для опубликования результатов диссертаций, также отражены в материалах и трудах международных и всероссийских конференций [36; 38–41; 43; 44; 73]. Все результаты, выносимые на защиту, получены автором лично и не нарушают авторских прав других лиц. В совместных публикациях И. А. Финогенко принадлежат постановки исследуемых задач.
Автор выражает свою искреннюю благодарность д.ф.-м.н. И. А. Финогенко за научное руководство данной работой.
Глава Импульсно-скользящие режимы 1.1 Предварительные сведения о решениях разрывных систем Как было указано во введении, исследования будут опираться на понятия решений разрывных систем в смысле Филиппова, АйзерманаПятницкого и на метод эквивалентного управления. Для полноты изложения приведем соответствующие определения [56] (см. также [61]).
1. Определение решения А. Ф. Филиппова. Пусть f (t, x) некоторая однозначная функция, определенная и непрерывная всюду в области Rn+1 за исключением некоторого множества M. Предполагается, что множество M имеет нулевую меру Лебега. Как правило, в прикладных задачах множество M некоторый набор гиперповерхностей в пространстве переменных (t, x).
Определение 1.1.1. Функция f (t, x) называется кусочно-непрерывной, если выполняются следующие условия:
1) область состоит из конечного числа областей j, j = 1, l, и множества M (нулевой меры) точек границ этих областей;
2) в каждой области j функция f непрерывна по совокупности переменных;
3) для каждой точки (t, x) M существует конечный предел функции f по любой из областей j, для которой точка (t, x) является граничной.
Отметим, что функция f (t, x) рассматривается при условии (t, x) M. На множестве M она может быть не определена и задается некоторым специальным образом, что и приводит к различным понятиям решения дифференциальных уравнений с разрывной правой частью.
Для кусочно-непрерывной функции f (t, x) через F (t, x) обозначим выпуклую оболочку всех ее предельных значений в каждой фиксированной точке (t, x). Если в точке (t, x) функция f (t, x) непрерывна, то F (t, x) множество состоящее из одной точки f (t, x). Такое многозначное доопределение функции f называется простейшим выпуклым доопределением.
Определение 1.1.2. Под решением дифференциального уравнения с кусочно-непрерывной функцией f в правой части понимается решение дифференциального включения Функция x : (, ) Rn является решением дифференциального включения (1.1.2), если на каждом конечном отрезке [t0, t1 ] (, ) она абсолютно непрерывна, и ее производная x(t) удовлетворяет включению x(t) F t, x(t) для почти всех t [t0, t1 ].
Приведенное определение решения называется решением дифференциального уравнения (1.1.1) по Филиппову.
2. Определение решения М. А. Айзермана, Е. С. Пятницкого. Рассмотрим систему уравнений где функция f (t, x, u1..., um ) непрерывна по совокупности аргументов, функция u = (u1,..., um ) имеет смысл управления. Пусть каждая функция ui = ui (t, x) разрывна только на одной гладкой поверхности Si = {(t, x) : i (t, x) = 0} и является кусочно-непрерывной. Это означает, что каждая функция ui (t, x) непрерывна в областях Si+ и Si, на которые поверхность Si разбивает пространство переменных (t, x), и для каждой точки (t, x) Si существуют конечные предельные значения функции ui (t, x) по этим областям. Обозначим их u+ (t, x) и u (t, x).
Через Ui (t, x) обозначается отрезок с концами ui (t, x) и ui (t, x), если (t, x) Si. В областях непрерывности функции ui (t, x) множество Ui (t, x) состоит из одной точки ui (t, x).
Определим F1 (t, x) = f t, x, U1 (t, x),..., Um (t, x), как множество значений функции f (t, x, u1,..., um ), когда точка (t, x) фиксирована, а переменные u1,..., um независимо друг от друга пробегают, соответственно, множества U1 (t, x),..., Um (t, x). Через F2 (t, x) обозначается выпуклая оболочка множества F1 (t, x).
Определение 1.1.3. Под решением уравнения (1.1.3) понимается решение дифференциального включения Отметим, что включение (1.1.4) может быть записано в виде совокупности систем дифференциальных уравнений:
где u = ui (t, x) в точках непрерывности функции ui (t, x) и измеримы. Совокупность систем уравнений (1.1.5) называется репрезентативной системой уравнений и была введена в работах М. А. Айзермана, Е. С. Пятницкого [1; 2] для обоснования включения (1.1.4).
3. Метод эквивалентного управления. Как отмечалось выше, для разрывных систем существует особый тип решений скользящие режимы. Основным методом описания скользящих режимов является метод эквивалентного управления. Будем рассматривать уравнение (1.1.3). Пусть (t, x) принадлежит одновременно поверхностям S1,..., Sr, 1 r m. Задача состоит в том, чтобы найти значения ueq (t, x) из уравi нений Определение 1.1.4. Функции ueq (t, x) называются эквивалентными управлениями и под решением уравнения (1.1.3) понимается абсолютно непрерывная функция x(t), удовлетворяющая на пересечении поверхностей Si, i = 1, r и уравнению (1.1.3) вне поверхностей Si.
Необходимым условием существования такого решения является выполнение условий: ueq t, x(t) Ui t, x(t) для всех i = 1, r. Если хотя бы одно из таких условий не выполняется, решения в указанном выше смысле не существует, и метод эквивалентного управления “не работает”.
Эквивалентные управления определяют уравнение скользящего режима и условия его существования неявно. Если скользящий режим существует, то он является решением в смысле Айзермана-Пятницкого.
Отметим, что если функция f (t, x, u) линейна по u, и векторы частных производных функций i (t, x) в точках пересечения поверхностей Si линейно независимы, то три описанных выше подхода к определению решения (по Филиппову, по Айзерману-Пятницкому и методом эквивалентного управления) совпадают.
1.2 Постановка задачи Пусть Rn n-мерное векторное пространство с евклидовой нормой ·. В первой главе исследуется управляемый объект, представленный в виде где x = (x1,..., xn ), F (t, x) многозначное отображение с выпуклыми компактными значениями, u управляющее воздействие, задаваемое абстрактным оператором u p(t, x)t, сопоставляющим каждому текущему моменту времени t и состоянию объекта x импульс p(t, x)t, вектор-функция p(t, x) интенсивность импульса, t дельта-функция Дирака, сосредоточенная в момент времени t. Будем называть ее “бегущим импульсом”, а выражение p(t, x)t позиционным импульсным управлением. Мы задаем разбиение h : t0 < t1 <... < tN = t0 + T отрезка I, полагаем, что импульсные воздействия происходят только в точках разбиения, и получаем ломаные Эйлера xh (·), по определению совпадающие на промежутках (tk, tk+1 ] с решениями задач Коши Рассматривается случай, когда в результате действия корректирующего импульса в момент времени tk предельная справа точка tk, x(tk + 0) интегральной кривой, соответствующей ломаной Эйлера, оказывается на многообразии S = {(t, x) Rn+1 : j (t, x) = 0, j = 1, m}, где m n. Тогда множество ломаных Эйлера называется импульсноскользящим режимом, а траектории r(·), предельные для равномерно сходящихся на промежутке (t0, ] последовательностей ломаных Эйлера идеальными (предельными) импульсно-скользящим режимами. Исследуются общие свойства импульсно-скользящих режимов и вопрос об уравнении, которому они удовлетворяют.
1.3 Общие свойства импульсно-скользящих режимов На отрезке числовой прямой I = [t0, t0 + T ] R зададим некоторое разбиение h : t0 < t1 <... < tN = t0 + T и через d(h) обозначим максимальное расстояние между двумя соседними узлами этого разбиения. Пусть p : I Rn Rn некоторая непрерывная функция и xh : I Rn функция, удовлетворяющая следующим условиям:
(X1) xh (t) абсолютно непрерывна на каждом промежутке (tk, tk+1 ];
Множество всех разбиений h отрезка I обозначим через H. Последовательность функций {xhi (·)}, hi H, назовем конфинальной, если Из (X1) и (X2) следует, что имеет место следующее равенство:
для всех t J = (t0, t0 + T ], где xh (t) производная функции xh (t), определенная почти всюду на I, mt номер узла разбиения h, ближайшего слева к точке t J и не совпадающего с t, mt0 = 0. Из (1.3.1) вытекает, что при условии t0 < < t t0 + T выполняется В случае, когда промежуток [, t) не содержит узлов разбиения, сумма в правой части (1.3.2) равна 0.
Лемма 1.3.1. Пусть функции p(t, x) и xh (t) удовлетворяют следующим условиям:
для всех (t, x), (, y) I Rn ;
по Лебегу функция;
для всех k = 0, N 1 и всех разбиений h H. Тогда существует константа M такая, что для всех разбиений h H и всех t I выполняется Доказательство. Для всех t [t0, t1 ] из неравенства (1.3.4) получаем p t, xh (t) для произвольного узла разбиения tk = t0. Из условий (1.3.5) и (1.3.3) вытекает:
Тогда с учетом (1.3.4) получаем следующую оценку:
Воспользовавшись представлением (1.3.1) и неравенствами (1.3.8), (1.3.4), получаем L) C()d. Объединяя последнее неравенство и неравенство (1.3.7) и используя теорему 1.1 из [65, с. 37], получаем оценку (1.3.6) с константой Лемма доказана.
Лемма 1.3.2. Пусть выполняются все условия леммы 1.3.1. Тогда из любой конфинальной последовательности функций {xhi (t)} можно выделить подпоследовательность, равномерно на отрезке I сходящуюся к некоторой абсолютно непрерывной на промежутке J = (t0, t0 + T ] функции, и любой равномерный на промежутке J предел r(t) конфинальной последовательности функций удовлетворяет условиям Замечание 1.3.1. Доказательство этой леммы опирается на обобщение теоремы Арцела, которое установлено в лемме из [55, с. 309] 1. ОтЛемма [55, с. 309]. Пусть на отрезке a t b задана последовательность точек t1, t2,... и бесконечное множество n-мерных вектор-функций, модули которых ограничены одним и тем же числом c. Пусть для любого > 0 существуют такие m() и () > 0, что на каждом интервале длины меньше (), не содержащем точек t1, t2,..., tm(), колебание каждой из данных функций меньше.
Тогда из данного множества функций можно выбрать последовательность, равномерно сходящуюся к вектор-функции, непрерывной при t = t1, t2,... и могущей иметь разрывы только первого рода при метим, что в работах [18], [21] доказательство теоремы 1 о выделении из конфинальной последовательности равномерно сходящейся подпоследовательности ссылается на это обобщение без каких-либо необходимых выкладок. Представленное ниже доказательство леммы 1.3. содержит проверку условий применимости леммы из [55, с. 309].
Доказательство. Пусть, t произвольные моменты времени, такие, Тогда в силу оценок (1.3.8) и (1.3.6) получаем (1+M ) A(t)A( ) +L (1+L)(1+M ) A(t)A( ) +L(t )+L( t,hi )+L(1+M ) A( )A(t,hi ) где K = (1+L)(1+M ), R(, t,hi ) = L( t,hi )+L(1+M ) A( )A(t,hi ), t,hi ближайший слева к точке узел разбиения hi. В случае отсутствия узлов разбиения hi на промежутке [, t) имеет место оценка Зафиксируем произвольное > 0. Тогда в силу абсолютной непрерывности функции A(t) существует такое () > 0, что для любых, t J, удовлетворяющих неравенству |t | < (), выполняется K A(t) A( ) + L(t ) < /2. Так как t,hi d(hi ), то с учетом конфинальности последовательности {xhi (·)} и абсолютной непрерывноt = t1, t2,... ; величина разрыва в точках tm, m > m() не превосходит (безразлично, определены или нет данные функции в точках tm ).
сти функции A(t) заключаем: существует такое натуральное k(), что для любого натурального i k() и для любого t J имеет место неравенство R(, t,hi ) < /2. Таким образом из (1.3.10) вытекает, что при условии i k() выполняется оценка для любых, t J, удовлетворяющих неравенству |t | < ().
Через h = {tj } обозначим последовательность, содержащую совокупность всех узлов разбиений hi, i N, занумерованную в произвольном порядке. Так как множество функций {xhi (·) : i N, i < k()} из конфинальной последовательности {xhi (·)} конечно, то конечно и множество G() всех узлов разбиений отрезка I для этих функций, при этом t0 G(). Тогда существует такое натуральное m() > 0, что G() {tj h : j = 1, m()}. Колебание произвольной функции xhi (t), i < k(), на интервале длины меньше (), не содержащем точек t1,..., tm() h, определяется оценкой (1.3.11) и не превосходит.
Объединяя вышесказанное, заключаем, что колебание любой функции xh (·) {xhi (·)} на любом интервале длины меньше (), не содержащем точек t1,..., tm() h, не превосходит. Это означает выполнение условий леммы (см. [55, с. 309]). Следовательно, существует подпоследовательность {xhi (·)} {xhi (·)} функций, равномерно сходящаяся к некоторой функции r(t).
Для того, чтобы показать абсолютную непрерывность функции r(t), перейдем к пределу при i + в неравенстве (1.3.10). В результате получим r(t) r( ) K A(t) A( ) + L(t ) для любых t0 < < t t0 + T. Из последнего неравенства, с учетом абсолютной непрерывности функции A(t), вытекает абсолютная непрерывность функции r(t) на промежутке J.
Покажем выполнение равенств (1.3.9) для функции r(t), которая является равномерным на J пределом конфинальной последовательности функций xhi (t). С учетом (1.3.5) и (1.3.3) и обозначая через tmt,hi ближайший слева к моменту времени t узел разбиения hi, не совпадающий с t, имеем:
p t, r(t) В силу равномерной сходимости последовательности {xhi (·)} на промежутке J правая часть неравенства (1.3.12) при i + стремится к нулю, и тем самым первое равенство в (1.3.9) установлено. Второе равенство вытекает из равномерной сходимости последовательности {xhi (·)} и условия (X2) при k = 0.
Лемма доказана.
Доказательство лемм 1.3.1 и 1.3.2 следует схемам доказательств лемм 1.1, 1.2 и теоремы 1 из [18], но при этом не предполагается, что функции xh (t) являются ломаными Эйлера для какой-либо системы с позиционным импульсным управлением. Таким образом, утверждения лемм 1.3. и 1.3.2 являются общими свойствами импульсно-скользящих режимов.
1.4 Скользящие режимы дифференциальных включений с разрывными нелинейностями Рассмотрим управляемую систему управляющее воздействие, F : R1 Rn Rn отображение с выпуклыми компактными значениями, удовлетворяющее условиям (B1)–(B3).
Поставим задачу поиска управления u, при которых оно реализует движение по множеству S = {(t, x) Rn+1 : i (t, x) = 0, i = 1, m}, m n, где i (t, x) непрерывно дифференцируемые функции. Введем обозначения: t (t, x) вектор-функция, каждая i-я координата которой является частной производной i (t, x) по t; x (t, x) mn матрица Якоби, каждая i-я строчка которой представляет собой градиент функции i (t, x) по переменной x. Будем искать управление в форме где u = (1,..., um ), B(t, x) некоторая непрерывная n m матричная функция, удовлетворяющая равенству для любой точки (t, x) S, Em единичная m m матрица.
Для любых (t, x) Si = {(t, x) Rn+1 : i (t, x) = 0} определим функции где Hi (t, x) 0 некоторые непрерывные функции, i = 1, m.
Полагая u(t, x) = u1 (t, x),..., um (t, x), приходим к дифференциальному включению (1.4.1) с разрывной нелинейностью в правой части, которое запишется в виде:
Пусть Ui (t, x) отрезок, концами которого являются предельные значения функций ui (t, x) в каждой точке (t, x), i = 1, m. В точках непрерывности функции ui (t, x) множество Ui (t, x) состоит из одной точки значения этой функции. Через U (t, x) Rm обозначим множество векторов (1,..., um ), когда ui независимо друг от друга пробегают множества Ui (t, x).
Под решением задачи (1.4.4), определенном на отрезке I = [t0, t0 +T ], будем понимать решение дифференциального включения т. е. абсолютно непрерывную функцию x(t), удовлетворяющую (1.4.5) почти всюду на I.
Включение (1.4.5) может быть представлено в виде управляемой системы Решением для задачи (1.4.6), определенным на отрезке I = [t0, t0 + T ], называется пара x(t), u(t), состоящая из абсолютно непрерывной функции x(t) (траектории) и измеримой функции u(t) (управления), удовлетворяющих включениям (1.4.6) почти всюду на I.
Теорема 1.4.1. Пусть для многозначного отображения F (t, x) с выпуклыми компактными значениями выполняются предположения (B1)–(B3), функции i (t, x), i = 1, m, m n являются непрерывно дифференцируемыми, матрица B(t, x) и функции Hi (t, x) непрерывны.
Тогда:
1. Для любых начальных условий x(t0 ) = x0 существует локальное решение включения (1.4.5), определенное на некотором отрезке I = [t0, t0 + T ].
2. Для любого решения x(t) включения (1.4.5) найдется измеримая функция u(t), такая, что пара x(t), u(t) будет решением управляемой системы (1.4.6).
Доказательство. Докажем утверждение 1. Обозначим Так как в каждой фиксированной точке (t, x) множество U (t, x) Rm выпуклое и компактное, B(t, x) линейный непрерывный оператор, действующий из Rm в Rn, то множество U (t, x) = B(t, x)U (t, x) также выпуклое и компактное. Тогда и множество F (t, x) выпуклое и компактное, как сумма двух выпуклых и компактных множеств.
Ниже при доказательстве свойств (B’1)–(B’3) без оговорок используются некоторые хорошо известные свойства полунепрерывных сверху и измеримых многозначных отображений с компактными значениями, которые можно найти, например, в [8, гл. 1].
(B’1) Будучи полунепрерывным сверху по переменной t, многозначное отображение t U (t, x) измеримо при каждом фиксированном x.
Тогда из условия (B1) для F (t, x) вытекает, что многозначное отображение t F (t, x) также измеримо, как алгебраическая сумма двух измеримых отображений, и поэтому имеет измеримый селектор при каждом фиксированном x.
(B’2) В силу непрерывности функций Hi (t, x), i = 1, m, и непрерывности матрицы B(t, x) многозначное отображение U (t, x) имеет замкнутый график и локально ограничено в окрестности каждой точки (t, x). Тогда многозначное отображение U (t, x) полунепрерывно сверху в каждой точке (t, x) по совокупности аргументов. Из условия (B2) для F (t, x) вытекает, что многозначное отображение F (t, x) полунепрерывно сверху по переменной x при почти каждом фиксированном t, как алгебраическая сумма двух полунепрерывных сверху многозначных отображений.
(B’3) Из полунепрерывности сверху многозначного отображения U (t, x) вытекает, что оно ограничено на любом компактном подмножестве пространства Rn+1. Тогда из условия (B3) для F (t, x) вытекает, что для любой ограниченной области Rn+1 существует суммируемая по Лебегу функция (t), такая, что для всех (t, x) и v F (t, x) выполняется неравенство v (t). (Это свойство будем называть интегральной ограниченностью многозначного отображения F (t, x).) Из установленных выше свойств (B’1)–(B’3) многозначного отображения F (t, x) вытекает (см. [8, теорема 3.2.4]), что для любых начальных данных (t0, x0 ) существует локальное решение x(t), x(t0 ) = x0, дифференциального включения (1.4.5), определенное на некотором отрезке I = [t0, t0 + T ].
Докажем утверждение 2. Пусть x(t) решение включения (1.4.5), определенное на I. Тогда для почти всех t I выполняется включение x(t) F t, x(t) + U t, x(t). Из леммы Филиппова о неявной функции (см. [8, теорема 1.5.15 ]) вытекает, что существует измеримая функция g(t) U t, x(t), такая, что x(t) F t, x(t) + g(t) для почти всех t I. Еще раз воспользовавшись леммой Филиппова, заключаем, что существует измеримая функция u(t) U t, x(t), такая, что g(t) = B t, x(t) u(t) для почти всех t I. Тогда пара x(t), u(t) решение управляемой системы (1.4.6), и утверждение 2 доказано.
Теорема доказана.
С учетом второго включения из (1.4.6) из теоремы 1.4.1 вытекает, что управляемая система (1.4.6) и дифференциальное включение (1.4.5) эквивалентны в том смысле, что любая траектория из пары x(t), u(t) является решением включения (1.4.5), и любое решение этого включения является траекторией системы (1.4.6).
Условия существования решения включения (1.4.4), удовлетворяющего условию t, x(t) S, t [t0, t0 + T ], и управлений, на которых оно реализуется, будем искать, используя схему метода эквивалентного управления (см. [56, с. 44]). Такие решения будем называть скользящими режимами для включения (1.4.4). Вначале рассмотрим необходимые условия.
Для каждых (t, x) S обозначим:
Элементы ueq (t, x) множества U eq (t, x) будем называть эквивалентными управлениями, а отображение (t, x) U eq (t, x) многозначным эквивалентным управлением.
Теорема 1.4.2. Пусть выполняются все условия теоремы 1.4.1, и x(t) скользящий режим включения (1.4.4), определенный на отрезке I = [t0, t0 + T ]. Тогда для почти всех t I, и функция x(t) является траекторией управляемой системы Доказательство. Так как функция x(t) является решением включения (1.4.5), то в соответствии с теоремой 1.4.1 существует измеримая функция u(t) U t, x(t), такая, что для почти всех t I выполняется включение x(t) F t, x(t) + B t, x(t) u(t). Тогда из условия x(t) S для всех t I получаем 0 = t t, x(t) + x t, x(t) x(t) t t, x(t) + x t, x(t) F t, x(t) u(t).
Из (1.4.9) вытекает, что u(t) U eq t, x(t) для почти всех t I.
Следовательно, выполняется условие (1.4.7), и u(t) U eq t, x(t) для почти всех t I. Таким образом, пара x(t), u(t) является решением управляемой системы (1.4.8). Теорема доказана.
Из теоремы 1.4.2 вытекает, что любой скользящий режим включения (1.4.4) является траекторией x(t) решения x(t), u(t) системы (1.4.8), реализованной на эквивалентном управлении, для которого u(t) = ueq t, x(t) U eq t, x(t). Отметим также, что при условии однозначности функции F (t, x) = {f (t, x)} условие (1.4.7) равносильно неравенствам и эквивалентные управления ueq (t, x) на множестве S однозначно определяются равенствами Это согласуется с методом эквивалентного управления для дифференциальных уравнений с разрывными позиционными управлениями.
Достаточные условия существования скользящих режимов и устойчивости множества S исследуем при помощи функции Для любого > 0 обозначим W (t, x) = {(t, x ) : x x <, |tt | < }.
Теорема 1.4.3. Пусть выполняются все условия теоремы 1.4.1, и на множестве S выполняется равенство (1.4.2). Предположим, что для каждой точки (t, x) S существует > 0 и окрестность W (t, x) этой точки, такая, что для всех (t, x ) W (t, x) и для всех индексов i = 1, m выполняется неравенство:
Тогда справедливы следующие утверждения:
1. Для любого решения x(t) дифференциального включения (1.4.4) с начальными данными (t0, x0 ) S выполняется t, x(t) S для всех точек t t0 , в которых это решение существует.
2. Для любых точек (t, x) S выполняется где символ int означает внутренность множества.
3. Для любых начальных данных (t0, x0 ) S существует скользящий режим включения (1.4.4), определенный (как решение включения (1.4.4)) на правом максимальном промежутке существования, и любое решение x(t) с начальными данными (t0, x0 ) S является скользящим режимом тогда и только тогда, когда оно является траекторией управляемой системы (1.4.8) с теми же самыми начальными данными.
4. Множество S является устойчивым в следующем смысле: для любых (t0, x0 ) S и > 0 существует > 0 такое, что при условиях x0 x0 < и |t0 t0 | < для любого решения дифференциального включения (1.4.4) с начальным условием x(t0 ) = x0 выполняется t, x(t) S для всех точек t t0 +, в которых это решение существует.
Доказательство. Докажем утверждение 1. Пусть x(t) решение включения (1.4.4) с начальной точкой (t0, x0 ) S, определенное на правом максимальном промежутке существования [t0, ). Обозначим через = sup{t [t0, ) : t, x(t) S, t [t0, t ]} и предположим, что <.
Тогда, x() S.
Введем обозначение A(t, x) = x (t, x)B(t, x)+Em. Элементы матрицы A(t, x) являются непрерывными функциями в силу непрерывности матриц x (t, x) и B(t, x) и, с учетом (1.4.2), принимают нулевые значения на множестве S. Следовательно, вектор-функция (t, x) = A(t, x)(t, x) u бесконечно малая в каждой точки (t, x) S.
Производная функции, определенной равенством (1.4.10), на решении x(t) запишется в виде:
и, следовательно, является измеримой функцией. Учитывая равенство (1.4.2), получаем выражение для V = V t, x(t) компоненты вектор-функции, и f (t) F t, x(t) x(t) удовлетворяет включению (1.4.5). Из бесконечной малости функций i (t, x) и неравенств (1.4.11) вытекает, что для каждой точки (t, x) S существует > 0 и окрестность W (t, x) этой точки, такие, что выполняются неравенства:
для всех точек (t, x ) W (t, x) и для всех w F (t, x ).
Из определения числа вытекает, что, x() S, и поэтому в неравенстве (1.4.14) можно положить t = и x = x(). Тогда из (1.4.13) и (1.4.14) получаем, что найдется точка 1 (, ) такая, что для почти всех t [, 1 ]. Следовательно, функция V t, x(t) невозрастающая, а так как V, x() = 0, то V t, x(t) = 0 для всех t [, 1 ].
Отсюда вытекает, что t, x(t) S для всех t [t0, 1 ], что противоречит определению числа. Полученное противоречие показывает, что t, x(t) S для всех t [t0, ). Утверждение 1 теоремы доказано.
Утверждение 2 вытекает из неравенства (1.4.11) и определений множеств U eq (t, x), U eq (t, x).
Докажем утверждение 3. Существование скользящего режима на правом максимальном промежутке существования следует из теоремы 1.4.1 и доказанного выше утверждения 1. Пусть теперь x(t) решение включения (1.4.4) с начальными данными (t0, x0 ) S, являющееся скользящим режимом. Тогда в силу теоремы 1.4.2 оно является траекторий управляемой системы (1.4.8). Обратно, если x(t) траектория системы (1.4.8) с начальными данными (t0, x0 ) S, то в силу (1.4.12) и теоремы 1.4.1 заключаем, что x(t) решение включения (1.4.4), а в силу утверждений данной теоремы оно является скользящим режимом.
Докажем утверждение 4. Пусть точка (t0, x0 ) S и число > произвольны. Так как V (t0, x0 ) = 0 и функция V (t, x) непрерывна, то выберем число 0 < 1 < /2 настолько малым, чтобы выполнялось неравенство (1.4.14) и для всех (t, x) W1 (t0, x0 ).
Используя свойство интегральной ограниченности правой части дифференциального включения (1.4.5), выберем число 0 < 2 < 1 так, чтобы для любых (t0, x0 ) W2 (t0, x0 ) и для любого решения x(t) с начальными условиями (t0, x0 ) выполнялось t, x(t) W1 (t0, x0 ) для всех t [t0, t0 + 2 ]. Тогда из (1.4.13) и (1.4.14) получаем, что для этого решения выполняется неравенство (1.4.15) для почти всех t [t0, t0 +2 ]. Если t0, x0 S, то для < 2, такого, что (t, x(t)) S для всех t [t0, t0 +], из (1.4.15) вытекает для всех t [t0, t0 + ]. Тогда из неравенств (1.4.16) и (1.4.17) вытекает, выбор чисел 1 и 2, заключаем, что t0 + 1 < t0 +. Теперь утверждение 4 вытекает из утверждения 1 данной теоремы, примененного к решению с начальными данными t0 = t0 + 1, x0 = x(t0 + 1 ).
Теорема доказана.
1.5 Импульсно-скользящие режимы дифференциальных включений Будем рассматривать дифференциальное включение (1.4.1) в предположении, что u управляющее воздействие, которое каждому текущему моменту времени t и состоянию x объекта ставит в соответствие импульс p(t, x)t, где t функция Дирака, сосредоточенная в моменте времени t, p(t, x) интенсивность импульса. Как уже отмечалось во введении, такие воздействия на систему называются позиционным импульсным управлением, которое “срабатывает” только в узлах разбиения В результате таких воздействий на решения включения x F (t, x) возникают ломаные Эйлера xh (t), которые применительно к нашей ситуации на каждом промежутке (tk, tk+1 ] совпадают с решениями задач Коши для дифференциального включения где xh (t0 ) = x0. Так как xh (tk + 0) = xh (tk ) + p tk, xh (tk ), k = 0, N 1, то функции xh (t) удовлетворяют условиям (X1), (X2). Мы рассматриваем такие управления, которые после каждого корректирующего импульса приводят систему на некоторое многообразие S = {(t, x) мы предполагаем, что функция p(t, x) удовлетворяет следующим условиям:
Совокупность всех ломаных Эйлера называется импульсно-скользящим режимом. Функция r(t), являющаяся равномерным на промежутке (t0, t0 +T ] пределом r(t) последовательности ломаных Эйлера при d(h) 0 и доопределенная в точке t0 равенством r(t0 ) = r(t0 + 0), называется идеальным (или предельным) импульсно-скользящим режимом. Поставим целью показать, что идеальный импульсно-скользящий режим для включения (1.4.1) является обычным скользящим режимом для включения (1.4.8) с начальным условием r(t0 ) = x0 + p(t0, x0 ).
Определим величину импульсного воздействия следующим образом В этом разделе всюду предполагаем, что B(t, x) непрерывная матричная функция размерности n m, и (t, x) непрерывно дифференцируемая векторная функция c матрицей Якоби x (t, x), имеющей ранг, равный m для всех (t, x) S. При этих предположениях из условий (1.5.2), (1.5.3) вытекает, что выполняется равенство (1.4.2) (см. [18, лемма 2.2]).
Сделаем ряд построений. Пусть xh (t) ломаная Эйлера включения (1.4.1), соответствующая некоторому разбиению h отрезка I точками t0 < t1 < · · · < tN = t0 + T. Обозначим где mt индекс узла разбиения h, ближайшего к точке t слева и не совпадающего с t.
Лемма 1.5.1. Пусть для многозначного отображения F (t, x) с выпуклыми компактными значениями выполняются условия (B1)–(B3), и для функции p(t, x), определенной равенством (1.5.3), выполняются условия (1.5.2) и неравенство (1.3.3). Тогда из любой конфинальной последовательности ломаных Эйлера {xhi (·)} включения (1.4.1) можно выделить подпоследовательность, равномерно на промежутке J сходящуюся к идеальному импульсно-скользящему режиму r(t) так, что соответствующая подпоследовательность из последовательности функций {phi (·)} будет равномерно на отрезке I сходиться к некоторой абсолютно непрерывной функции y(t), производная которой удовлетворяет для почти всех t I включению где U eq (t, r) = t (t, r) + r (t, r)F (t, r).
Доказательство. Существование подпоследовательности из конфинальной последовательности {xhi (·)}, равномерно на промежутке J сходящейся к идеальному импульсно-скользящему режиму r(t), следует из леммы 1.3.2. Чтобы не вводить новых обозначений, будем полагать, что сама эта последовательность равномерно сходится. Обозначим z hi (t) = t t, xhi (t) +x t, xhi (t) xhi (t) для всех t I. Так как t, xhi (t) = z hi (t) для почти всех t (tk1, tk ], то справедливо равенство для всех t (tk1, tk ], k = 1, Ni, где xhi (t) F t, xhi (t) для почти всех t (tk1, tk ].
Из (1.5.6) и (1.5.4) вытекает, что для всех t [t0, t0 + T ]. В силу леммы 1.3.1 последовательность ломаных Эйлера xhi (t) ограничена. Тогда в силу непрерывности векторной функции t (t, x), матриц x (t, x) и B(t, x) подинтегральные выражения в (1.5.7) являются ограниченными. Тогда при d(hi ) 0 второй интеграл из (1.5.7) равномерно по t I стремится к нулю, а из последовательности функций y hi (t), равных первым интегралам из (1.5.7), воспользовавшись теоремой Арцела, можно выделить равномерно сходящуюся к некоторой функции y(t) подпоследовательность. Без ограничения общности, будем полагать, что сама последовательность этих функций сходится. При этом y hi (t) = Qhi (t)z hi (t) Qhi (t) t t, xhi (t) + x t, xhi (t) F t, xhi (t) для почти всех t I. В силу теоремы 1.3 из [53, с. 16] имеем для почти всех t I. Так как tmt hi t, xhi (tmt ) r(t) и Qhi (t) = B tmt hi, xh (tmt hi ), то Qhi (t) B t, r(t) в каждой точке t J. Тогда из включений (1.5.9), (1.5.8) (учитывая выпуклость правой части (1.5.8)), из сходимости xhi (t) к функции r(t), и полунепрерывности сверху многозначного отображения F (t, x) заключаем, что для почти всех t I. Из равенства (1.5.7) вытекает, что предел последовательности функций phi (t) равен y(t).
Лемма доказана.
Теорема 1.5.1. Пусть выполняются все предположения леммы 1.5.1.
Тогда для включения (1.4.1) существует идеальный импульсноскользящий режим, и любой идеальный импульсно-скользящий режим r(t) является траекторией управляемой системы с начальным условием r(t0 + 0) = x0 + p(t0, x0 ).
Доказательство. Из (1.5.1), (1.5.2) и (1.5.3) вытекает, что для любой конфинальной последовательности ломаных Эйлера выполняется условие (1.3.5), и существование идеального импульсно-скользящего режима следует из леммы 1.3.2.
Пусть теперь r(t) идеальный импульсно-скользящий режим, и xhi (t) конфинальная последовательность ломаных Эйлера, равномерно на отрезке J сходящаяся к r(t). В соответствии с равенством (1.3.1) получаем где g hi (t) = xhi (s)ds, а функция phi (t) определена равенством (1.5.4).
Из теоремы Арцела вытекает, что из последовательности {g hi (·)} можно выделить равномерно сходящуюся на отрезке I к функции g(t) подпоследовательность. Из леммы 1.5.1 вытекает, что равномерно сходящуюся подпоследовательность можно выделить из последовательности {phi (·)} так, что предельная функция y(t) абсолютно непрерывна и удовлетворяет включению (1.5.5). Не ограничивая общности рассуждений, полагаем, что сами эти последовательности сходятся одновременно с последовательностью ломаных Эйлера. Поскольку g hi (t) F t, xhi (t) для почти всех t I, то, воспользовавшись соотношением (1.5.9) применительно к функциям g hi (t) так же, как в доказательстве леммы 1.5.1, заключаем, что Переходя к пределу в равенстве (1.5.10), получаем Из включения (1.5.5) и леммы Филиппова о неявной функции вытекает, что существует измеримая функция u(t) U eq t, r(t), такая, что для почти всех t I. Теперь утверждение теоремы следует из (1.5.11)– (1.5.12).
Теорема доказана.
Теорема 1.5.1 обобщает теорему 2.1 из [18] на дифференциальные включения.
Теорема 1.5.2. Пусть выполняются все предположения леммы 1.5. и, дополнительно, справедливы неравенства (1.4.11). Тогда любой идеальный импульсно-скользящий режим r(t) включения (1.4.1) с позиционным импульсным управлением u p(t, x)t является скользящим режимом этого же включения с разрывным позиционным управлением u = B(t, x)(t, x), и траекторией управляемой системы (1.4.6) при условии, что r(t0 ) = x0 + p(t0, x0 ), u(t, x) Теорема 1.5.2 является следствием теорем 1.4.3 и 1.5.1.
1.6 Линейный осцилятор с сухим трением Задачи оптимального управления, которые приводят к понятию импульсного синтеза, задаваемого оператором u p(t, x)t, рассматривались в [18, гл. 2], [21]. При этом идеальный импульсно-скользящий режим совпадает с оптимальной траекторией, и позиционное импульсное управление, реализованное как последовательность корректирующих импульсов для конфинальной последовательности ломаных Эйлера, преследует цель получить движение управляемой системы (1.4.1) по множеству S. В рамках предположений теоремы 1.5.2 идеальный импульсно-скользящий режим включения (1.4.1) является скользящим режимом этого же включения с разрывными позиционными управлениями u(t, x) = B(t, x)(t, x) и реализуется, как траектория включения (1.4.8). В этой ситуации цель достигается на первом же импульсном воздействии величины p(t0, x0 ) из любого начального состояния x(t0 ) = x0.
В силу утверждения 4 из теоремы 1.4.3 допускаются малые отклонения величины первого импульса.
Позиционное импульсное управление формирует последовательности ломаных Эйлера для любой управляемой системы, которая обеспечивает выполнение условий леммы 1.3.2. Разрывное управление (1.4.3) обладает универсальностью в том смысле, что сохраняет свою структуру для различных целевых множеств S, но его применимость для реализации скользящих режимов имеет ограничения. Использование этих двух типов управлений рассмотрим на простом примере.
Рассматривается линейный осциллятор с сухим трением. Тело единичной массы, рассматриваемое как материальная точка, движется по горизонтальной прямой Ox по действием упругой силы пружины c коэффициентом упругости k и точкой ненапряженного состояния x = 0.
Предполагается, что на тело действует сила тяжести P = mg и сила сухого трения Кулона F f r (x) = f P sgn x при условии x = 0; f трения может принимать любые значения из отрезка [f P, f P ], и полагаем F f r (0) = [f P, f P ]. Это соответствует обычному доопределению функции F f r (x) по Филиппову. Цель управления движения системы запишем в виде:
где u некоторая управляющая сила.
Поведение системы (1.6.1) при условии u = 0 легко анализируется (см. [4, гл. III, §3]). Ее траекториями являются полуэллипсы, расположенные выше и ниже оси Ox с центрами на концах отрезка Z = {(x, 0) :
|x| f P/k} “зоны застоя”, состоящей из множества неизолированных положений равновесия. Амплитуда колебаний системы уменьшается в арифметической прогрессии, и через конечное время тело останавливается в состоянии, которое может оказаться любой точкой “зоны застоя”.
Для достижения поставленной выше цели управления управляющая сила u должна, во-первых, преодолевать силу трения и, во-вторых, обеспечивать экспоненциально устойчивое движение системы в положение равновесия (0, 0) середину отрезка Z. Решение первой задачи зависит от ограничения на ресурс управления, а второй от выбора целевого множества, которое определим в виде S = {(x, x) : x + ax = 0}, где a > произвольный параметр.
Введем переменную v = x, определим многозначное отображение F = F1 (v, x), F2 (v, x) равенствами: F1 (v, x) = kx + F f r (v), F2 (v, x) = v и запишем дифференциальное включение (1.6.1) в форме включения (1.4.1):
с управлением u = (u1, u2 ) и множеством S = {(v, x) : (v, x) = 0}, (v, x) = v + ax.
Далее заключаем, что u1 = = H sgn (v + ax), u2 = 0 и Теперь включение (1.6.1) с управлением u = H sgn (x + ax) запишется, как управляемая система вида (1.4.6).
Множество U eq (v, x) определяется из условий 0 = v + ax, F1 (v, x)+av и при v = 0 состоит из одного элемента ueq = kx+f P sgn v av, который (на множестве S) запишем также в виде равенств:
При условии v = 0 получаем x = 0 и U eq (0, 0) = [f P, f P ].
В точке (0, 0) прямой v + ax = 0 имеем U eq (0, 0) = [d, d], где d = min {H, f P }, а оставшиеся точки этой прямой, в которых U eq (v, x) = (выполняется необходимое условие существования скользящего режима), принадлежат множеству точек фазовой плоскости (x, v), удовлетворяющих неравенствам:
Записывая уравнение движения осциллятора в виде и интегрируя его в точках непрерывности функций F f r и u, находим, что траекториями системы являются дуги эллипсов, соответствующие различным знакам значений переменной v и функции = v + ax:
где C произвольная константа. Прямые v = 0 и v + ax = 0 делят фазовую плоскость на четыре части. Расположение траекторий на ней симметрично относительно начала координат. Центры эллипсов расположены на оси Ox, а их смещение по этой оси в положительную или отрицательную стороны зависит от неравенств H < f P и H fP.
Это делает наглядным аналитический анализ этих неравенств. (Траектории решений системы (1.6.4) в областях непрерывности правой части на рис. 1.1–1.3 построены с использованием графической визуализации вычислительных экспериментов.) Отрезок Z = [L, L] на рис. 1.1 “зона застоя” (L = (f P H)/k); отрезок с концами в точках A = A(, 1 ) и B = B(, 1 ) траектория скользящего режима; = (f P +H)/(k+a2 ), = (f P H)/(k+a2 ), 1 = a, 1 = a.
Рис. 1.1. Траектории решений уравнения (1.6.4) в случае f P > H На рис. 1.2 “зона застоя” отсутствует, система имеет единственное положение равновесия в точке B = (0, 0), и на отрезке AB прямой S возникает устойчивый скользящий режим, который под действием эквивалентного управления экспоненциально стремится к началу координат.
Рис. 1.2. Траектории решений уравнения (1.6.4) в случае f P H Рассмотрим движение системы (1.6.2) под действием импульсного позиционного управления u p(v, x)t. В этом случае p1 (v, x) = (v + ax), p2 (v, x) = 0, и импульсно-скользящий режим, реализованный, как множество ломаных Эйлера, приводит систему на прямую v+ax = 0, меняя только переменную v (скорость движения). При попадании ломаной Эйлера при очередном корректирующем импульсе на отрезок AB (рис.
1.3), дальнейшее движение системы (1.6.2) до точки B может происходить, как скользящий режим управляемой системы (1.6.3), после чего вновь должен начаться импульсно-скользящий режим.
Рис. 1.3. Скользящий и импульсно-скользящий режимы при условии f P > H 1.7 Импульсно-скользящие режимы дифференциальных включений с матрицей при производной Рассмотрим систему Здесь A(t, x) Rn ; F (t, x) многозначное отображение; u позиционное импульсное управление. Для системы (1.7.1) ломаные Эйлера на интервалах (tk, tk+1 ], k = 0, N 1, совпадают с решениями следующих задач Коши:
где A1 (t, x) обратная матрица, xh (t0 ) = x0.
Отметим, что ломаные Эйлера удовлетворяют равенству где mt номер ближайшего слева к t узла разбиения h, не совпадающего с t, A t, xh (t) xh (t) F t, xh (t) для почти всех t I.
В дальнейшем рассматриваются такие управления, которые после каждого импульсного воздействия приводят систему (1.7.1) на множество S, определяемое m-мерной непрерывно дифференцируемой векторфункцией (t, x) с матрицей Якоби по x ранга m для всех (t, x) S:
Дополнительно предполагается отсутствие импульсов на множестве S, т.е.
Введем обозначения Тогда ломаные Эйлера (1.7.2) примут вид где xh (t) F t, xh (t) для п.в. t I, и будут совпадать с ломаными Эйлера импульсной управляемой системы где u p(t, x)t. При этом условия, обеспечивающие попадание системы на S после действия корректирующего импульса и равенство нулю величины импульса в случае, если (t, x) S, запишем в следующем виде:
Таким образом, если функции xh (t) и p(t, x) удовлетворяют условиям леммы 1.3.1, то ломаные Эйлера для системы (1.7.1) будут ограничены, и из любой конфинальной последовательности можно выделить подпоследовательность, равномерно сходящуюся к абсолютно непрерывной функции.
Пусть величина импульсного воздействия удовлетворяет равенству p(t, x) = B(t, x)(t, x), где B(t, x) матричная функция. Тогда p(t, x) удовлетворяет равенству p(t, x) = A1 (t, x)B(t, x)(t, x), и в силу леммы 2.2 из [18] на множестве S выполняется условие Предположим, что функция B(t, x) = A1 (t, x)B(t, x) непрерывна, p(t, x) удовлетворяет условию (1.3.3), F (t, x) многозначное отображение с выпуклыми компактными значениями, удовлетворяющее условиям (B1)–(B3).
Пусть, далее, существуют такие непрерывные положительные функции Hi (t, x) : I Rn R, i = 1, m, что для каждой точки (t, x) S найдутся > 0 и окрестность W (t, x) этой точки такие, что для всех (t, x ) W (t, x) выполняются неравенства где x i (t, x) градиент i-й координаты вектор-функции (t, x) по пеi ременной x, t (t, x) частная производная по времени i-й координаты вектор-функции (t, x),. Тогда в силу теорем 1.5.1 и 1.5.2 для включения (1.7.3) существует идеальный импульсно-скользящий режим, и любой идеальный импульсно-скользящий режим r(t) включения (1.7.3) на интервале J совпадает со скользящим режимом системы с позиционным разрывным управлением где ui (t, x) = Hi (t, x)sgn i (t, x), i = 1, m. При этом под скользящим режимом включения (1.7.6) понимается абсолютно-непрерывная функция x(t), такая, что t, x(t) S и x(t) решение включения где U (t, x) представляет собой простейшее выпуклое доопределение в смысле Филиппова (см. [56]) разрывной функции u(t, x).
Отметим, что неравенства (1.7.5) обеспечивают устойчивость множества S (см. [58]) в следующем смысле: для любых начальных данных (t0, x0 ) S и > 0 существует > 0 такое, что при условиях x0 x0 < и |t0 t0 | < для любого решения дифференциального включения (1.7.7) с начальным условием (t0, x0 ) выполняется t, x(t) S для всех точек t t0 +, в которых это решение существует. Однако, для описания всех возможных скользящих режимов системы (1.7.7) устойчивость множества S не требуется. Из теоремы 1.4.2 следует, что все движения системы (1.7.7) по множеству S находятся из включения Таким образом, все возможные скользящие режимы системы (1.7.7) находятся из включения (1.7.8) в случае, если U eq (t, x) = U eq (t, x), что обеспечивается выполнением неравенств Следовательно, имеет место следующая Теорема 1.7.1. Пусть A(t, x), F (t, x), p(t, x) таковы, что многозначное отображение F (t, x) = A1 (t, x)F (t, x) с выпуклыми компактными значениями удовлетворяет условиям (B1)–(B3), p(t, x) = A1 (t, x)p(t, x) удовлетворяет условию (1.3.3), и пусть существуют такие непрерывные положительные функции Hi (t, x) : I Rn R, i = 1, m, что выполняются неравенства (1.7.9).
Тогда для включения (1.7.1) c импульсным позиционным управлением u p(t, x)t существует идеальный импульсно-скользящий режим и любой идеальный импульсно-скользящий режим r(t) системы (1.7.1) на интервале J является скользящим режимом системы Hi (t, x)sgn i (t, x), i = 1, m, который реализуется на некотором управлении ueq t, r(t) U eq t, r(t).
Следствие 1.7.1. Пусть A(t, x) непрерывная матрица; для любых (t, x) I Rn выполняется неравенство A1 (t, x) 1 C, где C некоторая константа; F (t, x) многозначное отображение с выпуклыми компактными значениями, удовлетворяющее условиям (B1)– (B3); p(t, x) = B(t, x)(t, x) удовлетворяет условию (1.3.3). И пусть существуют такие непрерывные положительные функции Hi (t, x) :
I Rn Rm, i = 1, m, что выполняются неравенства (1.7.9).
Тогда справедливо утверждение теоремы 1.7.1.
Глава Изолированные импульсы и ломаные Эйлера 2.1 Постановка задачи и предварительные сведения об аппроксимациях Иосиды Введем в рассмотрение непрерывные функции i (t), удовлетворяющие условиям:
(D2) i (t)dt = 1, для любого i = 1, 2,..., которые будем называть дельтообразными.
Как указывалось во введении, в практическом использовании процедуры импульсного управления неизбежно возникает задача о замене в системе импульса Дирака последовательностью его непрерывных аппроксимаций дельтообразными функциями. При этом характер предельного перехода влияет на выбор понятия обобщенного решения.
В данной главе для дифференциальных включений с позиционным импульсным управлением в правой части, реализованным в виде ломаных Эйлера, исследованы два типа предельного перехода на дельтообразных функциях, приводящих к “ломаным Эйлера” и импульсноскользящим режимам Один из них приводит к известным условиям допустимости скачка в моменты импульсных воздействий, а другой определяет величину импульсной коррекции непосредственно по значению заранее заданной интенсивности импульса в зависимости от времени и состояния объекта. Исследования опираются на известные факты для дифференциальных уравнений с импульсами с использованием непрерывных однозначных аппроксимаций Иосиды многозначных отображений. Приведем необходимые сведения о них из статьи [60].
Пусть F : (, ) Rn Rn многозначное отображение с выпуклыми компактными значениями.
Условие A Для любых точек t (, ) и x, y Rn выполняется неравенство для любых u F (t, x) и v F (t, y), где l > 0 константа, A(t, x) = [aij (t, x)]n некоторая симметричная, положительно определенная и непрерывно дифференцируемая матрица, собственные значения которой ограничены некоторым отрезком [c, d], 0 < c d < +.
Все векторы понимаются как столбцы, а знак “T” всюду в дальнейшем используется для обозначения вектора-строки. Через z = J (t, x) обозначим решение включения z x + F (t, z) и положим F (t, x) = (J (t, x) x)/. Отметим, что J (t, x) и F (t, x) резольвента и, соответственно, аппроксимация Иосиды для отображения x F (t, x) при каждом фиксированном t.
Следующее утверждение является частным случаем леммы 1 из [60].
Утверждение 2.1.1. Пусть F : (, ) Rn Rn ограниченное, полунепрерывное сверху многозначное отображение с выпуклыми, компактными значениями, удовлетворяющее условию A. Тогда существует число > 0 такое, что определено однозначное отображение F (t, x) со свойствами:
1. F (t, x) ограничено, непрерывно по (, t, x) (0, ] (, ) Rn и липшицево по x. Последнее означает, что для каждого фиксированного ( (0, ]) и любых x1 и x2 выполняется:
где L > 0 некоторая константа.
2. Для любых (t, x), (t, y), u F (t, y) и (0, ] выполняется неравенство с некоторыми константами l1 > 0 и L > 0.
Замечание 2.1.1. Отметим (см. [59]), что в рамках условий утверждения 2.1.1 любые два решения включения x F (t, x) с одинаковыми начальными условиями (t0, x0 ) совпадают справа от точки t0 на их общем промежутке определения, т.е. выполняется свойство правосторонней единственности решений.
2.2 Включения с дельта-функциями, входящими в виде коэффициентов Пусть F : (, ) Rn Rn многозначное отображение. Сделаем следующие предположения:
(S1) F (t, x) является ограниченным полунепрерывным сверху многозначным отображением с выпуклыми компактными значениями;
(S2) для отображения F (t, x) выполняется условие A.
Рассмотрим дифференциальное включение и уравнение где F (t, x) аппроксимация Иосиды для отображения F (t, x), (t) некоторая (обычная) скалярная функция, g(t, x) = g1 (t, x),..., gn (t, x) векторная функция. Решения включения (2.2.1) и уравнений (2.2.2) понимаются в обычном смысле как абсолютно непрерывные функции, почти всюду удовлетворяющие (2.2.1) и (2.2.2) соответственно.
Лемма 2.2.1. Пусть многозначное отображение F (t, x) удовлетворяет условиям (S1)–(S2), функция (t) непрерывна, функция g(t, x) непрерывна и для любого t удовлетворяет условию Липшица по переменной x с константой Lp. Пусть x (t) и x(t) решения уравнения (2.2.2) и включения (2.2.1) соответственно, определенные на некотором отрезке I = [t0, t0 + T ]. Тогда существуют положительные константы K1, K2, K3 и такие, что Доказательство. Из условий леммы и утверждения 2.1.1 вытекает, что существуют числа > 0, L > 0 и l1 > 0 такие, что для всех (0, ] определено непрерывное, липшицевое по x отображение F (t, x), и выполняется неравенство (2.1.1).
Обозначим (t, x) = F (t, x) + (t)g(t, x), и пусть w F (t, y) + (t)g(t, y) произвольный вектор. Тогда w = u + (t)g(t, y) для некоторого u F (t, y). Из неравенства (2.1.1) получаем = (x y)T A(t, x) F (t, x) u + (t)(x y)T A(t, x) g(t, x) g(t, y) с некоторыми константами l1 и l2 для всех t I. Положим y(t) = x (t) x(t) и (t) = 2 y(t) A t, x (t) y(t). Тогда (t) = y(t) A t, x (t) y(t)+ 2 y(t) A t, x (t) y(t) для почти всех t I.
В доказательстве будем использовать следующее свойство квадратичных форм с симметричными положительно определенными матрицами (см., например, [7, с. 13]):
где отрезок [c, d] (0 < c d < +) содержит все собственные значения матрицы A(t, x) для любых (t, x).
Из неравенств (2.2.4) и (2.2.5) получаем с некоторыми положительными константами l3 и l4. Интегрируя неравенство (2.2.6), получаем Теперь из леммы Гронуолла (см., например, [8, с. 122]) получаем Из последнего неравенства, еще раз воспользовавшись неравенством для квадратичных форм (2.2.5), получаем (2.2.3).
Теперь рассмотрим задачу где t0 < 0 < t0 + T ; (t) импульс Дирака, сосредоточенный в точке t = 0, и последовательность задач где xi0 x0 и i (t) образуют последовательность непрерывных (дельтообразных) функций, удовлетворяющую условиям (D1)–(D2).
Введем вспомогательные задачи Теорема 2.2.1. Пусть F (t, x) и g(t, x) удовлетворяют условиям леммы 2.2.1, функции i (t) условиям (D1)–(D2). Тогда для любой последовательности решений xi (t) задач (2.2.8) при i + имеет место:
где u(t) и w(t) решения включений (2.2.9) и (2.2.11) соответственно.
Доказательство. Рассмотрим решения x (t) последовательности задач и вспомогательные задачи Отметим, что в силу замечания 2.1.1 при сделанных предположениях задачи (2.2.9)–(2.2.11) и (2.2.13)–(2.2.15) имеют единственные решения.
Из теоремы 3 [56, стр.36] и комментариев к ней (там же на стр. 37) получаем, что для любого фиксированного 0 < < при i + где u (t) и w (t) решения уравнений (2.2.13) и (2.2.15) соответственно.
В силу леммы 2.2.1 для произвольного > 0 существует число выполняется где xi (t) решения задач (2.2.8), и для всех t [t0, 0], где u(t) решение дифференциального включения (2.2.9). Из первого соотношения (2.2.16) вытекает, что для любого t [t0, 0) и этого же значения существует номер N2 N1 такой, что для всех i N2. Теперь из (2.2.17)–(2.2.19) получаем при фиксированном t [t0, 0) для всех i N Следовательно xi (t) u(t) при i + для любого фиксированного t [t0, 0) и первое соотношение (2.2.12) установлено.
Пусть v (t) решение дифференциального уравнения (2.2.14) и v(t) решение уравнения (2.2.10). Учитывая начальные условия v (0) = u (0) и v(0) = u(0), неравенство (2.2.18) и теорему о непрерывной зависимости решений от начальных условий, получаем, что v (t) v(t) при +0 равномерно для всех t [0, 1]. Тогда из леммы 2.2.1 при (t) 0 вытекает, что для решений w (t) уравнений (2.2.15) и решения w(t) включения (2.2.11) существует 0 < < такое, что выполняется для всех 0 < < и t [0, t0 + T ]. Из второго соотношения (2.2.16) вытекает, что для любых фиксированных 0 < < и t (0, t0 + T ] существует номер N3 такой, что для всех i N3. Теперь, с учетом (2.2.17) аналогично предыдущему, для любого > 0 существуют натуральное число N4 N3 такое, что при любом фиксированном t (0, t0 + T ] для всех i N4 второе соотношение (2.2.12) установлено.
Определение 2.2.1. Под обобщенным решением включения (2.2.7) будем понимать функцию x(t), которая является решением включения (2.2.9) на отрезке [t0, 0] и решением включения (2.2.11) на промежутке (0, t0 + T ] с начальным условием x(+0) = v(1), где v(t), t [0, 1], определена из уравнения (2.2.10).
В соответствии с этим определением теорема 2.2.1 обеспечивает существование и дает структуру обобщенных решений включения (2.2.7).
Доопределение обобщенного решения x(t) в точке разрыва t = 0 пределом слева (который, очевидно, существует) является удобным для нас соглашением. Применительно к дифференциальным уравнениям система (2.2.10) называется предельной, а начальное условие x(+0) = v(1) (в нашей ситуации) условием допустимости скачка (см. [16, с. 24-25]).
Рассмотрим дифференциальное уравнение вида где F (t, x) аппроксимация Иосиды многозначного отображения F (t, x).
Обобщенное решение уравнения (2.2.20) определяется уравнениями (2.2.13)–(2.2.15) аналогично предыдущему. Отметим, что функция x (t) удовлетворяет уравнению x = F (t, x) при t = 0, а в точке t = 0 терпит разрыв со скачком, который определяется уравнением (2.2.14).
Следствие 2.2.1. Пусть выполняются все условия теоремы 2.2.1. Тогда существуют положительные константы и K такие, что для любых обобщенных решений x(t), x (t) задач (2.2.7) и (2.2.20) соответственно выполняется для всех t I и для всех (0, ].
Неравенство (2.2.21) вытекает из формул (2.2.12), (2.2.16) и неравенства (2.2.3), примененного к последовательностям xi (t) и x (t) для (t) = i (t), при i +.
Рассмотрим задачу, которую запишем в виде где (t) -функция Дирака, сосредоточенная в точке t = 0, и последовательность задач где xi0 x0 и i (t) образуют последовательность непрерывных функций, удовлетворяющую условиям (D1)–(D2).
Рассмотрим дифференциальное включение и уравнение где F (t, x) непрерывная однозначная аппроксимация Иосиды отображения F (t, x) и > 0 положительный параметр. Решения включения (2.3.3) и уравнений (2.3.4), определенные на отрезке [t0, t0 + T ], понимаются как непрерывные функции, абсолютно непрерывные на отрезке I = [t0, t0 + T ], почти всюду на нем удовлетворяющие (2.3.3) и (2.3.4) соответственно.
Лемма 2.3.1. Пусть многозначное отображение F (t, x) удовлетворяет условиям (S1)–(S2), векторная функция p(x) удовлетворяет условию Липшица с константой Cp, скалярная функция (t) непрерывна и x (t), x(t) решения уравнений (2.3.4) и включения (2.3.3) соответственно, определенные на отрезке [t0, t0 + T ] с начальными функциями, равными x (t) = x (t0 ), x(t) = x(t0 ), t [t0, t0 ]. Тогда существуют положительные константы L1, L2, L3 и такие, что Доказательство. Мы будем следовать схеме доказательства леммы 2.2.1, внося необходимые изменения. В соответствии с утверждением 2.1.1 существуют числа > 0, L > 0 и l1 > 0 такие, что для всех (0, ] определено непрерывное, липшицевое по x отображение F (t, x) (аппроксимация Иосиды) такое, что выполняется неравенство (2.1.1).
Обозначим (t, x, x ) = F (t, x) + (t)p(x ) и произвольное w(t, y, y ) F (t, y) + (t)p(y ). Тогда w(t, y, y ) = u(t, y) + (t)p(y ), где u(t, y) F (t, y). Из неравенства (2.1.1) получаем = (x y)T A(t, x) F (t, x) u(t, y) + (t)(x y)T A(t, x) p(x ) p(y ) Положим y(t) = x (t) x(t) и (t) = 1 y(t) A t, x (t) y(t). Тогда = y(t) T A t, x (t) y(t) + 1 y(t) T A t, x (t) y(t) для почти всех t I. Из неравенств (2.2.5) и (2.3.6) получаем с некоторыми положительными константами l2, l3. Обозначим (t) = (t ) = (t) при некотором t [t0, t]. Из (2.3.7) вытекает с некоторыми положительными константами l4, l5. Интегрируя (2.3.8), получаем Теперь из леммы Гронуолла получаем Так как (t) (t) и (t0 ) = (t0 ), то из последнего неравенства, воспользовавшись неравенством для квадратичных форм (2.2.5), получаем неравенство (2.3.5).
Введем вспомогательные задачи Теорема 2.3.1. Пусть F (t, x) и p(x) удовлетворяют условиям леммы 2.3.1, функции i (t) условиям (D1)–(D2). Тогда для любой последовательности решений xi (t) задач (2.3.2) при i + имеет место:
где u(t) и z(t) решения включений (2.3.9) и (2.3.10) соответственно.
Доказательство. Рассмотрим последовательность задач и вспомогательные задачи Из теоремы 4 [56, стр.36] получаем, что для любого фиксированного где u (t) и z (t) решения уравнений (2.3.11) и (2.3.12) соответственно.
Дальнейшее доказательство дословно повторяет доказательство теоремы 2.2.1 с использованием соотношений (2.3.13) и леммы 2.3.1.
С учетом теоремы 2.3.1 обобщенное решение включения (2.3.1) определяется следующим образом.
Определение 2.3.1. Под обобщенным решением включения (2.3.1) будем понимать функцию x(t), удовлетворяющую дифференциальному включению (2.3.9) на отрезке [t0, 0] и дифференциальному включению (2.3.10) на промежутке (0, t0 + T ] с начальным условием x(+0) = x(0) + p x(0).
Как видно из этого определения, теорема 2.3.1 обеспечивает существование обобщенного решения включения (2.3.1). Рассмотрим дифференциальное уравнение вида где F (t, x) аппроксимация Иосиды многозначного отображения F (t, x).
Так же, как и для задач предыдущего раздела, справедливо Следствие 2.3.1. Пусть выполняются все условия теоремы 2.3.1. Тогда существуют положительные константы и K такие, что для любых обобщенных решений x(t), x (t) задач (2.3.1) и (2.3.14) соответственно выполняется Замечание 2.3.1. Теоремы 2.2.1, 2.3.1 и их следствия сформулированы для дифференциальных включений с импульсным воздействием в момент времени t = 0. Однако, это не ограничивает общности результатов, так как замена переменной s = tt позволяет рассматривать включения с импульсным воздействием в момент времени t = t.
2.4 Аппроксимация ломаных Эйлера Будем рассматривать дифференциальное включение в предположении, что u управляющее воздействие, которое каждому текущему моменту времени t и состоянию x объекта ставит в соответствие импульс p(t, x)t, где t -функция Дирака, сосредоточенная в моменте времени t, p(t, x) интенсивность импульса. Как уже отмечалось, такие воздействия на систему называются позиционным импульсным управлением, которое “срабатывает” только в узлах разбиения В результате таких воздействий на решения включения x F (t, x) возникают ломаные Эйлера xh (t), которые на каждом промежутке (tk, tk+1 ] совпадают с решениями задач Коши для дифференциального включения x F (t, x), Здесь полагаем, что функция p(t, x) не зависит от переменной t, и обозначаем ее p(x). Для разбиения h отрезка I введем в рассмотрение последовательность задач при i +. При каждом фиксированном k = 1, N 1 для функций i (t) введем в рассмотрение условия:
Учитывая, что i 0, ik 0 и ik 0 при i +, мы изначально считаем эти величины настолько малыми, что интервалы (tk +i, tk +ik ), k = 1, N 1, попарно не пересекаются.
Теорема 2.4.1. Пусть F (t, x) и p(x) удовлетворяют условиям лемk мы 2.3.1, функции i (t) условиям (D1k)–(D2k). Тогда для любого фиксированного разбиения h отрезка I последовательность решений xh (t) задач (2.4.1) при i + сходится к ломаной Эйлера x (t) в каждой точке t I, такой что t = tk, k = 0, N 1.
Доказательство. С учетом замечания 2.3.1, применим теорему 2.3.1 к включению (2.4.1) на отрезке I1 = [t0, t2 ] для произвольного > настолько малого, что t1 I1. При этом мы учитываем, что начиная с некоторого номера i будет выполняться i (t) = 0 для всех t I1. В результате получим, что при любом t I1, t = t1 t = t0. Тогда в силу правосторонней единственности решений включения x F (t, x) и произвольности > 0 заключаем, что (2.4.2) выполняется во всех точках отрезка [t0, t2 ] кроме точек tk, k = 0, 1, 2.
Теперь в качестве начальных данных возьмем какую-либо точку ломаной Эйлера в этой точке. Применяя аналогичные рассуждения к отрезку I2 = [s, t3 ] и учитывая правостороннюю единственность решений, заключаем, что (2.4.2) выполняется во всех точках отрезка [t0, t3 ] рого номера i, будет выполняться i (t) = 0 для всех t I2, k = 1, 2. Этот процесс продолжается до точки tN 1 и на этом последнем шаге мы рассматриваем отрезок [s, t0 + T ], где s середина отрезка [tN 2, tN 1 ].
Рассмотрим задачи где F (t, x) аппроксимация Иосиды для F (t, x).
Для (2.4.3) и (2.4.4) понятия обобщенных решений x(t) и x (t) вводятся по аналогии с предыдущим, как разрывные в точках t1,..., tN 1 кривые, доопределенные в них значениями x(tk 0) и x (tk 0) (k = 1, N 1) и удовлетворяющие (2.4.3) и (2.4.4) во всех остальных точках отрезка I соответственно.
Следствие 2.4.1. Пусть выполняются все условия теоремы 2.4.1. Тогда для любого фиксированного разбиения h отрезка I существует константа K, зависящая от числа N точек разбиения h, такая, что для любых обобщенных решений x(t) и x (t) включения (2.4.3) и уравнения (2.4.4) соответственно выполняется Доказательство вытекает из последовательного применения следствия 2.3.1 к отрезкам [tk1 tk ] и начальным условиям x(tk1 + 0), x (tk1 + 0) для k = 1, N 1.
Следствие 2.4.2. Пусть выполняются все условия теоремы 2.4.1. Тогда для любого фиксированного разбиения h отрезка I существует константа K, зависящая от числа N точек разбиения h, такая, что для любого обобщенного решения x (t) уравнения (2.4.4) и ломаной Эйлера xh (t) включения x F (t, x) выполняется Доказательство. Из определения ломаной Эйлера xh (t) вытекает, что на промежутке (t0, t0 + T ] она совпадает с обобщенным решением включения (2.4.3) и тогда утверждение следствия вытекает из следствия 2.4.1.
Замечание 2.4.1. Как отмечалось во введении, сеть ломаных Эйлера называется импульсно-скользящим режимом, если в результате действия корректирующих импульсов предельная справа точка ломаной Эйлера оказывается на многообразии S = {(t, x) R Rn : j (t, x) = 0, j = 1, m}, m n. Для этой цели используется условие “сброса”:
Условие (2.4.5) является конструктивным для ломаных Эйлера, удовлетворяющих условиям (X1)–(X2), так как известна функция скачков p(t, x) (интенсивность импульса). Однако для ломаных Эйлера, структура которых определяется условиями допустимости скачка из теоремы 2.2.1, функция скачков имеет зависимость p(t, x, g(t, x)) и требует дополнительного анализа.