на правах рукописи
СМИРНОВА Нина Анатольевна
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ И
СИНТЕЗ ОБУЧАЕМОГО УПРАВЛЕНИЯ УПРУГИМ МАНИПУЛЯТОРОМ
ПРИ ЦИКЛИЧЕСКИХ ОПЕРАЦИЯХ
(Специальность: 05.13.18 – Математическое моделирование,
численные методы и комплексы программ)
Автореферат диссертации на соискание учёной степени кандидата технических наук
Санкт-Петербург 2002 2
Работа выполнена на кафедре ‘Механика и процессы управления’ Санкт-Петербургского государственного политехнического университета.
Научный руководитель:
доктор технических наук, профессор Бурдаков С.Ф.
Официальные оппоненты:
доктор технических наук, профессор Мирошник И.В.
кандидат технических наук, доцент Чечурин Л.С.
Ведущая организация: Санкт-Петербургский Государственный Электротехнический Университет (ЛЭТИ)
Защита диссертации состоится 19 февраля 2003 г. в 16 часов на заседании диссертационного совета Д 212. 229. 13 Санкт-Петербургского государственного политехнического университета по адресу: 195251, Санкт-Петербург, Политехническая ул., д. 29, корп. 1, а. 41.
Автореферат разослан 16 января 2003 г.
Учёный секретарь диссертационного совета Д 212. 229. доктор биологических наук, профессор Зинковский А.В.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Управление траекторным движением упругих манипуляторов является одной из наиболее сложных задач теории и практики управления динамическими системами. Это связано с параметрической и структурной неопределённостью моделей манипуляторов, а также с невозможностью измерить весь вектор состояния. Поэтому широко распространённая схема синтеза алгоритмов управления на основе метода динамической компенсации напрямую оказывается не применимой и требует дополнения. Если имеется возможность выполнения манипулятором пробных движений, предшествующих рабочему движению, то дополнить управление по методу компенсации можно процедурами обучения. Такие задачи рассматривались в работах Arimoto S., Bondi P., De Luca A., Padieu B., Wang D., Первозванского А.А. и др. При анализе и синтезе алгоритмов управления с обучением основные теоретические результаты получены в предположении, что измерению доступен весь вектор состояния модели манипулятора. Однако обучение всегда проводится на реальном манипуляторе, обладающем неограниченным спектром частот, т.е. в условиях структурной неопределённости модели. Кроме того, измерению доступна только часть вектора состояния, определяемая расположением датчиков обратных связей в кинематической цепи. Эти обстоятельства определяют актуальность разработки методов и алгоритмов синтеза управления с обучением для упругого манипулятора в условиях параметрической и структурной неопределённости модели и неполного измерения вектора состояния.
Цель исследования. Цель диссертационной работы состоит в разработке методов обучаемого управления траекторным движением упругого манипулятора, выполняющего циклические операции. Она предполагает проведение исследования по следующим направлениям.
параметрической и структурной неопределённостью, предназначенных для синтеза алгоритмов обучаемого управления траекторным движением.
2. Разработка моделей обучаемого управления для основных задач, связанных с отработкой программных траекторий упругим манипулятором.
3. Разработка методики синтеза алгоритмов обучаемого управления траекторным движением упругого манипулятора в условиях параметрической и структурной неопределённости модели и неполного измерения вектора состояния.
управления используются методы механики, теории автоматического управления, теории дифференциальных уравнений, аппарат функций Ляпунова, метод пространства состояний, метод математического моделирования. Эффективность предлагаемых алгоритмов управления проверяется путём компьютерного моделирования.
Основные научные результаты.
• Модели упругого манипулятора как сингулярно возмущённой системы для основных задач, связанных с отработкой программных траекторий.
• Модели обучаемого управления траекторным движением манипулятора при сингулярных возмущениях, в том числе и при выполнении манипулятором контактных операций.
• Модели обучаемого управления при позиционировании упругого манипулятора в начале и конце программной траектории.
• Методика многоэтапного синтеза алгоритмов обучаемого управления траекторным движением манипулятора в условиях параметрической и структурной неопределённости его модели при измерении части вектора состояния и негладкости программной траектории.
манипулятора как сингулярно возмущённой системы для основных задач, связанных с отработкой программных траекторий, модели обучаемого управления, а также методика многоэтапного синтеза алгоритмов обучаемого управления траекторным движением упругого манипулятора являются новыми. Ряд результатов получен в сотрудничестве с С.Ф.Бурдаковым, что отражено в совместных публикациях.
Практическая ценность. Результаты диссертации могут быть использованы при разработке систем управления манипуляторами, а также в учебном процессе.
Апробация работы. Результаты работы докладывались и обсуждались на • 6-й научно-технической конференции “Робототехника для экстремальных условий” (18-20 апреля 1995 г., С.-Петербург);
• 2-й Российско-шведской конференции по автоматическому управлению (29- августа 1995 г., С.-Петербург);
• 12-й научно-технической конференции “Экстремальная робототехника” (17- апреля 2001 г., С.-Петербург);
• 5-й Всероссийской конференции по проблемам науки и высшей школы “Фундаментальные исследования в технических университетах” (8-9 июня 2001 г., С.-Петербург);
• 13-й научно-технической конференции “Экстремальная робототехника” (15- апреля 2002 г., С.-Петербург);
• 6-й Всероссийской конференции по проблемам науки и высшей школы “Фундаментальные исследования в технических университетах” (8-9 июня 2002 г., С.-Петербург).
Публикации. По теме диссертации опубликовано 15 печатных работ.
Структура и объём диссертации. Диссертация состоит из введения, трёх глав, заключения и библиографии. Диссертация изложена на 138 страницах, содержит рисунок.
СОДЕРЖАНИЕ РАБОТЫ
Во введении рассмотрены известные из литературы результаты в области синтеза алгоритмов обучаемого управления траекторным движением манипулятора в условиях неопределенности его модели. Обоснована актуальность работы и сформулированы цели исследования.
В главе 1 в разделах 1.1 - 1.3 систематизированы модели манипулятора с параметрической и структурной неопределенностью, построены сингулярно возмущённые модели, позволяющие проанализировать влияние неучтённых упругих свойств реальных манипуляторов.
Модель манипулятора как системы твёрдых тел имеет вид где q R n – вектор обобщенных координат; Q R n – вектор обобщенных сил; A (q) инерционная матрица; b(q, q) – вектор кориолисовых и центробежных сил инерции;
g(q) – вектор сил тяжести.
Модель манипулятора с упругими шарнирами и (или) упругими звеньями имеет вид где R m - вектор упругих координат, q m R n - вектор обобщенных координат, характеризующий положение роторов двигателей; Г - матрица жесткостей звеньев или кинематических передач, связывающих роторы двигателей со звеньями; A ij - элементы центробежных сил инерции; g m, f – элементы вектора сил тяжести.
манипулятора q l R n, для модели (М2) вычисляется по формуле q l = q m + M, где M - матрица преобразования координат. В координатах q m, q l модель манипулятора с упругими шарнирами принимает вид Модель манипулятора с упругими шарнирами при упрощённом описании динамики роторов имеет вид где A 1 - матрица инерции роторов двигателей; A 3 (q l ) - матрица инерции звеньев.
При дальнейших исследованиях в моделях (М1) – (М4) задаются номинальные значения параметров и возможные диапазоны их реальных значений. Этим неопределённость связана с учётом в моделях ограниченного спектра собственных частот реального манипулятора. В частности, если матрица Г в модели (М4) имеет такие элементы, что оценка низшей собственной частоты, обусловленной упругостью элементов манипулятора, удовлетворяет условию >> 0, где 0 характерная частота требуемой полосы пропускания замкнутой системы, то имеются основания для использования модели (М1). В этом случае для исследования влияния упругих свойств на эффективность алгоритмов управления использована сингулярно возмущённая модель где = Г(q m q l ) - вектор упругих моментов; = 0 - малый параметр; Г = 2 Г диагональная матрица.
Сингулярно возмущённая модель типа (М5), учитывающая упругость датчика силы, построена и для манипулятора, выполняющего контактные операции.
В разделе 1.4 проведён анализ эффективности алгоритмов управления, основанных на методе динамической компенсации, в условиях параметрической и структурной неопределённости модели манипулятора и неполного измерения вектора состояния. Показано, что компенсационные алгоритмы управления, построенные на основе модели манипулятора как системы твёрдых тел, при использовании их для параметрической неопределённости могут привести к неустойчивости замкнутой системы. Для обеспечения достаточного запаса устойчивости требуются обратные связи по скоростям роторов двигателей. Датчики положения могут быть связаны как с роторами двигателей, так и со звеньями. Проведённый анализ позволил установить основные направления для развития компенсационных алгоритмов управления в условиях параметрической и структурной неопределённости модели манипулятора и неполного измерения вектора состояния. Для манипулятора, выполняющего циклические операции, при соблюдении гипотезы воспроизводимости, обеспечение компенсационного эффекта возможно с помощью процедур обучения.
В главе 2 разработаны модели обучаемого управления для основных задач, связанных с отработкой программных траекторий упругим манипулятором. В разделе 2.1 описывается алгоритм обучаемого управления, предложенный А.А.Первозванским, и исследуется его эффективность в условиях параметрической неопределённости модели (М1). Рассматривается задача, в которой цель управления заключается в воспроизведении манипулятором с помощью ограниченного управления программной траектории q d (t ), q d (t ) с требуемой точностью характеристическим уравнением где, – положительно определенные диагональные матрицы.
При измерении координат q(t ) и скоростей q(t ), достаточной гладкости программной траектории q d (t ), q d (t ) и наличии вместо матрицы A (q) её оценки A алгоритм управления записывается в виде где v(t ) – настраиваемая компенсационная составляющая.
Компенсационная составляющая v(t ) для каждого ( k + 1) -го цикла движения вычисляется итеративным путём после завершения k-го цикла движения с помощью базовой процедуры обучения Для постоянной оценки A получены достаточные условия сходимости базовой процедуры обучения при линеаризации замкнутой системы (М1), (2), (3) вблизи точек на программной траектории. Показано, что сходимость базовой процедуры обучения в наибольшей степени зависит от уровня неопределённости модели по инерционной матрице A (q).
В разделе 2.2 с помощью модели (М5) исследовано влияние структурной неопределённости на сходимость процедуры обучения, построенной на основе базовой с использованием измерений с датчиков обратных связей, в алгоритме управления (2).
записывается в виде = 2 0 E, = 02 E - матрицы коэффициентов обратных связей, обеспечивающих в номинальной системе при идеальной компенсации свойства фильтра Баттерворта.
Параметр 0 выбран так, чтобы обеспечить сходимость базовой процедуры обучения (3) в алгоритме управления (2) для модели (М1). Исследованы свойства замкнутой системы (М5), (4). Введена в рассмотрение быстрая переменная z =, где равновесное состояние находится из второго уравнения системы (М5) при условии = В соответствии с методом разделения медленного и быстрого движений в сингулярно возмущённых системах получены уравнения, описывающие:
- медленное движение в соответствии с темпом программного задания - быстрое движение (вынужденные упругие колебания) Введён вектор y = [e T, e T ]T ошибок слежения за программной траекторией, представлено в виде Для анализа влияния возмущения d на поведение системы (8) использован устойчивости системы (8) в виде Анализ уравнения (7) позволил установить следующее. На каждом цикле движения в правой части уравнения (7) появляется явная функция времени v (t ) v (t ), описывающая упругие колебания в компенсационной составляющей на предыдущем цикле. Левая часть представляет собой слабодемпфированную колебательную систему с собственными частотами тех же упругих колебаний. В результате на каждом цикле возникают резонансные явления, приводящие к росту от цикла к циклу амплитуд упругих колебаний. Этот рост тем быстрее, чем меньше влияние демпфирующих составляюющих в левой части уравнения (7). Таким образом, обучение сингулярно возмущённой системы происходит с наложением двух эффектов – сходимости по медленному движению и роста амплитуд быстрой переменной z. В конечном итоге это может привести к нарушению условия (9) и к неустойчивости системы (8).
Моделирование показало, что типичной является следующая ситуация. На первых циклах движения процедура обучения монотонно сходится в смысле уменьшения от цикла к циклу нормы ошибки слежения y. Это происходит до тех пор, пока в ошибке y не начнёт преобладать быстрая составляющая, обусловленная упругими колебаниями. После этого доминирующим становится эффект роста амплитуд быстрой переменной z. В наибольшей степени описанная ситуация характерна для переходных режимов движения манипулятора (при выходе на программную траекторию, в угловых точках программной траектории и т.п.).
Предложено в процедуру обучения ввести механизм автоматического останова, срабатывающий при недопустимом возрастании нормы возмущения В соответствии с (10) останов происходит, как только выполняется условие k. Числитель и знаменатель в выражении для k вычисляются после завершения k -го цикла движения и понимаются в смысле • = sup (•), где T - длительность цикла движения. Для оценки в выражении (10) вектора возмущений d используется комбинация &&lk + e lk + e lk. Окончание процесса обучения контролируется и по условиям типа (1), так как при невысоких требованиях к точности отработки программной траектории попадание в требуемую трубку точности может произойти до проявления эффекта роста амплитуд быстрой переменной z.
В разделе 2.3 исследована задача управления траекторным движением манипулятора с упругим датчиком силы при выполнении контактных операций.
Исследован компенсационный алгоритм управления с процедурой обучения, построенный по модели манипулятора как системы твёрдых тел в предположении абсолютной жесткости датчика силы. Обратные связи компенсационного алгоритма строятся по измерениям координат и скоростей звеньев манипулятора и по силе прижатия R рабочего органа к поверхности, измеряемой датчиком силы. Показано, что этот алгоритм не обеспечивает устойчивости замкнутой системы при учёте упругости датчика силы.
Предложена модификация компенсационного алгоритма с использованием дополнительной обратной связи по вычисленному значению производной силы прижатия R на основе имеющихся измерений q и q. Исследован вопрос о сходимости процедуры обучения, построенной без учёта упругости датчика силы, для манипулятора с датчиками силы большой и малой жёсткости. В случае датчика большой жёсткости (когда собственная частота манипулятора с упругим датчиком силы превышает характерную частоту требуемой полосы пропускания замкнутой системы) использована сингулярно возмущённая модель. Показано, что процедура обучения, построенная без учёта упругости датчика, расходится, начиная с некоторого цикла, т.е. имеет место эффект, описанный в разделе 2.2. Для остановки процесса обучения по аналогии с (10) в соответствующую процедуру введён механизм автоматического останова, позволяющий прервать обучение при нарушении монотонности изменения ошибки отработки программного задания. В случае мягкого датчика накопление упругих возмущений от цикла к циклу также имеет место, что подтверждено результатами моделирования.
управления с обучением в случае датчика силы большой жёсткости не позволяет управлять прижатием при малых программных значениях, из-за большого перерегулирования, вызванного начальными рассогласованиями или другими возмущающими факторами. Большое перегулирование может привести к нарушению требования безотрывности движения рабочего органа по поверхности. В случае расширяется, однако при этом переходный процесс затягивается и может захватить большую часть траектории. Для обеспечения монотонной сходимости процесса обучения в широком диапазоне программных значений прижатия, предложена процедура обучения на основе модели манипулятора, учитывающей упругость датчика силы.
компенсационный алгоритм управления типа (4) с обратными связями по q m и q m.
Исследована сходимость двух процедур обучения, работающих по установившимся ошибкам и отличающихся набором измеряемых величин где e m и e l - установившиеся значения ошибок e m и e l, которые фиксируются для каждого цикла движения после затухания переходных процессов.
процедуры обучения (11) в смысле lim e mk = 0 и процедуры обучения (12) в смысле lim e lk = 0. Показано, что качество переходных процессов при управлении с обучением выше, чем в системе с интегральной обратной связью.
В главе 3 разработана методика синтеза алгоритмов управления траекторным параметрической и структурной неопределённости его модели, измерения части вектора состояния и негладкости программной траектории. Методика включает три этапа и позволяет синтезировать управление с обучением, обеспечивающее:
1) максимальное демпфирование упругих колебаний в замкнутой системе с помощью настройки коэффициентов обратных связей;
2) компенсацию взаимовлияния движений по различным степеням подвижности с помощью обучения вдоль программной траектории;
программного задания в особых точках программной траектории.
В диссертации управление (4) представлено в виде двух составляющих:
С помощью управления Q 1, которое названо стабилизирующим, обеспечивается максимальное демпфирование упругих колебаний в замкнутой системе. На первом этапе синтеза матрицы и настраиваются так, чтобы указанное свойство имело место в условиях параметрической неопределённости модели упругого манипулятора.
С помощью управления Q 2, которое названо координирующим, обеспечивается компенсационный эффект, позволяющий поддерживать высокую точность отработки задания q d (t ), q d (t ) на гладких участках программной траектории. Обучение координирующего управления Q2 на пробных циклах движения в условиях структурной неопределённости модели упругого манипулятора составляет второй этап синтеза управлений.
Третий этап синтеза необходим для негладких программных траекторий. Он состоит в сглаживании задания q d (t ) и настройке его с помощью обучения вблизи особых точек с целью минимизировать интенсивность упругих колебания.
Этап 1. Для настройки стабилизирующего управления рассмотрена модель (М3), линеаризованная относительно конечного набора ( j = 1,..., N ) точек программной траектории где x = [e T, e T, e T, e T ]T - вектор состояния;
матрицы соответствующих размерностей; w ( µ ) = g" (q dj ) - вектор возмущений, обусловленный силами тяжести (индекс j в модели (14) опущен); µ - вектор параметров манипулятора, принимающий значения из некоторого множества M и характеризующий параметрическую неопределённость модели.
Стабилизирующее управление (13) представлено в виде где K = - матрица коэффициентов обратных связей; y = Cx, C = 0 0 E - уравнение измерений.
Для каждой точки j введён показатель качества J j ( µ,, ), характеризующий оптимизационной задачи где A и B - допустимые множества, ограничивающие значения настраиваемых коэффициентов и условиями устойчивости и условием Q Q.
Стабилизирующее управление с настройкой K = * Этап 2. Система (14) с построенным робастно-оптимальным стабилизирующим управлением (15) и координирующим управлением Q 2 = Av представлена в виде Для настройки координирующего управления предложена модифицированная процедура обучения где G ( s) - передаточная функция настраиваемого фильтра, снижающего влияние упругих возмущений.
Показано, что сходимость процедуры обучения (16) зависит от свойств передаточной матрицы H( s, µ ) = [E + G 1K * ] 1 G ( s), связывающей векторы ошибок y k от цикла к циклу движения. Сходимость обеспечивается при условии невыхода за единичный уровень спектральной нормы передаточной матрицы H( s, µ )