«Базовые инерционные параметры и их применение в задачах управления манипуляционными роботами ...»
Московский государственный технический университет
имени Н.Э. Баумана
На правах рукописи
Крутиков Сергей Леонидович
Базовые инерционные параметры и их
применение в задачах управления
манипуляционными роботами
01.02.01 – Теоретическая механика
ДИССЕРТАЦИЯ
на соискание ученой степени
кандидата физико-математических наук
Научный руководитель:
доктор физико-математических наук, профессор Зенкевич Станислав Леонидович Москва – 2013 Содержание Введение................................... Глава 1. Классические инерционные параметры в механике ма нипуляционных роботов........................ 1.1. Построение кинематической модели робота-манипулятора с по мощью однородных координат и преобразований........ 1.2. Уравнения движения манипуляционного механизма в форме Лагранжа............................... 1.3. Идентификация параметров уравнений движения манипуляци онного механизма.......................... Глава 2. Базовые инерционные параметры и их свойства... 2.1. Понятие о базовых инерционных параметрах.......... 2.2. Теоремы о равенстве........................ 2.3. Теорема о базисном множестве................... Глава 3. Методы поиска базовых инерционных параметров.. 3.1. Обзор существующих методов................... 3.2. Метод проекций........................... 3.3. Рекуррентное вычисление проекций................ 3.4. Некоторые аспекты реализации.................. Глава 4. Применение базовых инерционных параметров в ди намическом управлении роботами-манипуляторами...... 4.1. Уравнения движения манипуляционного механизма в базовых параметрах.............................. 4.2. Идентификация базовых инерционных параметров....... Заключение.................................. Литература.................................. Приложение А. Исходные тексты программы расчета базовых инерционных параметров....................... Приложение Б. Исходные тексты сценариев среды Matlab.. Введение Манипуляционные роботы играют важную роль в современном произ водстве, характеризующемся высокой степенью гибкости и автоматизирован ности. Спектр задач выполняемых ими достаточно широк: сборка, сварка, окраска, механическая обработка, перемещение грузов. В условиях рынка любое производство стремится достичь наибольшей эффективности, напри мер, увеличивая количество выполненных технологических операций за то же время, или уменьшая временные затраты на выполнение того же коли чества операций без привлечения дополнительного оборудования. Для этого необходимо повышать быстродействие технологического оборудования, в том числе и роботов-манипуляторов, не теряя при этом в точности его работы. Од нако, при развитии больших скоростей и ускорений или манипулировании тя желыми грузами на точность исполнения роботом заданного движения начи нают оказывать влияние эффекты, связанные с динамикой исполнительного механизма робота. Поэтому в современных системах управления манипуляци онными роботами широкое распространение получили т.н. методы динами ческого управления, позволяющие компенсировать это влияние. Для приме нения таких методов требуется знание уравнений движения исполнительного механизма робота, являющихся, фактически, математической моделью этого механизма. Таким образом, уравнения движения используются также и для моделирования движений робота. Особенно перспективным представляется создание программных комплексов, имитирующих движение реально суще ствующих роботов. С помощью подобных средств возможно решать такие задачи, как обучение операторов роботехнических комплексов или тестиро вание и отладка алгоритмов и систем управления роботами [40], без риска повреждения этого, весьма дорогостоящего, оборудования.
Исполнительным механизмом робота-манипулятора (далее — манипуля ционный механизм) будем называть систему абсолютно твердых тел (зве ньев), связанных вращательными или телескопическими шарнирами и обра зующих разомкнутую кинематическую цепь, закрепленную на неподвижном основании. Уравнения движения такого механизма полностью определяются геометрическими размерами и масс-инерционными параметрами его звеньев.
В число последних входят: масса, координаты центра масс, осевые и центро бежные моменты инерции. Выяснить геометрические параметры манипуля ционного механизма, как правило, не составляет труда: они присутствуют не только в конструкторской документации, но и в эксплуатационной докумен тации, поставляемой вместе с роботом. Узнать масс-инерционные параметры нетрудно лишь в случае собственной разработки. Действительно, проекти рование и конструирование современных машин и механизмов не обходится без использования систем автоматизированного проектирования, с помощью которых можно получить всю необходимую информацию. В противном слу чае остается надеяться, что требуемые сведения предоставит фирма-произ водитель. Однако, в условиях высокой конкуренции между разработчиками роботов-манипуляторов это маловероятно. В подобной ситуации крайне по лезной оказывается процедура идентификации, суть которой заключается в экспериментальном определении неизвестных параметров по данным о дви жении робота. Особый интерес представляет проведение идентификации в режиме реального времени. Это дает возможность корректировать парамет ры математической модели манипуляционного механизма во время выполне ния роботом технологических задач, т.е. сделать систему управления роботом адаптивной.
В основе процедуры идентификации лежит эксперимент, состоящий в совершении исследуемым роботом-манипулятором каких-либо заданных дви жений. В процессе этого эксперимента необходимо измерять или оценивать параметры относительного расположения звеньев робота, скорости и ускоре ния их относительного движения, а также силовые факторы в шарнирах. В механике манипуляционных роботов хорошо известен факт линейности урав нений движения манипуляционного механизма относительно масс-инерцион ных параметров. Подставляя в эти уравнения геометрические параметры ме ханизма, которые предполагаются известными, и величины, измеренные в ходе эксперимента, можно составить переопределенную систему линейных алгебраических уравнений относительно неизвестных масс-инерционных па раметров1. Решение упомянутой системы и будет оценкой значений этих пара метров. Однако, исследования показали, что имеет место т.н. проблема иден тифицируемости: идентификационные модели манипуляционных механиз мов не имеют единственного решения. Эта проблема вызвана тем, что всяко му набору уравнений движения манипуляционного механизма соответствует бесконечное множество наборов масс-инерционных параметров его звеньев.
Поэтому было введено понятие базовых инерционных параметров, представ ляющих собой наименьший набор параметров уравнений движения манипу ляционного механизма, полностью их определяющий и соответствующий им взаимнооднозначно при неизменных геометрических параметрах. Очевидно, что запись уравнений движения с помощью базовых инерционных парамет ров позволяет избежать проблемы идентифицируемости. Еще одним преиму ществом использования базовых параметров является возможность миними зации количества вычислительных операций при решении обратной задачи динамики (ОЗД). Это оказывается весьма полезным при практической реа лизации методов динамического управления роботами-манипуляторами.
Таким образом, базовые инерционные параметры являются фундамен тальным понятием в механике манипуляционных роботов. Отдельной зада чей оказывается поиск такого набора параметров и их связи с обычными Подобные системы уравнений называют идентификационными моделями.
масс-инерционными параметрами2. В настоящее время существуют аналити ческие [20, 21, 30, 31] и численные [22, 36] методы решения этой задачи. Од нако первые принципиально являются приближенными, причем невозможно определить, в каких случаях результат является точным, а в каких — нет.
Вторые же дают точное решение, но только для манипуляторов с параллель ными или перпендикулярными осями соседних сочленений. Другой важной задачей является получение уравнений движения манипуляционных механиз мов относительно базовых инерционных параметров.
В связи с этим цель данной диссертационной работы состоит в математи ческой формализации понятия базовых инерционных параметров, разработке аналитического метода поиска базовых параметров, справедливого для мани пуляторов с произвольно ориентированными осями сочленений, разработке способов формирования уравнений движения и идентификационной модели манипуляционных механизмов в терминах базовых инерционных параметров.
Работа выполнена на кафедре «Робототехнические системы» МГТУ им.
Н.Э. Баумана и состоит из четырех глав.
В первой главе описано применение классических инерционных пара метров в основных задачах механики манипуляционных роботов, используе мых для управления ими: это обратная задача динамики, необходимая в рас четах моментов приводов сочленений, а также, требующаяся в ряде случаев, идентификация параметров уравнений движения. Рассмотрены различные идентификационные модели, приведен их сравнительный анализ. Указаны неудобства, возникающие при использовании классических параметров в ди намических и идентификационных моделях манипуляционных механизмов.
Во второй главе рассмотрено понятие базовых инерционных парамет ров и некоторые их свойства. Предложена математическая интерпретация базовых параметров, как коэффициентов разложения какого-либо элемента Далее будем называть их классическими инерционными параметрами.
некоторой конечной системы векторов линейного пространства функций3 по базису этой системы. Показана необходимость введения базовых параметров не только для уравнений движения, но и для других фундаментальных по нятий лагранжевой механики: полной энергии и функции Лагранжа. Сфор мулированы и доказаны необходимые и достаточные условия равенства этих различных множеств базовых параметров. Указан способ конструирования базиса конечномерного линейного пространства, элементами которого явля ются полная энергия и лагранжиан манипуляционного механизма, а также их коэффициенты влияния. Получены рекуррентные соотношения для вы числения базисных элементов.
Третья глава посвящена задаче поиска множества базовых инерцион ных параметров. Представлен обзор существующих методов, проведен их сравнительный анализ. Предложен метод проекций, позволяющий аналити чески решать задачу поиска базовых параметров для манипуляционных ме ханизмов с произвольно ориентированными осями сочленений, рассмотрены примеры его применения. Получены рекуррентные соотношения для вычис ления проекций, на их основе разработан эффективный по быстродействию алгоритм реализации метода проекций на вычислительной машине.
Четвертая глава посвящена применению базовых инерционных пара метров в задачах управления манипуляционными роботами. Выведены ре куррентные соотношения, позволяющие записать уравнения движения мани пуляционного механизма относительно базовых параметров, рассмотрен при мер. Проведена процедура идентификации базовых параметров первых трех звеньев робота PUMA 560. При выполнении эксперимента реальный манипу ляционный механизм заменен его математической моделью.
К главам даны приложения с исходными текстами программы, реали зующей разработанный рекуррентный алгоритм, а также тексты сценариев Далее будем называть их коэффициентами влияния.
среды Matlab, с помощью которых была проведена симуляция эксперимента.
Методы исследования. В работе используются методы линейной ал гебры, теоретической механики, математического моделирования.
Научная новизна работы заключается в следующем:
Предложена интерпретация полной энергии, лагранжиана и левой ча сти уравнений движения манипуляционного механизма как векторов линей ного пространства функций. Показано, что базовые инерционные парамет ры могут быть определены как коэффициенты разложения этих векторов по базисным коэффициентам влияния.Введены множества базовых параметров отдельно для полной энергии, лагранжиана и уравнений движения, доказа ны необходимые и достаточные условия их равенства. Доказана теорема, ука зывающая способ конструирования конечномерного линейного пространства, включающего коэффициенты влияния на лагранжиан. Предложен новый ме тод поиска базовых параметров, основанный на определении координат упо мянутых коэффициентов влияния в базисе этого пространства. Получены рекуррентные соотношения для вычисления координат коэффициентов вли яния, и разработан рекурсивный алгоритм реализации предложенного мето да. Выведены уравнения движения манипуляционного механизма в терминах базовых инерционных параметров в форме рекуррентных соотношений.
Основные результаты, выносимые на защиту:
Предложена математическая интерпретация базовых инерционных па раметров как коэффициентов базисного разложения, введены множе ства базовых параметров полной энергии, лагранжиана и уравнений движения, доказаны необходимые и достаточные условия их равенства;
Доказана теорема о базисном множестве, с ее помощью создан метод проекций для поиска базовых инерционных параметров, справедливый для манипуляционных механизмов с произвольно ориентированными осями сочленений;
Получены рекуррентные соотношения для вычисления проекций, на их основе разработан эффективный по быстродействию алгоритм реализа ции метода проекций;
Предложен способ формирования уравнений движения в рекуррентной форме в терминах базовых инерционных параметров.
Апробация работы. Основные положения работы докладывались и обсуждались на научно-техническом семинаре кафедры «Роботы и робото технические системы» МГТУ им. Н.Э. Баумана в 2009 г.; на XVIII между народной научной конференции студентов, аспирантов и молодых ученых «Ломоносов» в 2011 г; на специальном семинаре «Динамика относительного движения» кафедры теоретической механики и мехатроники механико-мате матического факультета МГУ им. М.В. Ломоносова в декабре 2010 г. и в феврале 2013 г.
Публикации. Материалы диссертации опубликованы в 5 печатных ра ботах, из них три статьи в рецензируемых журналах из перечня ВАК [9–11], одна статья в сборнике трудов конференций и одна в тезисах докладов.
Структура и объем диссертации. Диссертация состоит из введения, 4 глав, заключения, списка литературы из 40 наименований и 2 приложе ний. Основная часть работы составляет 145 страниц машинописного текста, включая 3 таблицы и 10 рисунков.
Классические инерционные параметры в механике манипуляционных роботов Прежде, чем переходить непосредственно к решению задач, поставлен ных в работе, изложим некоторые известные факты, связанные с особенно стями математического описания манипуляционных механизмов.
1.1. Построение кинематической модели робота-манипулятора с помощью однородных координат и преобразований Рассмотрим манипуляционный механизм, содержащий подвижных зве ньев и неподвижное основание. Свяжем с основанием абсолютную систему координат 0 0 0 0, а с каждым звеном — подвижную систему координат ( = 1, ) в соответствии с методом Денавита-Хартенберга [6].
Тогда положение системы координат, связанной с -м звеном, относительно системы координат, связанной с ( 1)-м звеном, полностью определяется с помощью четырех параметров, показанных на рисунке 1. Каждый из этих па раметров задает преобразование вращения вокруг или переноса вдоль неко торой координатной оси. Как видно из рисунка, для совмещения системы координат 1 1 1 1 с системой координат необходимо выполнить следующую последовательность преобразований:
1. вращение вокруг оси 1 на угол ;
2. перенос вдоль оси 1 на расстояние ;
Рис. 1. Взаимное расположение систем координат, связанных с соседними звеньями мани пуляционного механизма.
3. перенос вдоль оси на расстояние ;
4. вращение вокруг оси на угол.
Для их математического описания удобно воспользоваться аппаратом одно родных координат и преобразований, поскольку он позволяет осуществлять аффинные преобразования трехмерного евклидова пространства, не являю щиеся в нем линейными, с помощью линейных преобразований трехмерной плоскости в четырехмерном псевдоевклидовом пространстве.
Однородными координатами [13] точки евклидова пространства E3 с де картовыми координатами (1, 2, 3 ) называют четверку чисел (1, 2, 3, ) удовлетворяющую следующим соотношениям:
Нетрудно видеть, что между декартовыми и однородными координатами нет взаимнооднозначного соответствия: всякая точка пространства R3 декарто вых координат отображается в прямую в пространстве R4 /{0} однородных координат. Однако, такое соответствие можно установить рассматривая в этом пространстве плоскости вида =, = 0. В частности, если = 1 оставшиеся однородные координаты равны соответствующим декарто вым координатам. Таким образом, существуют биекции : R3, где a b b = (a ). Рассмотрим в пространстве однородных координат линейные преобразования4 T с матрицей следующей структуры:
где R (3), p R3. Применяя такое преобразование к образу (a) некоторого вектора a R3, получим Очевидно, что прообраз этого выражения является результатом аффин ного преобразования исходного вектора a. Далее будем работать только с отображением 1 и плоскостью 1 соответственно, поскольку в этом случе при нахождении образов и прообразов не потребуется избыточная операция умножения или деления на число. Кроме того, если ввести в пространстве однородных координат псевдоевклидово скалярное произведение с помощью билинейной формы, матрица которой имеет вид Далее будем называть их однородными преобразованиями.
то оно будет сохраняться при отображении только для элементов плоско сти 1, т.е. a, b E3 ab = (a) (b) = 1. Отметим, что псевдо евклидова норма, порожденная этим скалярным произведением, сохраняется при линейных преобразованиях вида соответствующих вращениям трехмерного евклидова пространства.
Запишем матрицы однородных преобразований, соответствующих пре образованиям вращения и переноса, необходимым для совмещения системы координат ( 1)-го звена с системой координат -го звена [6]:
1. вращение вокруг оси 1 на угол 2. перенос вдоль оси 1 на расстояние 3. перенос вдоль оси на расстояние 4. вращение вокруг оси на угол Для получения матрицы A суммарного преобразования воспользуемся пра вилами сложения однородных преобразований, согласно которым при исполь зовании пассивного подхода, т.е. при перемещении системы координат, необ ходимо перемножить соответствующие матрицы преобразований в прямом порядке [14]:
В результате получим В силу структуры рассматриваемых однородных преобразований совокуп ность трех первых элементов трех первых столбцов этой матрицы образует ортогональную матрицу R (3), определяющую преобразование враще ния, необходимое для совмещения осей систем координат ( 1)-го и -го звеньев. Согласно свойствам ортогональных матриц, элементы столбцов мат риц R определяют координаты ортов осей системы координат в системе координат 1 1 1 1. Первые же три элемента последнего столбца матрицы A являются координатами точки в системе координат ( 1)-го звена. В этом легко убедиться найдя результат однородного пре образования с матрицей A вектора 1 (0), где 0 = (0 0 0) — декартовы координаты точки в собственной системе координат. Отметим также, что каждая из матриц A должна зависеть только от одной обобщенной коорди наты, поскольку сочленения манипуляционного механизма допускают лишь одну относительную степень свободы. При использовании метода Денавита Хартенберга в качестве обобщенной координаты принимается угол пово рота в случае вращательного сочленения или перемещение — в случае поступательного сочленения [6].
Нашей основной задачей при построении кинематической модели мани пуляционного механизма является определение положений5 его звеньев от носительно абсолютной системы координат. С учетом сказанного ранее, это можно сделать найдя матрицы T однородных преобразований, определяю щих переход от абсолютной системы координат 0 0 0 0 к системе коорди нат -го звена. Эти матрицы будут содержать координаты радиу сов-векторов точек, которые мы будем считать полюсами, в абсолютной системе координат, а также компоненты ортогональных матриц, задающих преобразования вращения, совмещающие оси абсолютной системы координат с осями системы координат -го звена. Известно, что всякой матрице вра щения соответствует хотя бы один набор значений углов Эйлера [4]. Таким образом, матрицы T полностью определяют положение звеньев механизма в абсолютной системе координат. Вычислить их можно согласно правилам сложения однородных преобразований:
Отметим, что элементы матриц T являются функциями первых обобщен ных координат механизма.
Под положением твердого тела понимается три декартовых координаты некоторого полюса в этом теле и три параметра, характеризующих вращение относительно полюса, например, углы Эйлера.
1.2. Уравнения движения манипуляционного механизма С точки зрения решения задач управления для вывода уравнений движе ния манипуляционного механизма удобно воспользоваться методами анали тической механики Лагранжа, поскольку лагранжев формализм оперирует понятиями обобщенных координат и обобщенных сил. Действительно, рас сматривая манипуляционный механизм, как объект управления, можно счи тать, что управляющими воздействиями для него являются силы или момен ты, развиваемые приводами звеньев, а сигналами обратной связи — значе ния углов поворота или перемещений в сочленениях, измеряемые прямо или косвенно соответствующими датчиками. При этом конструктивное исполне ние большинства манипуляционных роботов таково, что и приводы звеньев, и датчики обратной связи расположены непосредственно в сочленениях. Таким образом, управлениями являются обобщенные силы от приводных силовых факторов6, а сигналами обратной связи — обобщенные координаты. Кроме того, при использовании методов лагранжевой механики существенно умень шается количество уравнений движения по сравнению с классическими мето дами, такими как, например, уравнения Ньютона-Эйлера, за счет исключе ния уравнений, описывающих движения, запрещенные связями. Это снижает вычислительную сложность алгоритмов динамического управления, что ока зывается весьма полезным, поскольку задача управления является задачей реального времени.
Из геометрических соотношений (1) следует, что связи, наложенные на движение звеньев манипуляционного механизма являются стационарными, удерживающими и голономными. Предположим также отсутствие трения в Это особенно актуально в связи с растущим применением в приводах роботов-манипуляторов высокомоментных безредукторных электродвигателей.
сочленениях звеньев7, что позволяет считать связи идеальными. Тогда для получения уравнений движения механизма можно использовать уравнения Лагранжа 2-го рода, которые имеют вид [14] где q, q — векторы 1 обобщенных координат и скоростей, Q — вектор обобщенных сил от непотенциальных силовых факторов, — лагранжиан, равный разности кинетической и потенциальной энергий механизма.
Кинетическая энергия манипуляционного механизма Известно, что кинетическая энергия К механической системы, стестнен ной стационарными связями, является квадратичной формой относительно обобщенных скоростей [4]:
Коэффициенты (, = 1, ) этой формы для системы абсолютно твер дых тел могут быть найдены следующим образом:
Здесь — количество материальных точек в -м твердом теле, — масса -й точки -го тела, а r E3 — ее радиус-вектор, заданный в абсолютной системе координат. В соответствии с построенной кинематической моделью, имеет место соотношение При необходимости учета трения в шарнирах можно применить стандартный подход: считать соответствующие силовые факторы активными и добавить их к обобщенным силам.
где — радиус-вектор -й точки -го звена, заданный в системе координат, связанной с этим звеном. Поскольку =, очевидно следующее Для краткости обозначим частные производные T / как U. Тогда, рас сматривая частные производные 1 r / как элементы обычного евкли дова пространства E4, можно записать Воспользуемся следующим очевидным свойством операции взятия следа матрицы: a, b R aт b = (abт ). С учетом этого свойства будем иметь или, пользуясь линейностью следа матрицы, Выражения в квадратных скобках представляют собой симметрические мат рицы размера 4 4, которые называют матрицами инерции и обозначают H [6]. Нетрудно убедиться в том, что они состоят из масс-инерционных па Здесь — масса,, и — статические моменты, а, и — центробежные моменты инерции -го звена механизма. Параметры, и физического смысла не имеют и определяются через осевые моменты инерции,, с помощью невырожденного линейного преобразования:
Отметим, что компоненты матриц инерции меняются при переходе к другой системе координат аналогично преобразованию компонент тензора инерции, только в роли ортогональной матрицы перехода выступает соответствующая матрица однородного преобразования [6]. В соотношении для элементы матриц инерции H заданы в собственных системах координат звеньев.
Внешние силовые факторы Будем считать манипулятор ненагруженным, т.е. движущимся под дей ствием сил тяжести звеньев, являющихся потенциальными, а также сил и моментов приводов сочленений, не являющихся таковыми. Таким образом, -я компонента вектора Q обобщенных сил будет равна соответствующему силовому фактору, действующему со стороны привода -го сочленения. Най дем потенциальную энергию П веса всех звеньев манипулятора. По определе нию дифференциал этой величины равен элементарной работе сил тяжести, взятой с противоположным знаком [4]:
Здесь g E3 — вектор ускорения свободного падения, а r E3 — радиус вектор центра масс -го звена, заданные в абсолютной системе координат механизма. Тогда где — произвольная постоянная. Далее будем считать ее выбранной так, чтобы в правой части последнего равенства не было постоянных слагаемых.
Запишем скалярное произведение векторов g и r с помощью псевдоевклидо ва скалярного произведения их образов в плоскости 1, введенного в преды дущем параграфе:
Пусть R3 — радиус-вектор центра масс -го звена в его собственной системе координат. Учитывая связь между образом этого вектора и вектора r в плоскости 1, получим Принимая во внимание, что ускорение свободного падения одинаково для всех звеньев манипулятора, будем иметь для потенциальной энергии следую щее соотношение Поскольку вектор S статического момента -го звена равен произведению его массы на радиус-вектор центра масс очевидно, что произведение совпадает с последним столбцом матрицы инерции H этого звена. Выделить его можно умножив эту матрицу на образ нулевого вектора 1 (0). Тогда Уравнения движения Вычисляя функцию Лагранжа как разность кинетической и потенциаль ной энергий и подставляя результат в уравнения Лагранжа, получим извест ные уравнения движения манипуляционного механизма [6] где — коэффициенты квадратичной формы кинетической энергии, — квадратичные формы относительно обобщенных скоростей, коэффициенты (, = 1, ) которых можно вычислить следующим образом а — обобщенные силы от весов звеньев, причем При необходимости в полученных уравнениях движения можно учесть до полнительные внешние силовые факторы, действующие на -е звено, приве денные к главному вектору F и главному моменту M, добавив к вектору обобщенных сил Q слагаемое Jт (Fт Mт )т. Здесь J — матрица Якоби, связы вающая линейные скорости точки приложения главного вектора и угловые скорости -го звена с обобщенными скоростями.
1.3. Идентификация параметров уравнений движения манипуляционного механизма В предыдущем параграфе были записаны известные уравнения движе ния манипуляционного механизма в форме удобной для решения задач управ ления роботом-манипулятором. Коэффициенты этих уравнений полностью определяются 4 геометрическими параметрами Денавита-Хартенберга и масс-инерционными параметрами звеньев. Ранее было отмечено, что в ряде случаев масс-инерционные параметры оказываются неизвестными и требу ется их определение с помощью эксперимента — идентификация. Конечно, существуют ситуации когда геометрические параметры механизма также не могут считаться известными, и необходимо проводить процедуру их иденти фикации. Подробнее об этом написано в работах [35, 37], здесь же предпола гается, что эти параметры определены тем или иным способом.
Свойство линейности Идентификация масс-инерционных параметров основана на известном в механике роботов-манипуляторов факте линейности кинетической и потен циальной энергий манипуляционного механизма относительно этих парамет ров [26]. Действительно, соответствующие частные производные по некоторо му масс-инерционному параметру -го звена имеют вид рация параметров соответствует порядку их перечисления. Нетрудно ви деть, что частная производная матрицы инерции -го звена по -му инерцион ному параметру этого же звена является постоянной матрицей, не зависящей от масс-инерционных параметров, а также от номера звена. Поэтому далее бу дем H / обозначать как DH. Таким образом, выражения (6) не содержат масс-инерционных параметров и зависят лишь от обобщенных координат и скоростей. Тогда кинетическая и потенциальная энергии манипуляционного механизма представимы в виде линейных форм или, вводя вектор-столбец p = { }=1,10 : = 10(1)+ и векторы-строки Вектор p состоит из всех масс-инерционных параметров всех звеньев манипу лятора, поэтому будем называть его вектором масс-инерционных парамет ров манипулятора. Компоненты векторов-строк wК и wП являются весовы ми коэффициентами, определящими вклад некоторого масс-инерционного па раметра в кинетическую и потенциальную энергию соответственно, поэтому далее будем называть их коэффициентами влияния. Вообще, если некоторая, не обязательно скалярная, функция линейно зависит от ряда параметров, то ее частные производные по этим параметрам будем называть коэффициента ми влияния соответствующего параметра на эту функцию.
С учетом сказанного, функция Лагранжа для манипуляционного меха низма, как разность его кинетической и потенциальной энергий, представима в виде линейной формы где w = wК wП. Поскольку дифференциальное преобразование применяемое в левой части уравнений Лагранжа (2) к лагранжиану, линей но, уравнения движения манипуляционного механизма также оказываются линейными относительно масс-инерционных параметров:
где W = w — матрица размера 10.
Идентификационные модели Благодаря свойству линейности процедура идентификации масс-инерци онных параметров сводится к решению системы линейных алгебраических уравнений относительно вектора p оценок этих параметров. Действительно, измерив в процессе движения робота в 10 временных отсчетах зна чения его обобщенных координат, скоростей и ускорений, а также силовых факторов, действующих со стороны приводов сочленений, и подставив эти значения в уравнения (8) получим т.н. явную динамическую идентификаци онную модель [24]:
Основным недостатком этой модели является необходимость измерения обоб щенных ускорений манипуляционного механизма. Реальные роботы-манипу ляторы не оснащаются акселерометрами, поэтому ускорения можно опреде лить лишь путем численного дифференцирования обобщенных скоростей, что при наличии шумов измерений может существенно снизить точность оцен ки масс-инерционных параметров. Этой проблемы удается избежать исклю чив обобщенные ускорения из идентификационной модели, для чего уравне ния Лагранжа (2) интегрируют по времени на некотором отрезке [1, 2 ]:
В результате имеем или, учитывая (7), Подставляя в последнее соотношение измеренные значения обобщенных ко ординат, скоростей и управляющих моментов получаем т.н. неявную динами ческую модель [24]:
Очевидно, что в этой идентификационной модели ускорения не требуются, од нако вычислительная сложность расчета выражений в круглых скобках соот ношений (10), а, следовательно, и основной матрицы этой системы линейных уравнений, выше, чем при использовании явной динамической модели [18].
В связи с этим чаще всего используют энергетическую идентификационную модель [19], в основе которой лежит теорема об изменении полной энергии голономной системы в интегральной форме [12]:
Поскольку полная энергия есть сумма кинетической и потенциальной энер гий, для нее справедливо представление в виде линейной формы где w = wК + wП. В результате, имея те же измерения, что и в случае неявной динамической модели, получим В работе [18] проведено подробное исследование и представлен сравнитель ный анализ трех приведенных типов идентификационных моделей, согласно которому выражения в левых частях соотношений (12) имеют наиболее про стой вид и требуют наименьших вычислительных затрат при расчетах. При этом ошибка оценки неизвестных параметров во всех трех случаях приблизи тельно одинакова. В качестве недостатка энергетической модели можно отме тить необходимость большего числа точек измерений (в раз). Заметим, что теоретически для любой идентификационной модели достаточно такого коли чества точек измерений, чтобы основная матрица соотвествующей системы линейных уравнений была квадратной. Такая ситуация была бы удобна, по скольку подобные системы довольно легко решаются, например, методом ис ключения Гаусса и различными его модификациями [3]. Однако на практике идентификационные модели обычно приходится делать переопределенными и применять для их решения метод наименьших квадратов с целью уменьше ния влияния шумов измерений на оценку неизвестных параметров [16].
Проблема идентифицируемости При проведении идентификации масс-инерционных параметров реаль ных роботов-манипуляторов обнаружилось, что при соответствии измерен ных параметров движения управляющим силовым факторам, любая из си стем линейных уравнений (9),(10),(12) совместна, но не имеет единственно го решения из-за линейной зависимости столбцов основных матриц этих си стем [18]. Эта проблема может быть вызвана двумя причинами:
траектория движения манипулятора q () в пространстве обобщенных координат такова, что коэффициенты влияния масс-инерционных па раметров, как элементы линейного пространства функций времени, оказываются линейно зависимыми;
кинематическая схема и геометрические параметры манипулятора та ковы, что коэффициенты влияния масс-инерционных параметров, как элементы линейного пространства функций обобщенных координат q, скоростей q и, в случае динамических идентификационных моделей, ускорений q, оказываются линейно зависимыми.
Первая причина обусловлена «неудачным» выбором траектории движения и может быть устранена в случае проведения идентификации в режиме off-line, для чего необходимо использовать специальные методы формирования экс периментальных траекторий, изложенные в работах [23, 33, 38, 39]. Вторая же причина обусловлена тем, что на движение звеньев манипуляционного механизма наложены связи. Этот факт вытекает из следующей теоремы:
Теорема 1. Коэффициенты влияния классических инерционных парамет ров на функцию Лагранжа свободного твердого тела, движущегося в поле силы тяжести, как элементы линейного пространства функций обобщен ных координат и скоростей, линейно независимы.
Доказательство. Пусть в пространстве E3 задана неподвижная система ко ординат, а в произвольно выбранной точке свободного твердого тела поме щено начало подвижной системы координат, связанной с этим телом. За обобщенные координаты примем декартовы координаты,, точки нача ла подвижной системы координат, заданные в неподвижной системе, и углы поворота,, вокруг осей неподвижной системы координат. Тогда обоб щенными скоростями будут являться компоненты вектора линейной скорости v E3 точки начала подвижной системы координат и вектора угловой ско рости E3 твердого тела, заданных в неподвижной системе координат.
Кинетическая энергия свободного твердого тела с учетом (3) и (4), а также свойства цикличности следа матрицы, может быть записана в виде Здесь T — однородная матрица перехода к подвижной системе координат, а H — матрица инерции рассматриваемого твердого тела, заданная в подвижной системе. Представляя сумму произведений как произведение сумм и прини мая во внимание, что получим где r = ( )т и R —матрица суммарного вращения на углы,, вокруг соответствующих осей неподвижной системы координат, имеем Из кинематики манипуляционных механизмов известно [6], что где () — кососимметрическая матрица, компоненты которой определяются Обозначим линейную и угловую скорости v и, заданные в подвижной си стеме координат, как v и соответственно. Очевидно, что v = R и = R.
В результате, учитывая известное свойство матриц [6] Непосредственно проверяется, что откуда после алгебраических преобразований вытекает Покажем, что компоненты вектора-строки wК линейно независимы. В отсут ствие связей компоненты вектора обобщенных скоростей q = (vт т )т являют ся независимыми переменными. Тогда компоненты вектора псевдоскоростей = (т т )т, как элементы линейного пространства R6 обобщенных скоро стей, линейно независимы, поскольку Действительно, матрица Y ортогональна при любых значениях обобщенных координат, поэтому интерпретация ее как матрицы координат псевдоскоро стей ( = 1, 6) в базисе, = 1, 6 пространства обобщенных скоростей приводит к истинности утверждения о линейной независмости. Пусть Тогда нетрудно видеть, что wК = bZ, где b — вектор-строка, составленная из всех элементов множества, а Поскольку псевдоскорости линейно независимы, т.е. просто образуют другой базис в пространстве обобщенных скоростей, то справедлива лемма 7, сфор мулированная и доказанная в параграфе 2.3, из которой следует линейная независимость элементов множества как подмножества системы линейно независимых векторов пространства функций, определенных на некотором параллелепипеде пространства обобщенных скоростей. Таким образом, коэф фициенты влияния на кинетическую энергию линейно независимы, ибо мат рица Z их координат в базисе пространства (), имеет максимальный ранг, в чем легко убедиться приведя ее к ступенчатому виду [1].
Найдем коэффициенты влияния на потенциальную энергию. Пользуясь соотношением (5) при = 1 и = 0, получим или, обозначая вектор ускорения свободного падения, заданный в подвижной системе координат, как g, Нетрудно видеть, что Пусть u, v и w — орты осей подвижной системы координат, заданные в неподвижной системе, тогда R = (u v w) и Покажем, что отличные от нуля компоненты вектора-строки wП, как элемен ты линейного пространства функций обобщенных координат, линейно неза висимы. Во-первых, П является функцией обобщенных координат,, и, следовательно, никак не зависит от П ( {7, 8, 9}), явлющихся функция ми,,. Во-вторых, компоненты вектора g образуют систему линейно независимых векторов. Действительно, рассмотрим некоторую нетривиаль ную линейную комбинацию или, выполняя подстановку и вынося общий множитель за скобки, Выражение в круглых скобках является нетривиальной линейной комбина цией линейно независимых векторов и всегда отлично от нуля [7], поэтому равенство рассматриваемой линейной комбинации нулю при любых значени ях обобщенных координат возможно лишь в случае ортогональности вектора ускорения свободного падения и вектора равного выражению в скобках. Од нако для свободного твердого тела это невозможно, поскольку для каждого заданного g и любого набора коэффициентов,, найдется такое положе ние этого тела и соответствующие ему значения обобщенных координат, что g = u + v + w. Отметим, что ненулевые коэффициенты влияния на потен циальную энергию никак не зависят от коэффициентов влияния на кинети ческую энергию, ибо первые являются функциями обобщенных координат, а вторые — псевдоскоростей.
Покажем, наконец, истинность утверждения теоремы. По определению w = wК wП, поэтому коэффициенты влияния на лагранжиан принадле жат пространству,,, gт r. Тогда матрица их координат в базисе этого пространства имеет вид нетрудно видеть, что ее ранг максимален.
Итак, мы установили линейную независимость коэффициентов влияния в случае свободного твердого тела. Теперь нас интересует, будет ли сохранять ся это свойство, если на движение тела наложены стационарные, удержива ющие, голономные связи, уравнения которых в дифференциальной форме имеют вид Ясно, что в этом случае элементы множества уже не образуют системы линейно независимых векторов, но это, вообще говоря, не свидетельствует о линейной зависимости компонент вектора-строки w. В этом можно убе диться рассмотрев, например, связи вида = 0 или = Таким обра зом, однозначно ответить на интересующий нас вопрос в общем случае не удается — многое зависит от конкретного вида уравнений связей, а также их количества. Однако для класса манипуляционных механизмов достаточ но легко установить факт линейной зависимости коэффициентов влияния.
По определению каждое звено такого механизма стеснено пятью связями ви да (13), а значит ранг системы векторов, = 1, 6 равен единице при лю бых значениях обобщенных координат. Поскольку линейное преобразование с невырожденной матрицей не меняет ранга системы векторов, множество псевдоскоростей, = 1, 6 также имеет ранг равный единице. Для опре деленности будем считать независимым элементом 1, тогда все остальные псевдоскорости могут быть линейно выражены через него Нетрудно видеть, что в этом случае все коэффициенты влияния на кинетиче скую энергию К ( = 1, 10) линейно выражаются через 1 и, следовательно, являются линейно зависимыми. Поскольку первые шесть компонент вектора строки wП тождественно равны нулю, по крайней мере шесть компонент вектора-строки w оказываются линейно зависимыми. Таким образом, ко эффициенты влияния на функцию Лагранжа масс-инерционных параметров каждого звена манипуляционного механизма, а значит и совокупности всех звеньев, образуют систему линейно зависимых векторов. Ясно, что эта линей ная зависимость будет сохраняться и для уравнений движения, и для полной энергии механизма в силу соотношений (8) и (11). Более того, для много звенного механизма характерно появление линейной зависимости между ко эффициентами влияния масс-инерционных параметров различных звеньев, а не только одного и того же.
Итак, связи, наложенные на движение звеньев манипулятора, делают коэффициенты влияния линейно зависимыми, и, как следствие, не позволя ют установить взаимнооднозначного соответствия между множеством всех левых частей уравнений движения и множеством всех наборов масс-инерци онных параметров. Очевидно, что всякой векторной функции обобщенных ко ординат, скоростей и ускорений, являющейся левой частью каких-либо урав нений движения, соответствует бесконечное множество наборов масс-инерци онных параметров звеньев. С одной стороны, это свойство крайне полезно, например, в теории подобия, но с другой стороны однозначное определение масс-инерционных параметров звеньев манипулятора путем идентификации оказывается принципиально невозможным. В заключение отметим, что по мимо проблемы идентифицируемости, линейная зависимость коэффициентов влияния приводит к появлению избыточных вычислительных операций в про цессе решения прямой и обратной задач динамики, получения идентифика ционных моделей и т.п. Это прямо следует из соотношений (8) и (11). Ми нимизация вычислений может оказаться достаточно актуальной проблемой в свете того, что перечисленные выше задачи зачастую требуется решать в режиме реального времени.
В настоящее время существует два подхода к разрешению указанной про блемы [16]. Первый состоит в регуляризации по Тихонову рассматриваемой задачи, т.е. выборе из бесконечного числа решений системы линейных уравне ний единственного решения исходя из некоторого дополнительного критерия.
Таковым может служить, например, решение доставляющее минимум квад ратической ошибки оценки и имеющее наименьшую норму, которое можно найти с помощью псевдообращения основной матрицы линейной системы [2].
Однако получаемые таким способом оценки масс-инерционных параметров будут существенно отличаться от истинных их значений, хотя и могут быть успешно использованы, например, в алгоритмах динамического управления для расчета управляющих сил и моментов. Второй способ заключается во введении уменьшенного набора масс-инерционных параметров, такого, чтобы существовало взаимнооднозначное соответствие между множеством наборов таких параметров и множеством всех левых частей уравнений движения. Эле менты уменьшенного набора параметров называют базовыми инерционными параметрами по причинам, которые будут показаны далее. Чтобы отличать базовые параметры от элементов обычного набора параметров, последние называют классическими инерционными параметрами. Метод базовых па раметров позволяет не только решать практические задачи управления ро ботами-манипуляторами, но также устраняет структурную неоднозначность уравнений движения и полной энергии относительно инерционных парамет ров. Последнее весьма полезно для решения упомянутой выше задачи мини мизации вычислений в прикладных расчетах, а также в компьтерных методах получения уравнений движения манипуляционного механизма в символьном виде. Следующая глава посвящена математическим аспектам понятия базо вых инерционных параметров.
Выводы 1. Классические инерционные параметры при известных геометрических параметрах манипуляционного механизма полностью определяют коэф фициенты уравнений движения, поэтому их знание необходимо для ре шения задач анализа и синтеза современных методов управления робо тами-манипуляторами.
2. Нередко априорная информация о классических инерционных парамет рах отсутствует или недоступна. В таких ситуациях требуется проведе ние процедуры идентификации инерционных параметров, которая, бла годаря линейности левых частей уравнений движения и полной энер гии манипуляционного механизма относительно этих параметров, мо жет быть сведена к решению системы линейных алгебраических урав нений.
3. Получение однозначной оценки классических инерционных параметров путем идентификации принципиально невозможно вследствие струк турной неоднозначности как левых частей уравнений движения, так и полной энергии манипуляционного механизма, относительно этих па раметров. Устранение подобной неоднозначности возможно с помощью другой параметризации кинетической и потенциальной энергий меха низма — базовых инерционных параметров. Это также позволяет сни зить вычислительную сложность расчетов при моделировании движе ний звеньев манипуляционных роботов и реализации методов динами ческого управления ими.
Базовые инерционные параметры и их свойства 2.1. Понятие о базовых инерционных параметрах Итак, базовые инерционные параметры представляют собой специаль ную параметризацию левой части уравнений движения манипуляционного механизма, устраняющую их структурную неоднозначность. Основываясь на более строгой формулировке понятия базовых инерционных параметров, при веденной в работе [31], являющейся одной из фундаментальных для рассмат риваемой проблемы, можно дать общее определение базовых параметров, представленное ниже. Базовыми параметрами некоторого многопараметри ческого8 семейства скалярных или векторных функций одной или нескольких переменных будем называть совокупность действительных чисел, удовлетво ряющих следующим свойствам:
Минимальность. Множество базовых параметров не может быть сведе но к меньшему набору параметров, который, в то же время, полностью бы определял заданное семейство функций;
Однозначность. Различные наборы значений базовых параметров зада ют различные функции семейства.
Однако для разработки методов поиска связи классических и базовых пара метров, записи уравнений движения и идентификационных моделей в терми нах базовых параметров требуется математическая интерпретация данного выше определения. Ниже рассмотрен предлагаемый подход к формализации Здесь имеется ввиду, что перебирая все возможные значения всех параметров можно перебрать все функции данного семейства.
понятия базовых параметров, а в конце параграфа приведено сравнение с существующими способами.
Изучив соотношения (6) можно утверждать, что коэффициенты влияния на кинетическую энергию являются квадратичными формами вида а на потенциальную энергию — некоторыми непрерывными нелинейными функциями (q) обобщенных координат. Отметим, что последние не содер жат постоянных слагаемых благодаря выбору произвольной постоянной в выражении (5):
где = 0, если потенциальная энергия не содержит слагаемого вида ( = ), и = в противном случае. Очевидно, что такие квадратичные формы и функции (q) образуют подпространства в бесконечномерном ли нейном пространстве непрерывных функций обобщенных координат и скоро стей, определенных на некотором параллелепипеде фазового пространства.
Далее будем обозначать их FК и FП соответственно. Покажем, что эти под пространства имеют только один общий элемент — нулевой. Предположим, что существуют такие не равные тождественно нулю квадратичная форма из FК с матрицей B (q) и функция (q) из FП, что Выберем произвольное значение вектора обобщенных координат q* и введем обозначения B* = B (q* ), * = (q* ) и * = {q : ((q* )т qт )т }. Тогда должно быть справедливо Здесь 1 (q) — функция, тождественно равная единице во всех точках множе ства *. Из последнего равенства следует, что некоторая линейная комбина пространства непрерывных функций обобщенных скоростей, определенных на множестве *, равна нулю. Согласно лемме 7, сформулированной и дока занной ниже в данной главе, указанная система векторов линейно независи ма, поэтому * = 0 и qт B* q 0, откуда, в силу произвольности q*, немедлен но следует, что (q) 0 и qт B (q) q 0. С учетом сказанного коэффициенты влияния на функцию Лагранжа и на полную энергию механизма являются элементами пространства F = FК FП [1]. Тогда соотношения (7) и (11) мож но интерпретировать как разложения некоторых векторов и простран ства F по элементам конечных систем векторов w и w соответственно этого же пространства, причем масс-инерционные параметры являются ко эффициентами этих разложений. Аналогичные рассуждения справедливы и в отношении коэффициентов влияния на левую часть уравнений движения.
Действительно, результатом применения линейного оператора к любому вектору пространства F является вектор-функция вида B (q) q + b (q, q).
Нетрудно видеть, что последние образуют линейное подпространство F в бесконечномерном линейном пространстве непрерывных векторов-функций обобщенных координат, скоростей и ускорений, определенных на некотором параллелепипеде 1 пространства R3. Таким образом, соотношение (8) мо жет быть истолковано как разложение вектора пространства F по элемен там конечной системы векторов того же пространства.
Итак, функция Лагранжа, полная энергия и левая часть уравнений движения являются элементами линейных оболочек конечных систем век существуют разложения указанных элементов по базисам этих линейных про странств [2]. Пусть среди компонент векторов-строк w и w найдется не бо лее и соответственно линейно независимых элементов, а в матрице W — не более линейно независимых столбцов. Тогда векторы-строки w = ленные из линейно независимых элементов соответствующих систем векто ров, являются «естественными» базисами пространств (w ), (w ) и (W ). Рассмотрим следующие базисные разложения:
где p R, p R и p R — векторы-столбцы, составленные из коэффициентов этих разложений. Из соотношений (6) видно, что коэф фициенты влияния на кинетическую и потенциальную энергию механизма определяются только его геометрическими параметрами. Из (7), (11) и (8) ясно, что этот вывод справедлив и для коэффициентов влияния на функцию Лагранжа, полную энергию и левую часть уравнений движения. Поэтому при заданной кинематической схеме манипулятора и выбранных базисах w, w и W в силу единственности базисного разложения имеют место взаимноод нозначные соответствия p, p и p. Кроме того, исклю чение из базисной системы векторов хотя бы одного элемента, и, как след ствие, уменьшение размерности столбца коэффициентов этого разложения, приводит к невозможности представления всех элементов соответствующего линейного пространства как линейных комбинаций векторов редуцирован ной базисной системы. Это означает, что редуцированная система базисных векторов не обладает полнотой описания рассматриваемого линейного про странства. Таким образом, коэффициенты базисного разложения являются наименьшим набором параметров, полностью определяющим в выбранном базисе все элементы соответствующего пространства. Из сказанного следует, что совокупности элементов столбцов p, p и p удовлетворяют данному выше определению базовых параметров. Заметим, что в общем случае коэф фициенты разложений (14) различны, откуда вытекает необходимость вве дения базовых параметров отдельно для лагранжиана, для полной энергии и для левой части уравнений движения. Кроме того, любое невырожденное линейное преобразование с матрицей A любого из трех векторов базовых па раметров также является вектором базовых параметров, но соответствующим другому базису, переход к которому определяется матрицей A1.
Теперь найдем связь между базовыми и классическими инерционными параметрами. Поскольку (w ), (w ) и w (W ), где = 1, 10, справедливы соотношения Здесь y R, y R и y R — векторы-столбцы, составленные из координат соответствующих коэффициентов влияния в «естественных»
базисах указанных пространств. Введем матрицы Y = y... y, Y = y... y и Y = y... y, тогда имеет место следующее Рассмотрим условия инвариантности лагранжиана, полной энергии и левой части уравнений движения которые с учетом (15) могут быть записаны в виде Каждое из этих соотношений можно интерпретировать как равенство ну левому вектору некоторой линейной комбинации базисных векторов. Ясно, что это возможно лишь в случае тривиальных коэффициентов этой комбина ции [7], откуда следует Таким образом, базовые инерционные параметры являются некоторыми ли нейными комбинациями классических параметров, причем коэффициенты этих комбинаций равны координатам соответствующих коэффициентов влия ния в «естественных» базисах пространств (w ), (w ) и (W ).
В заключение сравним предложенный подход с другими, существующи ми на сегодняшний день. В работах [30, 31] используется иная интерпретация соотношений (7), (11) и (8): элементами линейного пространства считаются масс-инерционные параметры, а их коэффициенты влияния — коэффици ентами соответствующих разложений. С этой точки зрения базовые инерци онные параметры являются базисом пространства всевозможных масс-инер ционных параметров. В другом подходе, применяемом в [22, 36], базовые пара метры трактуются с точки зрения их приложения к решению проблемы иден тифицируемости и определяются из условия инвариантности идентификаци онной модели как координаты вектора ее правой части в базисе пространства, задаваемого столбцами основной матрицы соответствующей линейной систе мы. Наконец, в работах [20, 21, 27] применяется подход, подобный предложен ному выше, также основанный на поиске линейно зависимых и независимых коэффициентов влияния. Однако, по мнению диссертанта он недостаточно проработан с математической точки зрения, в частности, самоочевидным счи тается факт равенства базовых параметров полной энергии и уравнений дви жения, что, вообще говоря, имеет место лишь при выполнении определенных условий, сформулированных и доказанных в следующем параграфе. Так или иначе, все перечисленные способы формализации базовых инерционных пара метров позволяют находить связь последних с классическими параметрами, обзор соответствующих методов представлен в главе 3, целиком посвященной этой задаче. Однако, эти методы либо справедливы лишь для манипуляцион ных механизмов с параллельными или перпендикулярными осями соседних вращательных сочленений, либо принципиально являются приближенными и не гарантируют получения истинного решения. Предложенный же выше способ формализации базовых параметров, как будет показано далее, поз воляет не только находить связь с классическими параметрами для любых манипуляционных механизмов, но и получить замкнутую форму уравнений движения и энергетической идентификационной модели таких механизмов.
2.2. Теоремы о равенстве Рассмотренный в предыдущем параграфе подход к понятию базовых инерционных параметров с одной стороны позволяет установить достаточ но простую связь с классическими параметрами, но, с другой стороны, при водит к появлению трех различных вариантов базовых параметров, причем остается неясным какие из них могут иметь практическое применение. На пер вый взгляд необходимы только параметры левой части уравнений движения p, ведь и управление, и идентификация осуществляются на основе уравне ний движения, как, собственно, и моделирование. С другой стороны, оценка масс-инерционных параметров возможна и с помощью теоремы об изменении полной энергии в интегральной форме, причем такой способ имеет определен ные преимущества с точки зрения минимизации вычислений. То же можно сказать и о моделировании движений манипулятора с помощью принципа Гамильтона9. Наконец, кажется логичным, что для поиска базовых инерци онных параметров, как линейных комбинаций классических инерционных па раметров, достаточно иметь выражения для кинетической и потенциальной энергии и не обязательно требовать знания уравнений движения. Таким об разом, использование базовых параметров лагранжиана p и полной энергии p, а также соответствующих представлений (14) этих величин позволяет по лучить выигрыш в быстродействии при решении прикладных задач. Все это говорит о крайней полезности нахождения какой-либо связи между этими тремя различными вариантами базовых инерционных параметров, для чего были доказаны необходимые и достаточные условия их равенства, сформули рованные в виде следующих теорем:
Теорема 2. Для равенства базовых инерционных параметров функции Лагран жа p и полной энергии p манипуляционного механизма необходимо и достаточно выполнения следующего соотношения между их коэффициен тами влияния где : F F — преобразование Лежандра, причем Теорема 3. Для равенства базовых инерционных параметров функции Лагран жа p и уравнений движения p манипуляционного механизма необходи Так называемое «вариационное интегрирование». Соответствующие теоретические основы подроб но изложены в работе [29], а примеры использования для моделирования транспортных средств — в ра боте [28].
мо и достаточно выполнения следующего соотношения между их коэффи циентами влияния Для доказательства этих теорем сначала сформулируем и докажем несколь ко вспомогательных лемм.
Лемма 1. Если вектор-строка a из элементов представляет собой систе му линейно независимых векторов пространства F, то система векторов a F также линейно независима.
Доказательство. Предположим противное. Тогда, по определению [7], долж но выполняться равенство где не все R равны нулю. Это равенство может выполняться в следующих случаях:
Выполнение этого равенства невозможно, поскольку в этом случае си стема векторов a должна быть линейно зависимой, что противоречит Поскольку F, справедливо следующее Тогда рассматриваемое условие можно записать в виде или, приводя подобные слагаемые, Нетрудно видеть, что левая часть последнего равенства является эле ментом подпространства FК, а правая — подпространства FП. Ранее было показано, что FК FП = {0 (q, q)}, поэтому выполнение этого равенства возможно лишь в случае qт B (q) q 0 и (q) 0, и, следо вательно, 0 ( = 1, ), что противоречит линейной независимости системы векторов a.
Выполнение этого равенства невозможно, поскольку невозможно равен ство нулевому вектору нетривиальной линейной комбинации системы линейно независимых векторов a [7].
С учетом (17) рассматриваемое условие можно переписать в виде или, упрощая выражения, Левая часть последнего равенства является линейной комбинацией эле ментов подпространства FК, а правая — элементов подпространства FП.
В силу замкнутости линейных подпространств [7], выполнение рассмат риваемого условия оказывается возможным лишь в случае равенства упомянутых линейных комбинаций нулевому вектору, откуда следует равенство нулю нетривиальной линейной комбинации Таким образом, выполнение ни одного из перечисленных условий невоз можно, а, значит, наше предположение неверно и система векторов a явля ется линейно независимой, ясно, что ее ранг равен.
Лемма 2. Если вектор-строка a из элементов представляет собой систе му линейно независимых векторов пространства F, то система векторов a F также линейно независима.
Доказательство. Предположим противное. Тогда, по определению, должно выполняться равенство где не все R равны нулю. Это возможно в следующих случаях:
Из равенства нулю частных производных по обобщенным координа там и представления (17) следует, что квадратичные формы qт B (q) q тождественно равны нулю либо их матрицы являются постоянными.
Кроме того, поскольку функции (q) не могут содержать постоянных слагаемых, в частности, не могут быть тождественно равными констан те, они тождественно равны нулю. Таким образом, возможны два ва матрицы. Первый вариант противоречит факту линейной независимо сти системы векторов a, являющемуся условием леммы. Из второго же вкупе с рассматриваемым условием следует Эти линейных уравнений для каждого выделяют в пространстве обобщенных ускорений R часть плоскости размерности (B ) ограниченной параллелепипедом q, являющимся сужением области определения 1 функций-элементов пространства F на -мерное под пространство обобщенных ускорений. Однако это противоречит тому факту, что обобщенные ускорения, как аргументы функций, могут принимать любые значения из соответствующей области определения q, поэтому выполнение рассматриваемого условия невозможно.
С учетом (17) рассматриваемое условие примет вид или, перенося все в левую часть равенства, Нетрудно видеть, что выражение в правых квадратных скобках пред ставляет собой вектор-строку, элементы которой являются квадратич ными формами относительно обобщенных скоростей. Действительно, если B =,=1,, то -й элемент этого вектора-строки будет равен Ясно, что выражения в круглых скобках, являющиеся коэффициента ми этих квадратичных форм, зависят только от обобщенных коорди нат. Будем обозначать матрицы коэффициентов соответствующих квад ратичных форм как B ( = 1, ). Выберем некоторое произвольное значение вектора обобщенных ускорений q* из q. Тогда выражения в левых квадратных скобках равенств (18) станут векторами-строками h = { }=1,, составленными из непрерывных нелинейных функций обобщенных координат, причем С учетом этого рассматриваемое условие приобретет вид слагаемые в этих равенствах представляют собой элементы простран ства FК. Вторые же слагаемые принадлежат расширенному простран ству FП, которое помимо элементов пространства FП содержит функ ции обобщенных координат с постоянными слагаемыми, в частности, функции-константы. Из доказательства в первом параграфе главы то го, что FК FП = 0 следует справедливость этого факта и для про странств FК и FП. Тогда (q) 0 и qт B (q) q 0. Но значение q* было выбрано произвольно, поэтому должно быть справедливо следую щее Выберем произвольные значения обобщенных координат q* и скоростей q* из параллелепипеда, являющегося сужением области определе ния 1 функций-элементов пространства F на 2-мерное фазовое под пространство, и введем следующие обозначения С учетом этого, рассматриваемое условие приводит к совокупности си стем линейных уравнений каждая из которых в пространстве R обобщенных ускорений задает часть плоскости размерности (B* ), ограниченной параллелепи педом q. Но обобщенные ускорения могут принимать любые значения из q, что вкупе с произвольным выбором значений q* и q* означает невозможность выполнения рассматриваемого условия.
Внося постоянные множители под знак частного дифференциала, полу В силу замкнутости линейных подпространств, стоящая в круглых скоб ках последнего равенства нетривиальная линейная комбинация линей но независимых векторов подпространства F является ненулевым век тором этого же пространства. Проводя далее рассуждения, аналогич ные первому пункту, получим противоречие и, следовательно, невоз можность выполнения данного условия.
Невозможность выполнения рассматриваемого условия доказывается аналогично предыдущему пункту, но с заменой ссылки на ход рассуж дений в первом пункте ссылкой на второй пункт.
Таким образом, выполнение ни одного из перечисленных условий невоз можно, а, значит, наше предположение неверно и система векторов a явля ется линейно независимой, ясно, что ее ранг равен.
Лемма 3. Системы векторов w и w являются базисами одного и того же конечномерного линейного подпространства пространства F.
Доказательство. По определению системы векторов w F и w F линейно независимы, это же, согласно лемме 1, справедливо и для w. По кажем, что рассматриваемые системы линейно независимых векторов имеют одинаковый размер. Действительно, полная энергия механической системы связана с функцией Лагранжа преобразованием Лежандра = [12]. Учи тывая (14) и (16), получим Поскольку это должно быть справедливо для любых значений p R10, имеет место следующее равенство Линейно независимые системы векторов w и w являются базисами ли нейных подпространств (w ) и ( w ). В силу (15) последнее равен ство можно интерпретировать как базисные разложения элементов системы векторов w, принадлежащей обоим этим пространствам, причем столбцы матриц Y и Y определяют их координаты в соответствующих базисах.
Известно, что ранг произвольной системы векторов может быть найден как ранг ее матрицы координат в некотором базисе [7]. Из определения матриц Y и Y очевидно, что их ранги максимальны и равны и соответствен но. Тогда из сказанного выше следует, что величины и не могут быть различными.
Таким образом, пространства (w ) и ( w ) имеют одинако вую размерность, покажем, что они совпадают. Поскольку ранг системы век торов w равен, в ней наберется именно столько линейно независимых векторов [7]. Без ограничения общности можно считать, что линейно незави симыми являются первые векторов этой системы. В самом деле, этого все гда можно добиться перестановкой элементов вектора-строки w и столбцов матриц координат Y и Y. Обозначим матрицы, составленные из координат векторов,..., в базисах w и w как Y и Y соответственно. С учетом этого будем иметь Заметим, что матрицы Y и Y являются квадратными и невырожденными.
Это следует из того, что вектора,..., линейно независимы и =.
Тогда, умножая последнее равенство справа на Y и обозначая матрич ное произведение Y Y как Y, получим Очевидно, что матрица Y также является квадратной и невырожденной.
Рассмотрим теперь произвольный ненулевой вектор w a : a R, a = из (w ). С учетом последнего соотношения этот вектор может быть представлен в виде Но поскольку матрица Y — квадратная и невырожденная и a = 0, вектор коэффициентов равный их произведению также отличен от нулевого векто ра. Это означает, что любой ненулевой вектор из (w ) в то же время является и ненулевым вектором в ( w ), что окончательно доказывает утверждение леммы.
Лемма 4. Системы векторов W и w являются базисами одного и того же конечномерного линейного подпространства пространства F.
Доказательство. Левая часть уравнений движения манипуляционного ме ханизма в форме Лагранжа (2) имеет вид, или, учитывая (14a) и (16), w Y p. С другой стороны, для нее имеет место представление (14c). Тогда справедливо равенство которое должно выполняться для любых значений p R10. В результате получаем Проводя далее рассуждения аналогичные доказательству леммы 3, но с использованием леммы 2 вместо леммы 1, очевидно, получим справедливость доказываемого утверждения.
Теперь докажем непосредственно утверждение теоремы 2.
Доказательство. Запишем полную энергию манипуляционного механизма как преобразование Лежандра функции Лагранжа с учетом соотношений (14b) и (14a):
Согласно лемме 3 это равенство представляет собой разложение одного и то го же вектора по двум различным базисам одного и того же линейного подпространства. Как известно, для перехода от одного базиса к другому достаточно осуществить невырожденное линейное преобразование одного из этих базисов [1]. Но поскольку в общем случае рассматриваемые базисные системы векторов могут оказаться ортонормированными, потребуем допол нительно ортогональности преобразования. Таким образом, справедливо сле дующее равенство где T — ортогональная матрица перехода от базиса w к базису w. К этой матрице не предъявляется никаких иных требований, кроме ортогональ ности, в остальном же матрица перехода может быть выбрана произвольно.
Выберем ее равной единичной матрице, которая соответствует тождествен ному преобразованию. Тогда рассматриваемые базисные системы векторов являются одним и тем же базисом, а, значит, столбцы координат p и p вектора в этих базисах равны. Наоборот — если координаты указанного вектора в рассматриваемых базисах одинаковы, то системы векторов w и w совпадают в силу единственности базисного разложения.
Теорема 3 доказывается аналогично, но с использованием соотношения вместо (21) и леммы 4 вместо леммы 3.
Таким образом, при соблюдении условий теорем о равенстве существуют только одни базовые инерционные параметры p, одинаковые и для лагранжи ана, и для полной энергии, и для левой части уравнений движения манипуля ционного механизма. Далее, если не будет оговорено особо, будем полагать, что необходимые и достаточные условия равенства базовых параметров вы полнены. Кроме того, в этом случае матрицы координат коэффициентов влия ния классических инерционных параметров Y, Y и Y в соответствующих базисах w, w и W также одинаковы, что следует из равенств (19) и (20).
В заключение отметим, что необходимые и достаточные условия равенства базовых параметров также позволяют, задавшись базисными коэффициента ми влияния на функцию Лагранжа w, определить базисные коэффициенты влияния на энергию w и на уравнения движения W, что упрощает ре шение задачи исключения из левой части уравнений движения и выражения полной энергии манипуляционного механизма избыточных вычислительных операций.
2.3. Теорема о базисном множестве Ранее в данной главе было показано, что поиск связи между базовыми и классическими инерционными параметрами сводится к выявлению линейно независимых элементов конечной системы векторов бесконечномерного функ ционального пространства. Поскольку была также установлена единствен ность базовых параметров при соблюдении условий теорем 2 и 3, для про ведения указанного анализа удобнее рассматривать систему коэффициентов влияния на функцию Лагранжа w, ибо их выражения проще коэффициен тов влияния на уравнения движения W, и при этом связаны с ними напря мую линейным преобразованием, в отличие от коэффициентов влияния на полную энергию w, которые связаны с W композицией преобразований. Для решения поставленной задачи удобно использовать методы мат ричного анализа, однако для их применения необходимо найти координаты рассматриваемых коэффициентов влияния в каком-либо базисе некоторого конечномерного линейного подпространства пространства F. Благодаря осо бой структуре кинетической и потенциальной энергии манипуляционного ме ханизма оказывается возможным отыскать такое подпространство и способ задания в нем «естественного» базиса, что утверждается следующей теоре мой:
Теорема 4 (о базисном множестве). Все компоненты вектора-строки w принадлежат конечномерному линейному подпространству F простран ства F, которое может быть представлено в виде тензорного произведе ния пространств где — количество звеньев манипулятора, а пространства Y определяют ся следующим образом:
в случае вращательного сочленения в случае поступательного сочленения Размерность этого пространства равна 1 + (2 + )/2 5 3, где — ко личество вращательных сочленений.
Отметим, что под функциями вида 1 () понимается функция равная единице на всей области определения своего аргумента. Для доказательства теоремы нам понадобится несколько вспомогательных лемм, формулировка и доказательство которых приведено ниже.
Лемма 5. Подмножество {1 (), cos, sin, cos (2), sin (2)} линейного про странства C[, ] функций непрерывных на некотором отрезке [, ] дей ствительной числовой оси образует систему линейно независимых векто ров этого пространства.
Доказательство. Предположим, что это не так. Тогда должны существовать такие R ( = 1, 5) не все равные нулю, что Возьмем пять точек действительной оси, задаваемых соотношениями = + ( 1), = 1, 5, причем 0 < ( )/4. Это значит, что все [, ], поэтому должны быть справедливы равенства представляющие собой однородную систему линейных алгебраических урав нений относительно. Поскольку, согласно предположению, не все равны нулю, эта система должна иметь ненулевое решение, что возможно тогда и только тогда, когда определитель ее основной матрицы равен нулю [2]:
После алгебраических преобразований получим откуда следует, что рассматриваемый определитель равен нулю в следующих случаях:
Но величина, определяющая точки, может принимать любые значения из промежутка (0, ( )/4]. Это значит, что на отрезке [, ] существуют совокупности пяти точек, в которых определитель основной матрицы систе мы (23) отличен от нуля, и имеет место только тривиальное решение = 0.
Таким образом, выполнение равенства (22) одновременно для всех точек от резка [, ] невозможно, что противоречит предположению о линейной зави симости системы векторов из условия леммы. Следовательно, предположение неверно, и рассматриваемые вектора линейно независимы.
Лемма 6. Подмножество 1 (),, 2 линейного пространства C[, ] функ ций непрерывных на некотором отрезке [, ] действительной числовой оси образует систему линейно независимых векторов этого пространства.
Доказательство. Предположим противное. Тогда должны существовать та кие 1, 2, 3 R не все равные нулю, что [, ] справедливо равенство Следовательно система линейных уравнений должна иметь отличное от нуля решение. Однако определитель основной матрицы этой системы равен ( )3 /4, поэтому возможно только триви альное решение. Отсюда следуют те же выводы, что и при доказательстве леммы 5, означающие линейную независимость рассматриваемой системы векторов.
Лемма 7. В линейном пространстве функций непрерывных на некотором параллелепипеде = x R :, = 1, -мерного ариф метического пространства подмножество образует систему линейно независимых векторов.
Доказательство. Предположим обратное. Тогда должны существовать та кие, R ( = 1,, = 1, ) не все равные нулю, что x справедливо равенство или в векторно-матричной записи Дифференциал левой части этого равенства имеет вид xт Cx и также равен Дифференциалы независимых переменных являются произвольными при ращениями соответствующих координат и потому независимы. Тогда их ли нейная комбинация равная нулю может быть только тривиальной, т.е.
откуда следует, что все равны нулю. Действительно, пусть в из послед них уравнений имеются отличные от нуля коэффициенты. Следовательно, точка с радиусом-вектором x должна принадлежать части плоскости раз мерности, ограниченной параллелепипедом. Но x может принимать любые значения из, что означает невозможность существования отличных от нуля коэффициентов. Также, можно заметить, что если все рав ны нулю, то также равно нулю. Таким образом, исходное предположение неверно, и рассматриваемая система векторов линейно независима.
Теперь перейдем непосредственно к доказательству теоремы 4.
Доказательство. Тензорным произведением векторных пространств V ( = 1, ) называют [1] такое векторное пространство U, снабженное полилиней ным отображением что если элементы множеств {, = 1, } V образуют базисы соответ ствующих пространств, то элементы множества образуют базис пространства U. Поэтому сначала необходимо доказать, что если в качестве отображения выступает обычное скалярное умножение, то существует тензорное произведение пространств Y ( = 0, ). Воспользуемся методом математической индукции: пусть F = Y0... Y ( = 1, ), дока жем, что существует F1. Для этого необходимо и достаточно, чтобы элемен ты множества 1 = 0 1, 0 = 1, 0, 1 = 1, 1 были линейно независимы.
Здесь 00 Y0, 11 Y1 — базисные векторы соответствующих пространств, 0 = (Y0 ), 1 = (Y1 ). Очевидно, что элементы пространства Y0 явля ются непрерывными скалярными функциями, определенными на множестве 0 = q R : | |, = 1,, а элементы пространства Y1 — функция ми одной переменной 1, определенными на отрезке 1, 1. Поэтому эле менты пространства F1 являются непрерывными функциями, определенны Предположим теперь, что элементы 1 линейно зависимы. Тогда должны су ществовать такие ( = 1, 0, = 1, 1 ) не все равные нулю, что Поскольку 1 линейно независимы и не все равны нулю, существует та кое 1 [1, 1 ], что по крайней мере одна из 0 линейных комбинаций =1 1 (1 ) отлична от нуля. Но 0 также линейно независимы, поэтому их нетривиальная линейная комбинация не может быть равна нулю во всех точках множества 0. Это значит, что существует непустое подмножество множества 1, в точках которого равен ство (24) не выполняется. Поэтому наше предположение неверно, и элементы множества 1 линейно независимы.
Теперь для доказательства существования F необходимо доказать, что если существует F (1 < ), то существует и F+1. Для этого необходимо и достаточно, чтобы элементы множества были линейно независимы. Здесь F, +1 Y+1 — базисные векторы соответствующих пространств, = (F ), +1 = Y+1. Нетрудно видеть, что элементы пространства F являются непрерывными функциями, определенными на множестве а элементы пространства Y+1 — функциями одной переменной +1, опреде ленными на отрезке +1, +1. Следовательно элементы пространства F+ являются непрерывными функциями, определенными на множестве Предположим теперь, что элементы +1 линейно зависимы. Тогда должны существовать такие ( = 1,, = 1, +1 ) не все равные нулю, что Поскольку +1 линейно независимы и не все равны нулю, существует такое +1 [+1, +1 ], что по крайней мере одна из линейных комбина ций =1 +1 +1 отлична от нуля. Но также линейно независимы, поэтому их нетривиальная линейная комбинация не может быть равна нулю во всех точках множества. Это значит, что суще ствует непустое подмножество множества +1, для которого равенство (25) не выполняется. Поэтому наше предположение неверно, и элементы множе ства +1 линейно независимы. Таким образом, согласно методу математиче ской индукции пространство F = F существует. Поскольку это простран ство является тензорным произведением, его базисные векторы полностью определяются базисными векторами пространств-сомножителей Y, а также отображением. Согласно лемме 7 элементы множества линейно независимы, и, следовательно, образуют базис пространства Y0. Мож но подсчитать размерность этого пространства:
В соответствии с леммами 5 и 6 за множество базисных векторов простран ства Y можно принять множество {1 ( ), cos, sin, cos (2 ), sin (2 )}, если -е сочленение вращательное, и множество 1 ( ),, — если посту пательное. Очевидно, что = 5 в первом случае, и = 3 — во втором.
Поскольку пространства Y конечномерны, и конечно, пространство F также конечномерно, причем где — количество вращательных сочленений.
Итак, искомое пространство F существует, является конечномерным и имеет указанную размерность. Для окончательного доказательства утвержде ния теоремы необходимо показать, что каждый элемент вектора-строки w может быть представлен в виде линейной комбинации базисных векторов этого пространства. Пусть базисные векторы пространств F занумерованы, т.е. определены биекции между некоторыми конечными подмножествами множества N0 и множествами. Базисный вектор пространства F, соответ ствующий индексу N0, будем обозначать. Тогда любой базисный век тор пространства F однозначно определяется набором индексов (0,..., ), где. Обозначая соответствующий этому набору базисный вектор как 0..., можно записать Введем нумерацию элементов множеств ( = 1, ) следующим образом:
если -е сочленение — поступательное:
если -е сочленение — вращательное:
Для задания нумерации элементов множества 0 обозначим подмножества {0,..., } и 0,..., (2 + )/2 множества N0 как и 0 соответственно и рассмотрим отображения : 0 и : 0. Первое из них задается следующими правилами:
Второе — формулой (, ) = (, ) ((, ) 1) /2 + (, ), где,. Нетрудно проверить, что композиция отображений является искомой биекцией множеств 0 и 0, если определить обратное отображение 1 для некоторой пары (, ) и некоторого числа 0 0 следую щим образом:
Заметим, что в этом случае в результате обратного отображения число не может превосходить числа.
С учетом сказанного матрицы A перехода от системы координат ( 1)-го звена к системе координат -го звена представимы в виде следующей линейной комбинации:
где A — постоянные матрицы, элементы которых определяются геометриче скими параметрами механизма. Действительно, если -е сочленение враща Если же -е сочленение поступательное, то = 2, Матрица перехода от системы координат -го звена к абсолютной системе координат определяется соотношением T = A1... A. С учетом (28) это со отношение запишется в виде Здесь и далее используются следующие обозначения: = sin, = cos.
Раскрывая скобки, получим Обозначим выражение в круглых скобках как T1.... Тогда имеем Будем считать, что матрицы T1... являются нулевыми, если хотя бы один индекс ( = 1, ) больше. Запишем выражение для коэффициен та влияния -го инерционного параметра -го звена на потенциальную энер гию механизма. С учетом последнего соотношения, а также имея ввиду, что Нетрудно видеть, что выражение в квадратных скобках является постоян ной скалярной величиной. Обозначая его как 10(1)+, и принимая во внима ние (26), получим Рассмотрим теперь частные производные U = T /. Они могут быть вычислены следующим образом:
где D — постоянная матрица [6]. Тогда, с учетом (28), имеем Раскрывая скобки, получим Обозначим матричное произведение в круглых скобках как U1.... Тогда мат ричное произведение Uт U можно записать в виде Раскрыв скобки, получим Непосредственно проверяется, что произведения базисных векторов простран ства Y ( = 1, ) вида (, = 1, ) могут быть представлены как линейные комбинации базисных векторов того же пространства следующим образом:
если -е сочленение — вращательное:
если -е сочленение — поступательное:
Применяя эти правила ко всем (2... 2 ) слагаемым правой части равен ства (33) и приводя подобные слагаемые, очевидно получим где постоянные матрицы U1... являются некоторыми линейными комбина циями матричных произведений U U. Тогда выражение для коэф фициента влияния -го инерционного параметра -го звена на кинетическую энергию механизма примет вид Имея ввиду, что ( ) 1 ( = 1, ), и учитывая введенную ранее нумерацию элементов множества 0, можно записать где U... = U1..., если (, ) = 1 (0 ). Очевидно, что выражение в квад ратных скобках предпоследнего равенства является постоянной скалярной величиной. Обозначая его как 0 1... 1...1, и принимая во внимание (26), полу чим По определению коэффициент влияния -го инерционного параметра -го звена на функцию Лагранжа имеет вид С учетом равенств (30) и (36), окончательно получим Поскольку натуральные индексы и пробегают значения от 1 до и от 1 до 10 соответственно, коэффициенты влияния на лагранжиан всех масс инерционных параметров всех звеньев манипулятора представляются в виде линейных комбинаций базисных векторов пространства F. Таким образом, утверждение теоремы полностью доказано.
Помимо основного утверждения из доказательства данной теоремы сле дует еще несколько важных фактов:
1. При фиксированном числе звеньев манипулятора существует взаим нооднозначное соответствие между множеством базисных векторов пространства F и множеством кортежей длины + 1, -е элементы которых ( = 0, ) принадлежат множеству, причем при > = {1,..., 5}, если -е сочленение является вращательным, и = {1,..., 3} — если поступательным, а 0 = {0,..., ( + 1)/2}. Пред ставление базисных векторов в виде ( + 1)-разрядных натуральных индексов удобно в реализации данной концепции на цифровой вычис лительной машине.
2. Базисный вектор (0,..., ) пространства F -звенного манипулятора и базисный вектор (0,...,, 1) пространства F+1 (+1)-звенного мани пулятора представляют собой одно и то же в силу предыдущего пункта и соотношения (26). Таким образом, множество базисных векторов про странства F+1 содержит множество базисных векторов пространства F в качестве подмножества, и, следовательно, пространство F явля ется подпространством пространства F+1. Это означает, что часть ко ординат коэффициентов влияния на функцию Лагранжа сохраняется при добавлении звеньев в конец кинематической цепи манипуляцион ного механизма, поэтому некоторые результаты анализа, полученные ранее для механизма с меньшим числом звеньев, могут быть использо ваны позднее в анализе механизма с большим числом звеньев.
3. Коэффициенты влияния на полную энергию ( = 1, 10) также при надлежат подпространству F, причем их координаты в «естественном»
базисе этого подпространства 0... связаны с координатами соответ ствующих коэффициентов влияния на лагранжиан 0... следующими Это очевидным образом следует из соотношений (30) и (36) и опреде ления коэффициентов влияния:
Этот факт позволяет вычислять коэффициенты влияния классических или базовых инерционных параметров на полную энергию не с помо щью преобразования Лежандра соответствующих коэффициентов вли яния на функцию Лагранжа, а напрямую — как линейные комбинации векторов «естественного» базиса пространства F.
4. Для базисных векторов пространства F справедливы следующие ре куррентные соотношения что следует из (26). Как известно, рекурсия является одним из источни ков повышения быстродействия численных расчетов. Расчет значений базисных векторов в конкретных точках фазового пространства может быть использован для исключения избыточных вычислений при расче те значений функции Лагранжа и полной энергии манипуляционного механизма, что полезно в решении прикладных задач.
5. Проекции 0...
функцию Лагранжа заведомо равны нулю в следующих случаях:
Выводы 1. На основе классического определения базовых инерционных парамет ров уравнений движения введено общее определение понятия базовых параметров некоторого многопараметрического семейства функций. При менение этого определения к семействам функций Лагранжа, полных энергий и левых частей уравнений движения манипуляционных меха низмов и рассмотрение перечисленных функций и коэффициентов вли яния на них классических инерционных параметров как элементов ли нейных пространств приводит к интерпретации базовых параметров как коэффициентов базисных разложений (14). Базовые параметры упомя нутых выше семейств функций в общем случае не совпадают, поэтому имеется три варианта базовых инерционных параметров: для лагранжи ана, для полной энергии, для левой части уравнений движения. Каж дый из этих наборов параметров связан с набором классических инерци онных параметров линейным преобразованием (16), матрица которого совпадает с координатами их коэффициентов влияния в «естественном»
базисе соответствующего линейного пространства.
2. Сформулированы и доказаны необходимые и достаточные условия ра венства различных вариантов базовых инерционных параметров. Согла шение о выполнении этих условий приводит к единственности базовых инерционных параметров, и, кроме того, устанавливает связь между ба зисными коэффициентами влияния на функцию Лагранжа, на полную энергию и на левую часть уравнений движения. Рассуждения, приве денные в первых двух параграфах главы, справедливы не только для класса манипуляционных механизмов, но и для произвольных систем твердых тел, стесненных стационарными, удерживающими, голономны ми связями.
3. Доказано существование и указан способ конструирования базиса конеч номерного линейного пространства, содержащего коэффициенты влия ния классических инерционных параметров на лагранжиан и полную энергию, что позволяет применять аппарат теории матриц для решения различных задач, связанных с базовыми инерционными параметрами.
Получены рекуррентные соотношения для вычисления базисных векто ров упомянутого пространства в конкретных точках фазового простран ства, что способствует повышению быстродействия расчетов в некото рых прикладных задачах.
Методы поиска базовых инерционных Из предыдущей главы становится ясно, что задача поиска связи меж ду базовыми и классическими инерционными параметрами в виде линейного преобразования (16) очень важна, ибо матрица этого преобразования являет ся также матрицей координат коэффициентов влияния в их «естественном»
базисе. Приведение этой матрицы к ступенчатому виду позволяет определить базисные коэффициенты влияния, что, согласно (14), необходимо для получе ния уравнений движения и идентификационных моделей в терминах базовых инерционных параметров. В данной главе представлен обзор известных ме тодов решения упомянутой задачи и предложен альтернативный метод.
3.1. Обзор существующих методов Рекуррентные соотношения Готье-Халила Получены путем анализа и сравнения выражений кинетической и по тенциальной энергий манипуляционного механизма с 1 и звеньями.
Используется следующая интерпретация базовых параметров: если коэффи циент влияния на кинетическую или потенциальную энергию -го классиче ского параметра -го звена связан линейной зависимостью с коэффициентами влияния классических параметров предыдущих звеньев или того же звена то этот коэффицент влияния можно исключить из рассмотрения, а неизмен ности выражений кинетической и потенциальной энергии, а, следовательно, и уравнений движения, добиться заменой параметров т.н. перегруппиро ванными параметрами Подробно математические основы данного подхода, а также примеры, рас смотрены в работах [20, 21, 26]. В результате получается следующий алго ритм:
1. Инициализировать множество базовых инерционных параметров эле ментами множества классических инерционных параметров. Отметим, что среди последних место параметров ( {,, }) занимают 2. Исключить из множества базовых параметров элементы, не входящие в полную энергию, а, следовательно, и в уравнения движения манипу ляционного механизма, согласно приведенным ниже правилам. Пусть 1 — номер первого вращательного сочленения, а 2 — номер первого из последующих вращательных сочленений, ось которого не параллельна оси сочленения 1, тогда, если ось 1 -го сочленения параллельна вектору силы тяжести и оси со членений < 1 параллельны оси 1 -го сочленения либо 1 = 1, параметры 1 и 1 могут быть исключены. Это же касается и ось -го сочленения (1 < 2 ) параллельна оси 1 -го сочлене 3. Найти перегруппированные параметры с помощью следующих соотно если -е сочленение вращательное:
если -е сочленение поступательное:
где J1 — тензор инерции (1)-го звена, составленный из соответ ствующих перегруппированных параметров, J — тензор инерции -го звена, заданный в собственной системе координат, 1, — ортогональная матрица перехода от системы координат ( 1)-го звена к системе координат -го звена.
На каждом шаге этой обратной рекурсии в множество базовых пара метров включаются все перегруппированные параметры, не равные соответствующим классическим параметрам, и исключаются из него все классические параметры, входящие в выражения таких перегруппи рованных параметров. При возникновении в расчетах на последующих шагах исключенных классических параметров, вместо них используют ся соответствующие перегруппированные параметры.
Достоинствами рассматриваемого метода являются возможность получения аналитического решения с помощью простых рекуррентных соотношений, а также существование модификации, применимой к классу манипуляционных механизмов с древовидной кинематической схемой [20]. Что же касается недо статков, то, хотя приведенный выше алгоритм справедлив для любых мани пуляционных механизмов, точное решение имеет место лишь в случае кине матических схем с параллельными или перпендикулярными осями соседних сочленений. В остальных случаях этот алгоритм лишь позволяет определить верхнюю грань количества базовых параметров и часть подмножества класси ческих параметров, не входящих в уравнения движения. Наконец, отсутству ет замкнутая форма уравнений движения относительно получаемых базовых параметров. Для вывода уравнений движения манипуляционного механиз ма необходимо либо подставлять выражения кинетической и потенциальной энергий, записанные с помощью базовых параметров, в уравнения Лагранжа 2-го рода, либо использовать специальную численную процедуру, алгоритм которой описан в работе [27]. Причем во втором случае базовые параметры придется определять заново, находя линейные зависимости вида (38), но уже для коэффициентов влияния на левую часть уравнений движения, в отсут ствие соотношений, аналогичных (39), из-за чего теряется основное достоин ство метода.