«ЛЕКЦИИ ПО АЛГЕБРЕ МИНИСТЕРСТВО ОБЩЕГО И ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ МЕХАНИКО-МАТЕМАТИЧЕСКИЙ ФАКУЛЬТЕТ А. П. Пожидаев, С. Р. Сверчков, И. П. Шестаков ...»
А. П. Пожидаев, С. Р. Сверчков, И. П. Шестаков
ЛЕКЦИИ ПО АЛГЕБРЕ
МИНИСТЕРСТВО ОБЩЕГО И ПРОФЕССИОНАЛЬНОГО
ОБРАЗОВАНИЯ
РОССИЙСКОЙ ФЕДЕРАЦИИ
НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
МЕХАНИКО-МАТЕМАТИЧЕСКИЙ ФАКУЛЬТЕТ
А. П. Пожидаев, С. Р. Сверчков, И. П. Шестаков
ЛЕКЦИИ ПО АЛГЕБРЕ
Часть 1 Учебное пособие Новосибирск 2011 УДК 512.64(075) ББК: В14.5я73-1 Г 144 А. П. Пожидаев, С. Р. Сверчков, И. П. Шестаков, Лекции по алгебре: В 2 ч.: Учеб. пособие / Новосиб. гос. ун-т. Новосибирск, 2011. 102 с.ISBN 978-5-94356-751- Данный курс лекций содержит запись основного курса высшей алгебры, читавшегося авторами в 1989 – 2010 гг. на одном из потоков первого курса механико-математического факультета Новосибирского государственного университета. Часть 1 соответствует программе первого семестра, а часть программе второго семестра. Для чтения и понимания текста от читателя требуется знание элементарных понятий теории множеств, отображений и принципа математической индукции. Предназначено для студентов и преподавателей по курсу высшей алгебры.
Издание подготовлено для научно-исследовательского университета в рамках реализации Программы развития НИУ-НГУ.
ISBN 978-5-94356-751- c Новосибирский государственный университет, c Пожидаев А. П., Сверчков С. Р., Шестаков И. П., Оглавление Введение 1 Векторные пространства. Матрицы и определители §1 Определение и примеры полей................... §2 Поле комплексных чисел: конструкция в виде пар действительных чисел........................ §3 Модуль и аргумент комплексного числа.............. §4 Формула Муавра. Извлечение корня из комплексного числа.. §5 Отношение эквивалентности и разбиение множества на классы. §6 Эквивалентность систем линейных уравнений при элементарных преобразованиях................... §7 Приведение к ступенчатому виду методом Гаусса........ §8 Исследование систем линейных уравнений. Необходимые и достаточные условия совместности и определенности...... §9 Векторные пространства: определение и примеры.
Пространство решений однородной системы линейных уравнений §10 Подпространство, линейная зависимость............. §11 Базис и размерность векторного пространства: существование и свойства. Координаты вектора.................. §12 Изоморфизм векторных пространств одной размерности.... §13 Базис подпространства векторного пространства......... §14 Сумма и пересечение подпространств, связь их размерностей.. §15 Пространство линейных отображений L(U, V ) и пространство матриц Mm,n (F )........................... §16 Изоморфизм пространств L(U, V ) и Mm,n (F )........... §17 Суперпозиция линейных отображений и произведение матриц. §18 Обратимые преобразования и матрицы.............. §19 Образ и ядро линейного отображения, связь их размерностей.
Характеризация обратимого преобразования в терминах ядра §20 Вертикальный и горизонтальный ранги матрицы, их равенство §21 Ранг матрицы как размерность образа соответствующего §22 Элементарные преобразования матриц, эквивалентность §23 Независимость числа главных неизвестных от способа приведения системы к ступенчатому виду. Теорема КронекераКапелли................................ §24 Однородные системы, размерность пространства решений, §25 Линейные многообразия и решения неоднородной системы §26 Фактор-пространство, его базис и размерность.......... §27 Определитель квадратной матрицы, его основные свойства... §28 Определитель матрицы как полилинейная кососимметрическая §29 Теорема об определителе транспонированной матрицы..... §30 Разложение определителя по любому столбцу. Присоединенная §33 Ранг матрицы как наибольший порядок ненулевых миноров.
§1 Алгебраическая операция. Алгебраическая система, §2 Определение и примеры полугрупп. Теорема об обобщенной §3 Подгруппы, циклические группы. Порядок элемента и порядок §4 Симметрическая группа. Разложение подстановки на §5 Разложение подстановки в произведение транспозиций, независимость чётности числа сомножителей от способа §11 Примеры и свойства колец. Кольца многочленов и формальных §12 Гомоморфизмы и идеалы колец. Фактор-кольцо и основная §13 Поле, подполе, расширение поля. Поле Fp. Теорема о простом изоморфизм с конструкцией в виде пар действительных Введение Что такое алгебра? Ответить на этот вопрос однозначно, достаточно определенно и к тому же коротко нельзя. С одной стороны, истоки ее уходят вглубь веков можно сказать, что алгебра началась, когда появились первые алгебраические операции С другой стороны, можно сказать, что алгебра началась, когда цифры стали заменяться буквами. Точка зрения на то, что является объектом исследования алгебры постоянно менялась. Так, в 17–18 вв. под алгеброй понималась наука о буквенных вычислениях, решение алгебраических уравнений и т.п. В 18–19 вв. алгебра это алгебра многочленов, теория систем алгебраических уравнений с несколькими неизвестными, теория матриц и определителей. С середины 19 в. центр тяжести в исследованиях смещается на изучение произвольных алгебраических операций, что произошло вследствие расширения понятия числа: появились комплексные числа, кватернионы, октонионы. В конце 19 – начале 20 вв. возникает общая аксиоматическая основа всех старых идей. В принципе, можно сказать, что предметом изучения современной алгебры являются множества с заданными на них алгебраическими операциями. Поэтому, если говорить о современной алгебре и ее приложениях, то нужно описать все ее основные структуры:
группы, кольца, поля и т.д. Это, в частности, в самом вводном объеме, будет сделано нами в данном курсе лекций, а более содержательное знакомство с алгеброй будет происходить по мере ее изучения.
Говоря общими словами, можно сказать, что алгебра по отношению ко всей математике играет примерно такую же роль, как математика по отношению к остальным наукам. Наряду с “математизацией” естествознания в наши дни не без основания говорят об “алгебраизации” математики, т.
е. о проникновении идей и методов алгебры в самые различные разделы математики, а также физики. В настоящее время алгебраический язык стал играть роль “языка межнационального общения”, связывающего между собой различные дисциплины математики и физику.
Процесс применения алгебры похож на процесс применения математики.
Чтобы изучить методами математики какое-либо явление естествознания, строят его математическую модель. Если она достаточно адекватно отражает свойства явления, то, изучая ее методами математики, мы можем что-то говорить и о самом явлении. Аналогично, различным объектам математического исследования можно сопоставить некоторый алгебраический объект, в той или иной мере отражающий свойства исходного объекта, и т. д. Выдающийся алгебраист И. Р. Шафаревич называет этот процесс “координатизацией”, имея в виду, что математические объекты координатизируются алгебраическими.
Самый наглядный пример: декартовы координаты, сводящие геометрические задачи к решению алгебраических уравнений. Здесь координатами служат числа, которые можно складывать и умножать.
Однако в других случаях для такой “координатизации” обычных чисел с обычным сложением и умножением далеко не достаточно. Наоборот, сталкиваясь с новым типом объектов, мы вынуждены конструировать (или открывать) новые типы координатизирующих их “величин”. Построение и исследование возникающих таким образом “величин” с определенными на них операциями этим и характеризуется (конечно, очень приближенно) место алгебры в математике.
С этой точки зрения, развитие любого раздела алгебры состоит из двух этапов. Первый из них рождение нового типа алгебраических объектов из некоторой проблемы координатизации; второй их дальнейшая жизнь, т. е. систематическое развитие теории этого класса объектов, иногда тесно связанное, а иногда и совсем не связанное с той областью, в связи с которой объекты возникли. Здесь вновь ситуация такая же, как и у математики в целом.
Линейная алгебра. Основное внимание в данном курсе уделяется линейной алгебре. С широкой точки зрения, содержание линейной алгебры состоит в разработке математического языка для выражения одной из самых общих естественно-научных идей идеи линейности. Возможно, ее важнейшим частным случаем является принцип линейности малых приращений: почти всякий естественный процесс почти всюду в малом линеен (отметим, что “почти” здесь стоит по сути сейчас и фракталы рассматриваются как естественные объекты, и квантовые вычисления, которые нелинейны при любом “увеличении”). Этот принцип лежит в основе всего математического анализа и его приложений. Основные методы и понятия линейной алгебры являются на самом деле общими для многих разделов математики и ее приложений: математического и функционального анализа, линейных неравенств математической экономики, теории кодирования (над конечными полями), вычислительных методов линейной алгебры, полилинейной и общей алгебры. Краеугольным камнем в здании линейной алгебры лежит знакомая всем со школы векторная алгебра трехмерного пространства, и на первых порах можно применять ко всем новым понятиям 3-мерную геометрическую интуицию.
Основной модельной задачей линейной алгебры является решение систем линейных уравнений. С изучения линейных уравнений мы и начинаем, однако предварительно вводим понятие поля и, в частности, строим поле комплексных чисел, чтобы в дальнейшем рассматривать системы линейных уравнений в более общей ситуации (однако для простоты читатель всегда может понимать под полем действительные числа). Далее у нас естественно возникают матрицы, векторные пространства и линейные преобразования, затем вводится понятие определителя матрицы, даются его основные свойства и приложения к решению систем линейных уравнений. Все это служит содержанием первой главы. Во второй главе мы рассматриваем основные алгебраические системы: группы, кольца и поля. В третьей главе изучаются многочлены. Четвертая глава дает более глубокий анализ линейных преобразований над алгебраически замкнутым полем, а пятая над полями R и C. Шестая глава посвящена основам теории квадратичных форм, а заключительная, седьмая глава посвящена основам теории базисов Грёбнера-Ширшова, которые случае коммутативных алгебр называются базисами Грёбнера. В конце каждой главы приведены задачи для самостоятельной работы. Уровень сложности задач довольно разнообразный:
есть как и задачи для закрепления материала, так и задачи, требующие творческого подхода.
Авторы благодарны В. Н. Желябину и В. А. Чуркину за некоторые любезно предоставленные интересные задачи, включенные в настоящее издание.
Обозначения: A B означает, что из утверждения A следует утверждение B; A B эквивалентность утверждений A и B; квантор всеобщности служит заменой выражения “для всех”;
квантор существования; ! существует единственный; символ заменяет выражение “выполняется”; N обозначает натуральные числа, N натуральные числа с нулем, Z целые числа, Q рациональные, R действительные, C комплексные числа; i мнимая единица в C, символ := означает равенство по определению, порой обозначает начало доказательства, а конец доказательства обозначается символом.
Нумерация: нумерация параграфов в каждой части сквозная. Ссылка, например, на утверждение 1 означает утверждение 1 данного параграфа, ссылка же, например, на утверждение 1 §2.4 означает утверждение четвертого параграфа второй части.
Литература:
Э. Б. Винберг, Курс алгебры, М.: Факториал, 1999;
А. И. Кострикин, Введение в алгебру, Части I-III, М.: Физ.-Мат.
Литература, 2000;
А. Г. Курош, Курс высшей алгебры, СПб., 2003;
А. И. Мальцев, Основы линейной алгебры, М.: Наука, 2005;
Б. Л. ван дер Варден, Алгебра, М.: Наука, 1976.
Глава Векторные пространства. Матрицы и определители Эта глава начинается с изучения линейных уравнений, однако предварительно вводится понятие поля и, в частности, строится поле комплексных чисел, чтобы в дальнейшем рассматривать системы линейных уравнений в более общей ситуации (однако для простоты читатель всегда может понимать под полем действительные числа). Далее естественно возникают матрицы, векторные пространства и линейные преобразования, затем вводится понятие определителя матрицы, даются его основные свойства и приложения к решению систем линейных уравнений.
§1. Определение и примеры полей Декартово произведение A B множеств A и B есть множество всех упорядоченных пар (a, b), где a A, b B. Таким образом, A B = {(a, b) : a A, b B}. Декартова n-ая степень множества A есть множество An = {(a1,..., an ) : ai A}.
Пример. Пусть A = {1, 2}, B = {3, 7, 8}. Тогда Пусть X некоторое множество. Отображение f : X X X называется бинарной операцией на X, т. е. f бинарная операция, если для любых x1, x2 X однозначно определен элемент f (x1, x2 ) X. Запишем xy вместо f (x, y). Бинарная операция называется ассоциативной, если (a b) c = a (b c) для любых a, b, c X и коммутативной, если a b = b a для любых a, b X.
Множество F называется полем, если в нем определены две ассоциативные и коммутативные бинарные операции + (сложение) и · (умножение) такие, что 4) ( a F (a = 0) b F ) a·b = b·a = 1 (элемент b называется обратным к a и обозначается a1 );
Примеры полей.
• {0, 1}; +, ·, где операции стандартны, кроме 1 + 1 = 0.
Заметим, что N и Z полями не являются. Всюду далее символом F мы будем обозначать некоторое поле, элементы поля часто называются скалярами.
§2. Поле комплексных чисел: конструкция в виде пар действительных чисел Пусть C = {(a, b) : a, b R}. Определим на C операции:
Теорема 1. C; +, · является полем.
Доказательство. Заметим, что 0 = (0, 0) и 1 = (1, 0) являются, соответственно, нулём и единицей в C. Элемент ( a2 +b2, a2b 2 ) является обратным к (a, b). Далее доказательство состоит в очевидной проверке аксиом поля.
Запишем (a, b) = a · (1, 0) + b · (0, 1) := a · 1 + b · i := a + bi, где 1 единица C, i2 = (i)2 = 1. Тогда C = a · 1 + b · i : a, b R, i2 = 1 называется полем комплексных чисел. Отождествляя элементы (a, 0) с элементами a из R, получаем R C. Иногда будем также использовать запись (a, b) := a + ib.
§3. Модуль и аргумент комплексного числа Любому элементу z = a + bi C можно поставить в соответствие вектор координатной плоскости, у которого проекция на ось x равна a, на ось y равна b и угол наклона с осью x.
Действительное число |z| = a2 + b2 называется модулем комплексного числа z; угол := arg z называется аргументом числа z (определён с точностью до 2n), arg 0 не определен. Число a := Re z называют действительной, а b := Im z мнимой частью z. Таким образом, z = Re z + iIm z. Очевидно, что Re (z1 + z2 ) = Re (z1 ) + Re (z2 ), Im (z1 + z2 ) = Im (z1 ) + Im (z2 ).
Можно также использовать тригонометрическую запись комплексного числа z:
Заметим, что z1 = z2 |z1 | = |z2 |, arg z1 = arg z2 + 2k, k Z.
Лемма 1. Для любых z1, z2 C справедливо Доказательство. Имеем z1 · z2 = |z1 | · |z2 | · (cos 1 + i sin 1 ) · (cos 2 + i sin 2 ) = |z1 | · |z2 | · (cos (1 + 2 ) + i sin (1 + 2 )). Следовательно, |z1 · z2 | = |z1 | · |z2 | и arg z1 · z2 = arg z1 + arg z2 + 2k. Далее, комплексного числа Формула Муавра: для любого n N справедливо равенство Следствие. Для любого n N справедливо равенство Извлечение корня из комплексного числа.
Рассмотрим решения уравнения xn = z, где z = r (cos + i sin ).
Пусть x = (cos + i sin ) решение, тогда xn = n (cos n + i sin n).
Следовательно, Поэтому получаем n корней: xi = n r (cos i + i sin i ), i = 1,..., n.
Теорема 1. Уравнение xn = z имеет n решений это вершины правильного n-угольника, вписанного в окружность радиуса |z| с центом в нуле, при этом (1, 0) является вершиной.
Числа k = cos 2k +i sin 2k, k = 0, 1,..., n1, решения уравнения xn = 1, называют корнями из единицы степени n.
§5. Отношение эквивалентности и разбиение множества Любое подмножество R A B называется отношением, определенным на паре множеств A, B. Если (a, b) R, то пишут a b и говорят, что a находится в отношении R к элементу b. Отношение R на паре A, A называется бинарным отношением.
Пример. Равенство элементов в множестве A = {1, 2} можно понимать как бинарное отношение R = {(1, 1), (2, 2)} A A.
Бинарное отношение R на A называется отношением эквивалентности, или просто эквивалентностью на A, если для любых x, y, z A справедливо 1) x x рефлексивность;
2) x y y x симметричность;
Пример. Пусть Z множество целых чисел. Скажем, что a b, если (a b) делится на 2. Свойства 1) и 2) очевидны. Проверим 3): a b, b c Множество S = {B : B A, I} называется разбиением A на классы, если B = для любого I и для любого a A существует единственное B такое, что a B. Очевидно, что при этом A = B и для любых Теорема 1. 1) Любое отношение эквивалентности R на A определяет разбиение A на классы. 2) Любое разбиение A на классы определяет на A отношение эквивалентности.
Доказательство. 1) Определим Ka = {b A : b a} (далее := ).
Заметим, что Ka = для любого a A: так как a a, то a Ka. Пусть Следовательно, Ka Kb. Аналогично Kb Ka и Ka = Kb. Таким образом, для любых a, b A либо Ka Kb =, либо Ka = Kb. Подмножества Ka будем называть смежными классами A по R. Пусть S это множество всех различных смежных классов A по R. Очевидно, что S разбиение A на классы.
2) Пусть S = {B : B A, I} разбиение A на классы. Для любых x, y A положим x y тогда и только тогда, когда существует I такой, что x, y B. Тогда x x, так как существует I такой, что x B. Если следовательно, =, x, y, z B. Поэтому x z.
§6. Эквивалентность систем линейных уравнений при элементарных преобразованиях Пусть F некоторое поле. Система линейных уравнений (с.л.у.):
где aij коэффициенты системы, bi свободные члены системы, xj неизвестные, aij, bi F, i = 1,..., m, j = 1,..., n. Символ m (n + 1) означает размерность системы. C.л.у. называется однородной, если b1 =... = bm = 0. Однородная с.л.у.
называется приведённой системой для с.л.у. (1).
Набор (y1,..., yn ) F n называется решением системы (1), если при замене неизвестных xi на числа yi, i = 1,..., n, каждое из уравнений системы (1) обращается в равенство.
Обозначим через S F n множество решений с.л.у. (1), т. е. S = {(y1,..., yn ) : (y1,..., yn ) решение с.л.у. (1)}. Тогда система называется:
несовместной, если S = ; совместной, если S = ; определенной, если S состоит из одного элемента; и неопределенной, если S содержит более одного элемента.
Примеры.
• x1 + x2 = 2 неопределенная система;
• x1 = 1 определенная система.
Наша цель найти необходимые и достаточные условия совместности произвольной системы (1), и если система (1) совместна, то найти все ее решения.
Рассмотрим еще одну с.л.у.
Системы (1) и (2) называются эквивалентными, если либо они обе несовместны, либо совместны и обладают одними и теми же решениями.
Эквивалентность систем (1) и (2) будем обозначать символом (1) (2). Таким образом, если Si множество решений системы (i), i = 1, 2, то (1) (2) тогда и только тогда, когда S1 = S2. Заметим, что введенное отношение на с.л.у. размерности m (n + 1) является отношением эквивалентности.
Действительно, очевидно, что (1) (1) и (1) (2) (2) (1).
(3). Таким образом, по теореме 1 §5 множество с.л.у. разбивается на классы эквивалентности.
Будем говорить, что система (2) получена из системы (1) при помощи:
элементарного преобразования I типа, если система (2) получена из (1) перестановкой i-го и j-го уравнений (i = j); элементарного преобразования II типа, если система (2) получена из (1) добавлением к i-уравнению jуравнения (i = j), умноженного на некоторое F, т. е. i-ое уравнение системы (2) имеет вид а остальные уравнения системы (2) совпадают с уравнениями системы (1).
Будем обозначать соответственно: (1) (2), (1) (2). Элементарные преобразования I или II типа будем называть элементарными преобразованиями с.л.у. и обозначать (1) (2).
Лемма 1. Имеют место следующие утверждения:
2) (1) (2) (1) (2).
Доказательство. 1) Если (1) (2), то, очевидно, меняя обратно i-ое и j-ое уравнения с.л.у. (2), получим (1), т. е. (2) (1). Если (1) (2) по формуле (3), то добавляя к i-му уравнению (2) j-ое уравнение (2), умноженное на (), получим i-ое уравнение (1), т. е. (2) (1).
2) Если (1) (2), то уравнения системы не изменились, следовательно (1) (2).
bj. Следовательно, (y1,..., yn ) S2, и система (2) совместна. В силу (1) (2).
Теорема 1. Если с.л.у. (2) получена из (1) путем применения конечной последовательности элементарных преобразований, то (1) (2).
Доказательство. Пусть (1) (a1 )... (an1 ) (2). Докажем, что (1) (2) индукцией по n числу преобразований. Базис индукции при n = 1 следует из леммы 1. Предположим, что для (n 1) преобразований утверждение истинно. Тогда по лемме 1, (1) (a1 ). По предположению индукции (a1 ) (2). Следовательно, (1) (2).
§7. Приведение к ступенчатому виду методом Гаусса называется матрицей размера m n над F. Пусть B =..........
Матрицы A и B называются равными, если они совпадают поэлементно, т.
е. A = B aij = bij для всех 1 i m, 1 j n. Матрица состоящая из одних нулей называется нулевой и обозначается также через 0. Множество всех матриц размера m n над F обозначается через Mm,n (F ), т. е.
Матрица Ai = (ai1... ain ) M1,n (F ), 1 i m, называется i-ой строкой (i-строкой) матрицы A.
Матрица A(j) =. Mm,1 (F ) называется j-столбцом матрицы A.
Матрицу A можно формально записать через строки или столбцы:
Определим элементарные преобразования строк матрицы.
Элементарные преобразования (строк) I типа:
т. е. матрица B получена из матрицы A перестановкой i и j строки.
Элементарные преобразования строк II типа:
и Ai + Aj = ((ai1 + aj1 )... (ain + ajn )). Говорят, что матрица B получена из матрицы A добавлением к i-строке j-строки, умноженной на F.
Элементарные преобразования I и II типа будем называть просто элементарными преобразованиями строк матрицы A и записывать A B.
Матрица где a1k1,..., arkr = 0, 1 k1 <... < kr n, 1 r m, называется матрицей ступенчатого вида (ступенчатой матрицей).
Лемма 1. Пусть A Mm,n (F ) и A = 0. Тогда A элементарными преобразованиями приводится к ступенчатому виду.
Доказательство. Индукция по m числу строк матрицы A. При m = 1 ненулевая матрица уже является ступенчатой. Предположим, что утверждение верно для всех матриц из Mm1,n (F ). Рассмотрим A Mm,n (F ).
Так как A = 0, то существуют i, j, 1 i m, 1 j n, такие, что aij = 0.
Выберем минимальное j и произвольное i с этим свойством. Переставим 1-ю и i-ю строки матрицы A. Получим матрицу К каждой i-строке матрицы B, i = 2,..., m, добавим 1-ю строку матрицы B, умноженную на = b1j. Получим матрицу где c1j = b1j = 0. Рассмотрим матрицу (можно считать, что C Mm1,n ). По предположению индукции, матрица C элементарными преобразованиями приводится к ступенчатой матрице D. Совершим те же элементарные преобразования со строками C2,..., Cm матрицы C и получим ступенчатую матрицу Рассмотрим с.л.у.
Матрица A =.. M (F ) называется матрицей с.л.у. (1), матрицей системы (1). Расширенную матрицу A формально записывают в 1. Векторные пространства. Матрицы и определители виде A = (A|B), где B =. Mm,1 (F ) с.л.у. (1).
Таким образом, мы устанавливаем взаимно однозначное соответствие между с.л.у. размерности m (n + 1) и множеством матриц Mm,n+1 (F ).
Нетрудно заметить, что элементарным преобразованиям с.л.у. однозначно соответствуют элементарные преобразования матриц и наоборот.
С.л.у. (1) называется системой ступенчатого вида, если расширенная матрица A системы (1) является ступенчатой.
Теорема 1. Всякая с.л.у. (1) эквивалентна с.л.у. ступенчатого вида.
Доказательство. В силу леммы 1, приведем расширенную матрицу A системы элементарными преобразованиями к ступенчатому виду. Совершая те же элементарные преобразования с системой, приведем ее к системе ступенчатого вида. По теореме 1 §6, полученная ступенчатая система эквивалентна (1).
§8. Исследование систем линейных уравнений.
Необходимые и достаточные условия совместности и определенности Если расширенная матрица системы A нулевая, то, очевидно, система совместна и имеет бесконечное множество решений S = F n. Пусть A = 0.
Приведем ее элементарными преобразованиями к системе ступенчатого вида:
где c1k1,..., crkr = 0, 1 k1 <... < kr n. В силу теоремы 1 §7, (1) (2).
Поэтому для исследования системы (1) достаточно исследовать систему (2).
1) Несовместность. Если в системе (2) dr+1 = 0, то система (2) несовместна. Так как уравнению 0·x1 +...+0·xn = dr+1 = 0 не удовлетворяет никакой набор (y1,..., yn ) F n.
2) Совместность. Пусть dr+1 = 0. Докажем, что система (2) совместна.
Переменные xk1,..., xkr назовем главными, все остальные переменные свободными. Заметим, что по определению мы имеем r главных переменных и (n r) свободных переменных.
Введем обозначения для линейных комбинаций свободных переменных, входящих в каждое уравнение (3):
(здесь и всюду далее символ X означает отсутствие выражения X). Тогда Придадим свободным переменным произвольные значения из F и подставим их в (4). Тогда из последнего уравнения однозначно найдем xkr, подставим это значение в (r 1)-ое уравнение и однозначно найдем xkr1.
Продолжая так далее, подставим найденные значения в первое уравнение и однозначно найдем x1. Следовательно, система (2) (а потому и (1)) совместна.
Найденные решения из (4) называются общим решением системы (1).
c) Определенность. Если система (3) содержит хотя бы одну свободную переменную, то она, очевидно, является неопределенной, т. е. если r < n, то система (3), а, следовательно, (2) и (1) являются неопределенными. Пусть система (3) не содержит свободных переменных, т. е. r = n. Тогда в системе (4) n уравнений и отсутствуют 1,..., r. Поэтому x1,..., xn определяются однозначно.
Таким образом, доказана теорема:
Теорема 1. С.л.у. (1) с ненулевой расширенной матрицей является:
1) совместной тогда и только тогда, когда в ступенчатой системе (2) dr+1 = 0. В этом случае свободным переменным можно придать произвольные значения, а главные переменные при этих условиях определяются однозначно;
2) определенной тогда и только тогда, когда в ступенчатой системе (2) r = n.
Пример. Исследовать с.л.у. методом Гаусса:
Решение. Приведем расширенную матрицу системы к ступенчатому виду:
Поэтому система является определенной и x3 = 3, x2 = 2, x1 = 1.
§9. Векторные пространства: определение и примеры.
Пространство решений однородной системы линейных уравнений Произвольное множество элементов V = называется векторным (или линейным) пространством над полем F, если на V задана ассоциативная коммутативная бинарная операция сложения и, для любого F, унарная операция умножения на скаляр, удовлетворяющие следующим аксиомам:
1) существует нулевой элемент (ноль) 0 V такой, что a + 0 = 0 + a = a для любого a V ; для любого a V существует b V такой, что a + b = 2) для любых, F, a, b V выполняется:
a) () a = (a) (ассоциативность умножения на скаляр);
б) ( + ) a = a + a, (a + b) = a + b (дистрибутивность);
Элементы пространства V называются векторами, элементы из F называются скалярами.
Простейшие свойства операций векторного пространства:
1) В V существует только один нулевой элемент.
Пусть 01 и 02 два нулевых элемента из V, тогда: 01 + 02 = 01 = 02.
Доказательство очевидно.
Примеры векторных пространств.
1) E3 множество векторов 3-х мерного пространства над R с началом в точке 0 относительно операций векторного сложения и умножения на скаляр.
2) Пространство строк:
Множество Fn = {X = (x1,..., xn ) : x1,..., xn F } с операциями:
Докажем, что Fn с заданными операциями является линейным пространством.
Обратный: Для любого X = (x1,..., xn ) существует X = Дистрибутивность: (X + Y ) = (x1 + y1,..., xn + yn ) = (x1 + Остальные аксиомы проверяются аналогично.
Аналогично определяется и F n линейное пространство столбцов.
3) Пространство решений однородной системы линейных уравнений.
Рассмотрим однородную систему линейных уравнений Обозначим Vs = {(1,..., n ) : (1,..., n ) решение (2)}.
Определим на Vs операции по правилу (1). Проверим все аксиомы: Vs =, так как 0 = (0,..., 0) Vs. Покажем, что операции на Vs, заданные правилом (1), определены корректно.
Y в (2) уравнения обращаются в тождества. Тогда, для i = 1,..., m, имеем Так как по определению Vs Fn и операции на Vs определены также как и на Fn, то и остальные аксиомы выполнены. Таким образом, множество решений однородной системы линейных уравнений Vs является линейным пространством.
§10. Подпространство, линейная зависимость Пусть V векторное пространство над F и a1,..., an V. Множество L (a1,..., an ) = {1 a1 +... + n an : i F } называется линейной оболочкой системы векторов a1,..., an. Непустое подмножество U векторного пространства V называется подпространством в V, если U векторное пространство над F с теми же операциями, что определены в V.
Доказательство. Необходимость очевидна. Обратно, положим = = 1.
Тогда a + b U для любых a, b U. Далее, положим = 0. Тогда a U для любых F, a U. Остальные аксиомы выполнены в силу того, что V векторное пространство.
Следствие. L = L(a1,..., an ) подпространство в V.
Доказательство. Заметим, что L =. Далее, для любых, F и Векторы a1,..., an U называются линейно зависимыми, если существуют такие 1,..., n F, одновременно не равные нулю, что i ai = 0. Векторы a1,..., an U линейно независимы, если из равенства i= i= Примеры. 1) 1 = (1, 0,..., 0),..., n = (0, 0,..., 1) линейно независимы в 2) векторы a и 2a линейно зависимы для любого a V.
Теорема 1. 1) Если некоторая подсистема векторов a1,..., an линейно зависима, то векторы a1,..., an линейно зависимы.
2) Если a1,..., an линейно независимы, то любая их подсистема линейно независима.
3) Если a1,..., an линейно зависимы, то существует i такой, что ai 4) Если ai L (a1,... ai..., an ), то a1,..., an линейно зависимы.
5) Если a1,..., an линейно независимы, но a1,..., an, a линейно зависимы, a линейно независимы.
Доказательство. 1) Пусть i1 ai1 +... + is ais = 0, где 1 i1 <... < 2) Следует из 1).
5) Существуют такие 1,..., n, F, одновременно не равные нулю, что §11. Базис и размерность векторного пространства:
существование и свойства. Координаты вектора Пусть V векторное пространство над F. Пространство V называется конечномерным, если существуют a1,..., an V такие, что V = L (a1,..., an ). Набор векторов a1,..., an называется базисом пространства V, если a1,..., an линейно независимы и V = L (a1,..., an ).
Предложение 1. a) Пусть V = L (a1,..., an ). Тогда для любого x V базис V, то для любого x V существуют единственные 1,..., n F i= Существование и единственность базиса конечномерного пространства. решение.
Доказательство. Система совместна, так как имеет нулевое решение.
Приведем ее к ступенчатому виду методом Гаусса. По теореме 1 §8 получим, что система примет вид переменных равно (n r) (n m) > 0, т. е. существует ненулевое решение.
Лемма 2. Пусть V = L(a1,..., an ) и векторы b1,..., bm V линейно независимы. Тогда m n.
меньше числа неизвестных, то по лемме 1 система имеет ненулевое решение Теорема 1. Каждое ненулевое конечномерное пространство V = L(a1,..., an ) обладает конечным базисом. Все базисы V состоят из одинакового числа r n векторов (это число называется размерностью пространства V над F и обозначается dimF V = r).
Доказательство. Существование. Так как V = 0, то существует существует x2 V, x2 L(x1 ). По теореме 1 §10, x1, x2 линейно независимы.
Если V = L(x1, x2 ), то x1, x2 базис. Если V = L(x1, x2 ), то продолжаем процесс. По лемме 2 число линейно независимых векторов n, поэтому через r шагов, где r n, получим: x1,..., xr линейно независимы и xr+ L(x1,..., xr ) для любого xr+1 V. Следовательно, V = L(x1,..., xr ) и x1,..., xr базис V.
Единственность. Пусть V = L(x1,..., xr ) = L(y1,..., ys ), где x1,..., xr линейно независимы и y1,..., ys линейно независимы. По лемме 2, r s и Если a1,..., an базис V, то для любого x V существуют единственные называется координатами вектора x в базисе a1,..., an.
Пусть A, B множества, : A B отображение. Образом отображения называется множество Im () = { (a) : a A} B. Отображение сюръективное (отображение на), если Im () = B, т. е. для любого b B существует a A такой, что (a) = b; инъективное (отображение в; вложение), если (a1 ) = (a2 ) для любых a1, a2 A, a1 = a2 ;
биективное (взаимно однозначное), если однозначное отображение на, т. е. сюръективное и инъективное отображение.
Векторные пространства U и V называются изоморфными, если существует взаимно однозначное отображение : U V такое, что (a + b) = (a) + (b) для любых, F, a, b U. Отображение называется изоморфизмом. Обозначение: U V.
Теорема 1. Если dimF V = n, то V Fn.
такой, что (x) = (1,..., n ), т. е. отображение на. Более того, если x, y V, x = y, то [x]a1,...,an = [y]a1,...,an. Следовательно, это однозначное отображение и, в итоге, взаимно однозначное.
§13. Базис подпространства векторного пространства набор линейно независимых векторов из системы a1,..., an. Тогда Пусть r < n. Для любого i, 1 i n, векторы ai1,..., air, ai линейно зависимы. По теореме 1 §10, ai L(ai1,..., air ). Следовательно, a1,..., ar линейно независимы в V и r < n. Тогда существуют такие ar+1,..., an V, что a1,..., an базис пространства V.
Доказательство. Так как r < n, то L(a1,..., ar ) = V. Выберем произвольный ar+1 L (a1,..., an ) V. По теореме 1 §10, a1,..., ar+ линейно независимы. Если L (a1,..., ar+1 ) = V, то a1,..., ar+1 базис V.
Если нет, то повторяем процесс. За (n r) шагов найдем базис a1,..., an.
Теорема 1 (о размерности подпространства). Подпространство U конечномерного пространства V является конечномерным, т. е. для любого подпространства U пространства V = L(a1,..., an ) существует базис {(b1,..., br ) : r N, b1,..., br линейно независимы}. Тогда M = : так как U = 0, то существует a U такой, что a = 0. Следовательно, (a) M.
Далее, r n в силу леммы 2 §11.
число. Докажем, что b1,..., br базис U. По определению множества M, для любого b U векторы b1,..., br, b линейно зависимы. Тогда, по теореме 1 §9, b L (b1,..., br ). Следовательно, U L (b1,..., br ) U. Поэтому Следствие. Пусть U V и dim U = dim V, тогда U = V.
Доказательство. Имеем U V. Если U = V, то мы можем дополнить базис U до базиса V, но тогда dim U < dim V.
Как практически искать базис U ?
1) Если U = 0, то базиса нет и U = L(0).
2) Если U = 0, то существует ненулевой x1 U. Если U = L(x1 ), то x базис. Если U = L(x1 ), то существует x2 U такой, что x2 L(x1 ). / Следовательно, по теореме 1 §11, x1, x2 линейно независимы. Повторим процедуру и за r n шагов получим U = L (x1,..., xr ), где x1,..., xr базис U.
§14. Сумма и пересечение подпространств, связь их где ai, bi Ui. Следовательно, по лемме 1 §10, ai + bi Ui и a + b = подпространства в V.
Теорема 1. Пусть U1, U2 подпространства в V. Тогда dim (U1 + U2 ) = dim U1 + dim U2 dim (U1 U2 ).
Доказательство. Пусть dim U1 = n1, dim U2 = n2, dim (U1 U2 ) = m.
Пусть a1,..., am базис U1 U2. Так как U1 U2 U1, то, по лемме 3, мы можем дополнить a1,..., am векторами b1,..., bk U1 до базиса пространства Пусть U1, U2 подпространства в V. Сумма U1 + U2 называется прямой и обозначается U1 U2, если U1 U2 = 0.
Лемма 2. Пусть U1, U2 подпространства в V и U = U1 + U2. Тогда U = U1 U2 для любого u U существуют единственные u U1, u2 U2 такие, что u = u1 + u2.
Доказательство. Если U = U1 U2 и u U, то u = u1 + u2 для некоторых u1 U1, u2 U2. Если при этом u = v1 + v2 для некоторых v1 U1, v2 U2, Обратно, если U1 U2 = 0, то существует ненулевой u U1 U2, но тогда u = u + 0 и u = 0 + u два различных разложения элемента u.
§15. Пространство линейных отображений L(U, V ) и Пусть U и V векторные пространства над F. Отображение : U V называется линейным, если (x + y) = (x) + (y), (x) = (x) для любых x, y U, F. Данное эквивалентно тому, что (x + y) = Примеры. 1) Нулевое: : Fn Fm, для любого x Fn полагаем (x) = 0 Fm. Обозначим это отображение через 0, := 0.
2) Единичное: : Fn Fn, для любого x Fn полагаем (x) = x Fn.
Обозначаем := id.
3) Проекция на i-ю координату: : Fn F1, для любого x = (x1,..., xn ) Fn полагаем (x) = xi. Обозначаем := P ri.
Обозначим через L(U, V ) множество всех линейных отображений из U в V. Определим операции на L(U, V ):
Лемма 1. L(U, V ) с заданными операциями это векторное пространство над F.
Доказательство. L (U, V ) =, так как 0 L (U, V ). Проверим, что L (U, V ) замкнуто относительно операций: для любых, L (U, V ), Остальные аксиомы проверяются аналогично.
Рассмотрим множество Mn,m (F ) всех матриц над F и определим на нем операции:
Матричной единицей Eij в Mn,m (F ) называется матрица, у которой на пересечении i-строки и j-столбца стоит 1, а остальные элементы нулевые.
Лемма 2. 1) Mn,m (F ) векторное пространство над F. 2) Для i n, 1 j m, матричные единицы Eij образуют базис Mn,m (F ) и dimF Mn,m (F ) = n · m.
Доказательство. 1) Прямая проверка аксиом векторного пространства.
Тогда ij = 0 для любых i, j.
§16. Изоморфизм пространств L(U, V ) и Mm,n(F ) Умножение строки на матрицу: Пусть X Fm, A Mm,n (F ). Определим Имеем XA = ((a11 x1 +... + am1 xm ),..., (a1n x1 +... + amn xm )) = где Ai = (ai1,..., ain ) i-строка матрицы A, i = 1,..., m.
Заметим, что для любых X Fm, A Mm,n (F ) имеем XA Fn.
Для любой A Mm,n (F ) определим отображение A : Fm Fn по правилу: A (X) = XA для любого X Fm.
Лемма 1. A L (Fm, Fn ) для любой A Mm,n (F ).
Доказательство. Для любых, F, X, Y Fm, A Mm,n (F ) имеем A (y). Следовательно, A L(Fm, Fn ).
Определим отображение L : Mm,n (F ) L (Fm, Fn ) по правилу: для A Mm,n (F ) положим L (A) = A.
Mm,n (F ) и L (Fm, Fn ).
отображение.
Сюръективность. Для любых L (Fm, Fn ), X = (x1,..., xm ) Fm имеем Следовательно, по определению, (X) = A (X). Тогда L (A) = A =.
Инъективность. Пусть A, B Mm,n (F ) и A = B. Тогда существуют i, j такие, что ij = ij. Поэтому Но Ai = Bi, так как ij = ij. Поэтому A ( i ) = B ( i ) и A = B, откуда следует L(A) = A = L(B) = B.
Сохранение операций. Для любых, F, A, B Mm,n (F ), X Fm имеем:
(X · B) = A (X) + B (X) = (A + B ) (X). Следовательно, (A+B) = A +B и L(A+B) = L(A)+L(B), т. е. L изоморфизм.
стандартный базис Fm, называется матрицей преобразования в базисе 1,..., m и обозначается через [].
Определим отображение [ ] : L(Fm, Fn ) Mm,n (F ) правилом: [ ]() = [].
Лемма 2. Отображение [ ] является биективным.
Доказательство. Заметим, что для любой A Mm,n (F ) справедливо т. е. [ ] сюръективно. Далее, если, L (Fm, Fn ) и =, то по теореме 1 = A, = B, для некоторых различных A, B Mm,n (F ), и A = B.
Тогда [] = [A ] = A = B = [B ] = []. Таким образом, отображение [ ] является инъективным.
произведение матриц Суперпозиция двух отображений : U V и : V W есть отображение : U W, определенное по правилу: ( ) (x) = ( (x)) для любого 1 (2 3 ) = (1 2 ) 3 суперпозиция отображений ассоциативна.
линейных отображений является линейным отображением.
c) Для любых линейных отображений L (U, V ), L (V, W ), суперпозиция отображений дистрибутивна.
Доказательство. a) Для любого v V1 имеем (1 (2 3 )) (v) = c) Для любого u U имеем ( ( + ))(u) = ( + )((u)) = ((u)) + ((u)) = ( )(u) + ( )(u) = ( + )(u). Для любого w W имеем ((+ ))(w) = ((+ )(w)) = ((w))+((w)) = ()(w)+( )(w) = Примеры. 1) Рассмотрим суперпозицию отображений L и [ ]. По определению L [ ] : Mm,n (F ) Mm,n (F ) и (L [ ])(A) = [L(A)] = [A ] = A.
2) Рассмотрим суперпозицию отображений [ ] и L. По определению [ ] L : L(Fm, Fn ) L(Fm, Fn ). Пусть L(Fm, Fn ) и = A для некоторой A Mm,n (F ). Тогда ([ ] L)() = L([]) = L([A ]) = L(A) = A =.
Для любых A Mm,s (F ), B Ms,n (F ) положим где cij = [] · [].
Доказательство. Из теоремы 1 §16 следует, что существуют A Mm,s (F ), Будем обозначать стандартный базис Fn через 1 (n),..., n (n). Тогда ( i (m) · A) · B = Ai · B. Поэтому, в силу (1) §16 и §17, [ ] =. = Отметим, что из доказательства теоремы 1 для любых A Mm,s (F ), B Ms,n (F ) следует формула Следствие 1. a) Для любых A Mm,s (F ), B Ms,t (F ), C Mt,n (F ) справедливо (A · B) · C = A · (B · C) умножение матриц ассоциативно.
матриц дистрибутивно.
Доказательство. a) По формуле (2) и лемме 1, имеем Тогда (A·B)·C = (A · B) · C = A·(B·C) = A · (B · C).
b) По лемме 1 с), имеем A·(B+C) = A B+C = A (B + C ) = A B + A C = AB + AC = AB+AC. Продолжая далее как и в пункте 1, получаем требуемое. Аналогично показывается второе равенство.
§18. Обратимые преобразования и матрицы Отображение 1X : X X называется единичным (или тождественным), если 1X (x) = x для любого x X. Отображение g : Y X называется обратным к f : X Y и обозначается g = f 1, если f g = 1X, g f = 1Y.
При этом f называется обратимым.
Лемма 1. Для любого отображения f : X Y имеем:
b) обратное отображение g определяется однозначно;
c) если f g = 1X, то f инъективно, а g сюръективно;
d) f обратимо f биективно.
Доказательство. a) Для любого x X имеем: f 1Y (x) = 1Y (f (x)) = f (x), 1X f (x) = f (1X (x)) = f (x).
c) Пусть f (x1 ) = f (x2 ). Тогда x1 = 1X (x1 ) = (f g) (x1 ) = g (f (x1 )) = g (f (x2 )) = (f g) (x2 ) = 1X (x2 ) = x2, т. е. f инъективно. Для любого x X имеем: x = 1X (x) = (f g) (x) = g (f (x)). Следовательно, g сюръективно.
d) Если f g = 1X, g f = 1Y, то f инъективно и сюръективно f биективно.
Обратно, для любого y Y существует единственный x X такой, что Следствие 1. a) Если f биективно, то f 1 биективно и (f 1 )1 = f.
биективно и (f h) = h f.
Доказательство. a) По лемме 1, f 1 существует и обратимо f биективно и Множество матриц Mn,n (F ) обозначается через Mn (F ). Матрицы из Mn (F ) называются квадратными. Матрица A Mn (F ) называется обратимой, если существует B Mn (F ) такая, что A · B = B · A = E, обратной к A и обозначается B = A1. Обратимая матрица называется также невырожденной. Как и в случае линейных отображений, легко доказать, что обратная матрица единственна.
Теорема 1. Для любого преобразования L (Fn, Fn ) следующие условия эквивалентны:
a) обратимо;
c) [] обратимая матрица.
Доказательство. a) b) По лемме 1, 1 биективное и, следовательно, обратимое отображение. Докажем линейность 1. Для любых, F и X, Y Fn обозначим Y = 0. Так как (0) = 0 и биективно, то Z = 0. Следовательно, a) c) Так как отображение обратимо, то, по пункту b), обратимое линейное преобразование и 1 = 1 = 1, где 1 = 1F n.
Имеем, по теореме 1 §17, E и [] обратимая матрица, причем []1 = [1 ].
c) a) [] · B = B · [] = E. Тогда, по формуле 1 §16, [B ] = B. Поэтому [] · [B ] = [ B ] = [B ] · [] = [B ] = [1]. Так как [ ] инъективно, то Следствие 2. Отображение [ ] является изоморфизмом L(Fm, Fn ) и Mm,n (F ).
Доказательство. Из примеров §17 следует, что [ ] это отображение обратное к L. Поэтому из Следствия 1 и Теоремы 1 следует, что [ ] является изоморфизмом.
Следствие 3. Для любых матриц A, B Mn (F ) имеем 1) A обратима A1 обратима и (A1 )1 = A;
2) A, B обратимы A · B обратима и (A · B)1 = B 1 · A1.
Доказательство. Так как обратная матрица определена однозначно, то утверждение следует из равенств AA1 = A1 A = E, (AB)(B 1 · A1 ) = (B 1 · A1 )(AB) = E.
§19. Образ и ядро линейного отображения, связь их размерностей. Характеризация обратимого преобразования в терминах ядра и образа Рассмотрим линейное отображение : V U, где V, U векторные пространства над F. Ядром линейного отображения называется множество образом линейного отображения называется множество Доказательство. Так как (0) = 0, то 0 Ker =, 0 Im =.
Далее, для любых, F, a, b Ker имеем (a + b) = (a)+(b) = 0. Следовательно, a + b Ker, поэтому Ker подпространство в V.
Для любых, F, (a), (b) Im имеем (a) + (b) = (a + b), т. е. Im подпространство в U.
Теорема 1. dim V = dim Ker + dim Im.
Доказательство. Пусть e1,..., ek базис Ker, дополним его векторами ek+1,..., en до базиса V. Тогда Im = L((e1 ),..., (en )) =... = n = 0 и (ek+1 ),..., (en ) линейно независимы. Следовательно, dim Im.
Теорема 2. Пусть L (V, V ), V конечномерное пространство.
Тогда следующие условия эквивалентны: 1) обратимо; 2) Ker = 0; 3) Доказательство. По теореме 1, имеем Ker = 0 dim Ker = dim Im = dim V Im = V, откуда следует эквивалентность 2) 3).
1) 2) Если обратимо, то биективно по лемме 1 §18 и Ker = 0.
Пусть Ker = 0, тогда Im = V, сюръективно и, более того, если a, b Поэтому инъективно и 1) 2).
Отображение L (V, V ) называется невырожденным, если Ker = 0.
Следствие. Пусть dimF V <. Тогда невырождено обратимо.
§20. Вертикальный и горизонтальный ранги матрицы, Пусть A Mm,n (F ), V = V (A) подпространство в Fn, порожденное строками A, и VB = VB (A) подпространство в F m, порожденное столбцами A. Тогда dim V := r называется горизонтальным рангом (ранг по строкам) матрицы A, dim VB = rB вертикальным рангом (ранг по столбцам) матрицы A.
Лемма 1. Если матрица A получена из матрицы A элементарными преобразованиями строк, то r (A) = r (A ), rB (A) = rB (A ).
Доказательство. Первое очевидно. Для доказательства второго надо заметить, что если A получена из A элементарным преобразованием I и II типа, то всякая линейная зависимость между столбцами A перейдет в ту же зависимость (с теми же коэффициентами) между столбцами A. Так как A также получается из A элементарным преобразованием строк, то какието столбцы A линейно зависимы соответствующие столбцы A линейно зависимы. Поэтому rB (A) = rB (A ).
Пусть A = (aij ) Mm,n (F ). Тогда матрица A = (aji ) Mn,m (F ), у которой по определению элемент в i-ой строке и j-ом столбце равен aji, называется транспонированной матрицей к матрице A и обозначается A.
Теорема 1. r (A) = rB (A) (вертикальный и горизонтальные ранги совпадают).
Доказательство. Достаточно доказать неравенство rB (A) r (A), тогда из аналогичного неравенства для транспонированной матрицы получим r (A) = rB (A ) r (A ) = rB (A) и окончательно r (A) = rB (A).
Приведем A элементарными преобразованиями строк I и II типа к ступенчатому виду A. По лемме достаточно доказать искомое неравенство для A. Пусть A имеет r ненулевых строк; тогда эти строки независимы, и r (A ) = r. Так как в каждом столбце матрицы A последние mr координат нулевые, то без ограничения общности можно считать, что VB (A ) F r, откуда rB (A ) = dim VB (A ) dim F r = r.
Число r (A) = r (A) = rB (A) называется рангом матрицы A.
Следствие. Пусть A Mm,n (F ). Тогда r (A) = r (A ).
§21. Ранг матрицы как размерность образа соответствующего линейного преобразования.
Ранг произведения матриц В §16 мы определили умножение строки на матрицу и в теореме 1 §16 было доказано, что отображение L является изоморфизмом линейных пространств Mm,n (F ) и L (Fm, Fn ). Аналогично, можно рассмотреть умножение столбца на матрицу. Для любых X F n и A Mm,n (F ) положим В точности повторяя рассуждения §16, мы получим, что отображение является изоморфизмом линейных пространств Mm,n (F ) и L (F n, F m ).
Причем, если [] = ( (e1 ),..., (en )) матрица в стандартном базисе e1,..., en пространства F, то повторяя некоторые рассуждения предыдущих параграфов (меняя вектор-строки на вектор-столбцы), получим, что отображение действующее по правилу [ ] () = [], является изоморфизмом линейных пространств.
Теорема 1. Пусть L (Fm, Fn ). Тогда r ([]) = dim (Im ).
Доказательство. Заметим, что Im порождается векторами (e1 ),..., (em ). Тогда, по определению, По определению, r ([]) совпадает с максимальным числом линейно независимых векторов среди (e1 ),..., (em ), т. е. совпадает с размерностью пространства Im.
Следствие 1. Матрица A Mn (F ) обратима r (A) = n.
Доказательство. Рассмотрим A L (Fn, Fn ), где A (X) = X · A для X Fn. По теореме 1 §18 A обратимо [A ] = A обратимая матрица.
По теореме 2 §19 A обратимо Im A = Fn, т. е. dim Im A = dim Fn = n. По теореме 1 имеем r (A) = dim (Im A ) = n.
Пусть V, W векторные пространства, U подпространство в V и L(V, W ). Обозначим через |U отображение из U в W, действующее по правилу |U (u) = (u). Отображение |U называется ограничением отображения на подпространство U.
Теорема 2. Пусть A Mm,n (F ), B Mn,k (F ). Тогда Доказательство. Приведем два доказательства: первое на языке линейных отображений, второе на языке матриц.
что в стандартных базисах [] = A, [] = B. Тогда по теореме 1 § AB = [ ] = [] · []. В частности, r (A) = dim Im, r (B) = dim Im (), r (AB) = dim Im ( ). Ясно, что Im ( ) Im, поэтому r (AB) r (B).
Для доказательства второго неравенства рассмотрим отображение = |Im ограничение отображения на подпространстве Im. Тогда Im = Заметим, что второе неравенство может быть выведено из первого:
2) Пусть AB = C, тогда где для матрицы A Mm,n (F ) через Ai обозначены ее строки, а через A(j) столбцы. Поэтому Следовательно, r (AB) r (B), r (AB) r (A).
Следствие 2. Пусть A Mm,n (F ). Если матрицы B Mm (F ), C Mn (F ) обратимы, то r (BAC) = r (A).
Следствие 3. Матрица A Mn (F ) обратима A обратима справа или слева.
Доказательство. Действительно, из равенства AB = E следует, что n = r (E) r (A), поэтому r (A) = n и A обратима.
эквивалентность матриц одного ранга Для матрицы A Mm,n (F ) назовем элементарным преобразованием строк III типа умножение некоторой строки на F, = 0. Аналогично определим преобразование для столбцов. Элементарными преобразованиями матрицы A Mm,n (F ) назовем элементарные преобразования строк и столбцов типа I, II, III. Назовем две матрицы одинакового порядка эквивалентными, если одна получена из другой элементарными преобразованиями. Из леммы 1 § следует, что эквивалентные матрицы имеют равные ранги. Докажем теперь обратное.
Теорема 1. Матрицы A, B Mm,n (F ) эквивалентны они имеют одинаковый ранг.
Доказательство. Мы покажем, что всякая матрица A ранга r эквивалентна матрице, где Er единичная матрица порядка r. Действительно, элементарными преобразованиями строк A приводится к ступенчатому виду с r ненулевыми строками. Переставив, если надо, столбцы, можно считать, что первый ненулевой элемент в i-й строке (i = 1,..., r) стоит на i-м месте. Следующим шагом можно превратить все эти элементы в 1, а затем легко занулить все остальные элементы.
§23. Независимость числа главных неизвестных от способа приведения системы к ступенчатому виду.
Теорема Кронекера-Капелли Рассмотрим совместную с.л.у.
В §8 были определены главные переменные xk1,..., xkr и свободные переменные xi, i = k1,..., kr, 1 i n. Ввиду того, что в общем случае выбор главных переменных зависит от способа приведения A... C системы к ступенчатому виду, xk1,..., xkr будем называть главными переменными метода Гаусса A... C. Формулы (4) из § определяют основное свойство переменных xk1,..., xkr. А именно, придадим свободным переменным xi, 1 i n, i = k1,..., kr, произвольные значения 1,..., nr F, тогда по формулам (4) из §8, однозначно найдем единственное решение с.л.у. (1).
Переменные xi1,..., xis, s n, называются главными в системе (1), если для любых i F, 1 i n, i = i1,..., is, существует единственный набор (i1,..., is ) Fs такой, что и s максимально с этим свойством. Оставшиеся переменные назовем свободными.
В силу сказанного, любые главные переменные метода Гаусса являются главными. Возникают два вопроса:
от чего зависит число главных переменных?
какие переменные могут быть главными?
Ответы на них дает следующая теорема:
Теорема 1. Пусть AX = B совместная система линейных уравнений и r (A) = r. Тогда xi1,..., xir линейно независимы. В частности, число главных переменных равно рангу системы.
Доказательство. Перепишем с.л.у. (1) в виде Предположим, что A(i1 ),..., A(ir ) линейно зависимы. Тогда, так как r(A) = L A,...,A. Придадим свободным переменным следующие значения:
xj = 1, а остальные свободные переменные приравняем к нулю;
xj = 2, а остальные свободные переменные приравняем к нулю.
т. е. A L A,...,A. Получено противоречие, и, следовательно, A,..., A линейно независимы.
Обратно, так как с.л.у. (1) совместна, то B L A(1),..., A(n). Так как, r (A) = r, а A(i1 ),..., A(ir ) линейно независимы, то A(i1 ),..., A(ir ) базис L A(1),..., A(n). Следовательно, для любых i F, 1 i n, базису A(i1 ),..., A(ir ).
Теорема 2 (Кронекера-Капелли). С.л.у. AX = B совместна r (A) = r (A|B).
Доказательство. Имеем r (A) = r (A|B) dim L A(1),..., A(n) = §24. Однородные системы, размерность пространства решений, фундаментальная система решений Рассмотрим однородную с.л.у.
неизвестных.
В §9 было доказано, что Vреш. (множество решений системы (1)) является подпространством F n. Как найти его размерность и базис? Рассмотрим отображение : F n F m Доказательство. 1) Для любых, F ; X, Y F n имеем Следовательно, L (F n, F m ).
Теорема 1. dim Vреш. = n r(A).
Доказательство. Вычислим матрицу [] в стандартном базисе e1,..., en пространства F n. Имеем []e1,...,en = ( (e1 ),..., (en )) = (A · e1,..., A · en ) = A(1),..., A(n) = A. Далее, по теореме 1 §21, r (A) = dim (Im ). По теореме 1 §19, n = dim F n = dim Ker + dim Im.
Поэтому dim Vреш. = n r (A).
Произвольный базис пространства Vреш. для системы AX = 0 называется фундаментальной системой решений.
Алгоритм построения фундаментальной системы.
Пусть r(A) = r. Выберем произвольные главные переменные xi1,..., xir для системы (1). Для простоты изложения будем обозначать главные переменные через y1,..., yr, свободные переменные через yr+1,..., yn.
Через a = (1,..., n ) будем обозначать следующее решение системы (1):
y1 = 1,..., yr = r, yr+1 = r+1,..., yn = n. В силу формулы (4) из §8, найдем решения По построению они линейно независимы, а так как их число равно (n r), то это базис Vреш., и, следовательно, это фундаментальная система решений.
Теорема 2. Всякое подпространство V F n размерности s является пространством решений некоторой однородной системы ранга (n s).
Доказательство. Выберем a1,..., as некоторый базис V, дополним его векторами as+1,..., an до базиса F n. Пусть U = L(as+1,..., an ). Тогда F n = V U. Рассмотрим проекцию пространства F n на U : если x = v + u F n, где v V, u U, то (x) := u. Пусть A = []. Рассмотрим отображение : X AX. Тогда [] = A. Следовательно, =, и V = Ker = Vреш.
§25. Линейные многообразия и решения неоднородной системы линейных уравнений Пусть V линейное пространство, U подпространство в V, a V.
Множество a + U = {a + x : x U } называется линейным многообразием типа U и размерности dim U. Нетрудно заметить, что a + U является линейным подпространством a U. Действительно, 0 a + U a Лемма 1. Пусть a1 + U1, a2 + U2 линейные многообразия, тогда a1 + U1 = a2 + U2 U1 = U2, a1 a2 U1. В частности, для любого c a1 + U верно c + U1 = a1 + U1.
Доказательство. “” Существует u1 U1 такой, что a1 +u1 = a2 +0 = a2, т. е. a1 a2 = u1 U1. Существует u2 U2, что a1 + 0 = a1 = a2 + u2, т.
е. a1 a2 = u2 U2. Тогда для любого v2 U2 существует v1 U1 такой, что a1 + v1 = a2 + v2. Следовательно, v2 = (a1 a2 ) + v1 U1 и U2 U1.
Аналогично, U1 U2 и U1 = U2.
Следовательно, a1 + U1 = a2 + U2.
Вернемся к неоднородным системам линейных уравнений. Пусть эта система имеет вид Допустим, что система совместна, и X0 F n какое-то ее решение. Тогда X1 F решение (1) (X1 X0 ) решение однородной системы AX = 0.
Действительно, A·(X1 X0 ) = AX1 AX0 = B B = 0 и 0 = A·(X1 X0 ) = AX1 AX0 = AX1 B AX1 = B.
Теорема 1. Множество решений системы линейных уравнений (1) совпадает с линейным многообразием X0 +Vреш., где X0 частное решение (1), Vреш. пространство решений системы AX = 0. Обратно, всякое линейное многообразие в F n является множеством решений некоторой системы линейных уравнений от n неизвестных.
Доказательство. Пусть Y решение (1). Тогда (Y X0 ) Vреш. и Y X0 + Vреш.. С другой стороны, для любого u Vреш. имеем A(X0 + u) = AX0 + Au = B X0 + u решение (1).
Докажем обратное. Пусть подпространство V задается некоторой однородной системой AX = 0. Тогда многообразие (X0 + V ) задается системой AX = AX0.
§26. Фактор-пространство, его базис и размерность Пусть V векторное пространство, U V некоторое подпространство.
Обозначим через V /U множество всех линейных многообразий типа U в V, т. е.
Лемма 1. Для любых x, y V либо x+U = y+U либо (x + U )(y + U ) = Превратим V /U в линейное пространство над F, для любых a, b V и F полагая Необходимо проверить корректность определенных операций.
a1 + U.
Аксиомы векторного пространства в V /U справедливы ввиду того, что они справедливы в V и операции в V /U сводятся к соответствующим операциям над элементами из V.
Теорема 1. Отображение : V V /U, определенное по правилу (x) = x + U, является линейным отображением, т. е. L(V, V /U ). При этом Ker = U, Im = V /U. В частности, для конечномерных пространств dim V /U = dim V dim U. Пусть v1,..., vk дополнение базиса U до базиса V. Тогда v1 + U,..., vk + U базис V /U.
Доказательство. Для любых, F, x, y V имеем (x + y) = Далее, для любого x Ker имеем (x) = x + U = 0 + U x U.
Следовательно, Ker = U. Докажем, что для конечномерных пространств (Заметим, что это следует из теоремы 1 §19, но мы приведем явное доказательство.) Пусть a1,..., am базис U. Дополним его векторами am+1,..., an до базиса V. Тогда am+1 + U,..., an + U базис V /U. Действительно, Поэтому m+1 =... = n = 0, т. е. am+1 + U,..., an + U линейно независимы.
dim V dim U.
§27. Определитель квадратной матрицы, его основные Индукцией по размерности n квадратной матрицы A Mn (F ) определим отображение det : Mn (F ) F, которое будем называть детерминантом или определителем A, по следующему правилу:
Предположим, что для всех квадратных матриц размера меньше n функция det определена. Рассмотрим матрицу A Mn (F ). По предположению индукции, определены числа детерминанты матриц размера (n 1), полученных вычёркиванием i-строки и j-столбца матрицы A. Эти числа называются минорами матрицы A. Числа определению Формула (1) называется разложением определителя по 1-му столбцу.
Если ясно о какой матрице идет речь, то для краткости записывают: Mij = Mij (A), Aij = Aij (A), тогда Функция det(A) часто обозначается через |A|. Аналогично определяются миноры Mi1,...,ik ;j1,...,jk (A) = Mi1,...,ik ;j1,...,jk определители матриц, полученных из A вычёркиванием строк с номерами i1,..., ik и столбцов с номерами j1,..., jk.
Найдем по определению det a21 a22 a23 = a11 · 22 23 a21 · 12 13 + a31 · 12 13 = = a11 ·(a22 · a33 a32 · a23 )a21 ·(a12 · a33 a13 · a32 )+a31 ·(a12 · a23 a22 · a13 ) = Теорема 1. Определитель обладает следующими свойствами:
(D1) при перестановке строк определитель меняет знак;
(D2) при умножении какой-то строки на скаляр F определитель также умножается на ;
(D3) определитель является линейной функцией строк матрицы A;
(D4) |E| = 1.
Доказательство всех этих свойств по индукции; вначале расписываем определитель по определению, затем применяем предположение индукции, и вновь сворачиваем сумму в определитель. Нужно только проследить, что происходит со слагаемыми, соответствующими тем строкам, с которыми совершается преобразование.
верно для матриц размера (n 1). Пусть матрица B получена из A Mn (F ) перестановкой строк с номерами i и j. Тогда Для произвольной матрицы C Mn (F ) обозначим: Ci отсутствие i-строки;
Ci = (ci2, ci3,..., cin ) i-строка без первого элемента. Тогда, по предложению индукции, имеем: при k = i, j при k = i последовательно переставляя строки, вернем = (1) aj1 · (1) при k = j, аналогично, Следовательно, det (B) = det. Предположим, что (D2) верно для всех матриц размера (n 1). Пусть матрица B получена из A Mn (F ) умножением i-строки на. По предположению индукции, имеем: при k = i при k = i Следовательно, det (B) = (D3) Докажем в начале, что Легко проверить, что det(a + b) = (a + b) = det(a) + det(b), матрицы C = (cij ) имеем по предположению индукции: при k = i при k = i Следовательно, В силу доказанного и свойства (D2), имеем (D4) Имеем det(1) = 1, det det (En1 ), где Ek единичная матрица в Mk (F ).
Следствие 1. 1) Пусть 1 + 1 = 0 в поле F, если A Mn (F ) содержит две одинаковые строки, то |A| = 0. 2) Если A содержит нулевую строку, то |A| = 0. 3) |A| = n |A|.
Доказательство. 1) Поменяем местами одинаковые строки. Тогда из (D1) следует det(A) = det(A) и det(A) = 0. Свойство 2) вытекает из (D2) при = 0. Свойство 3) также следует из (D2).
§28. Определитель матрицы как полилинейная кососимметрическая нормированная функция строк Пусть V, U U. Отображение f называется полилинейным, если оно линейно по каждому аргументу, т. е. для любого i = 1,..., n и любых, f (v1,..., vi,..., vn ). Отображение f называется кососимметричным, если Лемма 1. Пусть : Mn (F ) F удовлетворяет свойствам (D1)(D4).
Тогда a) если матрица B получена из A элементарными преобразованиями строк II типа (прибавление к одной строке другой, умноженной на скаляр), то (B) = (A);
a11 · a22 ·... · ann.
Доказательство. Свойство a) вытекает из (D3), (D2) и следствия. Для доказательства b) заметим, что если ann = 0, то (A) = 0 в силу (D2). Если же ann = 0, то можно занулить все элементы n-го столбца, стоящие над ann.
После этого перейдем к an1n1, и т. д. Если все aii = 0, мы в итоге получим (A) = (diag {a11, a22,..., ann }) = (по (D2)) = a11 a22... ann (E) = a11 a22... ann.
Теорема 1. Пусть функция : Mn (F ) F удовлетворяет свойствам (D1) (D4). Тогда (A) = |A| для любой A Mn (F ).
Доказательство. Приведем A к ступенчатому виду A элементарными преобразованиями I и II типа (без умножений строк на скаляры). Пусть при этом мы совершили k перестановок строк. Тогда Если в A есть нулевая строка, то (A ) = |A | = 0. Иначе же A является верхнетреугольной и снова (A ) = |A | по лемме 1.
Теорема 1. Для любой A Mn (F ) имеем |A| = |A |.
ad bc =. Предположим, что для любой матрицы B Mk (F ), при k < n, |B| = |B |. Обозначим элементы матрицы A через a, т. е. a = aji.
Теперь разложим определитель M1i (A ) по 1-му столбцу:
Подставив это в S, получим Тогда Следствие 1. Свойства (D1) (D4) верны не только для строк, но и для столбцов матрицы A.
§30. Разложение определителя по любому столбцу.
Присоединенная матрица и ее применение к нахождению обратной матрицы Теорема 1 (о разложении определителя по любому столбцу (строке)).
Доказательство. Пусть B получена из A перестановкой 1-го и j-го столбцов. Тогда Аналогично для строк.
Следствие 1.
определителю матрицы, полученной из A заменой j-ой строки строкой Xj = Матрица A = (Aij ) называется присоединённой матрицей к матрице A.
Теорема 2. Пусть A Mn (F ). Тогда A · A = A · A = det(A) · E. В частности, если det(A) = 0, то A1 = det(A) · A.
Доказательство. Пусть C = A·A. Тогда cij = n aik Ajk и по следствию Аналогично, A · A = det(A) · E.
Следствие 2. Следующие условия для квадратной матрицы A эквивалентны:
(i) A обратима;
(ii) строки A линейно независимы;
(iii) столбцы A линейно независимы;
(iv) |A| = 0, т. е. A невырождена.
Доказательство. Эквивалентность (i) (ii) (iii) это следствие §21. Если строки A линейно независимы, то, как и в §28, A эквивалентна диагональной матрице без нулевых строк, т. е. |A| = 0. Из (iv) следует (i) по теореме 2.
§31. Определитель произведения матриц Лемма 1. Пусть A = diag {d1,..., dn }, B Mn (F ). Тогда |A| |B|.
Лемма 2. Пусть C = AB. Если A получена из A каким-то элементарным преобразованием строк I и II типа, то C = A B получается из C тем же самым элементарным преобразованием строк.
Доказательство. Ci = Ai B (1), Ai B (2),..., Ai B (n) = Ai · B.
Теорема 1. |A · B| = |A| · |B|.
Доказательство. Пусть C = A · B. Если r(A) < n, то r(AB) r(A) < n, поэтому |A| = |A · B| = 0. Пусть r(A) = n, тогда A невырождена и элементарными преобразованиями строк I и II типа приводится к диагональному виду D = diag {d1,..., dn }. Пусть при этом совершено k перестановок строк, тогда |A| = (1)k |D|. Применяя те же элементарные преобразования строк к матрице C, по лемме 2 получим матрицу C = DB; при этом |C | = (1)k |C|. По лемме 1, |C | = |D| · |B| = (1)k |A| · |B|, откуда |C| = |A| · |B|.
§32. Формулы Крамера Теорема 1 (Формулы Крамера). Если система n линейных уравнений от n неизвестных A · X = B имеет ненулевой определитель (т. е. |A| = 0), то она определена и ее единственное решение задается формулами xi = i, i = 1, 2,..., n, где = |A|, а i получается из заменой i-го столбца столбцом свободных членов.
Доказательство. Пусть A · X = B, где Так как строки матрицы A линейно независимы, то по теореме 1 §4, система имеет единственное решение. Найдём его:
§33. Ранг матрицы как наибольший порядок ненулевых миноров. Теорема об окаймляющем миноре Рангом матрицы по минорам назовем наибольший порядок ее ненулевых миноров.
Теорема 1. Ранг матрицы равен ее рангу по минорам.
Доказательство. Пусть rm ранг по минорам матрицы A, r = r(A). Ясно, что rm r, так как строки, входящие в любой ненулевой минор, линейно независимы.
Обратно, пусть строки Ai1,..., Air линейно независимы. Рассмотрим матрицу A, составленную из этих r строк, тогда r(A ) = r. Значит, существуют r линейно независимых столбцов в этой матрице: A (j1 ),..., A (jr ).
Матрица A, составленная из этих столбцов, принадлежит Mr (F ), столбцы ее линейно независимы, поэтому |A | = 0. Но |A | это минор r-го порядка матрицы A, стоящий на пересечении строк Ai1,..., Air и столбцов A(j1 ),..., A(jr ). Значит, rm r.
Теорема 2 (об окаймляющем миноре). Пусть все миноры порядка k + 1, содержащие данный ненулевой минор порядка k, равны нулю. Тогда r(A) = Доказательство. Пусть данный минор расположен в строках Ai1,..., Aik и столбцах A(j1 ),..., A(jk ). Столбцы A(j1 ),..., A(jk ) линейно независимы (т.
к. линейно независимы “укороченные” столбцы). Пусть B произвольный столбец матрицы A. Рассмотрим матрицу A со столбцами A,..., A(jk ), B. (j1 ) Ее строки Ai1,..., Aik тоже линейно независимы. Предположим, что r(A ) = k + 1; тогда найдется строка Aik+1 матрицы A, образующая вместе со строками Ai1,..., Aik линейно независимую систему. Значит, определитель матрицы порядка k + 1, составленной из этих строк, отличен от нуля. Но этот определитель является окаймляющим минором для исходного минора, поэтому обязан быть нулевым. Следовательно, r(A ) = k, и столбец B линейно выражается через столбцы A(j1 ),..., A(jk ). Значит, r(A) = k.
§34. Задачи 1. Найти сумму всех корней n-й степени из 1.
2. Доказать, что любой элемент из C является корнем квадратного или линейного уравнения с коэффициентами из R.
3. Найти число всех упорядоченных троек (A, B, C) подмножеств 4. Доказать, что для перемножения матриц 2 2 достаточно 7 умножений.
(Для матриц n n это т.н. проблема Штрассена.) 5. Пусть An M2n+1 (F ) у которой элементы первых n поддиагоналей равны 1, а элементы оставшихся поддиагоналей равны 1. Найти ранг An.
6. Пусть A квадратная матрица порядка n. Доказать, что если A2 = E, то сумма рангов матриц A + E и A E равна n.
7. Доказать, что если размерность суммы двух линейных подпространств в Rn на единицу больше размерности их пересечения, что сумма совпадает с одним из них, а пересечение с другим.
8. Обосновать следующий алгоритм построения базиса суммы и составляем матрицу B. Расширенную матрицу (A|B) элементарными преобразованиями строк приводим к ступенчатому виду. Тогда ненулевые строки в левой части расширенной матрицы дают базу суммы L1 + L2, а ненулевые строки в правой части, стоящие напротив нулевых строк из левой части, дают базу L1 L2.
9. Проверить, что поле вещественных чисел R является векторным пространством над полем рациональных чисел Q. Доказать, что квадратные корни 2, 3, 5,... из простых чисел линейно независимы 10. Проверить, что поле Q( 2) = {a + b 2|a, b Q} является векторным пространством над полем рациональных чисел Q. Найти его базис и размерность.
11. Найти максимальное значение определителя третьего порядка, у которого два элемента равны 4, а остальные 1 или 1.
12. Найти сумму всех определителей порядка n, в каждом из которых в каждой строке и в каждом столбце один элемент равен 1, а остальные нулю. Сколько всего таких определителей?
13. Пусть A1,..., An+1 матрицы размера nn. Доказать, что найдутся n+ 1 чисел x1,..., xn+1, не равные нулю одновременно, такие, что матрица x1 A1 +... + xn+1 An+1 вырождена.
14. Какую наибольшую размерность может иметь подпространство линейного пространства матриц n-го порядка, целиком состоящее из вырожденных матриц.
15. Пусть x1,..., xn ненулевые векторы векторного пространства V, A линейное преобразование в V такое, что Ax1 = x1, Axk = xk + xk1 , k = 2,..., n. Доказать, что x1,..., xn линейно независимы.
16. Элементарными преобразованиями строк назовем следующие:
умножение строки на ненулевое число; перестановку строк; прибавление к одной строке другой. Обосновать следующий алгоритм нахождения обратной матрицы к матрице A Mn (F ): Расширенную матрицу (A|E) элементарными преобразованиями строк приводим к виду (E|B), где E единичная матрица. Тогда A1 = B.
17. Пусть |AB| = 0. Доказать, что если E + AB обратима, то E + BA обратима. Можно ли утверждать то же самое, если |AB| = 0?
Глава Группы, кольца, поля В этой главе мы познакомимся с такими основными алгебраическими системами как группы, кольца и поля, и докажем первые важные теоремы об этих системах.
§1. Алгебраическая операция. Алгебраическая система, подсистема, изоморфизм Отображение f : X n X называется n-арной (n-местной) операцией на X, т. е. f n-арная операция, если для любых x1,..., xn X однозначно определен элемент f (x1,..., xn ) X. Пусть на X определены операции fi, i I, имеющие арности ni, i I. Обозначим через = {fi, i I} множество заданных на X операций. Система A = {X; } называется алгебраической системой типа ni, i I, где X основное множество системы, = {fi, i I} операции на X.
2) Z; +, ·, Н.О.Д (a, b, c) ; a, b, c Z система типа 2, 2, 3.
Подмножество B алгебраической системы A = {X; fi, i I} типа ni, i I называется алгебраической подсистемой системы A, если fi (b1,..., bni ) B для любого i I и для всех bj B, j = 1,..., ni.
Алгебраические системы A = {X; fi, i I} типа ni, i I и B = {Y ; gi, i I} такого же типа ni, i I называются изоморфными, если существует такое взаимно однозначное соответствие : X Y, что для любого i I и любых x1,..., xni X справедливо равенство (fi (x1,..., xni )) = gi ((x1 ),..., (xni )).
Алгебраическая система G; типа 2 называется группой если выполнены следующие аксиомы:
(G2) существует e G такой, что a e = e a = a для всех a G;
(G3) для любого a G существует b G такой, что a b = b a = e.
Если при этом также выполняется следующая аксиома:
то группа называется абелевой.
§2. Определение и примеры полугрупп. Теорема об обобщенной ассоциативности Пусть X некоторое множество и f бинарная операция на X. Напомним, что операция f называется ассоциативной, если f (f (x, y), z) = f (x, f (y, z)) для любых x, y, z X.
Аддитивная запись: (x + y) + z = x + (y + z).
Мультипликативная запись: (x · y) · z = x · (y · z).
Алгебраическая система X, f в этом случае называется ассоциативной по f.
Бинарная операция называется коммутативной, если f (x, y) = f (y, x) для любых x, y X (x + y = y + x либо x · y = y · x, в зависимости от формы записи операции). Система X, f в этом случае называется коммутативной (или абелевой) по f.
Элемент e X (0 X) называется единичным (нулевым) относительно операции (соответственно +), если e x = x e = x (0 + x = x + 0 = x) для любого x X. Нетрудно доказать, что единичный элемент единственен:
если e1 другая единица, то e = e e1 = e1. Далее бинарные операции будем записывать, не дублируя форму записи.
Примеры:
• Z; не абелева, не ассоциативная система, так как 2 3 = 3 2, • Mn (F ); + ассоциативно-коммутативная система;
• Mn (F ); · ассоциативная, но не коммутативная система:
Пусть G некоторое множество, бинарная операция на G.
Система G; называется группоидом. Ассоциативный группоид называется полугруппой, т. е. G, полугруппа, если (a b) c = a (b c) для любых a, b, c G. Полугруппа с единицей называется моноидом, т. е. G; · моноид, если (a b) c = a (b c) для любых a, b, c G и существует e G такой, Моноид, состоящий только из обратимых элементов, является группой.
Если ab = ba = e, то элемент b называется обратным к a и обозначается a1 (в аддитивной записи: a). Ясно, что (a1 )1 = a. Нетрудно заметить, что обратный элемент определяется однозначно:
Примеры:
• Пусть M (X) множество всех отображений из X в X, суперпозиция отображений. В силу доказанного в §17, M (X); моноид.
• Пусть S(X) множество всех биективных отображений X на X. Тогда S(X); группа (§17).
X. Нетрудно проверить, что P (X);, P (X); коммутативные полугруппы.
степени n над F. Аксиома (G1) доказана в §17; (G2): A·E = E·A = A для всех A Mn (F ), det(E) = 1 = 0; (G3): det(A) = 0 A1 = det(A) · A GL(n, F ).
• SL(n, F ) = {A : A Mn (F ), det(A) = 1}, · специальная линейная группа степени n над F. (G3): det (A) = 1 det A · A1 = det (A) · det A1 = det (E) A1 SL (n, F ).
• SL (n, Z) SL (n, Q) SL (n, R), GL (n, Q) GL (n, R) цепочка включений групп.
Пусть X; · группоид и x1,..., xn упорядоченная последовательность элементов из X. Обозначим через en число всех возможных элементов X, полученных из x1 ·... · xn различной естественной расстановкой скобок, не меняя порядка самих элементов. Например, e3 = 2 : (x1 · x2 ) · x3, x1 · (x2 · x3 ), если эти элементы различны;
e4 = 5 : ((x1 ·x2 )·x3 )·x4, (x1 · (x2 · x3 )) · x4, x1 · (x2 · (x3 · x4 )), x1 · ((x2 · x3 ) · x4 ), (x1 · x2 ) · (x3 · x4 ), если все эти элементы различны.
Теорема 1 (об обобщенной ассоциативности). Если бинарная операция на X ассоциативна, то en = 1, т. е. результат ее последовательного применения к n элементам множества X не зависит от способа расстановки скобок.
Докажем индукцией по n, что для любой расстановки скобок на x1,..., xn, При n = 1, 2 доказывать нечего. При n = что следует из аксиомы ассоциативности. Пусть для любых k, 3 k < n утверждение справедливо. Тогда по предложению индукции §3. Подгруппы, циклические группы. Порядок элемента и порядок порождённой им циклической Непустое подмножество H группы G называется подгруппой в G, если H группа относительно операции группы G. Обозначается H G.
подгруппа для любых a, b H верно a · b1 H.
Доказательство. Необходимость следует из определения подгруппы.
Обратно, пусть a H. Тогда a · a1 = e H. Поэтому e · b1 = b1 H выполняется:
1) an+m = an · am ; 2) (an )m = an·m.
Доказательство. 1) При n, m > 0 либо n = 0, m Z, m = 0, n Z, пункт 1) следует из (1). При n, m < При n > 0, m < Аналогично рассматривается случай n < 0, m > 0.
2. При m > 0 имеем (an )m = an ·... · an = an·m ; (an )m = e = an·0 = an·m при m = 0, а при m < 0 получаем Предложение 2. Пусть G группа, a G. Тогда a := {ak : k Z} подгруппа в G.
Доказательство. Элемент a a, поэтому a =. Для любых n, m Z имеем an · am = anm a. По предложению 1, a подгруппа в G.
Группа a называется подгруппой в G, порождённой элементом a.
Группа G называется циклической, если существует a G такой, что G = a. Элемент a в этом случае называется порождающим группы G.
Если группа содержит бесконечное число элементов, то она называется бесконечной; в противном случае группа называется конечной, а число её элементов называется порядком группы.
Рассмотрим произвольную группу G и a G. Для элемента a возможны 2 случая:
1) an = am для любых n = m N. В этом случае элемент a называют элементом бесконечного порядка и обозначают |a| := +.
min {n N : an = e}. В этом случае элемент a называют элементом порядка s и обозначают |a| := s.
Теорема 1. Пусть G группа. Тогда 1) для любого a G имеем |a| = | a |;
Доказательство. Если |a| = +, то очевидно, что | a | = +. Пусть |a| = k, тогда по определению все элементы e, a,..., ak1 различны. Далее, для любого m Z имеем m = k · p + q, где 0 q < k. Поэтому Следовательно, a = e, a,..., ak1. Причем, am = aq = e q = 0, т. е.
k/m.
§4. Симметрическая группа. Разложение подстановки на независимые циклы Пусть X множество из n элементов. Множество S(X) всех взаимно однозначных отображений множества X на X относительно операции суперпозиции отображений называется симметрической группой степени n и обозначается через Sn, т. е. Sn = S (X) ;. Для простоты изложения часто полагают X = {1, 2,..., n}. Элементы Sn называются подстановками.
Их принято обозначать строчными греческими буквами, тождественное отображение (или единицу в Sn ) обозначают через id.
Пусть Sn ; (1) = i1,..., (n) = in. Тогда данную подстановку позволяет легко перемножать подстановки:
· (s) = ( (s)) = (is ) = js ; а также находить обратный элемент:
Группа Sn не является коммутативной:
Легко подсчитать, что |Sn | = n!
транспозицией и обозначается через = (ij). Символ i называется действительно перемещаемым для Sn, если (i) = i. Обозначим через D() множество всех действительно перемещаемых символов для, т. е.
Подстановка называется циклом длины k, если где k (i) = i и обозначается = (i1 i2... ik ), где i1 = i, i2 = (i),..., ik = k1 (i), т. е.
Очевидно, что k = id и (i1,..., ik ) = (is,..., ik, i1,..., is1 ) для любого s = 2,..., k.
Предложение 1. Для любой подстановки Sn справедливо:
4) если i D (), то существует k N такое, что Доказательство. 1) Очевидно. 2) Действительно, если i D(), то (i) = i и 1 (i) = i. 3) Следует из 2). 4) В силу свойства 3), существуют s > t > взаимно однозначное отображение, то для любого j i,..., k1 (i) имеем:
Подстановки и называются независимыми, если D () D ( ) =.
Доказательство. Пусть i D () D ( ). Тогда · (i) = ( (i)) = i = Аналогично рассматривается случай i D () и i D ( ). Поэтому для Теорема 1. Каждая не единичная подстановка есть произведение попарно независимых циклов. Это разложение однозначно с точностью до перестановки.
Доказательство. Докажем существование такого разложения. Так как D ( ) =, то, в силу 4) Предложения 1, множество D ( ) можно представить в виде где для любого p, 1 p k, ip, (ip ),..., sp 1 (ip ) различны, sp (ip ) = ip и, при p = q, D ( ) существует единственное p, 1 p k, такое, что i D (p ). Поэтому (i) = 1 ·... · k (i) = p (i). Докажем единственность разложения. Пусть = 1 ·... · k = 1 ·... · m два разложения в произведение попарно независимых циклов. Тогда для любого i D ( ) существуют единственные p и s такие, что i D (p ) и i D (s ). Поэтому (i) = p (i) = s (i) и, в силу свойства 2) Предложения 1, p (i) D (p ) и s (i) D (s ). Поэтому 2 (i) = p (i) = s (i), где p (i) D (p ) и s (i) D (s ). Продолжая так далее, для любого k N имеем k (i) = p (i) = s (i). Следовательно, p = s и 1 ·... · p ·... · k = 1 ·... · s ·... · m. Продолжая этот процесс, за конечное число шагов получим k = m и i = i с точностью до перестановки циклов.
§5. Разложение подстановки в произведение транспозиций, независимость чётности числа Знакопеременная группа, ее порядок Докажем, что любую подстановку можно представить в виде произведения транспозиций.
Лемма 1. Для любой подстановки Sn существуют транспозиции Доказательство. Если = id, то = (12)2. Если = id, то, по теореме §4, представим = 1 ·... · m, где i попарно независимые циклы. Далее, любой цикл (i1 i2... is ) легко представить в виде произведения транспозиций Нетрудно заметить, что представление в виде произведения транспозиций неоднозначно: если Sn, то = (12) · (12) ·.
Пусть id = Sn и = 1 ·... · k разложение в произведение попарно независимых циклов. Число называется декрементом подстановки Sn. Декремент тождественной подстановки по определению полагают равным нулю, то есть N (id) = 0.
Лемма 2. Пусть = 1 ·... · k, где i транспозиции, тогда k N () ( mod 2), то есть чётность числа транспозиций в разложении любой подстановки совпадает с чётностью ее декремента.
Доказательство. Найдём, как меняется декремент подстановки при умножении её на транспозицию. Если = id, то (ij) = (ij)id = (ij) и N ((ij)) = 2 1 = N () + 1. Пусть = id. Разложим в произведение независимых циклов = 1 ·... ·. Подсчитаем N ((ij)). Рассмотрим все возможные случаи:
2) i D () и j D (). Пусть i входит в цикл (ii1... ik ), тогда (ij)(ii1... ik ) = (iji1... ik ). Так как независимые циклы перестановочны, считаем, что i D (1 ). Поэтому N ((ij) ) = N ((iji1... ik ) · 2 ·... · ) = 3) Аналогично рассматривается случай i D () и j D ().
4) i, j D () и входят в один цикл. С точностью до перестановки независимых циклов считаем, что i, j D (1 ). Тогда, если 1 = Случай, когда {i1... ik } =, разбирается аналогично.
5) i, j D () и входят в два различных цикла. С точностью до перестановки, считаем, что i D (1 ) и j D (2 ). Тогда Таким образом, для любой Sn и транспозиции имеем N ( · ) = в произведение транспозиций, тогда Для подстановки Sn число Sg() = (1)N () называется знаком подстановки.
транспозиций, тогда 1) чётность числа k не зависит от способа разложения в произведение транспозиций;
2) Sg() = (1)k ;
Доказательство. 1) В силу леммы 1, чётность числа k совпадает с чётностью декремента. 2) В силу леммы 1, k N () (mod2) Sg() = (1)N () = (1)k.
3) Пусть = 1 ·... · разложение в произведение транспозиций, тогда Sg ( · ) = (1) Подстановка Sn называется чётной, если Sg() = +1 и нечётной, если Sg() = 1.
Теорема 2. An = { Sn : Sg() = +1} является подгруппой в Sn и |An | = n!.
Доказательство. Подстановка id An, так как Sg(id) = +1. Пусть, 1 ·... · 2k разложение в произведение транспозиций. Нетрудно заметить, что 1 = 2k ·... · 1 и 1 An. По предложению 1 из §3, An подгруппа Пусть Bn множество всех нечётных подстановок из Sn. Тогда (12)An := {(12) : An } множество, состоящее из различных нечётных подставок, (12)Bn := {(12) : Bn } множество, состоящее из различных чётных подстановок. Поэтому |An | |Bn | |An |. Следовательно, |An | = |Bn | = 2 |Sn |.
Группа An называется знакопеременной группой.
§6. Теорема о полном развертывании определителя Теорема 1. Для любой A Mn (F ) справедливо равенство Доказательство. В силу теоремы 1 из §1.25, определитель |A| есть полилинейная кососимметрическая нормированная функция D строк матрицы A, т. е. |A| = D(A1,..., An ), где Ai i-строка матрицы A.
Разложим A1,..., An по стандартному базису {e1,..., en } пространства В силу кососимметричности функции D, имеем D(..., ei,..., ei,...) = 0.
Поэтому Найдём число D e(1),..., e(n). Заметим, что, в силу кососимметричности D, для любой транспозиции Sn и для любых различных i1,..., in имеем Разложим в произведение транспозиций: = 1 ·... · k. Тогда D e(1),..., e(n) = D ek (k1 (...1 (1)...)),..., ek (k1 (...1 (n)...)) = D e1 ·...·k1 (1),..., e1 ·...·k1 (n) = (1)2 D e1 ·...·k2 (1),..., e1 ·...·k2 (n) = §7. Изоморфизм групп, теорема Кэли Рассмотрим две группы G и G с операциями и. Отображение f : G G называется гомоморфизмом, если f сохраняет операцию, то есть для любых Гомоморфизм f называется эпиморфизмом, если отображение f сюръективное (отображение на), гомоморфизм f называется изоморфизмом, если отображение f биективно. В этом случае группы G и G называются изоморфными и это обозначается G G.
Простейшие свойства гомоморфизмов. Пусть f : G G гомоморфизм, тогда Действительно, ae = ea = a. Следовательно, f (a)f (e) = f (e)f (a) = f (a), и потому f (e) = e.
2) (f (g))1 = f g 1 для любого g G.
Действительно, 3) Пусть f Действительно, f 1 существует, так как f биективно. Далее, пусть Следовательно, Множество Ker f = {g G : f (g) = e } называется ядром гомоморфизма f :GG.
Доказательство. По свойству 1) e Ker f, следовательно, Ker f =.
Далее, для любых a, b Ker f имеем f a b1 = f (a) f b1 = e (f (b))1 = e, откуда a b1 Ker f. По предложению 1 из §3, Ker f G.
По свойству 1) e Im f, следовательно, Im f =. Для любых a, b Imf существуют a, b G такие, что f (a) = a, f (b) = b. Тогда Докажем, что изоморфизм определяет отношение эквивалентности на множестве всех групп.
1. Для любой группы G имеем G G.
Тождественное отображение id : G G, очевидно, является изоморфизмом.
Если f : G G изоморфизм, то, по свойству 3), f 1 : G изоморфизм.
3. Для любых групп G1, G2, G3 имеем G1 G2, G2 G3 G1 G3.
Если f : G1 G2, f2 : G2 G3 изоморфизмы, то f1 f2 : G1 G биективное отображение и для любых a, b G1 имеем где i операция в группе Gi. Таким образом, f1 f2 : G1 G гомоморфизм и G1 G3.
В силу теоремы 1 из §5, множество всех групп распадается на классы изоморфных групп. С точки зрения алгебры естественно изучать неизоморфные объекты.
Лемма 2. Все циклические группы одного порядка изоморфны.
Доказательство. Пусть G циклическая группа.
1) Пусть G Рассмотрим бесконечную циклическую группу Z = Z; + и отображение : G Z определённое правилом: (an ) = n для любого n Z. Очевидно, что биективно и для любых n, m Z имеем Следовательно, изоморфизм и G Z.
группы порядка n, т. е. G = a, |a| = n; G = b, |b| = n. Пусть : G G такое, что (ak ) = bk для всех 0 k n 1. Тогда биективно и для любых am, ak G имеем am · ak = (ar ), где r остаток от деления m + k на n, (bn )q · br = bnq+r = bm+k = bm · bk = (am ) · ak. Следовательно, G G.
Следующая теорема показывает, что все конечные группы с точностью до изоморфизма являются подгруппами в Sn.
Теорема 1 (Кэли). Любая конечная группа порядка n изоморфна некоторой подгруппе группы Sn.
Доказательство. Пусть G группа порядка n и Sn группа биективных отображений G на G относительно суперпозиции, т. е. Sn = S(G);. Для любого g G определим отображение Tg : G G по правилу Tg (a) = a · g для любого a G.
Докажем, что Tg S(G), т. е. Tg является биективным.
Для любого b G имеем Tg b · g 1 = b · g 1 · g = b Tg сюръективно.
инъективно и Tg S(G).
Так как a · e = a для любого a G, то Te = id. Поэтому Tg Tg1 (a) = Tg1 (Tg (a)) = (a · g) · g 1 = a · e = a = Te (a) для любого g G.
Следовательно, Tg1 = Tg1 для любого g G.
Рассмотрим множество H всех отображений Tg, g G. Докажем, что H = {Tg : g G} Sn. Действительно, id = Te H H =. Далее, для любых Ta, Tb H и c G имеем Следовательно, Ta Tb1 = Ta·b1 H и по предложению 1 из §3 имеем H Sn.
Рассмотрим отображение : G H, определённое по правилу (g) = Tg. Докажем, что изоморфизм. По определению, сюръективно. Пусть (a) = (b) Ta = Tb. Тогда для любого x G справедливо Таким образом, инъективно. Далее, для любых g1, g2 G имеем (g1 · g2 ) = Tg1 ·g2. Для любого x G имеем Tg1 ·g2 (x) = x · (g1 · g2 ) = (x · g1 ) · g2 = (Tg1 Tg2 ) (x) Tg1 ·g2 = Tg1 Tg2. Поэтому (g1 · g2 ) = Tg1 ·g2 = Tg1 Tg2 = (g1 ) (g2 ). Следовательно, изоморфизм и G H.
§8. Смежные классы по подгруппе. Теорема Лагранжа Рассмотрим подгруппу H группы G.
Определение. Множество gH = {gh : h H}, где g G, называется левым смежным классом группы G по подгруппе H, элемент g называют представителем этого класса.
Доказательство. “” Существует k K такой, что g · e = g = g1 · k g1 ·g = k K и аналогично g 1 ·g1 H. Тогда для любого h H существует H K. Аналогично доказываем, что K H. Следовательно, K = H.
Поэтому g1 H = gH.
Следствие 1. Два левых смежных класса G по H либо совпадают, либо не пересекаются.
Теорема 1 (Лагранж). Порядок конечной группы G делится на порядок любой её подгруппы H.
Доказательство. Очевидно, что g gH для любого g G. Поэтому G= gH. В силу следствия 1, можно выбрать все различные смежные что |gi H| = |H|. Действительно, если gi ·h1 = gi ·h2, то h1 = h2. Следовательно, Множество всех различных левых смежных классов обозначается через (G/H)l. Их число называется (левым) индексом H в G и обозначается через (G : H)l.
Таким образом, теорему Лагранжа можно записать следующим образом:
Аналогично определяются правые смежные классы и (G : H)r их правый индекс в G, и доказывается, что Следствие 2. Порядок любого элемента конечной группы делит порядок группы. Группа простого порядка p всегда циклическая.
Доказательство. По теореме 1 §3, имеем |g| = | g | для любого g G.
По теореме Лагранжа |g| делит |G|. Пусть |G| = p и a G, a = e. Тогда |a| Обратное утверждение теоремы Лагранжа в общем случае не верно. В группе A4 нет подгрупп порядка 6 (см. задачи). Но для циклических групп это утверждение верно.
Теорема 2. Всякая подгруппа циклической группы является циклической. В циклической группе порядка n для любого делителя d числа n существует единственная подгруппа порядка d.
Доказательство. Пусть H Z = Z; + и k = min {m H}. Тогда = k·q+r для любого H, при этом 0 r < k. Следовательно, r = q·k H, r = 0, и H = {s · k : s Z} = k бесконечная циклическая группа. Более того, по лемме 2 §7, H Z.
Рассмотрим случай конечной циклической группы Пусть H G и k = min {am H}. Как и в случае бесконечной циклической группы для любого am H имеем m = k · q + r, где 0 r < k.
Тогда т. е. H = ak конечная циклическая группа.
Далее, пусть n = d · m и H = am. Найдем порядок элемента am. Если |am | = s, то am·s = e и n делит m · s, следовательно, s d и |am | = d = |H|.
Рассмотрим произвольную подгруппу K G порядка d. По доказанному K = as, где |as | = d. Имеем as·d = e, т. е. n делит s · d. Таким образом, d·m·l = s·d m·l = s и m делит s. Следовательно, as am = H K H.
Так как |K| = |H| = d, то K = H.
§9. Нормальные подгруппы и фактор-группы Подгруппа H группы G называется нормальной, если gH = Hg для любого g G. Нормальная подгруппа обозначается H G.
Доказательство. Пусть H G. Тогда для любых h H, g G существует Обратно, для любых h H, g G существуют h1, h2 H : g 1 hg = h Поэтому gH = Hg для любого g G.
Отметим, что для любой H G справедливо Действительно, если g 1 Hg H для всех g G, то Определение фактор-группы. Пусть H G. Рассмотрим множество смежных классов Определим операцию на G/H по следующему правилу:
Проверим корректность определения операции. Выберем другие представители в смежных классах g1 H и g2 H. Пусть aH = g1 H, bH = g2 H.
Необходимо доказать, что (a · b) H = (g1 · g2 ) H.
По лемме 1 §8 имеем Так как H Следовательно, по лемме 1 §8, (a · b) H = (g1 · g2 ) H.
Теорема 1. G/H; · является группой.
Доказательство. Для a G обозначим смежный класс aH через a. Тогда, аксиомы группы.
a = a1.