Коэффициенты bi в правых частях уравнений называются
Системой m линейных уравнений с n неизвестными называется система вида
где aij и bi (i=1,…,m; b=1,…,n) – некоторые известные числа, а x1,…,xn – неизвестные. В обозначении коэффициентов aij первый индекс iобозначает номер уравнения, а второй j – номер неизвестного, при котором стоит этот коэффициент.
Коэффициенты при неизвестных будем записывать в виде матрицы , которую назовём матрицей системы.
Числа, стоящие в правых частях уравнений, b1,…,bm называются свободными членами.
Совокупность n чисел c1,…,cn называется решением данной системы, если каждое уравнение системы обращается в равенство после подстановки в него чисел c1,…,cn вместо соответствующих неизвестных x1,…,xn.
Наша задача будет заключаться в нахождении решений системы. При этом могут возникнуть три ситуации:
- Система может иметь единственное решение.
- Система может иметь бесконечное множество решений. Например, . Решением этой системы является любая пара чисел, отличающихся знаком.
- И третий случай, когда система вообще не имеет решения. Например, , если бы решение существовало, то x1 + x2 равнялось бы одновременно нулю и единице.
Система линейных уравнений, имеющая хотя бы одно решение, называется совместной. В противном случае, т.е. если система не имеет решений, то она называется несовместной.
Рассмотрим способы нахождения решений системы.
МАТРИЧНЫЙ МЕТОД РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ
Матрицы дают возможность кратко записать систему линейных уравнений. Пусть дана система из 3-х уравнений с тремя неизвестными:
Рассмотрим матрицу системы и матрицы столбцы неизвестных и свободных членов
т.е. в результате произведения мы получаем левые части уравнений данной системы. Тогда пользуясь определением равенства матриц данную систему можно записать в виде
или короче A∙X=B.
Здесь матрицы A и B известны, а матрица X неизвестна. Её и нужно найти, т.к. её элементы являются решением данной системы. Это уравнение называют матричным уравнением.
Пусть определитель матрицы отличен от нуля |A| ≠ 0. Тогда матричное уравнение решается следующим образом. Умножим обе части уравнения слева на матрицу A -1 , обратную матрице A: . Поскольку A -1 A = E и E∙X = X, то получаем решение матричного уравнения в виде X = A -1 B.
Заметим, что поскольку обратную матрицу можно найти только для квадратных матриц, то матричным методом можно решать только те системы, в которых число уравнений совпадает с числом неизвестных. Однако, матричная запись системы возможна и в случае, когда число уравнений не равно числу неизвестных, тогда матрица A не будет квадратной и поэтому нельзя найти решение системы в виде X = A -1 B.
Примеры. Решить системы уравнений.
Найдем матрицу обратную матрице A.
,
Таким образом, x = 3, y = – 1.
Решите матричное уравнение: XA+B=C, где
Выразим искомую матрицу X из заданного уравнения.
Найдем матрицу А -1 .
Решите матричное уравнение AX+B=C, где
Из уравнения получаем .
Следовательно,
Рассмотрим систему 3-х линейных уравнений с тремя неизвестными:
Определитель третьего порядка, соответствующий матрице системы, т.е. составленный из коэффициентов при неизвестных,
называется определителем системы.
Составим ещё три определителя следующим образом: заменим в определителе D последовательно 1, 2 и 3 столбцы столбцом свободных членов
Тогда можно доказать следующий результат.
Теорема (правило Крамера). Если определитель системы Δ ≠ 0, то рассматриваемая система имеет одно и только одно решение, причём
Доказательство. Итак, рассмотрим систему 3-х уравнений с тремя неизвестными. Умножим 1-ое уравнение системы на алгебраическое дополнение A11 элемента a11, 2-ое уравнение – на A21 и 3-е – на A31:
Сложим эти уравнения:
Рассмотрим каждую из скобок и правую часть этого уравнения. По теореме о разложении определителя по элементам 1-го столбца
.
Далее рассмотрим коэффициенты при x2:
Аналогично можно показать, что и .
Наконец несложно заметить, что
Таким образом, получаем равенство: .
Следовательно, .
Аналогично выводятся равенства и , откуда и следует утверждение теоремы.
Таким образом, заметим, что если определитель системы Δ ≠ 0, то система имеет единственное решение и обратно. Если же определитель системы равен нулю, то система либо имеет бесконечное множество решений, либо не имеет решений, т.е. несовместна.
Примеры. Решить систему уравнений
Решите систему уравнений при различных значениях параметра p:
Система имеет единственное решение, если Δ ≠ 0.
. Поэтому .
- При
- При p = 30 получаем систему уравнений которая не имеет решений.
- При p = –30 система принимает вид и, следовательно, имеет бесконечное множество решений x=y,y Î R.
Ранее рассмотренные методы можно применять при решении только тех систем, в которых число уравнений совпадает с числом неизвестных, причём определитель системы должен быть отличен от нуля. Метод Гаусса является более универсальным и пригоден для систем с любым числом уравнений. Он заключается в последовательном исключении неизвестных из уравнений системы.
Вновь рассмотрим систему из трёх уравнений с тремя неизвестными:
.
Первое уравнение оставим без изменения, а из 2-го и 3-го исключим слагаемые, содержащие x1. Для этого второе уравнение разделим на а21 и умножим на –а11, а затем сложим с 1-ым уравнением. Аналогично третье уравнение разделим на а31 и умножим на –а11, а затем сложим с первым. В результате исходная система примет вид:
Теперь из последнего уравнения исключим слагаемое, содержащее x2. Для этого третье уравнение разделим на , умножим на и сложим со вторым. Тогда будем иметь систему уравнений:
Отсюда из последнего уравнения легко найти x3, затем из 2-го уравнения x2 и, наконец, из 1-го – x1.
При использовании метода Гаусса уравнения при необходимости можно менять местами.
Часто вместо того, чтобы писать новую систему уравнений, ограничиваются тем, что выписывают расширенную матрицу системы:
и затем приводят её к треугольному или диагональному виду с помощью элементарных преобразований.
К элементарным преобразованиям матрицы относятся следующие преобразования:
- перестановка строк или столбцов;
- умножение строки на число, отличное от нуля;
- прибавление к одной строке другие строки.
Примеры: Решить системы уравнений методом Гаусса.
Вернувшись к системе уравнений, будем иметь
Выпишем расширенную матрицу системы и сведем ее к треугольному виду.
Вернувшись к системе уравнений, несложно заметить, что третье уравнения системы будет ложным, а значит, система решений не имеет.
Разделим вторую строку матрицы на 2 и поменяем местами первый и третий столбики. Тогда первый столбец будет соответствовать коэффициентам при неизвестной z, а третий – при x.
Вернемся к системе уравнений.
Из третьего уравнения выразим одну неизвестную через другую и подставим в первое.
Таким образом, система имеет бесконечное множество решений.
VMath
Инструменты сайта
Основное
Навигация
Информация
Действия
Содержание
Системы линейных уравнений
Обозначим через $ \mathbb A_<> $ любое из множеств $ \mathbb Q_<>, \mathbb R_<> $ или $ \mathbb C_<> $.
Примеры систем уравнений над $ \mathbb R $.
Относительно числа $ m_<> $ уравнений не делается ни какого предположения: оно может быть меньше, больше или равно числу переменных $ n_<> $. Если $ m_<>>n $ то система называется переопределенной. Решением системы уравнений называется любой набор значений переменных $ x_1=\alpha_<1>,\dots, x_n = \alpha_n $, обращающий каждое из уравнений в истинное равенство. Система называется совместной если она имеет хотя бы одно решение и несовместной в противном случае.
Можно доказать (см. результаты ☟ НИЖЕ ), что все возможности для произвольной системы ограничиваются следующими вариантами:
1. система совместна и имеет единственное решение;
2. cистема совместна и имеет бесконечное множество решений;
3. cистема несовместна.
При этом все решения будут находиться в том же множестве $ \mathbb A_<> $, что и коэффициенты системы.
Матричная форма записи
Для системы линейных уравнений относительно переменных $ x_1,x_2,\dots,x_n $ $$ \left\< \begin
Исключение переменных (метод Гаусса)
метода достаточно проста.
Пример. Решить систему уравнений $$ \left\< \begin
Решение. Выразим из первого уравнения $ x_ <1>$ $$ x_1=\frac<3> <2>x_2+\frac<1> <2>x_3 + \frac<3> <2>$$ и подставим в оставшиеся уравнения $$ 4 \left(\frac<3> <2>x_2+\frac<1> <2>x_3 + \frac<3><2>\right) -3\,x_2-5\,x_3=6 \ <\color
Ответ. $ x_<1>=1/4, x_2=-5/8, x_3=-5/8 $.
Теперь осталось формализовать изложенную идею метода (сформулировав допустимые правила действия над уравнениями — те, что в принципе, очевидны из здравого смысла ), а также исследовать возможные последствия его применения к системам общего вида.
Исключение переменных
Элементарными преобразованиями системы л.у. называются преобразования следующих трех типов:
1. перестановка двух уравнений;
2. умножение обеих частей уравнения на любое отличное от нуля число;
3. прибавление к одному уравнению любого другого, умноженного на произвольное число: пара уравнений $$ \begin
Теорема. Любое элементарное преобразование системы л.у. переводит эту систему в ей эквивалентную, т.е. имеющую то же множество решений, что и исходная.
Задача. С помощью элементарных преобразований привести систему л.у. к наиболее простому виду: такому, из которого легко было бы установить множество решений.
Предположим, что первое уравнение системы содержит явно неизвестную $ x_ <1>$, т.е. $ a_<11>^<> \ne 0 $. Исключим эту неизвестную из всех оставшихся уравнений. С этой целью вычтем из второго уравнения первое, домноженное на $ a_<21>/a_<11>^<> $. Получим $$\left(a_<22>— \frac
Понятно, что процесс исключения может быть продолжен и далее. Теперь посмотрим, где он может прерваться. Может так случиться, что очередная, $ \ell_<> $-я подсистема имеет коэффициент $ a_<\ell \ell>^ <[\ell-1]>$ равным нулю, что не позволит алгоритму идти дальше — т.е. исключить переменную $ x_<\ell>^<> $ из оставшихся уравнений (в принципе, такое могло случиться уже на первом шаге, если бы коэффициент $ a_<11>^<> $ был бы равен нулю). Возможные варианты дальнейших действий:
1. если хотя бы один коэффициент при $ x_<\ell>^<> $ в одном из оставшихся уравнений отличен от нуля: $ a_
2. если при всех $ j\ge \ell^<> $ коэффициенты $ a_
Поскольку число переменных конечно, то алгоритм исключения должен завершиться за конечное число шагов. Чем он может завершиться? Окончательная система должна иметь вид: $$ \left\< \begin
Предположение . Мы будем считать, что каждое из первых $ <\mathfrak r>_<> $ уравнений системы содержит в своей левой части хотя бы одну переменную с ненулевым коэффициентом.
Процесс получения системы такого вида из исходной системы уравнений называется прямым ходом метода Гаусса.
Исторический комментарий о Гауссе ☞ ЗДЕСЬ.
Установление множества решений
Теорема. Если хотя бы одно из чисел $ b_<<\mathfrak r>+1>^<[<\mathfrak r>-1]>,\dots , b_
Для простоты мы будем иллюстрировать наши рассуждения на системах л.у. над $ \mathbb R_<> $, в этом же множестве искать решения. Каждое из преобразований метода Гаусса будем обозначать $ \to_<> $.
Пример. Решить систему л.у.
$$ \left\< \begin
Решение. $$ \ \to \ \left\< \begin
Ответ. Система несовместна.
Пусть теперь $ b_<<\mathfrak r>+1>^<[<\mathfrak r>-1]>=0,<>\dots, b_
Теорема. Если прямой ход метода Гаусса заканчивается треугольной системой, т.е. $ \mathfrak r = n_<> $ и $ b_<<\mathfrak r>+1>^<[<\mathfrak r>-1]>=0,<>\dots, b_
Пример. Решить систему л.у.
$$ \left\< \begin
Ответ. $ x_1=1,\, x_<2>=2,\, x_3=-2 $ .
Исследуем теперь случай $ <\mathfrak r>1) : На основании предположения , в $ <\mathfrak r>$-м уравнении этой системы имеется хотя бы один ненулевой коэффициент в левой части, пусть $ a_ <<\mathfrak r><\mathfrak s>>^<[<\mathfrak r>-1]>\ne 0 $ — первый из них. Если $ <\mathfrak s>=n $, то из этого уравнения однозначно определится $ x_
Теорема. Если прямой ход метода Гаусса заканчивается трапециевидной системой, т.е. $ \mathfrak r 2) матрицы $ A_<> $ (третьего порядка). Понятие определителя распространяется и на квадратные матрицы бóльших порядков; образно говоря, определитель — это функция элементов матрицы, отвечающая за единственность решения системы уравнений.
Дальнейший матричный анализ метода Гаусса ☞ ЗДЕСЬ.
Формулы Крамера
Рассмотрим систему линейных уравнений с квадратной матрицей $ A_<> $, т.е. такую, у которой число уравнений совпадает с числом неизвестных.
Теорема. Cистема
$$ \left\<\begin
Доказательство ☞ ЗДЕСЬ
Пример. Решить систему уравнений
$$ \left\<\begin
Решение. $$ x_1=\frac<\left|\begin
Решение системы линейных уравнений с квадратной матрицей $ A_<> $ является непрерывной функцией коэффициентов этой системы при условии, что $ \det A_<> \ne 0 $.
Кроме того, формулы Крамера начинают конкурировать по вычислительной эффективности с методом Гаусса в случае систем, зависящих от параметра. Подробнее ☞ ЗДЕСЬ.
Еще один способ решения системы основан на построении обратной матрицы: $$ AX= <\mathcal B>\quad \Rightarrow \quad X=A^<-1> <\mathcal B>\ . $$ Этот способ малоэффективен при фиксированных числовых $ A_<> $ и $ <\mathcal B>_<> $.
Найти достаточное условие существования общего решения систем уравнений:
$$ A_1 X = <\mathcal B>_1 \quad u \quad A_2 Y = <\mathcal B>_2 \ , $$ при квадратных матрицах $ A_1 $ и $ A_2 $ одинакового порядка.
Теорема Кронекера-Капелли
Матрица, получающаяся конкатенацией матрицы $ A_<> $ и столбца правых частей $ <\mathcal B>_<> $ $$ [ A| <\mathcal B>] = \left( \begin
Теорема [Кронекер, Капелли]. Система $ AX= <\mathcal B>$ совместна тогда и только тогда, когда ранг матрицы этой системы совпадает с рангом ее расширенной матрицы:
$$ \operatorname
Доказательство необходимости. Пусть существует решение $ x_1=\alpha_1,\dots,x_n=\alpha_n $ системы, тогда $$\alpha_1 A_<[1]>+\dots+\alpha_n A_<[n]>= <\mathcal B>\ ,$$ т.е. столбец $ <\mathcal B>$ линейно выражается через столбцы $ A_<[1]>,\dots,A_ <[n]>$. Но тогда $$ \operatorname
Доказательство достаточности проводится в следующем пункте. ♦
Пример. Исследовать совместность системы уравнений
Решение. В этом примере число уравнений совпадает с числом неизвестных. Это обстоятельство несколько облегчает рассуждения. Обратимся к замечанию из предыдущего пункта: система л.у. с числом уравнений, совпадающем с числом неизвестных, как правило, совместна. Тогда попробуем установить условия, обеспечивающие противоположное свойство — несовместность. Оно, фактически, единственно: за все отвечает определитель системы $ \det A_<> $. Если он отличен от нуля — система совместна. $$\det A = \left| \begin
Осталось исследовать критические случаи: $ <\color
При $ <\color
Ответ. Система несовместна при $ <\color
Система однородных уравнений
$$ \left\< \begin
Пример. Найти условие, при котором три точки плоскости с координатами $ (x_1,y_1), (x_2,y_2) $ и $ (x_3,y_<3>) $ лежат на одной прямой.
Решение. Будем искать уравнение прямой в виде $ ax+by+c=0 $ при неопределенных коэффициентах $ a,b,c_<> $. Если точки лежат на прямой, то получаем для определения этих коэффициентов систему линейных уравнений: $$ \left\< \begin
Доказать, что для совместности системы
$$ \left\< \begin
An elementary treatise on determinants
в следующей формулировке.
Теорема. Для того чтобы система $ n_<> $ неоднородных уравнений была совместна, необходимо и достаточно, чтобы порядок наибольшего отличного от нуля минора был одинаков в расширенной и нерасширенной матрице системы.
Додсон — один из самых знаменитых математиков мира. Назовите его псевдоним.
Ответ ☞ ЗДЕСЬ
Общее решение
Пусть выполнено условие теоремы Кронекера-Капелли: $ \operatorname
Пусть теперь $ \mathfrak
Пример. Исследовать совместность и найти общее решение системы уравнений:
Решение проведем двумя способами, соответствующими двум способам вычисления ранга матрицы. Вычисляем сначала ранг матрицы $ A $ по методу окаймляющих миноров: $$ |2| \ne 0,\quad \left| \begin
Ненулевой минор третьего порядка (базисный минор) находится в первой, второй и четвертых строках, что означает линейную независимость соответствующих уравнений. Третье уравнение линейно зависит от остальных, и может быть отброшено. Далее, указанный базисный минор образован коэффициентами при $ x_1,x_3 $ и $ x_4 $. Следовательно оставшиеся уравнения могут быть разрешены относительно этих переменных, т.е. они — зависимые, а $ x_2 $ и $ x_5 $ — основные. Использование формулы дает общее решение $$ \begin
Ответ. Общее решение системы: $ x_1=1/2 (x_2+x_5-1),\ x_3=3-4\,x_5,\ x_4=0 $.
Проанализируем теперь полученные общие формулы для общего решения. В этих формулах $ \beta_j $ представляет решение системы, получаемое при $ x_<\mathfrak
Вывод. Формула общего решения системы $ A X=\mathcal B $: $$ x_j=\beta_j + \gamma_
Теорема. Общее решение системы уравнений $ A X=\mathcal B $ представимо в виде суммы какого-то частного решения этой системы и общего решения соответствующей однородной системы $ A X=\mathbb O $.
Доказательство тривиально если система $ A X=\mathcal B $ имеет единственное решение. Если же решений бесконечно много, то выбрав какое-то одно частное $ X=X_1 $ мы получаем, что любое другое частное решение $ X=X_2 $ должно быть связано с первым соотношением $$ A(X_2-X_1)=\mathbb O , $$ т.е. разность частных решений неоднородной системы обязательно является решением однородной системы уравнений $ AX=\mathbb O $. ♦
Теперь посмотрим как можно описать общее решение однородной системы.
Система однородных уравнений
Система линейных уравнений называется однородной, если все коэффициенты правых частей равны нулю: $$ \left\< \begin
Задача ставится о поиске нетривиального решения. Оно не всегда существует. Так, к примеру, если матрица $ A_<> $ системы — квадратная и имеет ненулевой определитель, то, согласно теореме Крамера, нетривиальных решений у однородной системы нет. Теорема Кронекера-Капелли утверждает, что условие $ \det (A_<>) = 0 $ является и достаточным для существования нетривиального решения.
Теорема 1. Для того, чтобы система однородных уравнений с квадратной матрицей $ A_<> $ имела нетривиальное решение необходимо и достаточно, чтобы $ \det (A_<>) = 0 $.
Для произвольной (не обязательно квадратной) матрицы $ A_<> $ имеет место следующий общий результат.
Теорема 2. Если $ \operatorname
Теорема 3. Множество решений системы однородных уравнений образует линейное подпространство пространства $ \mathbb A^
Пусть матрица системы $ AX=\mathbb O $ квадратная и
$$ \operatorname
Теперь обсудим способы нахождения ФСР.
1. Первый из них получается из общего метода решения системы линейных уравнений, рассмотренного в предыдущем пункте. Так же, как и в том пункте, сделаем упрощающее обозначения предположение, что зависимыми переменными являются первые $ x_<1>,\dots,x_ <\mathfrak r>$, т.е. общее решение задается формулами $$ x_j=\gamma_
Оформим этот способ построения ФСР в теорему:
Теорема 4. Если система уравнений $ AX=\mathbb O $ имеет структуру матрицы $ A_<> $ вида:
$$ A = \left[ E_ <\mathfrak r>\mid P_ <\mathfrak r \times (n-\mathfrak r)>\right] \ , $$ то ее ФСР состоит из столбцов матрицы $$ \left[ \begin
Пример. Найти ФСР для системы уравнений
Решение. Приводим систему к трапециевидному виду: $$ \left\< \begin
2. Этот способ напоминает вычисление обратной матрицы методом приписывания единичной матрицы. Транспонируем матрицу $ A_<> $ системы и припишем к ней справа единичную матрицу порядка $ n_<> $: $$ \left[ A^ <\top>| E_n \right] = \left(\begin
Пример. Найти ФСР для системы уравнений
$$ \left\< \begin
$$ \left(\begin
3. Еще один способ построения ФСР основан на теореме Гамильтона-Кэли.
Теорема. Пусть матрица системы $ AX=\mathbb O $ квадратная и $ \operatorname
Пример. Найти ФСР для системы уравнений
Решение. Здесь $$ A= \left( \begin
Блок-схемы зависимости множества решений системы уравнений $ AX= \mathcal B $ от комбинации чисел $ n, \mathfrak r $ ☞ ЗДЕСЬ.
Геометрическая интерпретация
Геометрический смысл введенных определений поясним на примере $ \mathbb R^ <3>$. Уравнение $$ a_1x_1+a_2x_2+a_3x_3=b $$ — при фиксированных вещественных коэффициентах $ a_1,a_2,a_3 $ (хотя бы один из них считаем отличным от нуля) и $ b_<> $ — задает плоскость. Если, к примеру, $ a_1\ne 0 $, то из уравнения получаем выражение для $ x_ <1>$ как функции $ x_2,x_3 $: $$ x_1=\frac
Теорема. Общее решение системы уравнений $ A X=\mathcal B $ представимо в виде суммы какого-то частного решения этой системы и общего решения соответствующей однородной системы $ A X=\mathbb O $.
Координаты произвольной точки плоскости $ a_1x_1+a_2x_2+a_3x_3=0 $ задаются соотношениями $$ \left( \begin
Теперь рассмотрим систему из двух уравнений: $$ \left\<\begin
Мы рассмотрели пока только случай пересекающихся плоскостей в пространстве. Его можно считать общим, т.е. случаем «как правило»: две случайным образом выбранные плоскости в $ \mathbb R^ <3>$ пересекаться будут. Исследуем теперь исключительный случай — параллельности плоскостей. Исключительность этого случая может быть проверена и аналитикой. Для несовместности системы из двух уравнений необходимо, чтобы ранг ее матрицы $$ \left( \begin
Перейдем теперь к системе из трех уравнений: $$ \left\< \begin
Теорема Кронекера-Капелли в этом случае не нужна — нет, она остается справедливой! — но проверка условия на ранги матриц тривиальна: они оба равны $ 3_<> $. Если же указанный определитель обращается в нуль, то этот факт эквивалентен тому, что три строки определителя линейно зависимы. Например, возможно, что строка $ (a_<31>,a_<32>, a_<33>) $ может быть представлена в виде линейной комбинации первых двух строк. Вспомним геометрический смысл этих строк: они задают координаты векторов, перпендикулярных соответствующим плоскостям. Если система уравнений $$ \left\<\begin
Статья не закончена!
Ортогональность
Геометрические соображения из предыдущего пункта могут быть обобщены на случай когда размерности рассматриваемых пространств увеличиваются, и мы говорим о точках и векторах многомерных пространств. В последующих пунктах нам потребуются понятия линейной оболочки, линейного пространства, размерности, базиса и координат применительно к векторам-столбцам или векторам-строкам. Их можно найти ☞ ЗДЕСЬ.
Задача решения системы линейных уравнений $$ \left\< \begin
С другой стороны, к той же задаче решения системы уравнений, в предыдущем ПУНКТЕ мы подошли с другой стороны. Первое из уравнений системы $$ 3\,x_1+4\,x_2-x_3=2 $$ можно интерпретировать так: скалярное произведение векторов $ \vec<<\mathbf OA>^<[1]>> $ и $ \vec<<\mathbf OX>> $ равно фиксированному числу $ 2_<> $. Здесь вектора рассматриваются в пространстве строк $ \mathbb R_<>^ <3>$; считается, что каждый вектор имеет начало в начале координат $ \mathbf O=[0,0,0] $, а конец — в точке с координатами $ [3,4,-1] $ или, соответственно, $ [x_1,x_2,x_3] $. Если скалярное произведение векторов обозначать скобками $ \langle <> \mbox < >\rangle $, то систему уравнений можно переписать в виде $$ \langle \vec<<\mathbf OA>^<[1]>> ,\ \vec<<\mathbf OX>> \rangle=2,\ \langle \vec<<\mathbf OA>^<[2]>> ,\ \vec<<\mathbf OX>> \rangle=1 \quad npu \quad A^ <[1]>= [3,4,-1], A^<[2]>=[1,-2,3] $$ — строках матрицы $ A_<> $. И задачу решения такой системы понимать в смысле: найти координаты всех векторов-строк $ [x_1,x_2,x_3] $ которые обеспечат нам заданные значения скалярных произведений с двумя фиксированными векторами.
Геометрическая интерпретация еще более упрощается если рассмотреть случай однородной системы уравнений. Так, решить систему уравнений $$ \left\< \begin
Все эти геометрические соображения обобщаются в произвольное пространство $ \mathbb R_<>^
В терминах скалярного произведения, задачу решения системы линейных уравнений можно переформулировать как поиск строки $ X=[x_1,x_2,\dots,x_n] $, ортогональной всем строкам матрицы $ A_<> $: $$ \langle A^<[1]>,X \rangle=0, \langle A^<[2]>,X \rangle=0,\dots, \langle A^<[m]>,X \rangle=0 \ . $$ Множество таких строк образует линейное подпространство пространства $ \mathbb R_<>^
Теорема. $ \operatorname
Системы линейных уравнений
Глава 5. Системы линейных уравнений
Определение. Матрицей называется прямоугольная таблица, составленная из чисел.
Числа, записанные в матрице, называются её элементами. При этом они могут быть как действительными, так и комплексными. Пример:
A =.
Наша матрица A состоит из 3 строк и 4 столбцов. Будем записывать это так, что (3, 4) − размер матрицы A (иногда пишут 3×4, но × легко перепутать с x, особливо в рукописном тексте). Вообще, если в матрице s строк и n столбцов, то её размером считается запись (s, n). Матрицу обрамляют круглыми скобками: (). В литературе вы можете встретить другие обозначения: || || или []. Если s = n, то матрица называется квадратною. Матрицу размера (n, n) называют также квадратною матрицею n—го порядка.
Если надобно записать матрицу в общем (буквенном) виде, то пишут так:
A =.
Это матрица размера (s, n), каждый её элемент обозначен одной и той же буквою − обыкновенно (хотя и не обязательно) это та же буква, которая обозначает самоё матрицу, но строчная. Эта буква снабжена двойными индексами: a11 − это не ‘a одиннадцать’, а ‘a один-один’. Первый индекс означает номер строки, в которой стоит данный элемент, второй − номер столбца. Разделителей между индексами обыкновенно не пишут, доколе это не может привести к неопределённости; к примеру, запись a211 непонятна: не то это a2,11, не то a21,1. В этом случае разделитель обязателен (здесь это запятая).
Среди всех матриц выделим матрицы, состоящие из одного столбца, т. е. размера (s, 1):
.
Такую матрицу назовём матрицей—столбцом, или вектор—столбцом. Аналогично матрицу вида
размера (1, n) назовём матрицей—строкой, или вектор—строкой.
5.1.2. Ступенчатая матрица
Определение 1. Строка матрицы называется нулевой строкой, если она состоит из одних нулей.
Определение 2. Главным элементом какой-либо ненулевой строки данной матрицы называется первый ненулевой элемент этой строки, считая слева направо.
Нулевая строка не имеет главного элемента, все остальные строки имеют однозначно определённый главный элемент. В любой матрице число главных элементов равно числу ненулевых строк.
Определение 3. Матрица называется ступенчатой, если для любых двух её последовательных строк выполняется одно из двух условий:
1) вторая строка состоит из одних нулей (нулевая строка);
2) обе строки ненулевые, и при этом главный элемент первой строки расположен строго левее главного элемента второй строки.
Из этого определения легко понять, что нулевые строки концентрируются в конце (внизу) матрицы, составляя нулевой блок (блок нулевых строк). В самом деле, если какая-либо строка нулевая, то в силу первой части определения все последующие строки также нулевые. Впрочем, нулевых строк может и вовсе не быть.
Определение 4. Матрица называется главной ступенчатой, если она является ступенчатой и сверх того
3) все главные элементы равны единице;
4) выше главных единиц (в тех же столбцах) стоят одни нули.
Из определения ясно, что каждый главный столбец главной ступенчатой матрицы устроен так, что в одной позиции стоит 1, а в остальных позициях − нули. (Ниже 1 стоят нули из-за того, что матрица является ступенчатой.) При этом номер позиции (строки), в которой стоит 1, равен номеру этого столбца в череде главных столбцов.
5.1.3. Элементарные преобразования
Определение 1. Элементарным преобразованием первого типа над строками какой-либо матрицы называется перестановка местами двух произвольных строк этой матрицы.
Определение 2. Элементарным преобразованием второго типа называется умножение произвольной строки данной матрицы на какое-либо число, не равное 0.
Определение 3. Элементарным преобразованием третьего типа называется прибавление к какой-либо строке данной матрицы другой строки, умноженной предварительно на любое число[1].
5.1.4. Теорема C. F. Gauss’а[2]
Теорема (C. F. Gauss’а). Любую матрицу с помощью нескольких элементарных преобразований над строками можно привести к главному ступенчатому виду.
Доказательство. Будем рассматривать матрицы размера (s, n). Обозначим через N сумму числа строк и столбцов: N = s + n. Доказательство поведём индукцией по этому параметру N. Наименьшее возможное значение N равно 2 (для матриц размера (1, 1)).
Основание (база) индукции. Пусть наша матрица A имеет размер (1, 1). Тогда A = = (a11). Если a11 = 0, то матрица уже главная ступенчатая. Если же нет, то разделим (единственную) строку матрицы A на a11, получим матрицу (1), которая уже является главной ступенчатой.
Индуктивный переход. Пусть теорема C. F. Gauss’а справедлива для любой матрицы, у которой s + n 1 вычтем из i-й строки матрицы D её первую строку, предварительно умножив её на число di1. После этой серии элементарных преобразований в новой матрице E все элементы первого столбца, кроме первого, станут равными нулю. Обозначим через F матрицу, получающуюся из E вычёркиванием первой строки и первого столбца. Её размеры меньше размеров матрицы A, и поэтому её можно привести к главному ступенчатому виду G с помощью серии элементарных преобразований над её строками, что равносильно совершению таких же элементарных преобразований над матрицей E. Пусть матрица E привелась таким образом к матрице H. Матрица H уже ступенчатая, но не обязательно главная ступенчатая. Возьмём какой-нибудь главный столбец матрицы G. Пусть главная единица нашего столбца стоит в k-й строке и l-м столбце матрицы H.
Вычтем из первой строки матрицы H её k-ю строку, умноженную предварительно на число h1l, и первый элемент нашего столбца обнулится. Важно, что при этом никак не затрагивается первый столбец, − он остаётся неизменным. Произведём указанную операцию с каждым главным столбцом матрицы G. Ясно, что новая матрица уже будет главной ступенчатой. Теорема доказана.
5.1.5. Обратимость элементарных преобразований
Предложение. Если над матрицей A совершено элементарное преобразование какого-либо типа, приводящее её к матрице B, то существует элементарное преобразование того же типа, приводящее матрицу B снова к матрице A.
Доказательство. Это очевидно для преобразований первого и второго типов. В самом деле, если мы совершили перестановку строк, то вторичная перестановка тех же строк вернёт нас к исходной матрице. Если мы умножили некоторую строку на ненулевое число, то умножение той же строки на обратное число вернёт нас к исходной матрице. Допустим теперь, что в данной матрице A мы прибавили к i-й строке j-ю строку (i ≠ j), предварительно умноженную на число α, и таким образом пришли к матрице B. Утверждаю, что можно вернуться к матрице A, если прибавить к i-й строке матрицы B её j-ю строку, предварительно умноженную на число −α. Так как при обоих преобразованиях все строки, кроме i-й, вообще не менялись, то достаточно посмотреть, что произойдёт с каким-нибудь элементом bik матрицы B. Вычисляем:
т. е. мы вернулись к матрице A, QED.
§ 5.2. Системы линейных уравнений
5.2.1. Основные определения
Определение 1. Система уравнений вида
называется системой линейных алгебраических уравнений с неизвестными x1, x2, …, xn.
Числа aij называются коэффициентами системы, bi − её свободными членами.
Определение 2. Решением системы (1) называется такой набор чисел что при подстановке этих чисел в левые части системы (1) вместо соответствующих неизвестных система (1) обратится в систему верных числовых равенств.
Определение 3. Решить систему (1) − значит найти все её решения (множество всех решений).
Определение 4. Система (1) называется совместною, если она имеет хотя бы одно решение (множество всех решений непусто), и несовместною в противном случае, т. е. если она не имеет решений (множество всех решений пусто).
Определение 5. Система (1) называется определённою, если она имеет ровно одно решение, и неопределённою, если имеет более одного решения.
Мы очень скоро увидим, что неопределённая система имеет бесконечно много решений.
5.2.2. Элементарные преобразования над системами уравнений
Определение 1. Элементарным преобразованием первого типа над системой уравнений называется перестановка местами двух произвольных уравнений системы.
Определение 2. Элементарным преобразованием второго типа называется умножение любого уравнения системы на какое-либо число, не равное 0.
Определение 3. Элементарным преобразованием третьего типа называется прибавление к какому-либо уравнению другого уравнения, умноженного предварительно на любое число[3].
Каждой системе уравнений вида (1) можно поставить в соответствие две матрицы: матрицу системы и расширенную матрицу системы.
Определение 4. Матрицей системы уравнений (1) называется матрица, составленная из коэффициентов системы:
Определение 5. Расширенной матрицей системы уравнений (1) называется матрица, составленная из коэффициентов системы и свободных членов:
Иногда в расширенной матрице отделяют столбец свободных членов вертикальной чертой (сплошной или прерывистой), но это не обязательно. Ясно, что матрица системы не даёт полной информации о системе в отличие от расширенной матрицы, по которой можно однозначно восстановить систему уравнений, если только мы знаем список неизвестных (буквы, которыми были обозначены неизвестные). Впрочем, последнее не так существенно, потому что ведь мы в первую очередь интересуемся решениями, а каждое решение представляет собою просто набор чисел без обозначений неизвестных.
Определение 6. Пусть даны две системы уравнений относительно одного и того же набора неизвестных x1, x2, …, xn. Говорят, что система (2) является следствием системы (1), если каждое решение системы (1) является решением системы (2).
Другими словами, множество всех решений системы (1) есть подмножество (часть) множества всех решений системы (2).
Определение 7. Две системы уравнений относительно одного и того же набора неизвестных x1, x2, …, xn называются эквивалентными, или равносильными, если множества их решений совпадают, или, что то же, каждая из них является следствием другой.
Иными словами, две системы эквивалентны тогда и только тогда, когда каждое решение первой системы является решением второй и, наоборот, каждое решение второй системы является решением первой.
Предложение. При совершении одного элементарного преобразования система уравнений переходит в эквивалентную систему.
Доказательство. Достаточно доказать, что вторая система является следствием первой. Действительно, предположив, что это уже доказано, совершим обратное элементарное преобразование, которое вернёт нас к исходной системе (см. п. 5.1.5). По доказанному первая система тогда будет следствием второй, и всё доказано.
Докажем, что вторая система является следствием первой. Для преобразований первых двух типов это совершенно очевидно. Совершим преобразование третьего типа, прибавив к i-й строке j-ю строку, умноженную предварительно на число α. При этом изменится только i-е уравнение, поэтому я здесь выпишу только его:
Пусть − какое-либо решение исходной (первой) системы. Тогда по определению понятия решения выполняются числовые равенства:
Если подставить наше решение в новую систему, то все равенства, кроме i-го, будут выглядеть точно так же и поэтому выполняются. i-е же равенство будет выглядеть так:
Чтобы убедиться, что оно тоже выполняется, достаточно взять i-е равенство системы (1*) верных числовых равенств и прибавить к нему j-е равенство той же системы, предварительно умножив его на α. Предложение доказано.
5.2.3. Теорема C. F. Gauss’а (о системах линейных уравнений)
Лемма. Если в системе линейных уравнений совершить одно элементарное преобразование, то расширенная матрица новой системы может быть получена из расширенной матрицы старой системы с помощью совершения аналогичного (точно такого же, я буду говорить одноимённого) преобразования.
Доказательство: это очевидно.
Следствие. Если в расширенной матрице A системы линейных уравнений (1) совершить одно элементарное преобразование над её строками и таким образом прийти к новой матрице B, а затем одноимённое преобразование совершить над системой уравнений (1), то расширенная матрица новой системы (2) совпадёт с матрицей B.
Доказательство. В силу леммы расширенная матрица системы (2) может быть получена из матрицы A, т. е. расширенной матрицы системы (1), с помощью совершения преобразования, одноимённого тому, которое было совершено нами над системой уравнений (1). С другой стороны, это последнее преобразование было одноимённо тому, которое мы совершили над матрицей A. Таким образом, расширенная матрица системы (2) может быть получена из A с помощью того же самого преобразования, которое мы в самом начале совершили над матрицей A. Значит, эта новая расширенная матрица совпадает с B, QED.
Теорема (C. F. Gauss’а, о системах линейных уравнений). Всякая система линейных уравнений с помощью конечного числа элементарных преобразований может быть приведена к такой системе уравнений, расширенная матрица которой является главной ступенчатой.
Доказательство. Приведём расширенную матрицу данной системы уравнений с помощью серии элементарных преобразований над её строками к главному ступенчатому виду. Теперь будем совершать над самой данной системой одноимённые преобразования. По следствию из леммы на каждом этапе очередная матрица будет расширенной матрицей соответствующей системы уравнений. Значит, и последняя, главная ступенчатая, матрица будет служить расширенной матрицей последней системы, QED.
Важно, что на каждом этапе в силу предложения из предыдущего пункта система уравнений переходит в эквивалентную. На этом основан метод C. F. Gauss’а решения систем, при котором система приводится с помощью серии элементарных преобразований к главному ступенчатому виду. Множество всех решений системы при этом не меняется, так что достаточно решить последнюю систему. А системы, имеющие главный ступенчатый вид, решаются очень легко, как будет видно из следующего пункта.
5.2.4. Решение ступенчатых систем уравнений
Рассмотрим систему линейных уравнений, расширенная матрица которой является главной ступенчатой. Допуская известную вольность речи, будем такие системы называть ступенчатыми.
Определение. В ступенчатой системе уравнений неизвестные, соответствующие главным столбцам, называются главными неизвестными, все остальные − свободными неизвестными.
Здесь надлежит различать три случая.
1°. Столбец свободных членов является главным. В этом случае система несовместна.
В самом деле, пусть главный элемент последнего столбца расширенной матрицы (т. е. столбца свободных членов) находится в i-й строке. Тогда i-е уравнение имеет следующий вид:
(Напомню, что все главные элементы главной ступенчатой матрицы равны 1, а левее любого главного элемента всегда стоят одни нули.) Ясно, что такое уравнение не имеет решений, тем более не может иметь решений вся наша система.
2°. Все столбцы, кроме последнего, главные. (Другими словами: нет свободных неизвестных, а столбец свободных членов не является главным, т. е. не содержит главных элементов.) В этом случае в i-м столбце на i-м месте стоит 1 (i ≤ n), на остальных местах − нули. После отбрасывания нулевых уравнений придём к эквивалентной системе, которая в нашем случае приобретает следующий вид:
Ясно, что такая система имеет решение, и притом единственное, а именно, . Система является определённой.
3°. Есть свободные неизвестные, но столбец свободных членов не является главным. Покажем, что в этом случае система имеет бесконечно много решений (и, следовательно, является неопределённой). Отбросим в расширенной матрице нулевые строки (они сосредоточены внизу матрицы), что приведёт к эквивалентной системе. Можно считать, что исходная расширенная матрица не была нулевой (для нулевой матрицы доказываемое утверждение очевидно), так что хотя бы одна строка останется. Теперь число строк в матрице равно числу главных неизвестных. Для удобства переобозначим неизвестные: пусть y1, y2, …, yr − главные неизвестные, а z1, z2, …, zn−r − свободные. Разнесём теперь неизвестные в разные части: главные неизвестные оставим в левых частях уравнений, а свободные перенесём в правые части, естественно, с противоположным знаком (свободные члены также остаются в правых частях). Получится система, эквивалентная исходной, следующего вида:
Мы видим, что здесь все главные неизвестные явно выражены через свободные, причём эти выражения (правые части) представляют собою линейные функции, т. е. линейные комбинации свободных неизвестных плюс свободный член. Как же решить получившуюся систему? Придадим свободным неизвестным произвольные значения и вычислим по написанным формулам соответствующие значения главных неизвестных. Очевидно, что в совокупности мы получим решение нашей системы. Более того, каждое решение можно получить таким способом при подходящем выборе свободных неизвестных, так как все неизвестные всегда будут связаны соотношениями (3). В этом смысле формулы (3) описывают множество всех решений нашей системы, т. е задают, как говорят, её общее решение. И ясно, что решений будет бесконечно много, потому что хотя бы одно свободное неизвестное у нас есть, значит, придать определённые значения свободным неизвестным мы можем бесконечным числом различных способов, и получающиеся решения будут различны.
Попутно мы фактически доказали следующие два утверждения.
Теорема 1 (критерий совместности ступенчатой системы). Система уравнений, расширенная матрица которой имеет главный ступенчатый вид, совместна тогда и только тогда, когда столбец свободных членов не является главным.
Теорема 2. Если система линейных уравнений имеет более одного решения, то она имеет бесконечно много решений.
Таким образом, линейная система не может иметь, например, ровно семь решений.
5.2.5. Однородные системы уравнений
Так называются системы линейных уравнений, в которых все свободные члены равны нулю:
Такая система всегда совместна, т. к. она всегда имеет решение (нулевое, или тривиальное решение).
Теорема. Если в однородной системе линейных уравнений (4) число уравнений s строго меньше числа неизвестных n, то такая система имеет хотя бы одно нетривиальное решение.
Доказательство. Приведём нашу систему к главному ступенчатому виду. На всех этапах однородность, очевидно, сохраняется. После отбрасывания нулевых уравнений мы получим однородную систему уравнений, эквивалентную исходной. Число её уравнений строго меньше числа неизвестных, так как число неизвестных не изменилось, а число уравнений даже могло уменьшиться. Но число строк теперь равно числу главных элементов, а значит, числу главных столбцов и числу главных неизвестных. Таким образом, число главных неизвестных строго меньше общего числа неизвестных. Значит, есть свободные неизвестные, а тогда система неопределённая (нулевой столбец свободных членов не может быть главным) и имеет бесконечно много решений. Значит, есть и ненулевые решения, QED.
[1] При этом результат ставится в первую из этих двух строк, а вторая из них, равно как и все остальные строки матрицы, не меняется.
[2] ́дрих Га́усс (нем. Johann Carl Friedrich Gauß; 30 апреля 1777, Брауншвейг − 23 февраля 1855, Гёттинген) − великий немецкий математик, астроном и физик, считается одним из величайших математиков всех времён.
[3] При этом результат ставится на место первого из этих двух уравнений, а второе из них, равно как и все остальные, не меняется.
http://vmath.ru/vf5/algebra2/linearsystems
http://pandia.ru/text/78/222/99293.php