Метод исключения — сведение системы ДУ к одному уравнению
Частным случаем канонической системы дифференциальных уравнений является одно уравнение n-го порядка, разрешенное относительно старшей производной.
Введением новых функций
это уравнение заменяется нормальной системой уравнений
Можно утверждать и обратное, что, вообще говоря, нормальная система уравнений первого порядка
эквивалентна одному уравнению порядка . На этом основан один из методов интегрирования систем дифференциальных уравнений — метод исключения .
Проиллюстрируем этот метод на примере системы двух уравнений:
Здесь — постоянные коэффициенты, а и — заданные функции; и — искомые функции. Из первого уравнения системы (1) находим
Подставляя во второе уравнение системы вместо у правую часть (2), а вместо производную от правой части (2), получаем уравнение второго порядка относительно
где — постоянные. Отсюда находим . Подставив найденное выражение для и в (2), найдем .
Пример 1. Проинтегрировать систему уравнений
Решение. Из первого уравнения системы (3) находим , тогда
Подставляя (4) во второе уравнение системы (3), получаем линейное дифференциальное уравнение с постоянными коэффициентами второго порядка
Общее решение уравнения (5)
Находя производную по от (6), получаем
Общее решение системы (3):
Пример 2. Решить задачу Коши для системы
Решение. Из второго уравнения системы (7) находим
Подставляя (9) и (10) в первое уравнение системы (7), получаем уравнение , общее решение которого
Подставляя (11) в (9), найдем . Общее решение системы (7)
При начальных условиях (8) из (12) получим систему уравнений для определения
решая которую, найдем . Подставляя эти значения и в (12), получаем решение поставленной задачи Коши:
Пример 3. Решить систему уравнений
Решение. Из первого уравнения системы находим
Подставляя эти выражения для и во второе уравнение, получаем
Считая , из последнего уравнения имеем и после интегрирования получим . Теперь легко находим
Общее решение данной системы
Замечание. Не всякая система дифференциальных уравнений может быть сведена к одному уравнению более высокого порядка. Например,
не сводится к одному уравнению второго порядка. Ее общее решение .
VMath
Инструменты сайта
Основное
Навигация
Информация
Действия
Содержание
Системы линейных уравнений
Обозначим через $ \mathbb A_<> $ любое из множеств $ \mathbb Q_<>, \mathbb R_<> $ или $ \mathbb C_<> $.
Примеры систем уравнений над $ \mathbb R $.
Относительно числа $ m_<> $ уравнений не делается ни какого предположения: оно может быть меньше, больше или равно числу переменных $ n_<> $. Если $ m_<>>n $ то система называется переопределенной. Решением системы уравнений называется любой набор значений переменных $ x_1=\alpha_<1>,\dots, x_n = \alpha_n $, обращающий каждое из уравнений в истинное равенство. Система называется совместной если она имеет хотя бы одно решение и несовместной в противном случае.
Можно доказать (см. результаты ☟ НИЖЕ ), что все возможности для произвольной системы ограничиваются следующими вариантами:
1. система совместна и имеет единственное решение;
2. cистема совместна и имеет бесконечное множество решений;
3. cистема несовместна.
При этом все решения будут находиться в том же множестве $ \mathbb A_<> $, что и коэффициенты системы.
Матричная форма записи
Для системы линейных уравнений относительно переменных $ x_1,x_2,\dots,x_n $ $$ \left\< \begina_<11>x_1 &+a_<12>x_2&+ \ldots&+a_<1n>x_n &=b_1,\\ a_<21>x_1 &+a_<22>x_2&+ \ldots&+a_<2n>x_n &=b_2,\\ \dots & & & & \dots \\ a_x_1 &+a_x_2&+ \ldots&+a_x_n &=b_m. \end \right. $$ матрицей системы называется матрица $$ A=\left( \begina_ <11>& a_ <12>& \dots & a_ <1n>\\ a_ <21>& a_ <22>& \dots & a_ <2n>\\ \dots &&& \dots \\ a_ & a_ & \dots & a_ \end \right)_ \ ; $$ cтолбец $$ <\mathcal B>= \left( \beginb_ <1>\\ b_ <2>\\ \vdots \\ b_ \end \right) $$ называется столбцом правых частей системы, а столбец $$ X= \left( \beginx_ <1>\\ x_ <2>\\ \vdots \\ x_ \end \right) $$ — столбцом неизвестных. Используя правило умножения матриц, систему можно записать в матричном виде: $$ AX= <\mathcal B>\ . $$ Любое решение $ x_1=\alpha_1,\dots,x_n=\alpha_n $ системы можно также записать в виде столбца: $$ X=\left( \begin\alpha_1 \\ \vdots \\ \alpha_n \end \right) \in \mathbb A^n \ . $$ Матрица, составленная из всех коэффициентов системы уравнений: $$ [A \mid \mathcal B ]= \left( \begina_ <11>& a_ <12>& \dots & a_ <1n>& b_1 \\ a_ <21>& a_ <22>& \dots & a_ <2n>& b_2 \\ \dots &&& & \dots \\ a_ & a_ & \dots & a_ & b_m \end \right)_ \ , $$ т.е. конкатенацией матрицы $ A_<> $ и столбца правых частей $ <\mathcal B>_<> $ называется расширенной матрицей системы л.у.
Решение. Выразим из первого уравнения $ x_ <1>$ $$ x_1=\frac<3> <2>x_2+\frac<1> <2>x_3 + \frac<3> <2>$$ и подставим в оставшиеся уравнения $$ 4 \left(\frac<3> <2>x_2+\frac<1> <2>x_3 + \frac<3><2>\right) -3\,x_2-5\,x_3=6 \ <\color\iff > \ 3x_2-3x_3 = 0 $$ $$ \ <\color\iff > \ x_2-x_3=0 \ ; $$ $$ 3 \left(\frac<3> <2>x_2+\frac<1> <2>x_3 + \frac<3><2>\right) +5x_2+9x_3=-8 \ <\color\iff > \ \frac<19> <2>x_2 +\frac<21><2>x_3=-\frac<25> <2>$$ $$ <\color\iff > 19x_2 +21x_3=-25 \ . $$ Два получившихся уравнения не зависят от неизвестной $ x_ <1>$ — она оказалась исключенной из этих уравнений. Иными словами, мы получили новую подсистему уравнений $$ \left\< \beginx_2&-x_3&=0 \\ 19x_2&+21x_3&=-25, \end \right. $$ которой должны удовлетворять неизвестные $ x_ <2>$ и $ x_ <3>$. Продолжаем действовать по аналогии: выразим из первого уравнения $ x_ <2>$ через $ x_ <3>$: $$x_2=x_3 $$ и подставим во второе: $$ 40 x_3 =-25 \ \iff \ x_3=-\frac<5> <8>\ . $$ Итак, значение одной компоненты решения получено. Для нахождения оставшихся подставим значение $ x_ <3>$ в полученные по ходу решения соотношения: $$ x_2=x_3=-\frac<5> <8>\ \Rightarrow \ x_1=\frac<3> <2>x_2+\frac<1> <2>x_3 + \frac<3><2>=\frac<1> <4>\ . $$
Ответ. $ x_<1>=1/4, x_2=-5/8, x_3=-5/8 $.
Теперь осталось формализовать изложенную идею метода (сформулировав допустимые правила действия над уравнениями — те, что в принципе, очевидны из здравого смысла ), а также исследовать возможные последствия его применения к системам общего вида.
Исключение переменных
Элементарными преобразованиями системы л.у. называются преобразования следующих трех типов:
1. перестановка двух уравнений;
2. умножение обеих частей уравнения на любое отличное от нуля число;
Теорема.Любое элементарное преобразование системы л.у. переводит эту систему в ей эквивалентную, т.е. имеющую то же множество решений, что и исходная.
Задача. С помощью элементарных преобразований привести систему л.у. к наиболее простому виду: такому, из которого легко было бы установить множество решений.
Предположим, что первое уравнение системы содержит явно неизвестную $ x_ <1>$, т.е. $ a_<11>^<> \ne 0 $. Исключим эту неизвестную из всех оставшихся уравнений. С этой целью вычтем из второго уравнения первое, домноженное на $ a_<21>/a_<11>^<> $. Получим $$\left(a_<22>— \frac>> a_ <12>\right)x_2 + \dots + \left(a_<2n>— \frac>> a_ <1n>\right)x_n = b_2 — \frac>> b_1 \ , $$ Аналогичное преобразование — вычитание из третьего уравнения системы первого, умноженного на $ a_<31>/a_<11>^<> $, позволяет исключить $ x_ <1>$ из этого уравнения, т.е. заменить его на $$\left(a_<32>— \frac>> a_ <12>\right)x_2 + \dots + \left(a_<3n>— \frac>> a_ <1n>\right)x_n = b_3 — \frac>> b_1 \ . $$ Продолжаем процесс далее. В конечном итоге исключаем $ x_ <1>$ из всех уравнений кроме первого: $$ \left\< \begina_<11>x_1 &+a_<12>x_2&+ \ldots&+a_<1n>x_n &=b_1,\\ &a_<22>^<[1]>x_2&+ \ldots&+a_<2n>^<[1]>x_n &=b_2^<[1]>,\\ &\dots & & & \dots \\ &a_^<[1]>x_2&+ \ldots&+a_^<[1]>x_n &=b_m^<[1]>. \end \right. \ \ npu \ \ \begina_^ <[1]>&= & \displaystyle a_ — \fraca_<1k>>> ,\\ b_j^ <[1]>&= & \displaystyle b_j — \fracb_1>> . \end $$ Полученная система эквивалентна исходной системе, однако она имеет более простой вид: в ней выделилась подсиcтема $$ \left\< \begina_<22>^<[1]>x_2&+ \ldots&+a_<2n>^<[1]>x_n &=b_2^<[1]>,\\ \dots & & & \dots \\ a_^<[1]>x_2&+ \ldots&+a_^<[1]>x_n &=b_m^<[1]>, \end \right. $$ которая не зависит от переменной $ x_ <1>$. К этой новой подсистеме можно применить те же рассуждения, что и к исходной системе, поставив теперь целью исключение переменной $ x_ <2>$.
Понятно, что процесс исключения может быть продолжен и далее. Теперь посмотрим, где он может прерваться. Может так случиться, что очередная, $ \ell_<> $-я подсистема имеет коэффициент $ a_<\ell \ell>^ <[\ell-1]>$ равным нулю, что не позволит алгоритму идти дальше — т.е. исключить переменную $ x_<\ell>^<> $ из оставшихся уравнений (в принципе, такое могло случиться уже на первом шаге, если бы коэффициент $ a_<11>^<> $ был бы равен нулю). Возможные варианты дальнейших действий:
1. если хотя бы один коэффициент при $ x_<\ell>^<> $ в одном из оставшихся уравнений отличен от нуля: $ a_^<[\ell-1]>\ne 0^<> $, то это уравнение переставляется с $ \ell_<> $-м;
2. если при всех $ j\ge \ell^<> $ коэффициенты $ a_^ <[\ell-1]>$ равны нулю, то переменная $ x_<\ell>^<> $ не входит ни в одно оставшееся уравнение, и можно перейти к исключению переменной $ x_<\ell+1>^<> $.
Поскольку число переменных конечно, то алгоритм исключения должен завершиться за конечное число шагов. Чем он может завершиться? Окончательная система должна иметь вид: $$ \left\< \begina_<11>x_1 +&a_<12>x_2&+ \ldots& +a_<1 <\mathfrak r>>x_<\mathfrak r>& +a_ <1 ,<\mathfrak r>+1>x_<<\mathfrak r>+1>&+ \ldots + & a_<1n>x_n &=b_1,\\ &a_<22>^<[1]>x_2&+ \ldots& +a_<2 <\mathfrak r>>^ <[1]>x_<\mathfrak r>& +a_<2 ,<\mathfrak r>+1>^ <[1]>x_<<\mathfrak r>+1>&+ \ldots + & a_<2n>^ <[1]>x_n &=b_2^<[1]>,\\ & & \ddots & & & & & \dots \\ & & & a_ <<\mathfrak r><\mathfrak r>>^<[<\mathfrak r>-1]>x_ <\mathfrak r>& + a_ <<\mathfrak r>, <\mathfrak r>+1>^<[<\mathfrak r>-1]>x_<<\mathfrak r>+1>& + \ldots + & a_ <<\mathfrak r>,n>^<[<\mathfrak r>-1]>x_n &=b_<\mathfrak r>^<[<\mathfrak r>-1]>, \\ & & & & & & 0 &=b_<<\mathfrak r>+1>^<[<\mathfrak r>-1]>, \\ & & & & & & \dots & \\ & & & & & & 0 &=b_^<[<\mathfrak r>-1]>, \\ \end \right. $$ при $ <\mathfrak r>\le n_<> $. Заметим, что все коэффициенты этой системы будут принадлежать тому же множеству, что и коэффициенты исходной системы.
Предположение . Мы будем считать, что каждое из первых $ <\mathfrak r>_<> $ уравнений системы содержит в своей левой части хотя бы одну переменную с ненулевым коэффициентом.
Процесс получения системы такого вида из исходной системы уравнений называется прямым ходом метода Гаусса.
Исторический комментарий о Гауссе ☞ ЗДЕСЬ.
Установление множества решений
Теорема.Если хотя бы одно из чисел $ b_<<\mathfrak r>+1>^<[<\mathfrak r>-1]>,\dots , b_^<[<\mathfrak r>-1]> $ отлично от нуля, то исходная система линейных уравнений будет несовместной.
Для простоты мы будем иллюстрировать наши рассуждения на системах л.у. над $ \mathbb R_<> $, в этом же множестве искать решения. Каждое из преобразований метода Гаусса будем обозначать $ \to_<> $.
Пусть теперь $ b_<<\mathfrak r>+1>^<[<\mathfrak r>-1]>=0,<>\dots, b_^<[<\mathfrak r>-1]>=0 $. Возможны два случая: $ <\mathfrak r>=n_<> $ и $ <\mathfrak r>предположения , имеем $ a_^ <[n-1]>\ne 0 $. Но тогда, поскольку система является конечной стадией прямого хода метода Гаусса, то и все коэффициенты $ a_^<[n-2]>, \dots, a_<22>^<[1]>, a_ <11>$ должны быть отличны от нуля — в противном случае метод Гаусса не остановился бы на системе такого вида; он называется треугольным: Из последнего уравнения системы можно однозначно установить значение $ x_ $: $$x_n=b_n^ <[n-1]>\big/ a_^ <[n-1]>\ .$$ Далее, подставляя это значение в $ (n-1) $-е уравнение системы, выражаем $ x_ $: $$ x_= \frac^ <[n-2]>— a_^<[n-2]>x_>< a_^<[n-2]>>= \frac< b_^ <[n-2]>— a_^ <[n-2]>b_n^ <[n-1]>\Big/ a_^<[n-1]>>< a_^<[n-2]>> . $$ Подставляем полученные значения для $ x_ $ и $ x_ $ в $ (n-2)_<> $-е уравнение системы, выражаем $ x_ $, и т.д., в конце концов приходим к первому уравнению, из которого выражаем $ x_ <1>$ если ранее уже получены выражения для $ x_2,\dots,x_ $.
Теорема.Если прямой ход метода Гаусса заканчивается треугольной системой, т.е. $ \mathfrak r = n_<> $ и $ b_<<\mathfrak r>+1>^<[<\mathfrak r>-1]>=0,<>\dots, b_^<[<\mathfrak r>-1]>=0 $, то исходная система линейных уравнений имеет единственное решение.
Исследуем теперь случай $ <\mathfrak r>1) : На основании предположения , в $ <\mathfrak r>$-м уравнении этой системы имеется хотя бы один ненулевой коэффициент в левой части, пусть $ a_ <<\mathfrak r><\mathfrak s>>^<[<\mathfrak r>-1]>\ne 0 $ — первый из них. Если $ <\mathfrak s>=n $, то из этого уравнения однозначно определится $ x_ $ $$ x_n=\alpha_n = b_<\mathfrak r>^<[<\mathfrak r>-1]> \big/ a_ <<\mathfrak r>n>^<[<\mathfrak r>-1]> \ . $$ Если же $ <\mathfrak s>предположения , в этом уравнении имеется хотя бы один ненулевой коэффициент в левой части; пусть $ a_<<\mathfrak r>-1, <\mathfrak k>>^<[<\mathfrak r>-2]>\ne 0_<> $ — первый из них. Поскольку мы преположили, что система является конечной стадией прямого хода метода Гаусса, то $ <\mathfrak k>по крайней мере две переменные, значения которых еще не были зафиксированы на предыдущих шагах. Это следует из предположения, что число уравнений $ <\mathfrak r>_<> $ меньше числа неизвестных $ n_<> $. Такое уравнение допускает бесконечное число решений, любое из которых в ходе дальнейших шагов может быть «доделано» до решения системы.
Теорема.Если прямой ход метода Гаусса заканчивается трапециевидной системой, т.е. $ \mathfrak r 2) матрицы $ A_<> $ (третьего порядка). Понятие определителя распространяется и на квадратные матрицы бóльших порядков; образно говоря, определитель — это функция элементов матрицы, отвечающая за единственность решения системы уравнений.
Дальнейший матричный анализ метода Гаусса ☞ ЗДЕСЬ.
Формулы Крамера
Рассмотрим систему линейных уравнений с квадратной матрицей $ A_<> $, т.е. такую, у которой число уравнений совпадает с числом неизвестных.
Теорема.Cистема
$$ \left\<\begina_<11>x_1 +a_<12>x_2+\ldots+a_<1n>x_n &=&b_1\\ a_<21>x_1 +a_<22>x_2+\ldots+a_<2n>x_n &=&b_2\\ \ldots& & \ldots \\ a_x_1 +a_x_2+\ldots+a_x_n &=&b_n \end\right. $$ имеет единственное решение тогда и только тогда, когда определитель матрицы этой системы отличен от нуля: $$ \left| \begina_ <11>& a_ <12>& \dots & a_ <1n>\\ a_ <21>& a_ <22>& \dots & a_ <2n>\\ \dots &&& \dots \\ a_ & a_ & \dots & a_ \end \right| \ne 0 \ . $$ В этом случае решение можно вычислить поформулами Крамера 3) : $$ x_k =\frac<\det \left[ A_<[1]>|\dots|A_<[k-1]>|<\mathcal B>|A_<[k+1]>|\dots|A_ <[n]>\right]> <\det A>\quad npu \quad k\in \ < 1,\dots,n \>\ . $$ Для получения значения $ x_ $ в числитель ставится определитель, получающийся из $ \det A_<> $ заменой его $ k_<> $-го столбца на столбец правых частей ( здесь $ <> | $ означает конкатенацию).
Решение системы линейных уравнений с квадратной матрицей $ A_<> $ является непрерывной функцией коэффициентов этой системы при условии, что $ \det A_<> \ne 0 $.
Кроме того, формулы Крамера начинают конкурировать по вычислительной эффективности с методом Гаусса в случае систем, зависящих от параметра. Подробнее ☞ ЗДЕСЬ.
Еще один способ решения системы основан на построении обратной матрицы: $$ AX= <\mathcal B>\quad \Rightarrow \quad X=A^<-1> <\mathcal B>\ . $$ Этот способ малоэффективен при фиксированных числовых $ A_<> $ и $ <\mathcal B>_<> $.
Найти достаточное условие существования общего решения систем уравнений:
$$ A_1 X = <\mathcal B>_1 \quad u \quad A_2 Y = <\mathcal B>_2 \ , $$ при квадратных матрицах $ A_1 $ и $ A_2 $ одинакового порядка.
Теорема [Кронекер, Капелли].Система $ AX= <\mathcal B>$ совместна тогда и только тогда, когда ранг матрицы этой системы совпадает с рангом ее расширенной матрицы:
$$ \operatorname\, A = \operatorname\, [ A| <\mathcal B>] \ . $$ При выполнении этого условия, система имеет единственное решение, если число неизвестных $ n_<> $ совпадает с общим значением ранга $ \mathfrak r_<> $, и бесконечное множество решений, если $ n_<> $ больше этого значения.
Доказательство необходимости. Пусть существует решение $ x_1=\alpha_1,\dots,x_n=\alpha_n $ системы, тогда $$\alpha_1 A_<[1]>+\dots+\alpha_n A_<[n]>= <\mathcal B>\ ,$$ т.е. столбец $ <\mathcal B>$ линейно выражается через столбцы $ A_<[1]>,\dots,A_ <[n]>$. Но тогда $$ \operatorname \,\dots,A_<[n]>\>=\operatorname \,\dots,A_<[n]>,<\mathcal B>\> .$$ Следовательно $ \operatorname\, A = \operatorname\, [ A| <\mathcal B>] $.
Доказательство достаточности проводится в следующем пункте. ♦
Пример. Исследовать совместность системы уравнений
Решение. В этом примере число уравнений совпадает с числом неизвестных. Это обстоятельство несколько облегчает рассуждения. Обратимся к замечанию из предыдущего пункта: система л.у. с числом уравнений, совпадающем с числом неизвестных, как правило, совместна. Тогда попробуем установить условия, обеспечивающие противоположное свойство — несовместность. Оно, фактически, единственно: за все отвечает определитель системы $ \det A_<> $. Если он отличен от нуля — система совместна. $$\det A = \left| \begin<\color<\lambda>> &1&1&1 \\ 1&<\color<\lambda>>&1&1 \\ 1&1&<\color<\lambda>>&1 \\ 1&1&1&<\color<\lambda>> \end \right|= \left| \begin(<\color<\lambda>>-1) &(1-<\color<\lambda>>)&0&0 \\ 0&(<\color<\lambda>>-1)&(1-<\color<\lambda>>)&0 \\ 0&0&(<\color<\lambda>>-1)&(1-<\color<\lambda>>) \\ 1&1&1&<\color<\lambda>> \end \right| =(<\color<\lambda>>-1)^3 \left| \begin1 &-1&0&0 \\ 0&1&-1&0 \\ 0&0&1&-1 \\ 1&1&1&<\color<\lambda>> \end \right|= $$ $ =(<\color<\lambda>>-1)^3(<\color<\lambda>>+3) $. По теореме Крамера при $ <\color<\lambda>>\ne 1 $ и при $ <\color<\lambda>>\ne -3 $ решение системы единственно: $$x_1=x_2=x_3=x_4=1/(<\color<\lambda>>+3) \ .$$
Осталось исследовать критические случаи: $ <\color<\lambda>>=1_<> $ и $ <\color<\lambda>>= -3 $: определитель системы обращается в нуль, но система может оказаться совместной. Придется вычислять ранги, но, к счастью, уже числовых матриц (а не зависящих от параметра, как исходная!). При $ <\color<\lambda>>= 1_<> $ имеем $$ \operatorname \left( \begin1 &1&1&1 \\ 1&1&1&1 \\ 1&1&1&1 \\ 1&1&1&1 \end \right)= \operatorname \left( \begin1&1&1&1&1 \\ 1&1&1&1&1 \\ 1&1&1&1&1 \\ 1&1&1&1&1 \end \right)=1 \ , $$ и система совместна. Она эквивалентна единственному уравнению $$x_1+x_2+x_3+x_4=1 \ ,$$ которое имеет бесконечно много решений.
Ответ. Система несовместна при $ <\color<\lambda>> = -3 $; она имеет бесконечное множество решений при $ <\color<\lambda>> = 1_<> $ и единственное решение при $ <\color<\lambda>> \not\in \ <-3,1\>$.
Система однородных уравнений
$$ \left\< \begina_<11>x_1 &+a_<12>x_2&+ \ldots&+a_<1n>x_n &=0,\\ a_<21>x_1 &+a_<22>x_2&+ \ldots&+a_<2n>x_n &=0,\\ \dots & & & \dots & \\ a_x_1 &+a_x_2&+ \ldots&+a_x_n &=0 \end \right. $$ всегда совместна: она имеет тривиальное решение $ x_1=0,\dots,x_n=0 $. Для того, чтобы у нее существовало еще и нетривиальное решение необходимо и достаточно, чтобы определитель ее матрицы был равен нулю.
Пример. Найти условие, при котором три точки плоскости с координатами $ (x_1,y_1), (x_2,y_2) $ и $ (x_3,y_<3>) $ лежат на одной прямой.
Решение. Будем искать уравнение прямой в виде $ ax+by+c=0 $ при неопределенных коэффициентах $ a,b,c_<> $. Если точки лежат на прямой, то получаем для определения этих коэффициентов систему линейных уравнений: $$ \left\< \beginax_1+by_1+c & =0\\ ax_2+by_2+c & =0\\ ax_3+by_3+c & =0 \end \right. $$ Получившаяся система является однородной, условие существования у нее нетривиального решения (т.е. набора $ (a,b,c)_<> $ при хотя бы одном из чисел отличном от нуля): $$ \left|\beginx_1 & y_1 & 1 \\ x_2 & y_2 & 1 \\ x_3 & y_3 & 1 \end \right|=0 . $$ ♦
Доказать, что для совместности системы
$$ \left\< \begina_<11>x_1+a_<12>x_2+a_<13>x_3 &=& b_1 \\ a_<21>x_1+a_<22>x_2+a_<23>x_3 &=& b_2 \\ a_<31>x_1+a_<32>x_2+a_<33>x_3 &=& b_3 \\ a_<41>x_1+a_<42>x_2+a_<43>x_3 &=& b_4 \end \right. $$ необходимо, чтобы было выполнено условие $$ \left| \begina_<11>&a_<12>& a_ <13>& b_1 \\ a_<21>&a_<22>& a_ <23>& b_2 \\ a_<31>&a_<32>& a_ <33>& b_3 \\ a_<41>&a_<42>& a_ <43>& b_4 \end \right|=0 \quad . $$ Является ли это условие достаточным для совместности?
An elementary treatise on determinants
в следующей формулировке.
Теорема.Для того чтобы система $ n_<> $ неоднородных уравнений была совместна, необходимо и достаточно, чтобы порядок наибольшего отличного от нуля минора был одинаков в расширенной и нерасширенной матрице системы.
Додсон — один из самых знаменитых математиков мира. Назовите его псевдоним.
Ответ ☞ ЗДЕСЬ
Общее решение
Пусть выполнено условие теоремы Кронекера-Капелли: $ \operatorname (A)=\operatorname[A\mid \mathcal B ] =\mathfrak $. По определению ранга матрицы, в матрице $ A $ существует минор порядка $ \mathfrak $, отличный от нуля; этот же минор останется и минором расширенной матрицы $ [ A\mid \mathcal B ] $. Пусть, для определенности, ненулевой минор находится в левом верхнем углу матрицы 4) : $$ \Delta = A\left( \begin1 & 2 & \dots & \mathfrak \\ 1 & 2 & \dots & \mathfrak \end \right) = \left| \begina_ <11>& a_ <12>& \dots & a_<1\mathfrak> \\ a_ <21>& a_ <22>& \dots & a_<2\mathfrak> \\ \dots &&& \dots \\ a_<\mathfrak1> & a_<\mathfrak2> & \dots & a_ <\mathfrak\mathfrak> \end \right| \ne 0 \ . $$ Тогда первые $ \mathfrak $ строк матрицы $ A $ линейно независимы, а остальные будут линейно выражаться через них. Это же утверждение будет справедливо и для строк матрицы $ [A\mid \mathcal B] $. Умножая первые $ \mathfrak $ уравнений системы на соответствующие числа и складывая их, получим любое оставшееся уравнение. Таким образом, система уравнений может быть заменена эквивалентной ей системой из первых $ \mathfrak $ уравнений: $$ \left\< \begina_<11>x_1+\dots+a_<1\mathfrak>x_<\mathfrak>&+a_<1,\mathfrak+1>x_<\mathfrak+1>+ \dots +a_<1n>x_n&=&b_1, \\ \dots & & & \dots \\ a_<\mathfrak1>x_1+\dots+a_<\mathfrak\mathfrak>x_<\mathfrak>& +a_<\mathfrak,\mathfrak+1>x_<\mathfrak+1>+\dots +a_<\mathfrakn>x_n&=&b_\mathfrak \end \right. \quad \iff \quad A^ <\prime>X=<\mathcal B>^ <\prime>$$ Если $ \mathfrak=n $, то матрица $ A^ <\prime>$ квадратная. По предположению $ \det A^ <\prime>\ne 0 $. По теореме Крамера решение такой системы единственно.
Пусть теперь $ \mathfrak произвольных фиксированных значениях $ x_<\mathfrak+1>,\dots,x_n $: $$ x_j=\frac< \left| \begina_ <11>& \dots &a_ <1,j-1>&\left[ b_1-(a_<1,\mathfrak+1>x_<\mathfrak+1>+\dots +a_<1n>x_n) \right] &a_<1,j+1>& \dots &a_<1\mathfrak> \\ \dots &&&\dots&&& \dots \\ a_<\mathfrak1> & \dots &a_<\mathfrak,j-1> & \left[ b_<\mathfrak>- (a_<\mathfrak,\mathfrak+1>x_<\mathfrak+1>+\dots +a_<\mathfrakn>x_n) \right] &a_<\mathfrak,j+1>& \dots &a_<\mathfrak\mathfrak> \end \right| > <\Delta>$$ $$ \mbox <при>\ j\in \<1,\dots, \mathfrak\> . $$ Таким образом, в этом случае система имеет бесконечное множество решений. Используя свойство линейности определителя по столбцу (см. свойство 5 ☞ ЗДЕСЬ ), формулы можно переписать в виде $$ x_j=\beta_j + \gamma_+1>x_<\mathfrak+1>+\dots+\gamma_x_n \ npu \ j\in \ <1,\dots, \mathfrak\> \ . $$ Здесь $$ \beta_j =\frac<1> <\Delta>\left| \begina_ <11>& \dots &a_ <1,j-1>& b_1 &a_<1,j+1>& \dots &a_<1\mathfrak> \\ \vdots &&&\vdots&&& \vdots \\ a_<\mathfrak1> & \dots &a_<\mathfrak,j-1> & b_<\mathfrak> &a_<\mathfrak,j+1>& \dots &a_<\mathfrak\mathfrak> \end \right|\, , $$ $$ \gamma_ = -\frac<1> <\Delta>\left| \begina_ <11>& \dots &a_ <1,j-1>& a_ <1k>&a_<1,j+1>& \dots &a_<1\mathfrak> \\ \vdots &&&\vdots&&& \vdots \\ a_<\mathfrak1> & \dots &a_<\mathfrak,j-1> & a_<\mathfrakk> &a_<\mathfrak,j+1>& \dots &a_<\mathfrak\mathfrak> \end \right| \ . $$ Эти формулы называются общим решением системы $ A X=\mathcal B $. Участвующие в них переменные $ x_<\mathfrak+1>,\dots,x_n $ называются основными (или свободными), а $ x_1,\dots,x_<\mathfrak> $ — зависимыми. Решение, получающееся из общего решения фиксированием значений основных переменных, называется частным решением системы уравнений.
Пример. Исследовать совместность и найти общее решение системы уравнений:
Решение проведем двумя способами, соответствующими двум способам вычисления ранга матрицы. Вычисляем сначала ранг матрицы $ A $ по методу окаймляющих миноров: $$ |2| \ne 0,\quad \left| \begin2 & 1 \\ 6 & 2 \end \right| \ne 0, \quad \left| \begin2 & 1 & 2 \\ 6 & 2 & 4 \\ 4 & 1 & 1 \end \right|=2 \ne 0 \ , $$ а все миноры, окаймляющие последний, равны нулю. Итак, $ \operatorname (A) =3 $. Для нахождения ранга расширенной матрицы $ [A\mid \mathcal B] $ достаточно проверить окаймление найденного ненулевого минора третьего порядка с помощью элементов взятых из столбца правых частей. Имеется всего один такой минор, и он равен нулю. Следовательно $ \operatorname[ A\mid \mathcal B ] =3 $, система совместна, и имеет бесконечное множество решений.
Ненулевой минор третьего порядка (базисный минор) находится в первой, второй и четвертых строках, что означает линейную независимость соответствующих уравнений. Третье уравнение линейно зависит от остальных, и может быть отброшено. Далее, указанный базисный минор образован коэффициентами при $ x_1,x_3 $ и $ x_4 $. Следовательно оставшиеся уравнения могут быть разрешены относительно этих переменных, т.е. они — зависимые, а $ x_2 $ и $ x_5 $ — основные. Использование формулы дает общее решение $$ \beginx_1&=&\frac<\left| \begin2 & 1 & 2 \\ 3 & 2 & 4 \\ 1 & 1 & 1 \end \right|> <\displaystyle 2>-x_2\frac<\left| \begin-1 & 1 & 2 \\ -3 & 2 & 4 \\ -2 & 1 & 1 \end \right|> <\displaystyle 2>-x_5\frac<\left| \begin3 & 1 & 2 \\ 5 & 2 & 4 \\ 2 & 1 & 1 \end \right|> <\displaystyle 2>=-\frac<1><2>+\frac<1><2>x_2+\frac<1><2>x_5, \\ & & \\ x_3&=&\frac<\left| \begin2 & 2 & 2 \\ 6 & 3 & 4 \\ 4 & 1 & 1 \end \right|> <\displaystyle 2>-x_2\frac<\left| \begin2 & -1 & 2 \\ 6 & -3 & 4 \\ 4 & -2 & 1 \end \right|> <\displaystyle 2>-x_5\frac<\left| \begin2 & 3 & 2 \\ 6 & 5 & 4 \\ 4 & 2 & 1 \end \right|><\displaystyle 2>=3-4x_5, \\ & & \\ x_4 &=&\frac<\left| \begin2 & 1 & 2 \\ 6 & 2 & 3 \\ 4 & 1 & 1 \end \right|> <\displaystyle 2>-x_2\frac<\left| \begin2 & 1 & -1 \\ 6 & 2 & -3 \\ 4 & 1 & -2 \end \right|> <\displaystyle 2>-x_5\frac<\left| \begin2 & 1 & 3 \\ 6 & 2 & 5 \\ 4 & 1 & 2 \end \right|> <\displaystyle 2>= 0. \end $$ Решим теперь ту же задачу, воспользовавшись методом Гаусса исключения переменных в системе линейных уравнений: $$ \left\< \begin2x_1&-x_2&+x_3&+2x_4&+3x_5&=&2, \\ &&x_3&+2x_4&+4x_5&=&3, \\ &&&x_4&&=&0 \end \right. $$ Используя обратный ход метода Гаусса, снова приходим к полученным формулам.
Ответ. Общее решение системы: $ x_1=1/2 (x_2+x_5-1),\ x_3=3-4\,x_5,\ x_4=0 $.
Проанализируем теперь полученные общие формулы для общего решения. В этих формулах $ \beta_j $ представляет решение системы, получаемое при $ x_<\mathfrak+1>=0,\dots,x_n=0 $. Величины же коэффициентов $ \gamma_ $ вовсе не зависят от правых частей системы и будут одинаковыми при любых значениях $ b_1,\dots,b_m $. В частности, если $ b_1=0,\dots,b_m=0 $, то в формулах величины $ \beta_j $ обращаются в нуль и эти формулы превращаются в $$ x_j=\gamma_+1>x_<\mathfrak+1>+\dots+\gamma_x_n \ npu \ j\in \<1,\dots, \mathfrak\> \ . $$
Вывод. Формула общего решения системы $ A X=\mathcal B $: $$ x_j=\beta_j + \gamma_+1>x_<\mathfrak+1>+\dots+\gamma_x_n \ npu \ j\in \ <1,\dots, \mathfrak\> $$ состоит из двух частей: слагаемые, не содержащие свободных переменных, определяют частное решение неоднородной системы: $$ x_1= \beta_1,\dots, x_<\mathfrak>= \beta_<\mathfrak>,x_<\mathfrak+1>=0,\dots,x_n=0 \ ; $$ оставшиеся после их отбрасывания формулы задают общее решение системы $ AX=\mathbb O $. Этот результат обобщается в следующей теореме.
Теорема.Общее решение системы уравнений $ A X=\mathcal B $ представимо в виде суммы какого-то частного решения этой системы и общего решения соответствующей однородной системы $ A X=\mathbb O $.
Доказательство тривиально если система $ A X=\mathcal B $ имеет единственное решение. Если же решений бесконечно много, то выбрав какое-то одно частное $ X=X_1 $ мы получаем, что любое другое частное решение $ X=X_2 $ должно быть связано с первым соотношением $$ A(X_2-X_1)=\mathbb O , $$ т.е. разность частных решений неоднородной системы обязательно является решением однородной системы уравнений $ AX=\mathbb O $. ♦
Теперь посмотрим как можно описать общее решение однородной системы.
Система однородных уравнений
Система линейных уравнений называется однородной, если все коэффициенты правых частей равны нулю: $$ \left\< \begina_<11>x_1 &+a_<12>x_2&+ \ldots&+a_<1n>x_n &=0,\\ a_<21>x_1 &+a_<22>x_2&+ \ldots&+a_<2n>x_n &=0,\\ \dots & & & \dots & \\ a_x_1 &+a_x_2&+ \ldots&+a_x_n &=0. \end \right. $$ или, в матричном виде: $$ A_X=<\mathbb O>_ $$
Задача ставится о поиске нетривиального решения. Оно не всегда существует. Так, к примеру, если матрица $ A_<> $ системы — квадратная и имеет ненулевой определитель, то, согласно теореме Крамера, нетривиальных решений у однородной системы нет. Теорема Кронекера-Капелли утверждает, что условие $ \det (A_<>) = 0 $ является и достаточным для существования нетривиального решения.
Теорема 1.Для того, чтобы система однородных уравнений с квадратной матрицей $ A_<> $ имела нетривиальное решение необходимо и достаточно, чтобы $ \det (A_<>) = 0 $.
Для произвольной (не обязательно квадратной) матрицы $ A_<> $ имеет место следующий общий результат.
Теорема 2.Если $ \operatorname (A)=\mathfrak r 5) $ A_^<> $.
Теорема 3.Множество решений системы однородных уравнений образует линейное подпространство пространства $ \mathbb A^ $. Размерность этого подпространства равна $ n-\mathfrak r $, а фундаментальная система решений образует его базис.
Пусть матрица системы $ AX=\mathbb O $ квадратная и
$$ \operatorname (A) =n_<>-1 \, .$$ Доказать, что если ненулевой минор матрицы порядка $ n_<>-1 $ соответствует какому-нибудь элементу $ j_<> $-й строки, то система алгебраических дополнений к элементам $ a_,\dots,a_^<> $ этой строки составляет ФСР для $ AX=\mathbb O_<> $. Например, для системы $$ \left\< \begina_<11>x_1 +a_<12>x_2+a_<13>x_3&=0,\\ a_<21>x_1 +a_<22>x_2+a_<23>x_3&=0 \end \right. $$ ФСР состоит из решения $$ x_1=\left| \begina_ <12>& a_ <13>\\ a_ <22>& a_ <23>\end \right| , \ x_2=-\left| \begina_ <11>& a_ <13>\\ a_ <21>& a_ <23>\end \right| , \ x_3=\left| \begina_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right| \ , $$ если только хотя бы один из миноров отличен от нуля.
Теперь обсудим способы нахождения ФСР.
1. Первый из них получается из общего метода решения системы линейных уравнений, рассмотренного в предыдущем пункте. Так же, как и в том пункте, сделаем упрощающее обозначения предположение, что зависимыми переменными являются первые $ x_<1>,\dots,x_ <\mathfrak r>$, т.е. общее решение задается формулами $$ x_j=\gamma_+1>x_<\mathfrak+1>+\dots+\gamma_x_n \ npu \ j\in \<1,\dots, \mathfrak\> \ . $$ Иными словами, вектор столбец $$ X=\left(\begin\gamma_<1,\mathfrak+1>x_<\mathfrak+1>+\dots+\gamma_<1n>x_n \\ \gamma_<2,\mathfrak+1>x_<\mathfrak+1>+\dots+\gamma_<2n>x_n \\ \vdots \\ \gamma_<\mathfrak,\mathfrak+1>x_<\mathfrak+1>+\dots+\gamma_<\mathfrakn>x_n \\ x_<\mathfrak+1> \\ x_<\mathfrak+2> \\ \vdots \\ x_ \end\right) $$ будет решением однородной системы при любых наборах значений основных переменных $ x_<\mathfrak+1>,\dots,x_ $. Представим этот вектор в виде суммы векторов: $$ =x_<\mathfrak+1> \underbrace< \left(\begin\gamma_<1,\mathfrak+1> \\ \gamma_<2,\mathfrak+1> \\ \vdots \\ \gamma_<\mathfrak,\mathfrak+1> \\ 1 \\ 0 \\ \vdots \\ 0 \end\right)>_ + x_<\mathfrak+2> \underbrace<\left(\begin\gamma_<1,\mathfrak+2> \\ \gamma_<2,\mathfrak+2> \\ \vdots \\ \gamma_<\mathfrak,\mathfrak+2> \\ 0 \\ 1 \\ \vdots \\ 0 \end\right)>_+\dots+ x_ \underbrace<\left(\begin\gamma_ <1n>\\ \gamma_ <2n>\\ \vdots \\ \gamma_<\mathfrakn> \\ 0 \\ 0 \\ \vdots \\ 1 \end\right)>_> \ . $$ Таким образом, любое решение однородной системы представимо в виде линейной комбинации $ n_<>— \mathfrak r $ фиксированных решений. Именно эти решения и можно взять в качестве ФСР — их линейная независимость очевидна (единицы в нижних частях каждого вектора $ X_ $ расположены на разных местах, и ни какая линейная комбинация столбцов $ \ < X_1,\dots,X_\> $ не сможет обратить их одновременно в нуль).
Оформим этот способ построения ФСР в теорему:
Теорема 4.Если система уравнений $ AX=\mathbb O $ имеет структуру матрицы $ A_<> $ вида:
$$ A = \left[ E_ <\mathfrak r>\mid P_ <\mathfrak r \times (n-\mathfrak r)>\right] \ , $$ то ееФСРсостоит из столбцов матрицы $$ \left[ \begin— P^ <\top>\\ \hline E_ \end \right] \ . $$
Пример. Найти ФСР для системы уравнений
Решение. Приводим систему к трапециевидному виду: $$ \left\< \beginx_1-&x_2+&x_3-&x_4=&0, \\ &&x_3+&4x_4=&0 \end \right. $$ В качестве зависимых переменных можно взять, например, $ x_ <1>$ и $ x_ <3>$. $$ \beginx_1 & x_3 & x_2 & x_4 \\ \hline 1 & 0 & 1 & 0 \\ 5 & -4 & 0 & 1 \end $$
3. Еще один способ построения ФСР основан на теореме Гамильтона-Кэли.
Теорема.Пусть матрица системы $ AX=\mathbb O $ квадратная и $ \operatorname (A) = <\mathfrak r>$. Тогда характеристический полином матрицы $ A_<> $ имеет вид:
Блок-схемы зависимости множества решений системы уравнений $ AX= \mathcal B $ от комбинации чисел $ n, \mathfrak r $ ☞ ЗДЕСЬ.
Геометрическая интерпретация
Геометрический смысл введенных определений поясним на примере $ \mathbb R^ <3>$. Уравнение $$ a_1x_1+a_2x_2+a_3x_3=b $$ — при фиксированных вещественных коэффициентах $ a_1,a_2,a_3 $ (хотя бы один из них считаем отличным от нуля) и $ b_<> $ — задает плоскость. Если, к примеру, $ a_1\ne 0 $, то из уравнения получаем выражение для $ x_ <1>$ как функции $ x_2,x_3 $: $$ x_1=\frac-\fracx_2-\fracx_3 \ . $$ В этом представлении переменные $ x_ <2>$ и $ x_ <3>$ могут принимать любые вещественные значения независимо друг от друга, а вот переменная $ x_ <1>$ полностью определяется заданием $ x_ <2>$ и $ x_ <3>$. С одной стороны, последняя формула определяет общее решения системы линейных уравнений (которая в нашем частном случае состоит из одного-единственного уравнения); переменные $ x_ <2>$ и $ x_ <3>$ выбраны основными, а $ x_ <1>$ оказывается зависимой. Строго говоря, координаты любой точки плоскости можно представить формулами $$x_1=\frac-\fract-\fracu,\ x_2=t,\ x_3=u \quad npu \quad \\subset \mathbb R \ , $$ которые называются параметрическим представлением плоскости. Таким образом, получили геометрическую интерпретацию общего решения системы уравнений. Идем далее: представим последние формулы в векторной форме: $$ \left( \beginx_1 \\ x_2 \\ x_3 \end \right)= \left( \beginb/a_1- t\, a_2/a_1- u\, a_3/a_1 \\ t \\ u \end \right)= \left( \beginb/a_1\\ 0 \\ 0 \end \right)+ t \left( \begin-a_2/a_1\\ 1 \\ 0 \end \right) + u \left( \begin-a_3/a_1\\ 0 \\ 1 \end \right) \ . $$ Какой геометрический смысл имеет каждое из слагаемых? Первое слагаемое $$ X_0=\left( \beginb/a_1\\ 0 \\ 0 \end \right) $$ получается при задании $ t=0,u=0_<> $ в общем решении. Это — частное решение нашего уравнения и определяет точку, через которую проходит плоскость. Два оставшихся столбца $$ X_1=\left( \begin-a_2/a_1\\ 1 \\ 0 \end \right) \quad u \quad X_2=\left( \begin-a_3/a_1\\ 0 \\ 1 \end \right) $$ не задают решения нашего уравнения — если только $ b\ne 0_<> $. Но оба удовлетворяют однородному уравнению $$ a_1x_1+a_2x_2+a_3x_3=0 , $$ Последнее также определяет плоскость — параллельную исходной и проходящую через начало координат. Первая плоскость получается из второй сдвигом (параллельным переносом) на вектор $ \vec $: и этот факт составляет геометрическую интерпретацию теоремы, сформулированной в конце ☞ ПУНКТА:
Теорема.Общее решение системы уравнений $ A X=\mathcal B $ представимо в виде суммы какого-то частного решения этой системы и общего решения соответствующей однородной системы $ A X=\mathbb O $.
Координаты произвольной точки плоскости $ a_1x_1+a_2x_2+a_3x_3=0 $ задаются соотношениями $$ \left( \beginx_1 \\ x_2 \\ x_3 \end \right)=tX_1+uX_2 \ . $$ Векторы пространства $ \vec $ и $ \vec $ являются базисными векторами плоскости — любой вектор $ \vec $, лежащий в плоскости, через них выражается и они линейно независимы. Но $ X_ <1>$ и $ X_ <2>$ определяют фундаментальную систему решений однородного уравнения. Таким образом, мы получили геометрическую интерпретацию для ФСР: она задает базисные векторы плоскости, проходящей через начало координат.
Теперь рассмотрим систему из двух уравнений: $$ \left\<\begina_<11>x_1 +a_<12>x_2+a_<13>x_3 &=&b_1,\\ a_<21>x_1 +a_<22>x_2+a_<23>x_3 &=&b_2. \end\right. $$ Ее можно интерпретировать как пересечение двух плоскостей в $ \mathbb R^ <3>$. Здесь уже возможны варианты: пересечение может оказаться как пустым так и непустым. От чего это зависит? — В соответствии с теоремой Кронекера-Капелли, надо сравнить два числа $$ \operatorname \left( \begina_ <11>& a_ <12>& a_ <13>\\ a_ <21>& a_ <22>& a_ <23>\end \right) \quad u \quad \operatorname \left( \begina_ <11>& a_ <12>& a_ <13>& b_1 \\ a_ <21>& a_ <22>& a_ <23>& b_2 \end \right) \ . $$ Очевидно, ни одно из них не может быть большим $ 2_<> $. Если оба равны $ 2_<> $ и этот факт обеспечен, например, условием $$ \left| \begina_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right| \ne 0, $$ то решения системы определяют прямую в пространстве. Действительно, при таком условии систему можно разрешить относительно неизвестных $ x_ <1>$ и $ x_ <2>$ и представить общее решение в виде: $$ x_1= \frac<\left|\beginb_1 & a_ <12>\\ b_2 & a_ <22>\end \right|><\left|\begina_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right|>+ \frac<\left|\begina_ <12>& a_ <13>\\ a_ <21>& a_ <23>\end \right|><\left|\begina_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right|>x_3 \ , \quad x_2= \frac<\left|\begina_ <11>& b_ <1>\\ a_ <12>& b_ <2>\end \right|><\left|\begina_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right|>- \frac<\left|\begina_ <11>& a_ <13>\\ a_ <21>& a_ <23>\end \right|><\left|\begina_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right|>x_3 \ . $$ В этих формулах переменная $ x_ <3>$ принимает любое значение, а значения переменных $ x_ <1>$ и $ x_ <2>$ линейно выражаются через $ x_ <3>$. Общее решение фактически задает прямую в параметрическом виде: координаты произвольной ее точки определяются формулами $$ \left( \beginx_1 \\ x_2 \\ x_3 \end \right)=X_0+tX_1 \ , $$ где вектор $$ \quad X_0 = \left(\frac<\left|\begina_ <11>& b_ <1>\\ a_ <12>& b_ <2>\end \right|><\left|\begina_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right|> , \ \frac<\left|\begina_ <11>& b_ <1>\\ a_ <12>& b_ <2>\end \right|><\left|\begina_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right|>,\ 0\right)^ <\top>$$ задает координаты точки, лежащей на прямой (т.е. принадлежащей пересечению плоскостей), а вектор $$ X_1= \left(\frac<\left|\begina_ <12>& a_ <13>\\ a_ <21>& a_ <23>\end \right|><\left|\begina_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right|>,\ — \frac<\left|\begina_ <11>& a_ <13>\\ a_ <21>& a_ <23>\end \right|><\left|\begina_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right|>, \ 1 \right)^ <\top>$$ является направляющим для прямой. С тем же успехом мы могли бы взять в качестве направляющего вектор, получающийся растяжением $ X_ <1>$: $$ \tilde X_1 = \left(\left|\begina_ <12>& a_ <13>\\ a_ <21>& a_ <23>\end \right|,\ — \left|\begina_ <11>& a_ <13>\\ a_ <21>& a_ <23>\end \right|, \ \left|\begina_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right| \right)^ <\top>\ . $$ Очевидно, что любой из векторов $ X_ <1>$ или $ \tilde X_1 $ задает фундаментальную систему решений однородной системы уравнений 10) $$ \left\<\begina_<11>x_1 +a_<12>x_2+a_<13>x_3 &=&0,\\ a_<21>x_1 +a_<22>x_2+a_<23>x_3 &=&0. \end\right. $$ Последняя определяет прямую в $ \mathbb R^3 $, проходящую через начало координат. Мы снова получаем интерпретацию теоремы: общее решение неоднородной системы получается сдвигом (параллельным переносом) общего решения однородной системы на вектор $ \vec $.
Мы рассмотрели пока только случай пересекающихся плоскостей в пространстве. Его можно считать общим, т.е. случаем «как правило»: две случайным образом выбранные плоскости в $ \mathbb R^ <3>$ пересекаться будут. Исследуем теперь исключительный случай — параллельности плоскостей. Исключительность этого случая может быть проверена и аналитикой. Для несовместности системы из двух уравнений необходимо, чтобы ранг ее матрицы $$ \left( \begina_ <11>& a_ <12>& a_ <13>\\ a_ <21>& a_ <22>& a_ <23>\end \right) $$ оказался меньшим $ 2_<> $. Это равносильно тому, что все миноры второго порядка этой матрицы обращаются в нуль: $$ \left| \begina_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right|=0,\ \left| \begina_ <12>& a_ <13>\\ a_ <22>& a_ <23>\end \right| =0,\ \left| \begina_ <11>& a_ <13>\\ a_ <21>& a_ <23>\end \right|=0 \ . $$ Эти условия можно переписать в виде $$ \frac>>=\frac>>=\frac>> \ ; $$ и, если обозначить общую величину последний отношений через $ \tau_<> $, то получаем: $$ (a_<11>,a_<12>,a_<13>)=\tau (a_<21>,a_<22>,a_<23>) . $$ Если вспомнить, что каждый из этих наборов коэффициентов задает вектор $ \vec> $ в $ \mathbb R^ <3>$, перпендикулярный соответствующей плоскости, то, в самом деле, плоскости, определяемые уравнениями, оказываются параллельными. Пересекаться они, как правило, не будут: для пересечения необходимо, чтобы расширенная матрица системы $$ \left( \begina_ <11>& a_ <12>& a_ <13>& b_1 \\ a_ <21>& a_ <22>& a_ <23>& b_2 \end \right) $$ имела ранг меньший $ 2_<> $. Это возможно только при условии когда коэффициенты правых частей удовлетворяют соотношению $$ b_1 = \tau b_2 $$ при величине $ \tau_<> $ определенной выше. При выполнении этого условия второе уравнение получается из первого домножением на $ \tau_<> $ и соответствующие плоскости попросту совпадают.
Перейдем теперь к системе из трех уравнений: $$ \left\< \begina_<11>x_1 +&a_<12>x_2+&a_<13>x_3=&b_1, \\ a_<21>x_1 +&a_<22>x_2+&a_<23>x_3=&b_2, \\ a_<31>x_1 +&a_<32>x_2+&a_<33>x_3=&b_3. \end \right. $$ Вариантов взаимного расположения трех плоскостей в $ \mathbb R^ <3>$ уже значительно больше. Какой из них будет самым распространенным, то есть случаем «как правило»? Геометрически ответ очевиден: если пересечение двух плоскостей определяет, как правило, прямую, то эта прямая пересекается с третьей плоскостью, как правило, в одной-единственной точке. И алгебра подтверждает геометрию: в комментарии к теореме Крамера говорится, что система, число уравнений которой совпадает с числом неизвестных, как правило, имеет единственное решение. Условие для этого случая «как правило» дается той же теоремой Крамера: $$ \left| \begina_ <11>& a_ <12>& a_<13>\\ a_ <21>& a_ <22>& a_ <23>\\ a_ <31>& a_ <32>& a_ <33>\end \right| \ne 0 . $$
Теорема Кронекера-Капелли в этом случае не нужна — нет, она остается справедливой! — но проверка условия на ранги матриц тривиальна: они оба равны $ 3_<> $. Если же указанный определитель обращается в нуль, то этот факт эквивалентен тому, что три строки определителя линейно зависимы. Например, возможно, что строка $ (a_<31>,a_<32>, a_<33>) $ может быть представлена в виде линейной комбинации первых двух строк. Вспомним геометрический смысл этих строк: они задают координаты векторов, перпендикулярных соответствующим плоскостям. Если система уравнений $$ \left\<\begina_<11>x_1 +a_<12>x_2+a_<13>x_3 &=&b_1,\\ a_<21>x_1 +a_<22>x_2+a_<23>x_3 &=&b_2 \end\right. $$ определяет прямую в $ \mathbb R^ <3>$, то оба вектора $ \vec> $ и $ \vec> $ при $ A^<[1]>= (a_<11>,a_<12>, a_<13>) $ и $ A^<[2]>= (a_<21>,a_<22>, a_<23>) $ перпендикулярны этой прямой; любая их комбинация также перпендикулярна этой прямой, а, следовательно, плоскость $$ a_<31>x_1 +a_<32>x_2+a_<33>x_3 =b_3 $$ будет ей параллельна.
Статья не закончена!
Ортогональность
Геометрические соображения из предыдущего пункта могут быть обобщены на случай когда размерности рассматриваемых пространств увеличиваются, и мы говорим о точках и векторах многомерных пространств. В последующих пунктах нам потребуются понятия линейной оболочки, линейного пространства, размерности, базиса и координат применительно к векторам-столбцам или векторам-строкам. Их можно найти ☞ ЗДЕСЬ.
Задача решения системы линейных уравнений $$ \left\< \begin3x_1&+4x_2&-x_3&=2, \\ x_1&-2x_2&+3x_3&=1 \end \right. $$ может быть рассмотрена с двух точек зрения. С одной стороны, переписав систему в виде $$ x_1\left(\begin3 \\ 1 \end \right)+ x_2\left(\begin4 \\ -2 \end \right)+ x_3\left(\begin-1 \\ 3 \end \right)= \left(\begin2 \\ 1 \end \right) \ , $$ можно говорить о поиске линейной комбинации столбцов $$ \left(\begin3 \\ 1 \end \right),\ \left(\begin4 \\ -2 \end \right),\ \left(\begin-1 \\ 3 \end \right) $$ равной заданному столбцу $$ \left(\begin2 \\ 1 \end \right) \ . $$ В случае произвольной системы, записанной в матричном виде $$ A_X=\mathcal B_ \ $$ совместность системы интерпретировать в смысле принадлежности столбца $ \mathcal B $ линейной оболочке столбцов $ A_<[1]>,\dots,A_ <[n]>$: $$ \mathcal B=x_1 A_<[1]>+\dots+x_nA_ <[n]>\quad \iff \quad \mathcal B \in \mathcal L (A_<[1]>,\dots,A_<[n]>) \ . $$ В случае положительного ответа числа $ x_<1>,\dots,x_n $ интерпретируются как координаты столбца $ \mathcal B $ в системе столбцов 11) $ \,\dots,A_<[n]>\> $.
С другой стороны, к той же задаче решения системы уравнений, в предыдущем ПУНКТЕ мы подошли с другой стороны. Первое из уравнений системы $$ 3\,x_1+4\,x_2-x_3=2 $$ можно интерпретировать так: скалярное произведение векторов $ \vec<<\mathbf OA>^<[1]>> $ и $ \vec<<\mathbf OX>> $ равно фиксированному числу $ 2_<> $. Здесь вектора рассматриваются в пространстве строк $ \mathbb R_<>^ <3>$; считается, что каждый вектор имеет начало в начале координат $ \mathbf O=[0,0,0] $, а конец — в точке с координатами $ [3,4,-1] $ или, соответственно, $ [x_1,x_2,x_3] $. Если скалярное произведение векторов обозначать скобками $ \langle <> \mbox < >\rangle $, то систему уравнений можно переписать в виде $$ \langle \vec<<\mathbf OA>^<[1]>> ,\ \vec<<\mathbf OX>> \rangle=2,\ \langle \vec<<\mathbf OA>^<[2]>> ,\ \vec<<\mathbf OX>> \rangle=1 \quad npu \quad A^ <[1]>= [3,4,-1], A^<[2]>=[1,-2,3] $$ — строках матрицы $ A_<> $. И задачу решения такой системы понимать в смысле: найти координаты всех векторов-строк $ [x_1,x_2,x_3] $ которые обеспечат нам заданные значения скалярных произведений с двумя фиксированными векторами.
Геометрическая интерпретация еще более упрощается если рассмотреть случай однородной системы уравнений. Так, решить систему уравнений $$ \left\< \begin3x_1&+4x_2&-x_3&=0, \\ x_1&-2x_2&+3x_3&=0 \end \right. $$ означает подобрать вектор $ \vec<<\mathbf OX>> $ перпендикулярный (ортогональный) одновременно обоим векторам $ \vec<<\mathbf OA>^<[1]>> $ и $ \vec<<\mathbf OA>^<[2]>> $. Очевидно, что таких векторов в $ \mathbb R^ <3>$ бесконечно много — найдя хотя бы один такой вектор $ \vec<<\mathbf OX>> $, другие получим его растяжением: $ \alpha \cdot \vec<<\mathbf OX>> $ остается перпендикулярным векторам $ \vec<<\mathbf OA>^<[1]>> $ и $ \vec<<\mathbf OA>^<[2]>> $ при $ \forall \alpha \in \mathbb R $.
Все эти геометрические соображения обобщаются в произвольное пространство $ \mathbb R_<>^ $ строк или столбцов, состоящих из $ n_<> $ вещественных чисел (компонент). Для этого приходится обобщать понятие скалярного произведения. В общем случае оно вводится аксиоматически (и, более того, в одном и том же множестве может быть определено разными способами, см. ☞ ЕВКЛИДОВО ПРОСТРАНСТВО ). Мы сейчас не будем залезать так глубоко в эту аксиоматику, а просто определим скалярное произведение двух строк $ X=[x_1,x_2,\dots,x_n] $ и $ Y=[y_1,y_2,\dots,y_n] $ формулой $$ \langle X,Y \rangle=x_1y_1+x_2y_2+\dots+x_ny_n \ $$ и продекларируем без обоснований, что все привычные нам по случаям $ \mathbb R^ <2>$ и $ \mathbb R^ <3>$ свойства скалярного произведения будут выполнены.
В терминах скалярного произведения, задачу решения системы линейных уравнений можно переформулировать как поиск строки $ X=[x_1,x_2,\dots,x_n] $, ортогональной всем строкам матрицы $ A_<> $: $$ \langle A^<[1]>,X \rangle=0, \langle A^<[2]>,X \rangle=0,\dots, \langle A^<[m]>,X \rangle=0 \ . $$ Множество таких строк образует линейное подпространство пространства $ \mathbb R_<>^ $, это подпространство является ортогональным дополнением линейной оболочки $ \mathcal L ( A^<[1]>, A^<[2]>,\dots, A^ <[m]>) $ в пространстве $ \mathbb R_<>^ $. Это подпространство называется нуль-пространством матрицы или ядром матрицы $ A_<> $ и обозначается 12) $ <\mathcal K>er (A) $. Фундаментальная система решений системы $ AX=\mathbb O $ составляет базис этого подпространства. Для произвольного линейного пространства количество векторов его базиса называется размерностью пространства и обозначается $ \operatorname $. Во введенных обозначениях теорема из ☞ ПУНКТА переформулируется так:
Теорема. $ \operatorname \left( <\mathcal K>er (A) \right)=n- \mathfrak r $, где $ n_<> $ — количество столбцов матрицы $ A_<> $, а $ \mathfrak r=\operatorname (A) $ — ее ранг.
Метода Гаусса: примеры решения СЛАУ
В данной статье мы:
дадим определение методу Гаусса,
разберем алгоритм действий при решении линейных уравнений, где количество уравнений совпадает c количеством неизвестных переменных, а определитель не равен нулю;
разберем алгоритм действий при решении СЛАУ с прямоугольной или вырожденной матрицей.
Метод Гаусса — что это такое?
Метод Гаусса — это метод, который применяется при решении систем линейных алгебраических уравнений и имеет следующие преимущества:
отсутствует необходимость проверять систему уравнений на совместность;
есть возможность решать системы уравнений, где:
количество определителей совпадает с количеством неизвестных переменных;
количество определителей не совпадает с количеством неизвестных переменных;
определитель равен нулю.
результат выдается при сравнительно небольшом количестве вычислительных операций.
Основные определения и обозначения
Есть система из р линейных уравнений с n неизвестными ( p может быть равно n ):
a 11 x 1 + a 12 x 2 + . . . + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + . . . + a 2 n x n = b 2 ⋯ a p 1 x 1 + a p 2 x 2 + . . . + a p n x n = b p ,
где x 1 , x 2 , . . . . , x n — неизвестные переменные, a i j , i = 1 , 2 . . . , p , j = 1 , 2 . . . , n — числа (действительные или комплексные), b 1 , b 2 , . . . , b n — свободные члены.
Если b 1 = b 2 = . . . = b n = 0 , то такую систему линейных уравнений называют однородной, если наоборот — неоднородной.
Решение СЛАУ — совокупность значения неизвестных переменных x 1 = a 1 , x 2 = a 2 , . . . , x n = a n , при которых все уравнения системы становятся тождественными друг другу.
Совместная СЛАУ — система, для которой существует хотя бы один вариант решения. В противном случае она называется несовместной.
Определенная СЛАУ — это такая система, которая имеет единственное решение. В случае, если решений больше одного, то такая система будет называться неопределенной.
Координатный вид записи:
a 11 x 1 + a 12 x 2 + . . . + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + . . . + a 2 n x n = b 2 ⋯ a p 1 x 1 + a p 2 x 2 + . . . + a p n x n = b p
Матричный вид записи: A X = B , где
A = a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋯ ⋯ ⋯ ⋯ a p 1 a p 2 ⋯ a p n — основная матрица СЛАУ;
X = x 1 x 2 ⋮ x n — матрица-столбец неизвестных переменных;
B = b 1 b 2 ⋮ b n — матрица свободных членов.
Расширенная матрица — матрица, которая получается при добавлении в качестве ( n + 1 ) столбца матрицу-столбец свободных членов и имеет обозначение Т .
T = a 11 a 12 ⋮ a 1 n b 1 a 21 a 22 ⋮ a 2 n b 2 ⋮ ⋮ ⋮ ⋮ ⋮ a p 1 a p 2 ⋮ a p n b n
Вырожденная квадратная матрица А — матрица, определитель которой равняется нулю. Если определитель не равен нулю, то такая матрица, а потом называется невырожденной.
Описание алгоритма использования метода Гаусса для решения СЛАУ с равным количеством уравнений и неизвестных (обратный и прямой ход метода Гаусса)
Для начала разберемся с определениями прямого и обратного ходов метода Гаусса.
Прямой ход Гаусса — процесс последовательного исключения неизвестных.
Обратный ход Гаусса — процесс последовательного нахождения неизвестных от последнего уравнения к первому.
Алгоритм метода Гаусса:
Решаем систему из n линейных уравнений с n неизвестными переменными:
a 11 x 1 + a 12 x 2 + a 13 x 3 + . . . + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + a 23 x 3 + . . . + a 2 n x n = b 2 a 31 x 1 + a 32 x 2 + a 33 x 3 + . . . + a 3 n x n = b 3 ⋯ a n 1 x 1 + a n 2 x 2 + a n 3 x 3 + . . . + a n n x n = b n
Определитель матрицы не равен нулю.
a 11 не равен нулю — всегда можно добиться этого перестановкой уравнений системы;
исключаем переменную x 1 из всех уравнений систему, начиная со второго;
прибавим ко второму уравнению системы первое, которое умножено на — a 21 a 11 , прибавим к третьему уравнению первое умноженное на — a 21 a 11 и т.д.
После проведенных действий матрица примет вид:
a 11 x 1 + a 12 x 2 + a 13 x 3 + . . . + a 1 n x n = b 1 a ( 1 ) 22 x 2 + a ( 1 ) 23 x 3 + . . . + a ( 1 ) 2 n x n = b ( 1 ) 2 a ( 1 ) 32 x 2 + a ( 1 ) 33 x 3 + . . . + a ( 1 ) 3 n x n = b ( 1 ) 3 ⋯ a ( 1 ) n 2 x 2 + a ( 1 ) n 3 x 3 + . . . + a ( 1 ) n n x n = b ( 1 ) n ,
где a i j ( 1 ) = a i j + a 1 j ( — a i 1 a 11 ) , i = 2 , 3 , . . . , n , j = 2 , 3 , . . . , n , b i ( 1 ) = b i + b 1 ( — a i 1 a 11 ) , i = 2 , 3 , . . . , n .
Далее производим аналогичные действия с выделенной частью системы:
a 11 x 1 + a 12 x 2 + a 13 x 3 + . . . + a 1 n x n = b 1 a ( 1 ) 22 x 2 + a ( 1 ) 23 x 3 + . . . + a ( 1 ) 2 n x n = b ( 1 ) 2 a ( 1 ) 32 x 2 + a ( 1 ) 33 x 3 + . . . + a ( 1 ) 3 n x n = b ( 1 ) 3 ⋯ a ( 1 ) n 2 x 2 + a ( 1 ) n 3 x 3 + . . . + a ( 1 ) n n x n = b ( 1 ) n
Считается, что a 22 ( 1 ) не равна нулю. Таким образом, приступаем к исключению неизвестной переменной x 2 из всех уравнений, начиная с третьего:
к третьему уравнению систему прибавляем второе, которое умножено на — a ( 1 ) 42 a ( 1 ) 22 ;
к четвертому прибавляем второе, которое умножено на — a ( 1 ) 42 a ( 1 ) 22 и т.д.
После таких манипуляций СЛАУ имеет следующий вид:
a 11 x 1 + a 12 x 2 + a 13 x 3 + . . . + a 1 n x n = b 1 a ( 1 ) 22 x 2 + a ( 1 ) 23 x 3 + . . . + a ( 1 ) 2 n x n = b ( 1 ) 2 a ( 2 ) 33 x 3 + . . . + a ( 2 ) 3 n x n = b ( 2 ) 3 ⋯ a ( 2 ) n 3 x 3 + . . . + a ( 2 ) n n x n = b ( 2 ) n ,
где a i j ( 2 ) = a ( 1 ) i j + a 2 j ( — a ( 1 ) i 2 a ( 1 ) 22 ) , i = 3 , 4 , . . . , n , j = 3 , 4 , . . . , n , b i ( 2 ) = b ( 1 ) i + b ( 1 ) 2 ( — a ( 1 ) i 2 a ( 1 ) 22 ) , i = 3 , 4 , . . . , n . .
Таким образом, переменная x 2 исключена из всех уравнений, начиная с третьего.
Далее приступаем к исключению неизвестной x 3 , действуя по аналоги с предыдущим образцом:
a 11 x 1 + a 12 x 2 + a 13 x 3 + . . . + a 1 n x n = b 1 a ( 1 ) 22 x 2 + a ( 1 ) 23 x 3 + . . . + a ( 1 ) 2 n x n = b ( 1 ) 2 a ( 2 ) 33 x 3 + . . . + a ( 2 ) 3 n x n = b ( 2 ) 3 ⋯ a ( n — 1 ) n n x n = b ( n — 1 ) n
После того как система приняла такой вид, можно начать обратный ход метода Гаусса:
вычисляем x n из последнего уравнения как x n = b n ( n — 1 ) a n n ( n — 1 ) ;
с помощью полученного x n находим x n — 1 из предпоследнего уравнения и т.д., находим x 1 из первого уравнения.
Найти решение системы уравнений методом Гаусса:
3 x 1 + 2 x 2 + x 3 + x 4 = — 2 x 1 — x 2 + 4 x 3 — x 4 = — 1 — 2 x 1 — 2 x 2 — 3 x 3 + x 4 = 9 x 1 + 5 x 2 — x 3 + 2 x 4 = 4
Коэффициент a 11 отличен от нуля, поэтому приступаем к прямому ходу решения, т.е. к исключению переменной x 11 из всех уравнений системы, кроме первого. Для того, чтобы это сделать, прибавляем к левой и правой частям 2-го, 3-го и 4-го уравнений левую и правую часть первого, которая умножена на — a 21 a 11 :
— 1 3 , — а 31 а 11 = — — 2 3 = 2 3 и — а 41 а 11 = — 1 3 .
3 x 1 + 2 x 2 + x 3 + x 4 = — 2 x 1 — x 2 + 4 x 3 — x 4 = — 1 — 2 x 1 — 2 x 2 — 3 x 3 + x 4 = 9 x 1 + 5 x 2 — x 3 + 2 x 4 = 4 ⇔
⇔ 3 x 1 + 2 x 2 + x 3 + x 4 = — 2 x 1 — x 2 + 4 x 3 — x 4 + ( — 1 3 ) ( 3 x 1 + 2 x 2 + x 3 + x 4 ) = — 1 + ( — 1 3 ) ( — 2 ) — 2 x 1 — 2 x 2 — 3 x 3 + x 4 + 2 3 ( 3 x 1 + 2 x 2 + x 3 + x 4 ) = 9 + 2 3 ( — 2 ) x 1 + 5 x 2 — x 3 + 2 x 4 + ( — 1 3 ) ( 3 x 1 + 2 x 2 + x 3 + x 4 ) = 4 + ( — 1 3 ) ( — 2 ) ⇔
⇔ 3 x 1 + 2 x 2 + x 3 + x 4 = — 2 — 5 3 x 2 + 11 3 x 3 — 4 3 x 4 = — 1 3 — 2 3 x 2 — 7 3 x 3 + 5 3 x 4 = 23 3 13 3 x 2 — 4 3 x 3 + 5 3 x 4 = 14 3
Мы исключили неизвестную переменную x 1 , теперь приступаем к исключению переменной x 2 :
— a 32 ( 1 ) a 22 ( 1 ) = — — 2 3 — 5 3 = — 2 5 и а 42 ( 1 ) а 22 ( 1 ) = — 13 3 — 5 3 = 13 5 :
3 x 1 + 2 x 2 + x 3 + x 4 = — 2 — 5 3 x 2 + 11 3 x 3 — 4 3 x 4 = — 1 3 — 2 3 x 2 — 7 3 x 3 + 5 3 x 4 = 23 3 13 3 x 2 — 4 3 x 3 + 5 3 x 4 = 14 3 ⇔
⇔ 3 x 1 + 2 x 2 + x 3 + x 4 = — 2 — 5 3 x 2 + 11 3 x 3 — 4 3 x 4 = — 1 3 — 2 3 x 2 — 7 3 x 3 + 5 3 x 4 + ( — 2 5 ) ( — 5 3 x 2 + 11 3 x 3 — 4 3 x 4 ) = 23 3 + ( — 2 5 ) ( — 1 3 ) 13 3 x 2 — 4 3 x 3 + 5 3 x 4 + 13 5 ( — 5 3 x 2 + 11 3 x 3 — 4 3 x 4 ) = 14 3 + 13 5 ( — 1 3 ) ⇔
⇔ 3 x 1 + 2 x 2 + x 3 + x 4 = — 2 — 5 3 x 2 + 11 3 x 3 — 4 3 x 4 = — 1 3 — 19 5 x 3 + 11 5 x 4 = 39 5 41 5 x 3 — 9 5 x 4 = 19 5
Для того чтобы завершить прямой ход метода Гаусса, необходимо исключить x 3 из последнего уравнения системы — а 43 ( 2 ) а 33 ( 2 ) = — 41 5 — 19 5 = 41 19 :
3 x 1 + 2 x 2 + x 3 + x 4 = — 2 — 5 3 x 2 + 11 3 x 3 — 4 3 x 4 = — 1 3 — 19 5 x 3 + 11 5 x 4 = 39 5 41 5 x 3 — 9 5 x 4 = 19 5 ⇔
3 x 1 + 2 x 2 + x 3 + x 4 = — 2 — 5 3 x 2 + 11 3 x 3 — 4 3 x 4 = — 1 3 — 19 5 x 3 + 11 5 x 4 = 39 5 41 5 x 3 — 9 5 x 4 + 41 19 ( — 19 5 x 3 + 11 5 x 4 ) = 19 5 + 41 19 39 5 ⇔
⇔ 3 x 1 + 2 x 2 + x 3 + x 4 = — 2 — 5 3 x 2 + 11 3 x 3 — 4 3 x 4 = — 1 3 — 19 5 x 3 + 11 5 x 4 = 39 5 56 19 x 4 = 392 19
Обратный ход метода Гаусса:
из последнего уравнения имеем: x 4 = 392 19 56 19 = 7 ;
из 3-го уравнения получаем: x 3 = — 5 19 ( 39 5 — 11 5 x 4 ) = — 5 19 ( 39 5 — 11 5 × 7 ) = 38 19 = 2 ;
из 1-го: x 1 = 1 3 ( — 2 — 2 x 2 — x 3 — x 4 ) = — 2 — 2 × ( — 1 ) — 2 — 7 3 = — 9 3 = — 3 .
Ответ: x 1 = — 3 ; x 2 = — 1 ; x 3 = 2 ; x 4 = 7
Найти решение этого же примера методом Гаусса в матричной форме записи:
3 x 1 + 2 x 2 + x 3 + x 4 = — 2 x 1 — x 2 + 4 x 3 — x 4 = — 1 — 2 x 1 — 2 x 2 — 3 x 3 + x 4 = 9 x 1 + 5 x 2 — x 3 + 2 x 4 = 4
Расширенная матрица системы представлена в виде:
x 1 x 2 x 3 x 4 3 2 1 1 1 — 1 4 — 1 — 2 — 2 — 3 1 1 5 — 1 2 — 2 — 1 9 4
Прямой ход метода Гаусса в данном случае предполагает приведение расширенной матрицы к трапецеидальному виду при помощи элементарных преобразований. Этот процесс очень поход на процесс исключения неизвестных переменных в координатном виде.
Преобразование матрицы начинается с превращения всех элементов нулевые. Для этого к элементам 2-ой, 3-ей и 4-ой строк прибавляем соответствующие элементы 1-ой строки, которые умножены на — a 21 a 11 = — 1 3 , — a 31 a 11 = — — 2 3 = 2 3 и н а — а 41 а 11 = — 1 3 .
Дальнейшие преобразования происходит по такой схеме: все элементы во 2-ом столбце, начиная с 3-ей строки, становятся нулевыми. Такой процесс соответствует процессу исключения переменной . Для того, чтобы выполнить этой действие, необходимо к элементам 3-ей и 4-ой строк прибавить соответствующие элементы 1-ой строки матрицы, которая умножена на — а 32 ( 1 ) а 22 ( 1 ) = — 2 3 — 5 3 = — 2 5 и — а 42 ( 1 ) а 22 ( 1 ) = — 13 3 — 5 3 = 13 5 :
Теперь исключаем переменную x 3 из последнего уравнения — прибавляем к элементам последней строки матрицы соответствующие элементы последней строки, которая умножена на а 43 ( 2 ) а 33 ( 2 ) = — 41 5 — 19 5 = 41 19 .
x 1 x 2 x 3 x 4 3 0 0 0 | а 1 0 — 5 3 0 0 | а 2 0 0 — 19 5 0 | а 3 0 0 0 56 19 | 392 19 , где а 1 , а 2 , а 3 — некоторые числа.
Такие преобразования выступают аналогом прямому ходу, только преобразования выполняются не от 1-ой строки уравнения, а от последней. Прибавляем к элементам 3-ей, 2-ой и 1-ой строк соответствующие элементы последней строки, которая умножена на
— 11 5 56 19 = — 209 280 , н а — — 4 3 56 19 = 19 42 и н а — 1 56 19 = 19 56 .
Полученная матрица соответствует системе уравнений
3 x 1 = — 9 — 5 3 x 2 = 5 3 — 19 5 x 3 = — 38 5 56 19 x 4 = 392 19 , откуда находим неизвестные переменные.
Ответ: x 1 = — 3 , x 2 = — 1 , x 3 = 2 , x 4 = 7 .
Описание алгоритма использования метода Гаусса для решения СЛАУ с несовпадающим количеством уравнений и неизвестных, или с вырожденной системой матрицы
Если основная матрица квадратная или прямоугольная, то системы уравнений могут иметь единственное решение, могут не иметь решений, а могут иметь бесконечное множество решений.
Из данного раздела мы узнаем, как с помощью метода Гаусса определить совместность или несовместность СЛАУ, а также, в случае совместности, определить количество решений для системы.
В принципе, метод исключения неизвестных при таких СЛАУ остается таким же, однако есть несколько моментов, на которых необходимо заострить внимание.
На некоторых этапах исключения неизвестных, некоторые уравнения обращаются в тождества 0=0. В таком случае, уравнения можно смело убрать из системы и продолжить прямой ход метода Гаусса.
Если мы исключаем из 2-го и 3-го уравнения x 1 , то ситуация оказывается следующей:
x 1 + 2 x 2 — x 3 + 3 x 4 = 7 2 x 1 + 4 x 2 — 2 x 3 + 6 x 4 = 14 x — x + 3 x + x = — 1 ⇔
x 1 + 2 x 2 — x 3 + 3 x 4 = 7 2 x 1 + 4 x 2 — 2 x 3 + 6 x 4 + ( — 2 ) ( x 1 + 2 x 2 — x 3 + 3 x 4 ) = 14 + ( — 2 ) × 7 x — x + 3 x + x + ( — 1 ) ( x 1 + 2 x 2 — x 3 + 3 x 4 ) = — 1 + ( — 1 ) × 7 ⇔
⇔ x 1 + 2 x 2 — x 3 + 3 x 4 = 7 0 = 0 — 3 x 2 + 4 x 3 — 2 x 4 = — 8
Из этого следует, что 2-ое уравнение можно смело удалять из системы и продолжать решение.
Если мы проводим прямой ход метода Гаусса, то одно или несколько уравнений может принять вид — некоторое число, которое отлично от нуля.
Это свидетельствует о том, что уравнение, обратившееся в равенство 0 = λ , не может обратиться в равенство ни при каких любых значениях переменных. Проще говоря, такая система несовместна (не имеет решения).
В случае если при проведении прямого хода метода Гаусса одно или несколько уравнений принимают вид 0 = λ , где λ — некоторое число, которое отлично от нуля, то система несовместна.
Если же в конце прямого хода метода Гаусса получается система, число уравнений которой совпадает с количеством неизвестных, то такая система совместна и определена: имеет единственное решение, которое вычисляется обратным ходом метода Гаусса.
Если при завершении прямого хода метода Гаусса число уравнений в системе оказывается меньше количества неизвестных, то такая система совместна и имеет бесконечно количество решений, которые вычисляются при обратном ходе метода Гаусса.