Основные понятия общей теории систем линейных уравнений

Системы линейных уравнений: основные понятия

— это объединение из n линейных уравнений, каждое из которых содержит k переменных. Записывается это так:

Многие, впервые сталкиваясь с высшей алгеброй, ошибочно полагают, что число уравнений обязательно должно совпадать с числом переменных. В школьной алгебре так обычно и бывает, однако для высшей алгебры это, вообще говоря, неверно.

— это последовательность чисел ( k ₁, k ₂, . k_n ), которая является решением каждого уравнения системы, т.е. при подстановке в это уравнение вместо переменных x ₁, x ₂, . x_n дает верное числовое равенство.

Соответственно, решить систему уравнений — значит найти множество всех ее решений или доказать, что это множество пусто. Поскольку число уравнений и число неизвестных может не совпадать, возможны три случая:

Система несовместна, т.е. множество всех решений пусто. Достаточно редкий случай, который легко обнаруживается независимо от того, каким методом решать систему.
Система совместна и определена, т.е. имеет ровно одно решение. Классический вариант, хорошо известный еще со школьной скамьи.
Система совместна и не определена, т.е. имеет бесконечно много решений. Это самый жесткий вариант. Недостаточно указать, что «система имеет бесконечное множество решений» — надо описать, как устроено это множество.

Переменная x_i называется , если она входит только в одно уравнение системы, причем с коэффициентом 1. Другими словами, в остальных уравнениях коэффициент при переменной x_i должен быть равен нулю.

Если в каждом уравнении выбрать по одной разрешенной переменной, получим набор разрешенных переменных для всей системы уравнений. Сама система, записанная в таком виде, тоже будет называться разрешенной. Вообще говоря, одну и ту же исходную систему можно свести к разным разрешенным, однако сейчас нас это не волнует. Вот примеры разрешенных систем:

Обе системы являются разрешенными относительно переменных x ₁, x ₃ и x ₄. Впрочем, с тем же успехом можно утверждать, что вторая система — разрешенная относительно x ₁, x ₃ и x ₅. Достаточно переписать самое последнее уравнение в виде x ₅ = x ₄.

Теперь рассмотрим более общий случай. Пусть всего у нас k переменных, из которых r являются разрешенными. Тогда возможны два случая:

Число разрешенных переменных r равно общему числу переменных k : r = k . Получаем систему из k уравнений, в которых r = k разрешенных переменных. Такая система является совместной и определенной, т.к. x ₁ = b ₁, x ₂ = b ₂, . x_k = b_k ;
Число разрешенных переменных r меньше общего числа переменных k : r k . Остальные ( k − r ) переменных называются свободными — они могут принимать любые значения, из которых легко вычисляются разрешенные переменные.

Так, в приведенных выше системах переменные x ₂, x ₅, x ₆ (для первой системы) и x ₂, x ₅ (для второй) являются свободными. Случай, когда есть свободные переменные, лучше сформулировать в виде теоремы:

Обратите внимание: это очень важный момент! В зависимости от того, как вы запишете итоговую систему, одна и та же переменная может быть как разрешенной, так и свободной. Большинство репетиторов по высшей математике рекомендуют выписывать переменные в лексикографическом порядке, т.е. по возрастанию индекса. Однако вы совершенно не обязаны следовать этому совету.

Теорема. Если в системе из n уравнений переменные x ₁, x ₂, . x_r — разрешенные, а x _{r + 1}, x _{r + 2}, . x _k — свободные, то:

Если задать значения свободным переменным ( x _{r + 1} = t _{r + 1}, x _{r + 2} = t _{r + 2}, . x_k = t_k ), а затем найти значения x ₁, x ₂, . x_r , получим одно из решений.
Если в двух решениях значения свободных переменных совпадают, то значения разрешенных переменных тоже совпадают, т.е. решения равны.

В чем смысл этой теоремы? Чтобы получить все решения разрешенной системы уравнений, достаточно выделить свободные переменные. Затем, присваивая свободным переменным разные значения, будем получать готовые решения. Вот и все — таким образом можно получить все решения системы. Других решений не существует.

Вывод: разрешенная система уравнений всегда совместна. Если число уравнений в разрешенной системе равно числу переменных, система будет определенной, если меньше — неопределенной.

И все бы хорошо, но возникает вопрос: как из исходной системы уравнений получить разрешенную? Для этого существует метод Гаусса.

Системы линейных алгебраических уравнений: основные понятия, виды

Определение СЛАУ

Системой линейных алгебраических уравнений (СЛАУ) называется система вида:

$$\left\<\begin a_ <11>\cdot x_<1>+a_ <12>\cdot x_<2>+\ldots+a_ <1 n>\cdot x_=b_ <1>\\ a_ <21>\cdot x_<1>+a_ <22>\cdot x_<2>+\ldots+a_ <2 n>\cdot x_=b_ <2>\\ \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots . . \\ a_ \cdot x_<1>+a_ \cdot x_<2>+\ldots+a_ \cdot x_=b_ \end\right.$$

Упорядоченный набор значений $$\left\^<0>, x_<2>^<0>, \ldots, x_^<0>\right\>$$ называется решением системы, если при подстановке в уравнения все уравнения превращаются в тождество.

Задание. Проверить, является ли набор $<0,3>$ решением системы $\left\<\begin 3 x-2 y=-6 \\ 5 x+y=3 \end\right.$

Решение. Подставляем в каждое из уравнений системы $x=0$ и $y=3$:

$$5 x+y=3 \Rightarrow 5 \cdot 0+3=3 \Rightarrow 3=3$$

Так как в результате подстановки получили верные равенства, то делаем вывод, что заданный набор является решением указанной СЛАУ.

Ответ. Набор $<0,3>$ является решением системы $\left\<\begin 3 x-2 y=-6 \\ 5 x+y=3 \end\right.$

Виды систем

СЛАУ называется совместной, если она имеет, хотя бы одно решение.

В противном случае система называется несовместной.

Система $\left\<\begin 3 x-2 y=-6 \\ 5 x+y=3 \end\right.$ является совместной, так как она имеет, по крайней мере, одно решение $x=0$, $y=3$

Система $\left\<\begin 5 x+y=-6 \\ 5 x+y=3 \end\right.$ является несовместной, так как выражения, стоящие в левых частях уравнений системы равны, но правые части не равны друг другу. Ни для каких наборов $$ это не выполняется.

Система называется определённой, если она совместна и имеет единственное решение.

В противном случае (т.е. если система совместна и имеет более одного решения) система называется неопределённой.

Система называется однородной, если все правые части уравнений, входящих в нее, равны нулю одновременно.

Система называется квадратной, если количество уравнений равно количеству неизвестных.

Система $\left\<\begin 3 x-2 y=-6 \\ 5 x+y=3 \end\right.$ квадратная, так как неизвестных две и это число равно количеству уравнений системы.

Матричная запись систем уравнений

Исходную СЛАУ можно записать в матричном виде:

Задание. Систему $\left\<\begin x-y+z-4 t=0 \\ 5 x+y+t=-11 \end\right.$ записать в матричной форме и выписать все матрицы, которые ей соответствуют.

Решение. Заданную СЛАУ записываем в матричной форме $A. X=B$ , где матрица системы:

$$A=\left(\begin 1 & -1 & 1 & -4 \\ 5 & 1 & 0 & 1 \end\right)$$

то есть, запись СЛАУ в матричной форме:

$$\left(\begin 1 & -1 & 1 & -4 \\ 5 & 1 & 0 & 1 \end\right)\left(\begin x \\ y \\ z \\ t \end\right)=\left(\begin 0 \\ -11 \end\right)$$

Расширенная матрица системы

Задание. Записать матрицу и расширенную матрицу системы $\left\<\begin 2 x_<1>+x_<2>-x_<3>=4 \\ x_<1>-x_<2>=5 \end\right.$

Решение. Матрица системы $A=\left(\begin 2 & 1 & -1 \\ 1 & -1 & 0 \end\right)$ , тогда расширенная матрица $\tilde=(A \mid B)=\left(\begin 2 & 1 & -1 & 4 \\ 1 & -1 & 0 & 5 \end\right)$

Общая теория систем линейных уравнений

Условия совместности.

Займемся изучением систем из m уравнений с n неизвестными. Систему
\begina_<1>^<1>x^<1>+a_<2>^<1>x^<2>+. +a_^<1>x^=b^<1>,\\a_<1>^<2>x^<1>+a_<2>^<2>x^<2>+. +a_^<2>x^=b^<2>,\\\cdots\\a_<1>^x^<1>+a_<2>^x^<2>+. +a_^x^=b^\end мы можем кратко записать в виде \tag <1>A\boldsymbol=\boldsymbol.
Система задается своей расширенной матрицей A^ <*>, получаемой объединением матрицы системы A и столбца свободных членов \boldsymbol .

Простое и эффективное условие, необходимое и достаточное для совместности системы (1) , дает следующая теорема, называемая теоремой Кронекера-Капелли.

Система линейных уравнений совместна тогда и только тогда, когда ранг матрицы системы равен рангу расширенной матрицы.

Иначе утверждение теоремы можно сформулировать так: приписывание к матрице A размеров m \times n столбца \boldsymbol высоты m не меняет ее ранга тогда и только тогда, когда этот столбец — линейная комбинация столбцов A .

Если \mathbf\,A^ <*>= \mathbf\,A , то базисный минор A является базисным и для A^ <*>. Следовательно, \boldsymbol раскладывается по базисным столбцам A . Мы можем считать его линейной комбинацией всех столбцов A , добавив недостающие столбцы с нулевыми коэффициентами.

Обратно, если \boldsymbol раскладывается по столбцам A , то элементарными преобразованиями столбцов можно превратить A^ <*>в матрицу A_ <0>, получаемую из A приписыванием нулевого столбца. Из утверждения о том, что ранг матрицы не меняется при элементарных преобразованиях, следует \mathbf\,A_ <0>= \mathbf\,A^ <*>. С другой стороны, \mathbf\,A_ <0>= \mathbf\,A , так как добавление нулевого столбца не может создать новых невырожденных подматриц. Отсюда \mathbf\,A = \mathbf\,A^ <*>, как и требовалось.

Иначе это утверждение можно сформулировать так.

Система линейных уравнений несовместна тогда и только тогда, когда противоречивое равенство 0=1 является линейной комбинацией ее уравнений.

Равенство рангов матрицы системы и расширенной матрицы можно выразить, понимая ранг матрицы как строчный ранг. Это приведет нас к важной теореме, известной как теорема Фредгольма.

Транспонируем матрицу A системы (1) и рассмотрим систему из n линейных уравнений \tag <2>\begin a_<1>^<1>y_<1>+a_<1>^<2>y_<2>+. +a_<1>^y_=0,\\ a_<2>^<1>y_<1>+a_<2>^<2>y_<2>+. +a_<2>^y_=0,\\\cdots\\a_^<1>y_<1>+a_^<2>y_<2>+. +a_^y_=0\end с m неизвестными, матрицей A^и свободными членами, равными нулю. Она называется сопряженной однородной системой для системы (1) . Если \boldsymbol — столбец высоты m из неизвестных, то систему (2) можно записать как A^\boldsymbol=\boldsymbol , или лучше в виде \tag <3>\boldsymbol^A=\boldsymbol, где \boldsymbol — нулевая строка длины n .

Для того чтобы система (1) была совместна, необходимо и достаточно, чтобы каждое решение сопряженной однородной системы (3) удовлетворяло уравнению \tag <4>\boldsymbol^\boldsymbol=y_<1>b^<1>+. +y_b^=0.

1^ <\circ>. Пусть система (1) совместна, то есть существует столбец \boldsymbol высоты n , для которого A\boldsymbol=\boldsymbol . Тогда для любого столбца \boldsymbol высоты m выполнено \boldsymbol^A\boldsymbol=\boldsymbol^\boldsymbol . Если \boldsymbol — решение системы (3) , то \boldsymbol^\boldsymbol=(\boldsymbol^A)\boldsymbol=\boldsymbol\boldsymbol=0 .

2^ <\circ>. Предположим теперь, что система (1) несовместна. Тогда согласно утверждению 1 строка \begin 0&. & 0& 1 \end входит в упрощенный вид расширенной матрицы A^<*>=\begin A& |& \boldsymbol \end и, следовательно, является линейной комбинацией ее строк. Обозначим коэффициенты этой линейной комбинации y_<1>. y_ и составим из них столбец \boldsymbol . Для этого столбца \boldsymbol^\begin A& |& \boldsymbol \end=\begin 0&. & 1 \end (согласно данного утверждения). Это же равенство можно расписать как два: \boldsymbol^A=\boldsymbol и \boldsymbol^\boldsymbol=1 . Итак, нам удалось найти решение системы (3) , не удовлетворяющее условию (4) . Это заканчивает доказательство.

В качестве примера применим теорему Фредгольма к выводу условия параллельности двух различных прямых на плоскости. Их уравнения составляют систему A_<1>x+B_<1>y+C_<1>=0,\ A_<2>x+B_<2>y+C_<2>=0.
Она не имеет решений, если существуют такие числа y_<1>, y_ <2>, что y_<1>A_<1>+y_<2>A_<2>=0 , y_<1>B_<1>+y_<2>B_<2>=0 , но y_<1>C_<1>+y_<2>C_ <2>\neq 0 . Ясно, что y_ <1>и y_ <2>не равны нулю. Поэтому можно положить \lambda=-y_<2>/y_ <1>и записать полученное условие в виде: существует число \lambda такое, что A_<1>=\lambda A_ <2>, B_<1>=\lambda B_ <2>и C_ <1>\neq \lambda C_ <2>.

Нахождение решений.

В этом пункте мы будем предполагать, что дана совместная система из m линейных уравнений с n неизвестными. Ранг матрицы системы обозначим r . Поскольку ранг расширенной матрицы тоже равен r , мы можем считать базисные столбцы матрицы системы базисными столбцами расширенной матрицы. Элементарными преобразованиями строк приведем расширенную матрицу к упрощенному виду (возможность этого мы уже доказывали). Наша система линейных уравнений перейдет в эквивалентную ей систему из r линейно независимых уравнений.

Для удобства записи будем предполагать, что первые r столбцов — базисные. Тогда преобразованную систему можно записать в виде \tag <5>\begin x^<1>=\beta^<1>-(\alpha_^<1>x^+. +\alpha_^<1>x^),\\\cdots\\x^=\beta^-(\alpha_^x^+. +\alpha_^x^).\end
Здесь \alpha_^ и \beta^ — элементы преобразованной расширенной матрицы. В левых частях равенств мы оставили неизвестные, соответствующие выбранным нами базисным столбцам, так называемые базисные неизвестные. Остальные неизвестные, называемые параметрическими, перенесены в правые части равенств.

Как бы мы ни задали значения параметрических неизвестных, по формулам (5) мы найдем значения базисных так, что они вместе со значениями параметрических неизвестных образуют решение системы (1) . Легко видеть, что так мы получим все множество решений.

На формулах (5) можно было бы и остановиться, но ниже мы дадим более простое и наглядное, а также принципиально важное описание совокупности решений системы линейных уравнений.

Приведенная система.

Сопоставим системе линейных уравнений (1) однородную систему с той же матрицей коэффициентов: \tag<6>A\boldsymbol=\boldsymbol. По отношению к системе (1) она называется приведенной.

Пусть \boldsymbol_ <0>— решение системы (1) . Столбец \boldsymbol также будет ее решением тогда и только тогда, когда найдется такое решение у приведенной системы (6) , что \boldsymbol=\boldsymbol_<0>+\boldsymbol .

Пусть \boldsymbol — решение системы (1) . Рассмотрим разность \boldsymbol=\boldsymbol-\boldsymbol_ <0>. Для нее A\boldsymbol=A\boldsymbol-A\boldsymbol_<0>=\boldsymbol-\boldsymbol=\boldsymbol .

Обратно, если \boldsymbol — решение системы (6) , и \boldsymbol=\boldsymbol_<0>+\boldsymbol , то A\boldsymbol=A\boldsymbol_<0>+A\boldsymbol=\boldsymbol+\boldsymbol=\boldsymbol .

Это предложение сводит задачу описания множества решений совместной системы линейных уравнений к описанию множества решений ее приведенной системы.

Однородная система совместна. Действительно, нулевой столбец является ее решением. Это решение называется тривиальным.

Пусть столбцы матрицы A линейно независимы, то есть \mathbf\,A=n . Тогда система (6) имеет единственное решение (ранее мы это уже доказывали) и, следовательно, нетривиальных решений не имеет.

Если \boldsymbol_ <1>и \boldsymbol_ <2>— решения однородной системы, то любая их линейная комбинация — также решение этой системы.

Действительно, из A\boldsymbol_<1>=\boldsymbol и A\boldsymbol_<2>=\boldsymbol для любых \alpha и \beta следует A(\alpha \boldsymbol_<1>+\beta \boldsymbol_<2>)=\alpha A \boldsymbol_<1>+\beta A\boldsymbol_<2>=\boldsymbol .

Если однородная система имеет нетривиальные решения, то можно указать несколько линейно независимых решений таких, что любое решение является их линейной комбинацией. Сделаем это.

Матрица F , состоящая из столбцов высоты n , называется фундаментальной матрицей для однородной системы с матрицей А, если:

AF=O ;
столбцы F линейно независимы;
ранг F максимален среди рангов матриц, удовлетворяющих условию 1).

Столбцы фундаментальной матрицы называются фундаментальной системой решений.

Если фундаментальная матрица существует, то каждый ее столбец в силу первого условия определения — решение системы. Если система не имеет нетривиальных решений, то фундаментальной матрицы нет. Это будет в том случае, когда столбцы А линейно независимы: \mathbf\,A=n .

Ниже мы докажем, что в остальных случаях фундаментальная матрица существует, но сначала выясним, что означает третье условие в определении.

Пусть A — матрица размеров m \times n и ранга r . Если AF=O , то \mathbf\,F \leq n-r .

Приведем матрицу A к упрощенному виду элементарными преобразованиями строк, а затем элементарными преобразованиями столбцов обратим в нулевые все небазисные столбцы. Мы получим матрицу A’=PAQ , где P и Q — произведения соответствующих элементарных матриц. Первые r строк A’ — строки единичной матрицы порядка n , а остальные — нулевые. Обозначим F’=Q^<-1>F . Тогда \mathbf\,F’ = \mathbf\,F . Используя ранее доказанное нами утверждение, легко заметить, что первые r строк матрицы A’F’ совпадают с первыми r строками F’ . Но A’F’=PAF=O и, следовательно, F’ содержит r нулевых строк. Так как всего в ней n строк, \mathbf\,F’ \leq n-r . Это равносильно доказываемому утверждению.

Покажем теперь, как может быть построена фундаментальная матрица. Согласно ранее доказанному утверждению, решение однородной системы состоит из коэффициентов равной нулю линейной комбинации столбцов матрицы системы. Мы можем получить такие линейные комбинации, основываясь на теореме о базисном миноре. Снова для удобства записи будем считать, что в матрице A первые r столбцов — базисные. Каждый из небазисных столбцов \boldsymbol_ (j=r+1. n) раскладывается по базисным: \tag <7>\boldsymbol_=\alpha_^<1>\boldsymbol_<1>+. +\alpha_^\boldsymbol_. Отсюда следует, что столбец \begin -\alpha_^<1>. -\alpha_^& 0. 0& 1& 0. 0 \end^решением. (Единица в нем стоит на j -м месте.)

Таких решений можно составить столько, сколько есть небазисных столбцов, то есть (n-r) . Убедимся в том, что эти решения линейно независимы. Для этого объединим все столбцы в одну матрицу \tag <8>\begin -\alpha_^<1>& -\alpha_^<1>&. -\alpha_^<1>,\\\cdots\\-\alpha_^& -\alpha_^&. -\alpha_^,\\1& 0&. & 0\\0& 1&. & 0\\\cdots\\0& 0&. & 1\end.
Подматрица в последних n-r строках — единичная. Поэтому ранг матрицы (8) равен числу столбцов, и столбцы линейно независимы.

Таким образом, мы получили

Если ранг матрицы однородной системы линейных уравнений r меньше числа неизвестных n , то система имеет фундаментальную матрицу из n-r столбцов.

Итак, система столбцов (8) — фундаментальная система решений. Она называется нормальной фундаментальной системой решений. Каждому выбору базисных столбцов соответствует своя нормальная фундаментальная система решений. Вообще же, каждая система из n-r линейно независимых решений является фундаментальной.

Для нахождения матрицы (8) можно привести матрицу A системы к упрощенному виду, что даст коэффициенты разложения небазисных столбцов по базисным.

Пусть F — фундаментальная матрица системы A\boldsymbol=\boldsymbol . Рассмотрим произвольный столбец с высоты n-r . Произведение F\boldsymbol — столбец высоты n , и из равенства AF\boldsymbol =\boldsymbol следует, что при любом с столбец F\boldsymbol — решение системы. Оказывается, имеет место

Столбец \boldsymbol — решение системы A\boldsymbol=\boldsymbol тогда и только тогда, когда существует такой столбец \boldsymbol , что \tag <9>\boldsymbol=F\boldsymbol.

Остается доказать необходимость условия. Пусть \boldsymbol — решение. Присоединив его к F , получим матрицу F^<*>=\begin F\ |\ \boldsymbol \end . Эта матрица удовлетворяет условию AF^<*>=O , так как каждый ее столбец — решение. Значит, \mathbf\,F^<*>=n-r . По теореме Кронекера-Капелли мы заключаем отсюда, что существует столбец \boldsymbol , удовлетворяющий системе F\boldsymbol=\boldsymbol .

Общее решение системы линейных уравнений.

Теперь мы можем собрать воедино наши результаты — утверждения 2 и 6.

Выражение, стоящее в правой части формулы (10) , называется общим решением системы линейных уравнений. Если \boldsymbol_<1>. \boldsymbol_ — фундаментальная система решений, а c_<1>. c_ — произвольные постоянные, то формула (10) может быть написана так: \tag <11>\boldsymbol=\boldsymbol_<0>+c_<1>\boldsymbol_<1>+. +c_\boldsymbol_.

Теорема 3 верна, в частности, и для однородных систем. Если \boldsymbol_ <0>— тривиальное решение, то (10) совпадает с (9) .

Одна из ранее доказанных нами теорем гласит, что для существования единственного решения системы из n линейных уравнений с n неизвестными достаточно, чтобы матрица системы имела детерминант, отличный от нуля. Сейчас легко получить и необходимость этого условия.

Пусть A — матрица системы из n линейных уравнений с n неизвестными. Если \det A=0 , то система либо не имеет решения, либо имеет бесконечно много решений.

Равенство \det A=0 означает, что \mathbf\,A и, следовательно, приведенная система имеет бесконечно много решений. Если данная система совместна, то из теоремы 3 следует, что и она имеет бесконечно много решений.

Пример.

Рассмотрим уравнение плоскости как систему \tag<12>Ax+By+Cz+D=0 из одного уравнения. Пусть A \neq 0 и потому является базисным минором матрицы системы. Ранг расширенной матрицы 1, значит, система совместна. Одно ее решение можно найти, положив параметрические неизвестные равными нулю: y=z=0 . Мы получим x=-D/A . Так как n=3 , r=1 , фундаментальная матрица имеет два столбца. Мы найдем их, придав параметрическим неизвестным два набора значений: y=1 , z=0 и y=0 , z=1 . Соответствующие значения базисной неизвестной x , найденные из приведенной системы, будут -B/A и -C/A . Итак, общее решение системы (12) \tag <13>\begin x\\ y\\ z \end=\begin -D/A\\ 0\\ 0 \end+c_ <1>\begin -B/A\\ 1\\ 0 \end+c_ <2>\begin -C/A\\ 0\\ 1 \end.

Выясним геометрический смысл полученного решения. Очевидно, прежде всего, что решение \begin -D/A& 0& 0 \end^состоит из координат некоторой (начальной) точки плоскости, или, что то же, из компонент ее радиус-вектора. В формуле (10) решение x_0 можно выбирать произвольно. Это соответствует произволу выбора начальной точки плоскости. Мы уже знаем, что компоненты лежащих в плоскости векторов удовлетворяют уравнению A\alpha_<1>+B\alpha_<2>+C\alpha_<3>=0 , то есть приведенной системе. Два линейно независимых решения этой системы (фундаментальная система решений) могут быть приняты за направляющие векторы плоскости. Таким образом, формула (13) — не что иное, как параметрические уравнения плоскости.

источники:

http://www.webmath.ru/poleznoe/formules_5_1.php

http://univerlib.com/analytic_geometry/matrices_and_systems_of_linear_equations/common_theory_of_linear_equations_systems/