Системы линейных уравнений элементарные преобразования системы

Элементарные преобразования системы линейных уравнений.

Алгебра и теория чисел

Лекция 3

Системы линейных уравнений

План

1. Основные понятия и обозначения.

2. Элементарные преобразования системы линейных уравнений.

3. Ступенчатая матрица. Приведение матрицы к ступенчатому виду.

Литература

1. Бугров Я.С., Никольский С.М. Элементы линейной алгебры и аналитической геометрии. 1997, с. 25-48.

2. Ермаков В.И. Общий курс высшей математики. М.: Инфра — М, 2000. с. 5-22

3. Кремер Н.Ш. Высшая математика для экономистов. М.: Юнити, 2000. с. 38-56.

1. Основные понятия и обозначения. Простейшие системы двух линейных уравнений с двумя неизвестными изучаются в средней школе:

Известно, что справедлив один из следующих трех случаев: либо система имет одно решение, либо имеет бесконечно много решений, либо не имеет решений. В этом параграфе мы будем рассматривать общие системы линейных уравнений и установим это утверждение в общем случае кроме того изложим один из наиболее удобных методов решения систем линейных уравнений — метод последовательного исключения неизвестных или метод Гаусса по имени выдающегося немецкого математика К. Ф. Гаусса (1777-1855).

Определение 1.Системой m линейных уравнений с n неизвестными

(1)

где a11 ,a12 . amn — фиксированные числа (действительные, комплексные или принадлежащие некоторому полю) , называемые коэффициентами при неизвестных, b1 ,b2 . bm — фиксированные числа, называемые свободными членами.

Если все свободные члены в системе линейных уравнений равны нулю, то система линейных уравнений называется однородной.

Определение 2.Решением системы линейных уравнений (1) называется такой упорядоченный набор n чисел , при подстановке которыхв каждое из уравнений системы вместо соответственно неизвестных x1 , x2 . xn каждое из уравнений системы превращается в истинное числовое равенство.

Система называется совместной, если она имеет хотя бы одно решение, и называется несовместной, если она не имеет решений. Совместная система называется определенной, если она имеет одно решение, и называется неопределенной, если она не имеет решений.

Пусть S1 , S2 системы линейных уравнений с одним и тем же числом неизвестных, X1 , X2 — множества их решений соответственно.

Определение 3.Говорят, что система линейных уравнений S2 следствие системы S1 и S2 , если каждое решение системы S1 является решением системы S2 ,т.е. . Обозначаем .

Определение 4. Говорят, что системы S1 и S2 равносильны, если каждое решение системы S1 является решением системы S2 и каждое решение системы S2 является решением системы S1 , т.е. . Обозначаем .

Отношение следования и равносильности обладают следующими свойствами.

1. Если и , то (транзитивность).

Действительно, если и , то по определению 3 и Отсюда по свойству включения и по определению .

2. (рефлексивность).

3. Если , то — (симметричность).

4. Если и , то — (транзитивность).

Свойства 2, 3, 4 доказываются аналогично.

Элементарные преобразования системы линейных уравнений.

Определение 5. Элементарными преобразованиями системы линейных уравнений называются ее следующие преобразования:

1) перестановка любых двух уравнений местами;

2) умножение обеих частей одного уравнения на любое число ;

3) прибавление к обеим частям одного уравнения соответствующих частей другого уравнения, умноженных на любое число k ;

(при этом все остальные уравнения остаются неизменными).

Нулевым уравнением называем уравнение следующего вида:

.

Теорема 1. Любая конечная последовательность элементарных преобразований и преобразование вычеркивание нулевого уравнения переводит одну систему линейных уравнений в равносильную ей другую систему линейных уравнений.

Доказательство.В силу свойства 4 предыдущего пункта достаточно доказать теорему для каждого преобразования отдельно.

1. При перестановке уравнений в системе местами сами уравнения неизменяются, поэтому по определению полученная система равносильная первоначальной .

2. В силу первой части доказательства достаточно доказать утверждение для первого уравнения. Умножим первое уравнение системы (1) на число , получим систему

(2)

Пусть решение системы (1) . Тогда числа удовлетворяют всем уравнениям системы (1). Так как все уравнения системы (2) кроме первого совпадают с уравнениями системы (1), то числа удовлетворяют всем эти уравнениям. Так как числа удовлетворяют первому уравнению системы (1), то имеет место верное числовое равенство:

. (3)

Умножая его на число k,получим верное числовое равенство:

, (4)

т.о. устанавливаем, что решение системы (2).

Обратно, если решение системы (2), то числа удовлетворяют всем уравнениям системы (2). Так как все уравнения системы (1) кроме первого совпадают с уравнениями системы (2), то числа удовлетворяют всем эти уравнениям. Так как числа удовлетворяют первому уравнению системы (2), то справедливо числовое равенство (4). Разделив обе его части на число ,получим числовое равенство (3) и доказываем, что решение системы (1).

Отсюда по определению 4 система (1) равносильна системе (2).

3. В силу первой части доказательства достаточно доказать утверждение для первого и второго уравнения системы . Прибавим к обеим частям первому уравнению системы соответствующие части второго умноженные на число k , получим систему

(5)

Пусть решение системы (1) . Тогда числа удовлетворяют всем уравнениям системы (1). Так как все уравнения системы (5) кроме первого совпадают с уравнениями системы (1), то числа удовлетворяют всем эти уравнениям. Так как числа удовлетворяют первому уравнению системы (1), то имеют место верные числовые равенства:

, (6)

. (7)

Прибавляя почленно к первому равенству второе, умноженное на число k получим верное числовое равенство:

. (8)

Обратно, если решение системы (5), то числа удовлетворяют всем уравнениям системы (5). Так как все уравнения системы (1) кроме первого совпадают с уравнениями системы (5), то числа удовлетворяют всем эти уравнениям. Так как числа удовлетворяют первому уравнению системы (5), то справедливо числовое равенство (8). Вычитая из обеих его частей соответствующие части равенства (7) умноженные на число k получим числовое равенство (6).

Отсюда по определению 4 система (1) равносильна системе (5).

4. Так как нулевому уравнению удовлетворяет любой упорядоченный набор из n чисел, то при вычеркивании нулевого уравнения в системе получим систему равносильную исходной.

Ступенчатая матрица.

Определение 6.Матрицей размерности называется прямоугольная таблица

содержащая mn чисел, расположенных в m строк и n столбцов, числа называются элементами матрицы. Если , то матрица называется квадратной матрицей порядка m . Если все элементы матрицы равны нулю, то матрица называется нулевой матрицей. Элементы aii называются элементами главной диагонали.

Определение 7. Матрицей ступенчатого вида называется такая матрица, которая обладает свойствами:

1) в каждой строке матрицы имеется неравный нулю элемент;

2) в каждой строке матрицы, начиная со второй, первый слева неравный нулю элемент расположен правее первого слева неравного нулю элемента предыдущей строки матрицы.

Матрицу ступенчатого вида называют также трапециидальной матрицей, а квадратную матрицу ступенчатого вида называют треугольной матрицей. Ниже показаны две не ступенчатые матрицы и три ступенчатые матрицы (последняя матрица треугольная).

, , , , .

Определение 8. Элементарными преобразованиями строк матрицы называются следующие ее преобразования:

1) перестановка любых двух строк матрицы местами;

2) умножение одной строки матрицы на любое число ;

3) прибавление к одной строке матрицы другой ее строки умноженной на любое число k ;

(при этом все остальные строки матрицы остаются неизменными).

Аналогично можно рассматривать элементарные преобразования столбцов матрицы.

Теорема 2. Любую ненулевую матрицу конечным числом элементарных преобразований и преобразований вычеркивания нулевой строки можно привести к матрице ступенчатого вида.

Доказательство.Доказательство проводим методом математической индукции по числу m строк матрицы. Для m=1 утверждение теоремы справедливо, так как ненулевая однострочная матрица по определению имеет ступенчатый вид.

Предположим, что утверждение теоремы доказано для матриц, имеющих m-1 строку и докажем его для матриц, в которых содержится m строк. Пусть первый слева отличный от нуля столбец данной матрицы имеет номер k , так как матрица ненулевая, то такой столбец найдется, и матрица имеет вид:

.

Можем считать, что элемент , в противном случае строки матрицы можно переставить. Прибавим ко второй строке матрицы первую, умноженную на число , к третьей — первую , умноженную на и т.д. , к m-й — первую, умноженную на . После этих преобразований матрица примет вид:

. (9)

Рассмотрим матрицу, состоящую из последних m-1 строк матрицы (9):

. 10)

Если матрица (10) нулевая, то все строки в матрице (9) кроме первой нулевые. Вычеркивая их, приходим к матрице ступенчатого вида. Если матрица (10) ненулевая, то по индуктивному предположению конечным число элементарных преобразований и преобразований вычеркивания нулевой строки может быть приведена к матрице ступенчатого вида: ,

где элементы и не равны нулю. Тогда соответствующими преобразованиями строк матрица (9) преобразуется в матрицу ступенчатого вида:

; (11)

элементы , . не равны нулю. Теорема доказана.

4. Метод Гаусса. Системе линейных уравнений (1) соответствуют три матриц

, .

Первая матрица называется матрицей системы, вторая — расширенной или присойдиненной матрицей системы, третья — столбцом свободных членов.

Система линейных уравнений называется системой ступенчатого вида, если расширенная матрица системы есть матрица ступенчатого вида. Неизвестные с коэффициентами неравными нулю, которые стоят первыми в уравнениях системы ступенчатого вида называются главными неизвестными, а остальные неизвестные называются свободными.

Линейное уравнение, в котором все коэффициенты равны нулю, а свободный член не равен нулю, т.е. уравнение вида:

,

не имеет решений. Действительно, если — решение этого уравнения, то получим противоречие с условием. Такое уравнение называем противоречивым.

Пусть не все уравнения системы (1) нулевые. Тогда и расширенная матрица системы (1) ненулевая. По теореме 2 ее можно конечным числом элементарных преобразований и преобразований выбрасывания нулевой строки можно привести к матрице ступенчатого вида. Полученной матрице соответствует система линейных уравнений ступенчатого вида. Этим преобразованиям расширенной матрицы системы (1) соответствуют такие же преобразования системы линейных уравнений (1). По теореме 1 они переводят систему (1) в равносильную систему линейных уравнений, которая будет являются системой ступенчатого вида.

Таким образом мы доказали первую часть следующей теоремы.

Теорема 3.Любую систему линейных уравнений , содержащую ненулевое уравнение конечным числом элементарных преобразований и преобразований вычеркивания нулевого уравнения можно привести к равносильной ей системе ступенчатого вида. При этом возможны следующие три случая.

1. Если в полученной системе линейных уравнений ступенчатого вида есть противоречивое уравнение, то данная система не имеет решений.

2. Если в полученной системе линейных уравнений ступенчатого вида нет противоречивого уравнения и число уравнений в полученной системе равно числу неизвестных, то данная система имеет единственное решение.

3. Если в полученной системе линейных уравнений ступенчатого вида нет противоречивого уравнения и число уравнений в полученной системе меньше числа неизвестных, то данная система имеет бесконечно много решение.

Доказательство.Пусть дана система (1), содержащая ненулевое уравнение. По выше доказанному, она конечным числом элементарных преобразований она может быть преобразована к равносильной ей системе уравнений ступенчатого вида. Возможны случаи.

В полученной системе ступенчатого вида есть противоречивое уравнение. Тогда ни один набор чисел не удовлетворяет системе, и система (1) не имеет решений.

В полученной системе ступенчатого вида нет противоречивого уравнения. Тогда в каждом из уравнений системы ступенчатого вида содержится главное неизвестное. Отсюда получаем, что число главных неизвестных, а тем более число всех неизвестных, не менее числа уравнений в системе ступенчатого вида. Тогда возможны под случаи:

В системе ступенчатого вида число уравнений равно числу неизвестных, т. е. система имеет вид:

(12)

где Все неизвестные в системе являются главными. Из последнего уравнения находим единственное значение для неизвестного : . Подставляя найденное значение в предпоследнее уравнение, находим для неизвестного единственное значение и т.д. Наконец из первого уравнения по найденным значениям неизвестных из первого уравнения находим единственное значение неизвестного . Таким образом, система (12), а поэтому и система (1) имеет единственное решение.

В системе ступенчатого вида число уравнений меньше числа неизвестных. В этом случае матрица полученной системы имеет вид (11), а

систему можно записать в виде:

(13)

где В этой системе r главных неизвестных , все остальные свободные (в системе они обзначены точками. Возьмем для свободных неизвестных произвольные значения. Тогда значения главных неизвестных найдутся однозначно из системы (13). Так как главные неизвестные можно выбрать бесконечным числом способов, то получим, что система (13), а поэтому и система (1) имеет бесконечно много решений.

Следствие.Если в системе однородных уравнений число неизвестных больше числа уравнений, то система имеет бесконечно много решений.

Действительно, система однородных уравнений всегда имеет нулевое решение , и при приведении ее к ступенчатому виду всегда получим систему, в которой число неизвестных больше числа уравнений.

Метод исследования и решения систем линейных уравнений, изложенный в доказательстве теорем 3 называется методом Гаусса.

Пример 1.Решить систему

Составим расширенную матрицу системы и приведем ее к ступенчатому виду:

.

Составим по полученной матрице ступенчатого вида систему линейных уравнений ступенчатого вида:

В полученной системе число уравнений равно числу неизвестных и полученная система имеет единственное решение, которое двигаясь вверх последовательно находим:

Решение системы .

Пример 2.Решить систему

Составим расширенную матрицу системы и приведем ее к ступенчатому виду:

Соответствующая система имеет противоречивое уравнение. Поэтому данная система не имеет решений.

02. Элементарные преобразования системы линейных уравнений

Определение 5. Элементарными преобразованиями системы линейных уравнений называются ее следующие преобразования:

1) перестановка любых двух уравнений местами;

2) умножение обеих частей одного уравнения на любое число ;

3) прибавление к обеим частям одного уравнения соответствующих частей другого уравнения, умноженных на любое число k ;

(при этом все остальные уравнения остаются неизменными).

Нулевым уравнением называем уравнение следующего вида:

.

Теорема 1. Любая конечная последовательность элементарных преобразований и преобразование вычеркивание нулевого уравнения переводит одну систему линейных уравнений в равносильную ей другую систему линейных уравнений.

Доказательство. В силу свойства 4 предыдущего пункта достаточно доказать теорему для каждого преобразования отдельно.

1. При перестановке уравнений в системе местами сами уравнения неизменяются, поэтому по определению полученная система равносильная первоначальной.

2. В силу первой части доказательства достаточно доказать утверждение для первого уравнения. Умножим первое уравнение системы (1) на число , получим систему

(2)

Пусть решение системы (1) . Тогда числа удовлетворяют всем уравнениям системы (1). Так как все уравнения системы (2) кроме первого совпадают с уравнениями системы (1), то числа удовлетворяют всем эти уравнениям. Так как числа удовлетворяют первому уравнению системы (1), то имеет место верное числовое равенство:

. (3)

Умножая его на число K, получим верное числовое равенство:

, (4)

Т. о. устанавливаем, что решение системы (2).

Обратно, если решение системы (2), то числа удовлетворяют всем уравнениям системы (2). Так как все уравнения системы (1) кроме первого совпадают с уравнениями системы (2), то числа удовлетворяют всем эти уравнениям. Так как числа удовлетворяют первому уравнению системы (2), то справедливо числовое равенство (4). Разделив обе его части на число ,получим числовое равенство (3) и доказываем, что решение системы (1).

Отсюда по определению 4 система (1) равносильна системе (2).

3. В силу первой части доказательства достаточно доказать утверждение для первого и второго уравнения системы. Прибавим к обеим частям первому уравнению системы соответствующие части второго умноженные на число K , получим систему

(5)

Пусть решение системы (1) . Тогда числа удовлетворяют всем уравнениям системы (1). Так как все уравнения системы (5) кроме первого совпадают с уравнениями системы (1), то числа удовлетворяют всем эти уравнениям. Так как числа удовлетворяют первому уравнению системы (1), то имеют место верные числовые равенства:

, (6)

. (7)

Прибавляя почленно к первому равенству второе, умноженное на число K получим верное числовое равенство:

. (8)

Обратно, если решение системы (5), то числа удовлетворяют всем уравнениям системы (5). Так как все уравнения системы (1) кроме первого совпадают с уравнениями системы (5), то числа удовлетворяют всем эти уравнениям. Так как числа удовлетворяют первому уравнению системы (5), то справедливо числовое равенство (8). Вычитая из обеих его частей соответствующие части равенства (7) умноженные на число K получим числовое равенство (6).

Отсюда по определению 4 система (1) равносильна системе (5).

4. Так как нулевому уравнению удовлетворяет любой упорядоченный набор из n чисел, то при вычеркивании нулевого уравнения в системе получим систему равносильную исходной.

VMath

Инструменты сайта

Основное

Навигация

Информация

Действия

Содержание

Системы линейных уравнений

Обозначим через $ \mathbb A_<> $ любое из множеств $ \mathbb Q_<>, \mathbb R_<> $ или $ \mathbb C_<> $.

Примеры систем уравнений над $ \mathbb R $.

Относительно числа $ m_<> $ уравнений не делается ни какого предположения: оно может быть меньше, больше или равно числу переменных $ n_<> $. Если $ m_<>>n $ то система называется переопределенной. Решением системы уравнений называется любой набор значений переменных $ x_1=\alpha_<1>,\dots, x_n = \alpha_n $, обращающий каждое из уравнений в истинное равенство. Система называется совместной если она имеет хотя бы одно решение и несовместной в противном случае.

Можно доказать (см. результаты ☟ НИЖЕ ), что все возможности для произвольной системы ограничиваются следующими вариантами:

1. система совместна и имеет единственное решение;

2. cистема совместна и имеет бесконечное множество решений;

3. cистема несовместна.

При этом все решения будут находиться в том же множестве $ \mathbb A_<> $, что и коэффициенты системы.

Матричная форма записи

Для системы линейных уравнений относительно переменных $ x_1,x_2,\dots,x_n $ $$ \left\< \begin a_<11>x_1 &+a_<12>x_2&+ \ldots&+a_<1n>x_n &=b_1,\\ a_<21>x_1 &+a_<22>x_2&+ \ldots&+a_<2n>x_n &=b_2,\\ \dots & & & & \dots \\ a_x_1 &+a_x_2&+ \ldots&+a_x_n &=b_m. \end \right. $$ матрицей системы называется матрица $$ A=\left( \begin a_ <11>& a_ <12>& \dots & a_ <1n>\\ a_ <21>& a_ <22>& \dots & a_ <2n>\\ \dots &&& \dots \\ a_ & a_ & \dots & a_ \end \right)_ \ ; $$ cтолбец $$ <\mathcal B>= \left( \begin b_ <1>\\ b_ <2>\\ \vdots \\ b_ \end \right) $$ называется столбцом правых частей системы, а столбец $$ X= \left( \begin x_ <1>\\ x_ <2>\\ \vdots \\ x_ \end \right) $$ — столбцом неизвестных. Используя правило умножения матриц, систему можно записать в матричном виде: $$ AX= <\mathcal B>\ . $$ Любое решение $ x_1=\alpha_1,\dots,x_n=\alpha_n $ системы можно также записать в виде столбца: $$ X=\left( \begin \alpha_1 \\ \vdots \\ \alpha_n \end \right) \in \mathbb A^n \ . $$ Матрица, составленная из всех коэффициентов системы уравнений: $$ [A \mid \mathcal B ]= \left( \begin a_ <11>& a_ <12>& \dots & a_ <1n>& b_1 \\ a_ <21>& a_ <22>& \dots & a_ <2n>& b_2 \\ \dots &&& & \dots \\ a_ & a_ & \dots & a_ & b_m \end \right)_ \ , $$ т.е. конкатенацией матрицы $ A_<> $ и столбца правых частей $ <\mathcal B>_<> $ называется расширенной матрицей системы л.у.

Исключение переменных (метод Гаусса)

метода достаточно проста.

Пример. Решить систему уравнений $$ \left\< \begin 2x_1&-3x_2&-x_3&=3 \\ 4x_1&-3x_2&-5x_3&=6 \\ 3x_1&+5x_2&+9x_3&=-8 \end \right. $$

Решение. Выразим из первого уравнения $ x_ <1>$ $$ x_1=\frac<3> <2>x_2+\frac<1> <2>x_3 + \frac<3> <2>$$ и подставим в оставшиеся уравнения $$ 4 \left(\frac<3> <2>x_2+\frac<1> <2>x_3 + \frac<3><2>\right) -3\,x_2-5\,x_3=6 \ <\color\iff > \ 3x_2-3x_3 = 0 $$ $$ \ <\color\iff > \ x_2-x_3=0 \ ; $$ $$ 3 \left(\frac<3> <2>x_2+\frac<1> <2>x_3 + \frac<3><2>\right) +5x_2+9x_3=-8 \ <\color\iff > \ \frac<19> <2>x_2 +\frac<21><2>x_3=-\frac<25> <2>$$ $$ <\color\iff > 19x_2 +21x_3=-25 \ . $$ Два получившихся уравнения не зависят от неизвестной $ x_ <1>$ — она оказалась исключенной из этих уравнений. Иными словами, мы получили новую подсистему уравнений $$ \left\< \begin x_2&-x_3&=0 \\ 19x_2&+21x_3&=-25, \end \right. $$ которой должны удовлетворять неизвестные $ x_ <2>$ и $ x_ <3>$. Продолжаем действовать по аналогии: выразим из первого уравнения $ x_ <2>$ через $ x_ <3>$: $$x_2=x_3 $$ и подставим во второе: $$ 40 x_3 =-25 \ \iff \ x_3=-\frac<5> <8>\ . $$ Итак, значение одной компоненты решения получено. Для нахождения оставшихся подставим значение $ x_ <3>$ в полученные по ходу решения соотношения: $$ x_2=x_3=-\frac<5> <8>\ \Rightarrow \ x_1=\frac<3> <2>x_2+\frac<1> <2>x_3 + \frac<3><2>=\frac<1> <4>\ . $$

Ответ. $ x_<1>=1/4, x_2=-5/8, x_3=-5/8 $.

Теперь осталось формализовать изложенную идею метода (сформулировав допустимые правила действия над уравнениями — те, что в принципе, очевидны из здравого смысла ), а также исследовать возможные последствия его применения к системам общего вида.

Исключение переменных

Элементарными преобразованиями системы л.у. называются преобразования следующих трех типов:

1. перестановка двух уравнений;

2. умножение обеих частей уравнения на любое отличное от нуля число;

3. прибавление к одному уравнению любого другого, умноженного на произвольное число: пара уравнений $$ \begin a_x_1 +a_x_2+ \ldots+a_x_n &=&b_j,\\ a_x_1 +a_x_2+ \ldots+a_x_n &=&b_k \end $$ заменяется парой $$ \begin (a_+ <\color\lambda > a_) x_1 &+ (a_+ <\color\lambda > a_) x_2 &+ \ldots &+ (a_+ <\color\lambda > a_) x_n &=&b_j + <\color\lambda > b_k\, , \\ a_x_1 &+a_x_2&+ \ldots &+a_x_n &=&b_k \, . \end $$

Теорема. Любое элементарное преобразование системы л.у. переводит эту систему в ей эквивалентную, т.е. имеющую то же множество решений, что и исходная.

Задача. С помощью элементарных преобразований привести систему л.у. к наиболее простому виду: такому, из которого легко было бы установить множество решений.

Предположим, что первое уравнение системы содержит явно неизвестную $ x_ <1>$, т.е. $ a_<11>^<> \ne 0 $. Исключим эту неизвестную из всех оставшихся уравнений. С этой целью вычтем из второго уравнения первое, домноженное на $ a_<21>/a_<11>^<> $. Получим $$\left(a_<22>— \frac>> a_ <12>\right)x_2 + \dots + \left(a_<2n>— \frac>> a_ <1n>\right)x_n = b_2 — \frac>> b_1 \ , $$ Аналогичное преобразование — вычитание из третьего уравнения системы первого, умноженного на $ a_<31>/a_<11>^<> $, позволяет исключить $ x_ <1>$ из этого уравнения, т.е. заменить его на $$\left(a_<32>— \frac>> a_ <12>\right)x_2 + \dots + \left(a_<3n>— \frac>> a_ <1n>\right)x_n = b_3 — \frac>> b_1 \ . $$ Продолжаем процесс далее. В конечном итоге исключаем $ x_ <1>$ из всех уравнений кроме первого: $$ \left\< \begin a_<11>x_1 &+a_<12>x_2&+ \ldots&+a_<1n>x_n &=b_1,\\ &a_<22>^<[1]>x_2&+ \ldots&+a_<2n>^<[1]>x_n &=b_2^<[1]>,\\ &\dots & & & \dots \\ &a_^<[1]>x_2&+ \ldots&+a_^<[1]>x_n &=b_m^<[1]>. \end \right. \ \ npu \ \ \begin a_^ <[1]>&= & \displaystyle a_ — \fraca_<1k>>> ,\\ b_j^ <[1]>&= & \displaystyle b_j — \fracb_1>> . \end $$ Полученная система эквивалентна исходной системе, однако она имеет более простой вид: в ней выделилась подсиcтема $$ \left\< \begin a_<22>^<[1]>x_2&+ \ldots&+a_<2n>^<[1]>x_n &=b_2^<[1]>,\\ \dots & & & \dots \\ a_^<[1]>x_2&+ \ldots&+a_^<[1]>x_n &=b_m^<[1]>, \end \right. $$ которая не зависит от переменной $ x_ <1>$. К этой новой подсистеме можно применить те же рассуждения, что и к исходной системе, поставив теперь целью исключение переменной $ x_ <2>$.

Понятно, что процесс исключения может быть продолжен и далее. Теперь посмотрим, где он может прерваться. Может так случиться, что очередная, $ \ell_<> $-я подсистема имеет коэффициент $ a_<\ell \ell>^ <[\ell-1]>$ равным нулю, что не позволит алгоритму идти дальше — т.е. исключить переменную $ x_<\ell>^<> $ из оставшихся уравнений (в принципе, такое могло случиться уже на первом шаге, если бы коэффициент $ a_<11>^<> $ был бы равен нулю). Возможные варианты дальнейших действий:

1. если хотя бы один коэффициент при $ x_<\ell>^<> $ в одном из оставшихся уравнений отличен от нуля: $ a_^<[\ell-1]>\ne 0^<> $, то это уравнение переставляется с $ \ell_<> $-м;

2. если при всех $ j\ge \ell^<> $ коэффициенты $ a_^ <[\ell-1]>$ равны нулю, то переменная $ x_<\ell>^<> $ не входит ни в одно оставшееся уравнение, и можно перейти к исключению переменной $ x_<\ell+1>^<> $.

Поскольку число переменных конечно, то алгоритм исключения должен завершиться за конечное число шагов. Чем он может завершиться? Окончательная система должна иметь вид: $$ \left\< \begin a_<11>x_1 +&a_<12>x_2&+ \ldots& +a_<1 <\mathfrak r>>x_<\mathfrak r>& +a_ <1 ,<\mathfrak r>+1>x_<<\mathfrak r>+1>&+ \ldots + & a_<1n>x_n &=b_1,\\ &a_<22>^<[1]>x_2&+ \ldots& +a_<2 <\mathfrak r>>^ <[1]>x_<\mathfrak r>& +a_<2 ,<\mathfrak r>+1>^ <[1]>x_<<\mathfrak r>+1>&+ \ldots + & a_<2n>^ <[1]>x_n &=b_2^<[1]>,\\ & & \ddots & & & & & \dots \\ & & & a_ <<\mathfrak r><\mathfrak r>>^<[<\mathfrak r>-1]>x_ <\mathfrak r>& + a_ <<\mathfrak r>, <\mathfrak r>+1>^<[<\mathfrak r>-1]>x_<<\mathfrak r>+1>& + \ldots + & a_ <<\mathfrak r>,n>^<[<\mathfrak r>-1]>x_n &=b_<\mathfrak r>^<[<\mathfrak r>-1]>, \\ & & & & & & 0 &=b_<<\mathfrak r>+1>^<[<\mathfrak r>-1]>, \\ & & & & & & \dots & \\ & & & & & & 0 &=b_^<[<\mathfrak r>-1]>, \\ \end \right. $$ при $ <\mathfrak r>\le n_<> $. Заметим, что все коэффициенты этой системы будут принадлежать тому же множеству, что и коэффициенты исходной системы.

Предположение . Мы будем считать, что каждое из первых $ <\mathfrak r>_<> $ уравнений системы содержит в своей левой части хотя бы одну переменную с ненулевым коэффициентом.

Процесс получения системы такого вида из исходной системы уравнений называется прямым ходом метода Гаусса.

Исторический комментарий о Гауссе ☞ ЗДЕСЬ.

Установление множества решений

Теорема. Если хотя бы одно из чисел $ b_<<\mathfrak r>+1>^<[<\mathfrak r>-1]>,\dots , b_^<[<\mathfrak r>-1]> $ отлично от нуля, то исходная система линейных уравнений будет несовместной.

Для простоты мы будем иллюстрировать наши рассуждения на системах л.у. над $ \mathbb R_<> $, в этом же множестве искать решения. Каждое из преобразований метода Гаусса будем обозначать $ \to_<> $.

Пример. Решить систему л.у.

$$ \left\< \begin x_1&+x_2&-3\, x_3 =& -1 \\ 2\,x_1&+x_2&-2\, x_3 =& 1 \\ x_1&+x_2&+ x_3 =& 3 \\ x_1&+2\,x_2&-3\, x_3 =& 1. \end \right. $$

Решение. $$ \ \to \ \left\< \begin x_1&+x_2&-3\, x_3 =& -1 \\ &-x_2&+4\, x_3 =& 3 \\ &&4\, x_3 =& 4 \\ &x_2&=& 2 \end \right. \ \to \ \left\< \begin x_1&+x_2&-3\, x_3 =& -1 \\ &-x_2&+4\, x_3 =& 3 \\ &&4\, x_3 =& 4 \\ &&4\, x_3=& 5 \end \right. \ \to \ $$ $$ \to \ \left\< \begin x_1&+x_2&-3\, x_3 =& -1 \\ &-x_2&+4\, x_3 =& 3 \\ &&4\, x_3 =& 4 \\ &&0=& 1 \end \right. $$ Последнее равенство абсолютно противоречиво.

Ответ. Система несовместна.

Пусть теперь $ b_<<\mathfrak r>+1>^<[<\mathfrak r>-1]>=0,<>\dots, b_^<[<\mathfrak r>-1]>=0 $. Возможны два случая: $ <\mathfrak r>=n_<> $ и $ <\mathfrak r>предположения , имеем $ a_^ <[n-1]>\ne 0 $. Но тогда, поскольку система является конечной стадией прямого хода метода Гаусса, то и все коэффициенты $ a_^<[n-2]>, \dots, a_<22>^<[1]>, a_ <11>$ должны быть отличны от нуля — в противном случае метод Гаусса не остановился бы на системе такого вида; он называется треугольным: Из последнего уравнения системы можно однозначно установить значение $ x_ $: $$x_n=b_n^ <[n-1]>\big/ a_^ <[n-1]>\ .$$ Далее, подставляя это значение в $ (n-1) $-е уравнение системы, выражаем $ x_ $: $$ x_= \frac^ <[n-2]>— a_^<[n-2]>x_>< a_^<[n-2]>>= \frac< b_^ <[n-2]>— a_^ <[n-2]>b_n^ <[n-1]>\Big/ a_^<[n-1]>>< a_^<[n-2]>> . $$ Подставляем полученные значения для $ x_ $ и $ x_ $ в $ (n-2)_<> $-е уравнение системы, выражаем $ x_ $, и т.д., в конце концов приходим к первому уравнению, из которого выражаем $ x_ <1>$ если ранее уже получены выражения для $ x_2,\dots,x_ $.

Теорема. Если прямой ход метода Гаусса заканчивается треугольной системой, т.е. $ \mathfrak r = n_<> $ и $ b_<<\mathfrak r>+1>^<[<\mathfrak r>-1]>=0,<>\dots, b_^<[<\mathfrak r>-1]>=0 $, то исходная система линейных уравнений имеет единственное решение.

Пример. Решить систему л.у.

$$ \left\< \begin x_1&+3\,x_2&+ x_3 =&5 \\ 2\,x_1&+x_2&+ x_3 =& 2 \\ x_1&+x_2&+ 5\,x_3 =& -7 \\ 2\,x_1&+3\,x_2&-3\, x_3 =& 14. \end \right. $$

Ответ. $ x_1=1,\, x_<2>=2,\, x_3=-2 $ .

Исследуем теперь случай $ <\mathfrak r>1) : На основании предположения , в $ <\mathfrak r>$-м уравнении этой системы имеется хотя бы один ненулевой коэффициент в левой части, пусть $ a_ <<\mathfrak r><\mathfrak s>>^<[<\mathfrak r>-1]>\ne 0 $ — первый из них. Если $ <\mathfrak s>=n $, то из этого уравнения однозначно определится $ x_ $ $$ x_n=\alpha_n = b_<\mathfrak r>^<[<\mathfrak r>-1]> \big/ a_ <<\mathfrak r>n>^<[<\mathfrak r>-1]> \ . $$ Если же $ <\mathfrak s>предположения , в этом уравнении имеется хотя бы один ненулевой коэффициент в левой части; пусть $ a_<<\mathfrak r>-1, <\mathfrak k>>^<[<\mathfrak r>-2]>\ne 0_<> $ — первый из них. Поскольку мы преположили, что система является конечной стадией прямого хода метода Гаусса, то $ <\mathfrak k>по крайней мере две переменные, значения которых еще не были зафиксированы на предыдущих шагах. Это следует из предположения, что число уравнений $ <\mathfrak r>_<> $ меньше числа неизвестных $ n_<> $. Такое уравнение допускает бесконечное число решений, любое из которых в ходе дальнейших шагов может быть «доделано» до решения системы.

Теорема. Если прямой ход метода Гаусса заканчивается трапециевидной системой, т.е. $ \mathfrak r 2) матрицы $ A_<> $ (третьего порядка). Понятие определителя распространяется и на квадратные матрицы бóльших порядков; образно говоря, определитель — это функция элементов матрицы, отвечающая за единственность решения системы уравнений.

Дальнейший матричный анализ метода Гаусса ☞ ЗДЕСЬ.

Формулы Крамера

Рассмотрим систему линейных уравнений с квадратной матрицей $ A_<> $, т.е. такую, у которой число уравнений совпадает с числом неизвестных.

Теорема. Cистема

$$ \left\<\begin a_<11>x_1 +a_<12>x_2+\ldots+a_<1n>x_n &=&b_1\\ a_<21>x_1 +a_<22>x_2+\ldots+a_<2n>x_n &=&b_2\\ \ldots& & \ldots \\ a_x_1 +a_x_2+\ldots+a_x_n &=&b_n \end\right. $$ имеет единственное решение тогда и только тогда, когда определитель матрицы этой системы отличен от нуля: $$ \left| \begin a_ <11>& a_ <12>& \dots & a_ <1n>\\ a_ <21>& a_ <22>& \dots & a_ <2n>\\ \dots &&& \dots \\ a_ & a_ & \dots & a_ \end \right| \ne 0 \ . $$ В этом случае решение можно вычислить по формулами Крамера 3) : $$ x_k =\frac<\det \left[ A_<[1]>|\dots|A_<[k-1]>|<\mathcal B>|A_<[k+1]>|\dots|A_ <[n]>\right]> <\det A>\quad npu \quad k\in \ < 1,\dots,n \>\ . $$ Для получения значения $ x_ $ в числитель ставится определитель, получающийся из $ \det A_<> $ заменой его $ k_<> $-го столбца на столбец правых частей ( здесь $ <> | $ означает конкатенацию).

Доказательство ☞ ЗДЕСЬ

Пример. Решить систему уравнений

$$ \left\<\begin 2x_1& +3x_2&+11x_3&+5x_4 &=& \color2,\\ x_1& +x_2&+5x_3&+2x_4 &=& \color1 ,\\ 2x_1& +x_2&+3x_3&+2x_4 &=&\color<-3>,\\ x_1& +x_2&+3x_3&+4x_4 &=&\color<-3>. \end\right. $$

Решение. $$ x_1=\frac<\left|\begin \color2 & 3&11&5 \\ \color1 & 1&5&2 \\ \color<-3>& 1&3&2 \\ \color <-3>& 1&3&4 \end\right|> <\left|\begin 2& 3&11&5 \\ 1& 1&5&2 \\ 2& 1&3&2 \\ 1& 1&3&4 \end\right|>=\frac<-28><14>=-2, x_2=\frac<\left|\begin 2& \color2&11&5 \\ 1& \color1&5&2 \\ 2& \color<-3>&3&2 \\ 1& \color<-3>&3&4 \end\right|> <\left|\begin 2& 3&11&5 \\ 1& 1&5&2 \\ 2& 1&3&2 \\ 1& 1&3&4 \end\right|>=\frac<0><14>=0, \dots $$ Найдите оставшиеся компоненты решения. ♦

Решение системы линейных уравнений с квадратной матрицей $ A_<> $ является непрерывной функцией коэффициентов этой системы при условии, что $ \det A_<> \ne 0 $.

Кроме того, формулы Крамера начинают конкурировать по вычислительной эффективности с методом Гаусса в случае систем, зависящих от параметра. Подробнее ☞ ЗДЕСЬ.

Еще один способ решения системы основан на построении обратной матрицы: $$ AX= <\mathcal B>\quad \Rightarrow \quad X=A^<-1> <\mathcal B>\ . $$ Этот способ малоэффективен при фиксированных числовых $ A_<> $ и $ <\mathcal B>_<> $.

Найти достаточное условие существования общего решения систем уравнений:

$$ A_1 X = <\mathcal B>_1 \quad u \quad A_2 Y = <\mathcal B>_2 \ , $$ при квадратных матрицах $ A_1 $ и $ A_2 $ одинакового порядка.

Теорема Кронекера-Капелли

Матрица, получающаяся конкатенацией матрицы $ A_<> $ и столбца правых частей $ <\mathcal B>_<> $ $$ [ A| <\mathcal B>] = \left( \begin a_ <11>& a_ <12>& \dots & a_ <1n>& b_1 \\ a_ <21>& a_ <22>& \dots & a_ <2n>& b_2 \\ \dots &&& & \dots \\ a_ & a_ & \dots & a_ & b_m \end \right)_ $$ называется расширенной матрицей системы линейных уравнений $ AX= <\mathcal B>$.

Теорема [Кронекер, Капелли]. Система $ AX= <\mathcal B>$ совместна тогда и только тогда, когда ранг матрицы этой системы совпадает с рангом ее расширенной матрицы:

$$ \operatorname\, A = \operatorname\, [ A| <\mathcal B>] \ . $$ При выполнении этого условия, система имеет единственное решение, если число неизвестных $ n_<> $ совпадает с общим значением ранга $ \mathfrak r_<> $, и бесконечное множество решений, если $ n_<> $ больше этого значения.

Доказательство необходимости. Пусть существует решение $ x_1=\alpha_1,\dots,x_n=\alpha_n $ системы, тогда $$\alpha_1 A_<[1]>+\dots+\alpha_n A_<[n]>= <\mathcal B>\ ,$$ т.е. столбец $ <\mathcal B>$ линейно выражается через столбцы $ A_<[1]>,\dots,A_ <[n]>$. Но тогда $$ \operatorname \,\dots,A_<[n]>\>=\operatorname \,\dots,A_<[n]>,<\mathcal B>\> .$$ Следовательно $ \operatorname\, A = \operatorname\, [ A| <\mathcal B>] $.

Доказательство достаточности проводится в следующем пункте. ♦

Пример. Исследовать совместность системы уравнений

Решение. В этом примере число уравнений совпадает с числом неизвестных. Это обстоятельство несколько облегчает рассуждения. Обратимся к замечанию из предыдущего пункта: система л.у. с числом уравнений, совпадающем с числом неизвестных, как правило, совместна. Тогда попробуем установить условия, обеспечивающие противоположное свойство — несовместность. Оно, фактически, единственно: за все отвечает определитель системы $ \det A_<> $. Если он отличен от нуля — система совместна. $$\det A = \left| \begin<\color<\lambda>> &1&1&1 \\ 1&<\color<\lambda>>&1&1 \\ 1&1&<\color<\lambda>>&1 \\ 1&1&1&<\color<\lambda>> \end \right|= \left| \begin (<\color<\lambda>>-1) &(1-<\color<\lambda>>)&0&0 \\ 0&(<\color<\lambda>>-1)&(1-<\color<\lambda>>)&0 \\ 0&0&(<\color<\lambda>>-1)&(1-<\color<\lambda>>) \\ 1&1&1&<\color<\lambda>> \end \right| =(<\color<\lambda>>-1)^3 \left| \begin 1 &-1&0&0 \\ 0&1&-1&0 \\ 0&0&1&-1 \\ 1&1&1&<\color<\lambda>> \end \right|= $$ $ =(<\color<\lambda>>-1)^3(<\color<\lambda>>+3) $. По теореме Крамера при $ <\color<\lambda>>\ne 1 $ и при $ <\color<\lambda>>\ne -3 $ решение системы единственно: $$x_1=x_2=x_3=x_4=1/(<\color<\lambda>>+3) \ .$$

Осталось исследовать критические случаи: $ <\color<\lambda>>=1_<> $ и $ <\color<\lambda>>= -3 $: определитель системы обращается в нуль, но система может оказаться совместной. Придется вычислять ранги, но, к счастью, уже числовых матриц (а не зависящих от параметра, как исходная!). При $ <\color<\lambda>>= 1_<> $ имеем $$ \operatorname \left( \begin 1 &1&1&1 \\ 1&1&1&1 \\ 1&1&1&1 \\ 1&1&1&1 \end \right)= \operatorname \left( \begin 1&1&1&1&1 \\ 1&1&1&1&1 \\ 1&1&1&1&1 \\ 1&1&1&1&1 \end \right)=1 \ , $$ и система совместна. Она эквивалентна единственному уравнению $$x_1+x_2+x_3+x_4=1 \ ,$$ которое имеет бесконечно много решений.

При $ <\color<\lambda>>= -3 $: $$ \operatorname \left( \begin -3 &1&1&1 \\ 1&-3&1&1 \\ 1&1&-3&1 \\ 1&1&1&-3 \end \right)=3,\quad \operatorname \left( \begin -3 &1&1&1&1 \\ 1&-3&1&1&1 \\ 1&1&-3&1&1 \\ 1&1&1&-3&1 \end \right)=4 $$ и система несовместна.

Ответ. Система несовместна при $ <\color<\lambda>> = -3 $; она имеет бесконечное множество решений при $ <\color<\lambda>> = 1_<> $ и единственное решение при $ <\color<\lambda>> \not\in \ <-3,1\>$.

Система однородных уравнений

$$ \left\< \begin a_<11>x_1 &+a_<12>x_2&+ \ldots&+a_<1n>x_n &=0,\\ a_<21>x_1 &+a_<22>x_2&+ \ldots&+a_<2n>x_n &=0,\\ \dots & & & \dots & \\ a_x_1 &+a_x_2&+ \ldots&+a_x_n &=0 \end \right. $$ всегда совместна: она имеет тривиальное решение $ x_1=0,\dots,x_n=0 $. Для того, чтобы у нее существовало еще и нетривиальное решение необходимо и достаточно, чтобы определитель ее матрицы был равен нулю.

Пример. Найти условие, при котором три точки плоскости с координатами $ (x_1,y_1), (x_2,y_2) $ и $ (x_3,y_<3>) $ лежат на одной прямой.

Решение. Будем искать уравнение прямой в виде $ ax+by+c=0 $ при неопределенных коэффициентах $ a,b,c_<> $. Если точки лежат на прямой, то получаем для определения этих коэффициентов систему линейных уравнений: $$ \left\< \begin ax_1+by_1+c & =0\\ ax_2+by_2+c & =0\\ ax_3+by_3+c & =0 \end \right. $$ Получившаяся система является однородной, условие существования у нее нетривиального решения (т.е. набора $ (a,b,c)_<> $ при хотя бы одном из чисел отличном от нуля): $$ \left|\begin x_1 & y_1 & 1 \\ x_2 & y_2 & 1 \\ x_3 & y_3 & 1 \end \right|=0 . $$ ♦

Доказать, что для совместности системы

$$ \left\< \begin a_<11>x_1+a_<12>x_2+a_<13>x_3 &=& b_1 \\ a_<21>x_1+a_<22>x_2+a_<23>x_3 &=& b_2 \\ a_<31>x_1+a_<32>x_2+a_<33>x_3 &=& b_3 \\ a_<41>x_1+a_<42>x_2+a_<43>x_3 &=& b_4 \end \right. $$ необходимо, чтобы было выполнено условие $$ \left| \begin a_<11>&a_<12>& a_ <13>& b_1 \\ a_<21>&a_<22>& a_ <23>& b_2 \\ a_<31>&a_<32>& a_ <33>& b_3 \\ a_<41>&a_<42>& a_ <43>& b_4 \end \right|=0 \quad . $$ Является ли это условие достаточным для совместности?

An elementary treatise on determinants

в следующей формулировке.

Теорема. Для того чтобы система $ n_<> $ неоднородных уравнений была совместна, необходимо и достаточно, чтобы порядок наибольшего отличного от нуля минора был одинаков в расширенной и нерасширенной матрице системы.

Додсон — один из самых знаменитых математиков мира. Назовите его псевдоним.

Ответ ☞ ЗДЕСЬ

Общее решение

Пусть выполнено условие теоремы Кронекера-Капелли: $ \operatorname (A)=\operatorname[A\mid \mathcal B ] =\mathfrak $. По определению ранга матрицы, в матрице $ A $ существует минор порядка $ \mathfrak $, отличный от нуля; этот же минор останется и минором расширенной матрицы $ [ A\mid \mathcal B ] $. Пусть, для определенности, ненулевой минор находится в левом верхнем углу матрицы 4) : $$ \Delta = A\left( \begin 1 & 2 & \dots & \mathfrak \\ 1 & 2 & \dots & \mathfrak \end \right) = \left| \begin a_ <11>& a_ <12>& \dots & a_<1\mathfrak> \\ a_ <21>& a_ <22>& \dots & a_<2\mathfrak> \\ \dots &&& \dots \\ a_<\mathfrak1> & a_<\mathfrak2> & \dots & a_ <\mathfrak\mathfrak> \end \right| \ne 0 \ . $$ Тогда первые $ \mathfrak $ строк матрицы $ A $ линейно независимы, а остальные будут линейно выражаться через них. Это же утверждение будет справедливо и для строк матрицы $ [A\mid \mathcal B] $. Умножая первые $ \mathfrak $ уравнений системы на соответствующие числа и складывая их, получим любое оставшееся уравнение. Таким образом, система уравнений может быть заменена эквивалентной ей системой из первых $ \mathfrak $ уравнений: $$ \left\< \begin a_<11>x_1+\dots+a_<1\mathfrak>x_<\mathfrak>&+a_<1,\mathfrak+1>x_<\mathfrak+1>+ \dots +a_<1n>x_n&=&b_1, \\ \dots & & & \dots \\ a_<\mathfrak1>x_1+\dots+a_<\mathfrak\mathfrak>x_<\mathfrak>& +a_<\mathfrak,\mathfrak+1>x_<\mathfrak+1>+\dots +a_<\mathfrakn>x_n&=&b_\mathfrak \end \right. \quad \iff \quad A^ <\prime>X=<\mathcal B>^ <\prime>$$ Если $ \mathfrak=n $, то матрица $ A^ <\prime>$ квадратная. По предположению $ \det A^ <\prime>\ne 0 $. По теореме Крамера решение такой системы единственно.

Пусть теперь $ \mathfrak произвольных фиксированных значениях $ x_<\mathfrak+1>,\dots,x_n $: $$ x_j=\frac< \left| \begin a_ <11>& \dots &a_ <1,j-1>&\left[ b_1-(a_<1,\mathfrak+1>x_<\mathfrak+1>+\dots +a_<1n>x_n) \right] &a_<1,j+1>& \dots &a_<1\mathfrak> \\ \dots &&&\dots&&& \dots \\ a_<\mathfrak1> & \dots &a_<\mathfrak,j-1> & \left[ b_<\mathfrak>- (a_<\mathfrak,\mathfrak+1>x_<\mathfrak+1>+\dots +a_<\mathfrakn>x_n) \right] &a_<\mathfrak,j+1>& \dots &a_<\mathfrak\mathfrak> \end \right| > <\Delta>$$ $$ \mbox <при>\ j\in \<1,\dots, \mathfrak\> . $$ Таким образом, в этом случае система имеет бесконечное множество решений. Используя свойство линейности определителя по столбцу (см. свойство 5 ☞ ЗДЕСЬ ), формулы можно переписать в виде $$ x_j=\beta_j + \gamma_+1>x_<\mathfrak+1>+\dots+\gamma_x_n \ npu \ j\in \ <1,\dots, \mathfrak\> \ . $$ Здесь $$ \beta_j =\frac<1> <\Delta>\left| \begin a_ <11>& \dots &a_ <1,j-1>& b_1 &a_<1,j+1>& \dots &a_<1\mathfrak> \\ \vdots &&&\vdots&&& \vdots \\ a_<\mathfrak1> & \dots &a_<\mathfrak,j-1> & b_<\mathfrak> &a_<\mathfrak,j+1>& \dots &a_<\mathfrak\mathfrak> \end \right|\, , $$ $$ \gamma_ = -\frac<1> <\Delta>\left| \begin a_ <11>& \dots &a_ <1,j-1>& a_ <1k>&a_<1,j+1>& \dots &a_<1\mathfrak> \\ \vdots &&&\vdots&&& \vdots \\ a_<\mathfrak1> & \dots &a_<\mathfrak,j-1> & a_<\mathfrakk> &a_<\mathfrak,j+1>& \dots &a_<\mathfrak\mathfrak> \end \right| \ . $$ Эти формулы называются общим решением системы $ A X=\mathcal B $. Участвующие в них переменные $ x_<\mathfrak+1>,\dots,x_n $ называются основными (или свободными), а $ x_1,\dots,x_<\mathfrak> $ — зависимыми. Решение, получающееся из общего решения фиксированием значений основных переменных, называется частным решением системы уравнений.

Пример. Исследовать совместность и найти общее решение системы уравнений:

Решение проведем двумя способами, соответствующими двум способам вычисления ранга матрицы. Вычисляем сначала ранг матрицы $ A $ по методу окаймляющих миноров: $$ |2| \ne 0,\quad \left| \begin 2 & 1 \\ 6 & 2 \end \right| \ne 0, \quad \left| \begin 2 & 1 & 2 \\ 6 & 2 & 4 \\ 4 & 1 & 1 \end \right|=2 \ne 0 \ , $$ а все миноры, окаймляющие последний, равны нулю. Итак, $ \operatorname (A) =3 $. Для нахождения ранга расширенной матрицы $ [A\mid \mathcal B] $ достаточно проверить окаймление найденного ненулевого минора третьего порядка с помощью элементов взятых из столбца правых частей. Имеется всего один такой минор, и он равен нулю. Следовательно $ \operatorname[ A\mid \mathcal B ] =3 $, система совместна, и имеет бесконечное множество решений.

Ненулевой минор третьего порядка (базисный минор) находится в первой, второй и четвертых строках, что означает линейную независимость соответствующих уравнений. Третье уравнение линейно зависит от остальных, и может быть отброшено. Далее, указанный базисный минор образован коэффициентами при $ x_1,x_3 $ и $ x_4 $. Следовательно оставшиеся уравнения могут быть разрешены относительно этих переменных, т.е. они — зависимые, а $ x_2 $ и $ x_5 $ — основные. Использование формулы дает общее решение $$ \begin x_1&=&\frac<\left| \begin 2 & 1 & 2 \\ 3 & 2 & 4 \\ 1 & 1 & 1 \end \right|> <\displaystyle 2>-x_2\frac<\left| \begin -1 & 1 & 2 \\ -3 & 2 & 4 \\ -2 & 1 & 1 \end \right|> <\displaystyle 2>-x_5\frac<\left| \begin 3 & 1 & 2 \\ 5 & 2 & 4 \\ 2 & 1 & 1 \end \right|> <\displaystyle 2>=-\frac<1><2>+\frac<1><2>x_2+\frac<1><2>x_5, \\ & & \\ x_3&=&\frac<\left| \begin 2 & 2 & 2 \\ 6 & 3 & 4 \\ 4 & 1 & 1 \end \right|> <\displaystyle 2>-x_2\frac<\left| \begin 2 & -1 & 2 \\ 6 & -3 & 4 \\ 4 & -2 & 1 \end \right|> <\displaystyle 2>-x_5\frac<\left| \begin 2 & 3 & 2 \\ 6 & 5 & 4 \\ 4 & 2 & 1 \end \right|><\displaystyle 2>=3-4x_5, \\ & & \\ x_4 &=&\frac<\left| \begin 2 & 1 & 2 \\ 6 & 2 & 3 \\ 4 & 1 & 1 \end \right|> <\displaystyle 2>-x_2\frac<\left| \begin 2 & 1 & -1 \\ 6 & 2 & -3 \\ 4 & 1 & -2 \end \right|> <\displaystyle 2>-x_5\frac<\left| \begin 2 & 1 & 3 \\ 6 & 2 & 5 \\ 4 & 1 & 2 \end \right|> <\displaystyle 2>= 0. \end $$ Решим теперь ту же задачу, воспользовавшись методом Гаусса исключения переменных в системе линейных уравнений: $$ \left\< \begin 2x_1&-x_2&+x_3&+2x_4&+3x_5&=&2, \\ &&x_3&+2x_4&+4x_5&=&3, \\ &&&x_4&&=&0 \end \right. $$ Используя обратный ход метода Гаусса, снова приходим к полученным формулам.

Ответ. Общее решение системы: $ x_1=1/2 (x_2+x_5-1),\ x_3=3-4\,x_5,\ x_4=0 $.

Проанализируем теперь полученные общие формулы для общего решения. В этих формулах $ \beta_j $ представляет решение системы, получаемое при $ x_<\mathfrak+1>=0,\dots,x_n=0 $. Величины же коэффициентов $ \gamma_ $ вовсе не зависят от правых частей системы и будут одинаковыми при любых значениях $ b_1,\dots,b_m $. В частности, если $ b_1=0,\dots,b_m=0 $, то в формулах величины $ \beta_j $ обращаются в нуль и эти формулы превращаются в $$ x_j=\gamma_+1>x_<\mathfrak+1>+\dots+\gamma_x_n \ npu \ j\in \<1,\dots, \mathfrak\> \ . $$

Вывод. Формула общего решения системы $ A X=\mathcal B $: $$ x_j=\beta_j + \gamma_+1>x_<\mathfrak+1>+\dots+\gamma_x_n \ npu \ j\in \ <1,\dots, \mathfrak\> $$ состоит из двух частей: слагаемые, не содержащие свободных переменных, определяют частное решение неоднородной системы: $$ x_1= \beta_1,\dots, x_<\mathfrak>= \beta_<\mathfrak>,x_<\mathfrak+1>=0,\dots,x_n=0 \ ; $$ оставшиеся после их отбрасывания формулы задают общее решение системы $ AX=\mathbb O $. Этот результат обобщается в следующей теореме.

Теорема. Общее решение системы уравнений $ A X=\mathcal B $ представимо в виде суммы какого-то частного решения этой системы и общего решения соответствующей однородной системы $ A X=\mathbb O $.

Доказательство тривиально если система $ A X=\mathcal B $ имеет единственное решение. Если же решений бесконечно много, то выбрав какое-то одно частное $ X=X_1 $ мы получаем, что любое другое частное решение $ X=X_2 $ должно быть связано с первым соотношением $$ A(X_2-X_1)=\mathbb O , $$ т.е. разность частных решений неоднородной системы обязательно является решением однородной системы уравнений $ AX=\mathbb O $. ♦

Теперь посмотрим как можно описать общее решение однородной системы.

Система однородных уравнений

Система линейных уравнений называется однородной, если все коэффициенты правых частей равны нулю: $$ \left\< \begin a_<11>x_1 &+a_<12>x_2&+ \ldots&+a_<1n>x_n &=0,\\ a_<21>x_1 &+a_<22>x_2&+ \ldots&+a_<2n>x_n &=0,\\ \dots & & & \dots & \\ a_x_1 &+a_x_2&+ \ldots&+a_x_n &=0. \end \right. $$ или, в матричном виде: $$ A_X=<\mathbb O>_ $$

Задача ставится о поиске нетривиального решения. Оно не всегда существует. Так, к примеру, если матрица $ A_<> $ системы — квадратная и имеет ненулевой определитель, то, согласно теореме Крамера, нетривиальных решений у однородной системы нет. Теорема Кронекера-Капелли утверждает, что условие $ \det (A_<>) = 0 $ является и достаточным для существования нетривиального решения.

Теорема 1. Для того, чтобы система однородных уравнений с квадратной матрицей $ A_<> $ имела нетривиальное решение необходимо и достаточно, чтобы $ \det (A_<>) = 0 $.

Для произвольной (не обязательно квадратной) матрицы $ A_<> $ имеет место следующий общий результат.

Теорема 2. Если $ \operatorname (A)=\mathfrak r 5) $ A_^<> $.

Теорема 3. Множество решений системы однородных уравнений образует линейное подпространство пространства $ \mathbb A^ $. Размерность этого подпространства равна $ n-\mathfrak r $, а фундаментальная система решений образует его базис.

Пусть матрица системы $ AX=\mathbb O $ квадратная и

$$ \operatorname (A) =n_<>-1 \, .$$ Доказать, что если ненулевой минор матрицы порядка $ n_<>-1 $ соответствует какому-нибудь элементу $ j_<> $-й строки, то система алгебраических дополнений к элементам $ a_,\dots,a_^<> $ этой строки составляет ФСР для $ AX=\mathbb O_<> $. Например, для системы $$ \left\< \begin a_<11>x_1 +a_<12>x_2+a_<13>x_3&=0,\\ a_<21>x_1 +a_<22>x_2+a_<23>x_3&=0 \end \right. $$ ФСР состоит из решения $$ x_1=\left| \begin a_ <12>& a_ <13>\\ a_ <22>& a_ <23>\end \right| , \ x_2=-\left| \begin a_ <11>& a_ <13>\\ a_ <21>& a_ <23>\end \right| , \ x_3=\left| \begin a_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right| \ , $$ если только хотя бы один из миноров отличен от нуля.

Теперь обсудим способы нахождения ФСР.

1. Первый из них получается из общего метода решения системы линейных уравнений, рассмотренного в предыдущем пункте. Так же, как и в том пункте, сделаем упрощающее обозначения предположение, что зависимыми переменными являются первые $ x_<1>,\dots,x_ <\mathfrak r>$, т.е. общее решение задается формулами $$ x_j=\gamma_+1>x_<\mathfrak+1>+\dots+\gamma_x_n \ npu \ j\in \<1,\dots, \mathfrak\> \ . $$ Иными словами, вектор столбец $$ X=\left(\begin \gamma_<1,\mathfrak+1>x_<\mathfrak+1>+\dots+\gamma_<1n>x_n \\ \gamma_<2,\mathfrak+1>x_<\mathfrak+1>+\dots+\gamma_<2n>x_n \\ \vdots \\ \gamma_<\mathfrak,\mathfrak+1>x_<\mathfrak+1>+\dots+\gamma_<\mathfrakn>x_n \\ x_<\mathfrak+1> \\ x_<\mathfrak+2> \\ \vdots \\ x_ \end\right) $$ будет решением однородной системы при любых наборах значений основных переменных $ x_<\mathfrak+1>,\dots,x_ $. Представим этот вектор в виде суммы векторов: $$ =x_<\mathfrak+1> \underbrace< \left(\begin \gamma_<1,\mathfrak+1> \\ \gamma_<2,\mathfrak+1> \\ \vdots \\ \gamma_<\mathfrak,\mathfrak+1> \\ 1 \\ 0 \\ \vdots \\ 0 \end\right)>_ + x_<\mathfrak+2> \underbrace<\left(\begin \gamma_<1,\mathfrak+2> \\ \gamma_<2,\mathfrak+2> \\ \vdots \\ \gamma_<\mathfrak,\mathfrak+2> \\ 0 \\ 1 \\ \vdots \\ 0 \end\right)>_+\dots+ x_ \underbrace<\left(\begin \gamma_ <1n>\\ \gamma_ <2n>\\ \vdots \\ \gamma_<\mathfrakn> \\ 0 \\ 0 \\ \vdots \\ 1 \end\right)>_> \ . $$ Таким образом, любое решение однородной системы представимо в виде линейной комбинации $ n_<>— \mathfrak r $ фиксированных решений. Именно эти решения и можно взять в качестве ФСР — их линейная независимость очевидна (единицы в нижних частях каждого вектора $ X_ $ расположены на разных местах, и ни какая линейная комбинация столбцов $ \ < X_1,\dots,X_\> $ не сможет обратить их одновременно в нуль).

Оформим этот способ построения ФСР в теорему:

Теорема 4. Если система уравнений $ AX=\mathbb O $ имеет структуру матрицы $ A_<> $ вида:

$$ A = \left[ E_ <\mathfrak r>\mid P_ <\mathfrak r \times (n-\mathfrak r)>\right] \ , $$ то ее ФСР состоит из столбцов матрицы $$ \left[ \begin — P^ <\top>\\ \hline E_ \end \right] \ . $$

Пример. Найти ФСР для системы уравнений

Решение. Приводим систему к трапециевидному виду: $$ \left\< \begin x_1-&x_2+&x_3-&x_4=&0, \\ &&x_3+&4x_4=&0 \end \right. $$ В качестве зависимых переменных можно взять, например, $ x_ <1>$ и $ x_ <3>$. $$ \begin x_1 & x_3 & x_2 & x_4 \\ \hline 1 & 0 & 1 & 0 \\ 5 & -4 & 0 & 1 \end $$

2. Этот способ напоминает вычисление обратной матрицы методом приписывания единичной матрицы. Транспонируем матрицу $ A_<> $ системы и припишем к ней справа единичную матрицу порядка $ n_<> $: $$ \left[ A^ <\top>| E_n \right] = \left(\begin a_ <11>& a_ <21>& \dots & a_ & 1 & 0 & 0 & \dots & 0 \\ a_ <12>& a_ <22>& \dots & a_ & 0 & 1 & 0 & \dots & 0 \\ a_ <13>& a_ <23>& \dots & a_ & 0 & 0 & 1 & \dots & 0 \\ \vdots & & & \vdots & \vdots & & & \ddots & \vdots \\ a_ <1n>& a_ <2n>& \dots & a_ & 0 & 0 & 0 & \dots & 1 \end \right) \ ; $$ здесь $ <> |_<> <> $ означает конкатенацию. Получившуюся матрицу элементарными преобразованиями строк приводим к форме: $$ \left( \begin \hat A & K \\ \mathbb O & L \end \right) = \left(\begin \color <\star>& * & * & \dots & * & * & * & * & * & * & * & \dots & * \\ 0 & \color <\star>& * & \dots & * & * & * & * & * & * & * & \dots & * \\ 0 & 0 & \color <\star>& \dots & * & * & * & * & * & * & * & \dots & * \\ \vdots & & & \ddots & & \vdots & & & \vdots & & & & \vdots \\ 0 & 0 & \dots & & 0 & \color <\star>& * & * & * & * & * & \dots & * \\ \hline 0 & 0 & \dots & 0 & 0 & 0 & 0 & 0 & \Box & \Box & \Box & \dots & \Box \\ \vdots & & & & & \vdots & & & \vdots & & & & \vdots \\ 0 & 0 & \dots & 0 & 0 & 0 & 0 & 0 & \Box & \Box & \Box & \dots & \Box \end \right) \begin \left.\begin \\ \\ \\ \\ \\ \end\right\> \mathfrak r \\ \left. \begin \\ \\ \\ \end\right\> n — \mathfrak r \end \ . $$ Элементы трапециевидной матрицы $ \hat A $, обозначенные $ \color <\star>$, могут быть равны нулю, но $ \operatorname(\hat A)= \mathfrak r_<> $. В этом случае строки матрицы $ L_<> $, образовавшейся в правом нижнем углу (ее элементы обозначены $ \Box $), составляют ФСР для системы $ AX=\mathbb O $.

Пример. Найти ФСР для системы уравнений

$$ \left\< \begin x_1 &+2\,x_2&+ x_3&+3\,x_4&-x_5&+2\,x_6=&0,\\ -3x_1 &-x_2&+ 2\,x_3&-4\,x_4&+x_5&-x_6=&0,\\ x_1 &+x_2&+ 3\,x_3&+2\,x_4&+x_5&+3\,x_6=&0,\\ -8\,x_1 &-7\,x_2&+ 4\,x_3&-15\,x_4&+6\,x_5&-5\,x_6=&0,\\ 6x_1 &+5\,x_2& +5\,x_3&+11\,x_4 &&+9\,x_6=&0. \end \right. $$ Решение. Преобразуем матрицу $ \left[ A^ <\top>| E_6 \right] $

$$ \left(\begin 1 & -3 & 1 & -8 & 6 & 1 \\ 2 & -1 & 1 & -7 & 5 & & 1 \\ 1 & 2 & 3 & 4 & 5 & & & 1 \\ 3 & -4 & 2 & -15 & 11 &&&& 1 \\ -1 & 1 & 1 & 6 & 0 &&&&& 1 \\ 2 & -1 & 3 & -5 & 9 &&&&&& 1 \end \right)_ <6\times 11>$$ к трапециевидной форме с помощью элементарных преобразований строк: $$ \rightarrow \left(\begin 1 & -3 & 1 & -8 & 6 & 1 \\ 0 & 5 & -1 & 9 & -7 &-2 & 1 \\ 0 & 5 & 2 & 12 & -1 &-1 &0 & 1 \\ 0 & 5 & -1 & 9 & -7 &-3&0&0& 1 \\ 0 & -2 & 2 & -2 & 6 &1&0&0&0& 1 \\ 0 & 5 & 1 & 11 & -3 &-2&0&0&0&0& 1 \end \right)\rightarrow $$ $$ \rightarrow \left(\begin 1 & -3 & 1 & -8 & 6 & 1 \\ 0 & 5 & -1 & 9 & -7 &-2 & 1 \\ 0 & 0 & 3 & 3 & 6 &1 &-1 & 1 \\ 0 & 0 & 0 & 0 & 0 &-1&-1&0& 1 \\ 0 & 0 & 8/5 & 8/5 & 16/5 &1/5&2/5&0&0& 1 \\ 0 & 0 & 2 & 2 & 4 &0&-1&0&0&0& 1 \end \right)\rightarrow $$ $$ \rightarrow \left(\begin 1 & -3 & 1 & -8 & 6 & 1 \\ 0 & 5 & -1 & 9 & -7 &-2 & 1 \\ 0 & 0 & 3 & 3 & 6 &1 &-1 & 1 \\ 0 & 0 & 0 & 0 & 0 &-1&-1&0& 1 \\ 0 & 0 & 0 & 0 & 0 &-1/3&14/15&-8/15&0& 1 \\ 0 & 0 & 0 & 0 & 0 &-2/3&-1/3&-2/3&0& 0 & 1 \end \right) $$

3. Еще один способ построения ФСР основан на теореме Гамильтона-Кэли.

Теорема. Пусть матрица системы $ AX=\mathbb O $ квадратная и $ \operatorname (A) = <\mathfrak r>$. Тогда характеристический полином матрицы $ A_<> $ имеет вид:

Пример. Найти ФСР для системы уравнений

Решение. Здесь $$ A= \left( \begin 1 & 1 & -1 & -1 \\ 2 & 3 & 1 & -2 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end \right), \quad \det (A-\lambda E) = \lambda^2(\lambda^2-4\lambda+1), $$ $$ A^2-4A+E= \left( \begin 0 & 0 & 4 & 1 \\ 0 & 0 & -3 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end \right) $$

Блок-схемы зависимости множества решений системы уравнений $ AX= \mathcal B $ от комбинации чисел $ n, \mathfrak r $ ☞ ЗДЕСЬ.

Геометрическая интерпретация

Геометрический смысл введенных определений поясним на примере $ \mathbb R^ <3>$. Уравнение $$ a_1x_1+a_2x_2+a_3x_3=b $$ — при фиксированных вещественных коэффициентах $ a_1,a_2,a_3 $ (хотя бы один из них считаем отличным от нуля) и $ b_<> $ — задает плоскость. Если, к примеру, $ a_1\ne 0 $, то из уравнения получаем выражение для $ x_ <1>$ как функции $ x_2,x_3 $: $$ x_1=\frac-\fracx_2-\fracx_3 \ . $$ В этом представлении переменные $ x_ <2>$ и $ x_ <3>$ могут принимать любые вещественные значения независимо друг от друга, а вот переменная $ x_ <1>$ полностью определяется заданием $ x_ <2>$ и $ x_ <3>$. С одной стороны, последняя формула определяет общее решения системы линейных уравнений (которая в нашем частном случае состоит из одного-единственного уравнения); переменные $ x_ <2>$ и $ x_ <3>$ выбраны основными, а $ x_ <1>$ оказывается зависимой. Строго говоря, координаты любой точки плоскости можно представить формулами $$x_1=\frac-\fract-\fracu,\ x_2=t,\ x_3=u \quad npu \quad \\subset \mathbb R \ , $$ которые называются параметрическим представлением плоскости. Таким образом, получили геометрическую интерпретацию общего решения системы уравнений. Идем далее: представим последние формулы в векторной форме: $$ \left( \begin x_1 \\ x_2 \\ x_3 \end \right)= \left( \begin b/a_1- t\, a_2/a_1- u\, a_3/a_1 \\ t \\ u \end \right)= \left( \begin b/a_1\\ 0 \\ 0 \end \right)+ t \left( \begin -a_2/a_1\\ 1 \\ 0 \end \right) + u \left( \begin -a_3/a_1\\ 0 \\ 1 \end \right) \ . $$ Какой геометрический смысл имеет каждое из слагаемых? Первое слагаемое $$ X_0=\left( \begin b/a_1\\ 0 \\ 0 \end \right) $$ получается при задании $ t=0,u=0_<> $ в общем решении. Это — частное решение нашего уравнения и определяет точку, через которую проходит плоскость. Два оставшихся столбца $$ X_1=\left( \begin -a_2/a_1\\ 1 \\ 0 \end \right) \quad u \quad X_2=\left( \begin -a_3/a_1\\ 0 \\ 1 \end \right) $$ не задают решения нашего уравнения — если только $ b\ne 0_<> $. Но оба удовлетворяют однородному уравнению $$ a_1x_1+a_2x_2+a_3x_3=0 , $$ Последнее также определяет плоскость — параллельную исходной и проходящую через начало координат. Первая плоскость получается из второй сдвигом (параллельным переносом) на вектор $ \vec $: и этот факт составляет геометрическую интерпретацию теоремы, сформулированной в конце ☞ ПУНКТА:

Теорема. Общее решение системы уравнений $ A X=\mathcal B $ представимо в виде суммы какого-то частного решения этой системы и общего решения соответствующей однородной системы $ A X=\mathbb O $.

Координаты произвольной точки плоскости $ a_1x_1+a_2x_2+a_3x_3=0 $ задаются соотношениями $$ \left( \begin x_1 \\ x_2 \\ x_3 \end \right)=tX_1+uX_2 \ . $$ Векторы пространства $ \vec $ и $ \vec $ являются базисными векторами плоскости — любой вектор $ \vec $, лежащий в плоскости, через них выражается и они линейно независимы. Но $ X_ <1>$ и $ X_ <2>$ определяют фундаментальную систему решений однородного уравнения. Таким образом, мы получили геометрическую интерпретацию для ФСР: она задает базисные векторы плоскости, проходящей через начало координат.

Теперь рассмотрим систему из двух уравнений: $$ \left\<\begin a_<11>x_1 +a_<12>x_2+a_<13>x_3 &=&b_1,\\ a_<21>x_1 +a_<22>x_2+a_<23>x_3 &=&b_2. \end\right. $$ Ее можно интерпретировать как пересечение двух плоскостей в $ \mathbb R^ <3>$. Здесь уже возможны варианты: пересечение может оказаться как пустым так и непустым. От чего это зависит? — В соответствии с теоремой Кронекера-Капелли, надо сравнить два числа $$ \operatorname \left( \begin a_ <11>& a_ <12>& a_ <13>\\ a_ <21>& a_ <22>& a_ <23>\end \right) \quad u \quad \operatorname \left( \begin a_ <11>& a_ <12>& a_ <13>& b_1 \\ a_ <21>& a_ <22>& a_ <23>& b_2 \end \right) \ . $$ Очевидно, ни одно из них не может быть большим $ 2_<> $. Если оба равны $ 2_<> $ и этот факт обеспечен, например, условием $$ \left| \begin a_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right| \ne 0, $$ то решения системы определяют прямую в пространстве. Действительно, при таком условии систему можно разрешить относительно неизвестных $ x_ <1>$ и $ x_ <2>$ и представить общее решение в виде: $$ x_1= \frac<\left|\begin b_1 & a_ <12>\\ b_2 & a_ <22>\end \right|><\left|\begin a_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right|>+ \frac<\left|\begin a_ <12>& a_ <13>\\ a_ <21>& a_ <23>\end \right|><\left|\begin a_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right|>x_3 \ , \quad x_2= \frac<\left|\begin a_ <11>& b_ <1>\\ a_ <12>& b_ <2>\end \right|><\left|\begin a_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right|>- \frac<\left|\begin a_ <11>& a_ <13>\\ a_ <21>& a_ <23>\end \right|><\left|\begin a_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right|>x_3 \ . $$ В этих формулах переменная $ x_ <3>$ принимает любое значение, а значения переменных $ x_ <1>$ и $ x_ <2>$ линейно выражаются через $ x_ <3>$. Общее решение фактически задает прямую в параметрическом виде: координаты произвольной ее точки определяются формулами $$ \left( \begin x_1 \\ x_2 \\ x_3 \end \right)=X_0+tX_1 \ , $$ где вектор $$ \quad X_0 = \left(\frac<\left|\begin a_ <11>& b_ <1>\\ a_ <12>& b_ <2>\end \right|><\left|\begin a_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right|> , \ \frac<\left|\begin a_ <11>& b_ <1>\\ a_ <12>& b_ <2>\end \right|><\left|\begin a_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right|>,\ 0\right)^ <\top>$$ задает координаты точки, лежащей на прямой (т.е. принадлежащей пересечению плоскостей), а вектор $$ X_1= \left(\frac<\left|\begin a_ <12>& a_ <13>\\ a_ <21>& a_ <23>\end \right|><\left|\begin a_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right|>,\ — \frac<\left|\begin a_ <11>& a_ <13>\\ a_ <21>& a_ <23>\end \right|><\left|\begin a_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right|>, \ 1 \right)^ <\top>$$ является направляющим для прямой. С тем же успехом мы могли бы взять в качестве направляющего вектор, получающийся растяжением $ X_ <1>$: $$ \tilde X_1 = \left(\left|\begin a_ <12>& a_ <13>\\ a_ <21>& a_ <23>\end \right|,\ — \left|\begin a_ <11>& a_ <13>\\ a_ <21>& a_ <23>\end \right|, \ \left|\begin a_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right| \right)^ <\top>\ . $$ Очевидно, что любой из векторов $ X_ <1>$ или $ \tilde X_1 $ задает фундаментальную систему решений однородной системы уравнений 10) $$ \left\<\begin a_<11>x_1 +a_<12>x_2+a_<13>x_3 &=&0,\\ a_<21>x_1 +a_<22>x_2+a_<23>x_3 &=&0. \end\right. $$ Последняя определяет прямую в $ \mathbb R^3 $, проходящую через начало координат. Мы снова получаем интерпретацию теоремы: общее решение неоднородной системы получается сдвигом (параллельным переносом) общего решения однородной системы на вектор $ \vec $.

Мы рассмотрели пока только случай пересекающихся плоскостей в пространстве. Его можно считать общим, т.е. случаем «как правило»: две случайным образом выбранные плоскости в $ \mathbb R^ <3>$ пересекаться будут. Исследуем теперь исключительный случай — параллельности плоскостей. Исключительность этого случая может быть проверена и аналитикой. Для несовместности системы из двух уравнений необходимо, чтобы ранг ее матрицы $$ \left( \begin a_ <11>& a_ <12>& a_ <13>\\ a_ <21>& a_ <22>& a_ <23>\end \right) $$ оказался меньшим $ 2_<> $. Это равносильно тому, что все миноры второго порядка этой матрицы обращаются в нуль: $$ \left| \begin a_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right|=0,\ \left| \begin a_ <12>& a_ <13>\\ a_ <22>& a_ <23>\end \right| =0,\ \left| \begin a_ <11>& a_ <13>\\ a_ <21>& a_ <23>\end \right|=0 \ . $$ Эти условия можно переписать в виде $$ \frac>>=\frac>>=\frac>> \ ; $$ и, если обозначить общую величину последний отношений через $ \tau_<> $, то получаем: $$ (a_<11>,a_<12>,a_<13>)=\tau (a_<21>,a_<22>,a_<23>) . $$ Если вспомнить, что каждый из этих наборов коэффициентов задает вектор $ \vec> $ в $ \mathbb R^ <3>$, перпендикулярный соответствующей плоскости, то, в самом деле, плоскости, определяемые уравнениями, оказываются параллельными. Пересекаться они, как правило, не будут: для пересечения необходимо, чтобы расширенная матрица системы $$ \left( \begin a_ <11>& a_ <12>& a_ <13>& b_1 \\ a_ <21>& a_ <22>& a_ <23>& b_2 \end \right) $$ имела ранг меньший $ 2_<> $. Это возможно только при условии когда коэффициенты правых частей удовлетворяют соотношению $$ b_1 = \tau b_2 $$ при величине $ \tau_<> $ определенной выше. При выполнении этого условия второе уравнение получается из первого домножением на $ \tau_<> $ и соответствующие плоскости попросту совпадают.

Перейдем теперь к системе из трех уравнений: $$ \left\< \begin a_<11>x_1 +&a_<12>x_2+&a_<13>x_3=&b_1, \\ a_<21>x_1 +&a_<22>x_2+&a_<23>x_3=&b_2, \\ a_<31>x_1 +&a_<32>x_2+&a_<33>x_3=&b_3. \end \right. $$ Вариантов взаимного расположения трех плоскостей в $ \mathbb R^ <3>$ уже значительно больше. Какой из них будет самым распространенным, то есть случаем «как правило»? Геометрически ответ очевиден: если пересечение двух плоскостей определяет, как правило, прямую, то эта прямая пересекается с третьей плоскостью, как правило, в одной-единственной точке. И алгебра подтверждает геометрию: в комментарии к теореме Крамера говорится, что система, число уравнений которой совпадает с числом неизвестных, как правило, имеет единственное решение. Условие для этого случая «как правило» дается той же теоремой Крамера: $$ \left| \begin a_ <11>& a_ <12>& a_<13>\\ a_ <21>& a_ <22>& a_ <23>\\ a_ <31>& a_ <32>& a_ <33>\end \right| \ne 0 . $$

Теорема Кронекера-Капелли в этом случае не нужна — нет, она остается справедливой! — но проверка условия на ранги матриц тривиальна: они оба равны $ 3_<> $. Если же указанный определитель обращается в нуль, то этот факт эквивалентен тому, что три строки определителя линейно зависимы. Например, возможно, что строка $ (a_<31>,a_<32>, a_<33>) $ может быть представлена в виде линейной комбинации первых двух строк. Вспомним геометрический смысл этих строк: они задают координаты векторов, перпендикулярных соответствующим плоскостям. Если система уравнений $$ \left\<\begin a_<11>x_1 +a_<12>x_2+a_<13>x_3 &=&b_1,\\ a_<21>x_1 +a_<22>x_2+a_<23>x_3 &=&b_2 \end\right. $$ определяет прямую в $ \mathbb R^ <3>$, то оба вектора $ \vec> $ и $ \vec> $ при $ A^<[1]>= (a_<11>,a_<12>, a_<13>) $ и $ A^<[2]>= (a_<21>,a_<22>, a_<23>) $ перпендикулярны этой прямой; любая их комбинация также перпендикулярна этой прямой, а, следовательно, плоскость $$ a_<31>x_1 +a_<32>x_2+a_<33>x_3 =b_3 $$ будет ей параллельна.

Статья не закончена!

Ортогональность

Геометрические соображения из предыдущего пункта могут быть обобщены на случай когда размерности рассматриваемых пространств увеличиваются, и мы говорим о точках и векторах многомерных пространств. В последующих пунктах нам потребуются понятия линейной оболочки, линейного пространства, размерности, базиса и координат применительно к векторам-столбцам или векторам-строкам. Их можно найти ☞ ЗДЕСЬ.

Задача решения системы линейных уравнений $$ \left\< \begin 3x_1&+4x_2&-x_3&=2, \\ x_1&-2x_2&+3x_3&=1 \end \right. $$ может быть рассмотрена с двух точек зрения. С одной стороны, переписав систему в виде $$ x_1\left(\begin 3 \\ 1 \end \right)+ x_2\left(\begin 4 \\ -2 \end \right)+ x_3\left(\begin -1 \\ 3 \end \right)= \left(\begin 2 \\ 1 \end \right) \ , $$ можно говорить о поиске линейной комбинации столбцов $$ \left(\begin 3 \\ 1 \end \right),\ \left(\begin 4 \\ -2 \end \right),\ \left(\begin -1 \\ 3 \end \right) $$ равной заданному столбцу $$ \left(\begin 2 \\ 1 \end \right) \ . $$ В случае произвольной системы, записанной в матричном виде $$ A_X=\mathcal B_ \ $$ совместность системы интерпретировать в смысле принадлежности столбца $ \mathcal B $ линейной оболочке столбцов $ A_<[1]>,\dots,A_ <[n]>$: $$ \mathcal B=x_1 A_<[1]>+\dots+x_nA_ <[n]>\quad \iff \quad \mathcal B \in \mathcal L (A_<[1]>,\dots,A_<[n]>) \ . $$ В случае положительного ответа числа $ x_<1>,\dots,x_n $ интерпретируются как координаты столбца $ \mathcal B $ в системе столбцов 11) $ \,\dots,A_<[n]>\> $.

С другой стороны, к той же задаче решения системы уравнений, в предыдущем ПУНКТЕ мы подошли с другой стороны. Первое из уравнений системы $$ 3\,x_1+4\,x_2-x_3=2 $$ можно интерпретировать так: скалярное произведение векторов $ \vec<<\mathbf OA>^<[1]>> $ и $ \vec<<\mathbf OX>> $ равно фиксированному числу $ 2_<> $. Здесь вектора рассматриваются в пространстве строк $ \mathbb R_<>^ <3>$; считается, что каждый вектор имеет начало в начале координат $ \mathbf O=[0,0,0] $, а конец — в точке с координатами $ [3,4,-1] $ или, соответственно, $ [x_1,x_2,x_3] $. Если скалярное произведение векторов обозначать скобками $ \langle <> \mbox < >\rangle $, то систему уравнений можно переписать в виде $$ \langle \vec<<\mathbf OA>^<[1]>> ,\ \vec<<\mathbf OX>> \rangle=2,\ \langle \vec<<\mathbf OA>^<[2]>> ,\ \vec<<\mathbf OX>> \rangle=1 \quad npu \quad A^ <[1]>= [3,4,-1], A^<[2]>=[1,-2,3] $$ — строках матрицы $ A_<> $. И задачу решения такой системы понимать в смысле: найти координаты всех векторов-строк $ [x_1,x_2,x_3] $ которые обеспечат нам заданные значения скалярных произведений с двумя фиксированными векторами.

Геометрическая интерпретация еще более упрощается если рассмотреть случай однородной системы уравнений. Так, решить систему уравнений $$ \left\< \begin 3x_1&+4x_2&-x_3&=0, \\ x_1&-2x_2&+3x_3&=0 \end \right. $$ означает подобрать вектор $ \vec<<\mathbf OX>> $ перпендикулярный (ортогональный) одновременно обоим векторам $ \vec<<\mathbf OA>^<[1]>> $ и $ \vec<<\mathbf OA>^<[2]>> $. Очевидно, что таких векторов в $ \mathbb R^ <3>$ бесконечно много — найдя хотя бы один такой вектор $ \vec<<\mathbf OX>> $, другие получим его растяжением: $ \alpha \cdot \vec<<\mathbf OX>> $ остается перпендикулярным векторам $ \vec<<\mathbf OA>^<[1]>> $ и $ \vec<<\mathbf OA>^<[2]>> $ при $ \forall \alpha \in \mathbb R $.

Все эти геометрические соображения обобщаются в произвольное пространство $ \mathbb R_<>^ $ строк или столбцов, состоящих из $ n_<> $ вещественных чисел (компонент). Для этого приходится обобщать понятие скалярного произведения. В общем случае оно вводится аксиоматически (и, более того, в одном и том же множестве может быть определено разными способами, см. ☞ ЕВКЛИДОВО ПРОСТРАНСТВО ). Мы сейчас не будем залезать так глубоко в эту аксиоматику, а просто определим скалярное произведение двух строк $ X=[x_1,x_2,\dots,x_n] $ и $ Y=[y_1,y_2,\dots,y_n] $ формулой $$ \langle X,Y \rangle=x_1y_1+x_2y_2+\dots+x_ny_n \ $$ и продекларируем без обоснований, что все привычные нам по случаям $ \mathbb R^ <2>$ и $ \mathbb R^ <3>$ свойства скалярного произведения будут выполнены.

В терминах скалярного произведения, задачу решения системы линейных уравнений можно переформулировать как поиск строки $ X=[x_1,x_2,\dots,x_n] $, ортогональной всем строкам матрицы $ A_<> $: $$ \langle A^<[1]>,X \rangle=0, \langle A^<[2]>,X \rangle=0,\dots, \langle A^<[m]>,X \rangle=0 \ . $$ Множество таких строк образует линейное подпространство пространства $ \mathbb R_<>^ $, это подпространство является ортогональным дополнением линейной оболочки $ \mathcal L ( A^<[1]>, A^<[2]>,\dots, A^ <[m]>) $ в пространстве $ \mathbb R_<>^ $. Это подпространство называется нуль-пространством матрицы или ядром матрицы $ A_<> $ и обозначается 12) $ <\mathcal K>er (A) $. Фундаментальная система решений системы $ AX=\mathbb O $ составляет базис этого подпространства. Для произвольного линейного пространства количество векторов его базиса называется размерностью пространства и обозначается $ \operatorname $. Во введенных обозначениях теорема из ☞ ПУНКТА переформулируется так:

Теорема. $ \operatorname \left( <\mathcal K>er (A) \right)=n- \mathfrak r $, где $ n_<> $ — количество столбцов матрицы $ A_<> $, а $ \mathfrak r=\operatorname (A) $ — ее ранг.


источники:

http://matica.org.ua/metodichki-i-knigi-po-matematike/algebra-i-geometriia-tolstikov-a-v/02-elementarnye-preobrazovaniia-sistemy-lineinykh-uravnenii

http://vmath.ru/vf5/algebra2/linearsystems