Решение треугольной системы линейных уравнений

Прямые методы линейной алгебры

Одной из основных задач вычислительной математики является проблема решения систем линейных алгебраических уравнений с вещественными ко- эффициентами. Для нахождения приближенного решения систем уравнений используются прямые и итерационные методы. Математический аппарат ли- нейной алгебры базируется на понятиях нормы вектора и матрицы, числа обусловленности. Рассматриваются классические методы исключения неиз- вестных, отмечаются особенности решения задач с симметричной веществен- ной матрицей.

Метод исключения Гаусса

Начнем с обсуждения того, как можно легко решать треугольные системы. Затем опишем приведение системы общего вида к треугольной форме при помощи преобразований Гаусса. И, наконец, учитывая то, что полученный метод ведет себя очень плохо на нетривиальном классе задач, рассмотрим концепцию выбора ведущих элементов.

Треугольные системы

Рассмотрим следующую треугольную \( 2\times 2 \)-систему: $$ \begin l_ <11>& 0 \\ l_ <21>& l_ <22>\end \begin x_1\\ x_2 \end = \begin b_1\\ b_2 \end $$

Если \( l_<11>, l_ <22>\ne 0 \), то неизвестные могут быть определены последовательно: $$ \begin x_1 &= b_1/l_<11>,\\ x_2 &= (b_2 — l_<21>x_1)/l_ <22>\end $$

Это \( 2\times 2 \)-версия алгоритма, известного как прямая подстановка. Общую процедуру получаем, разрешая \( i \)-е уравнение системы \( Lx = b \) относительно \( x_i \): $$ x_i = \left( b_i — \sum_^ l_ x_j \right)/l_. $$

Если вычисления выполнить для \( i \) от \( 1 \) до \( n \), то будут получены все компоненты вектора \( x \). Заметим, что на \( i \)-м шаге необходимо скалярное произведение векторов \( L(i,1:i-1) \) и \( x(1:i-1) \). Так как \( b_i \) содержится только в формуле для \( x_i \), мы можем записать \( x_i \) на месте \( b_i \).

Прямая подстановка

Предположим, что \( L \in \mathbb^ \) — нижняя треугольная матрица и \( b \in \mathbb^n \). Следующий код Python заменяет \( b \) на решение системы \( Lx = b \). Матрица \( L \) должна быть невырождена.

Аналогичный алгоритм для верхней треугольной системы \( Ux = b \) называется обратная подстановка. Вот формула для \( x_i \): $$ x_i = \left( b_i — \sum_^ u_ x_j \right)/u_. $$ и снова \( x_i \) можно записать на месте \( b_i \).

Обратная подстановка

Если матрица \( U \in \mathbb^ \) верхняя треугольная и \( b \in \mathbb^n \), то следующий код Python заменяет \( b \) на решение системы \( Ux = b \). Матрица \( U \) должна быть невырождена.

Отметим, что при реализации формул прямой и обратной подстановки мы использовали срезы массивов (см. раздел ref). В первом алгоритме L[i,:i] означает, что берется из строки двумерного массива с индексом i все элементы с нулевого до i-1 -го включительно, а b[:i] — элементы массива b с индексами от 0 до i-1 включительно. Во втором алгоритме используются срезы U[i,i+1:] , содержащий от i+1 -го до последнего (включительно) элементы i -той строки, и b[i+1:] с элементами от i+1 -го до последнего (включительно). Кроме того использовалась функция dot модуля numpy , которая вычисляет скалярное произведение двух векторов. Таким образом, мы здесь использовали векторизованные вычисления.

\( LU \)-разложение

Как мы только что видели, треугольные системы решаются «легко». Идея метода Гаусса — это преобразование системы (1) в эквивалентную треугольную систему. Преобразование достигается соответствующих линейных комбинаций уравнений. Например, в системе $$ \begin 3x_1 + 5x_2 &= 9,\\ 6x_1 + 7x_2 &= 4, \end $$ умножая ее первую строку на 2 и вычитая ее из второй части, мы получим $$ \begin 3x_1 + 5x_2 &= 9,\\ -3x_2 &= -14. \end $$

Это и есть метод исключений Гаусса при \( n=2 \). Дадим полное описание этой важной процедуры, причем опишем ее выполнение на языке матричных разложений. Данный пример показывает, что алгоритм вычисляет нижнюю треугольную матрицу \( L \) и верхнюю треугольную матрицу \( U \) так, что \( A = LU \), т.е. $$ \begin 3 & 5 \\ 6 & 7 \end = \begin 1 & 0 \\ 2 & 1 \end \begin 3 & 5 \\ 0 & -3 \end $$ Решение исходной задачи \( Ax = b \) находится посредством последовательного решения двух треугольных систем: $$ Ly = b, \quad Ux = y \quad \Rightarrow Ax = LUx = Ly = b $$

Матрица преобразования Гаусса.

Чтобы получить разложение, описывающее исключение Гаусса, нам нужно иметь некоторое матричное описание процесса обнуления матрицы. Пусть \( n=2 \), тогда как \( x_1 \ne 0 \) и \( \tau = x_2/x_1 \), то $$ \begin 1 & 0 \\ -\tau & 1 \end \begin x_1\\ x_2 \end = \begin x_1\\ 0 \end $$ В общем случае предположим, что \( x \in \mathbb^n \) и \( x_k \ne 0 \). Если $$ \tau^ <(k)T>= [ \underbrace<0, \ldots, 0>_k, \tau_, \ldots, \tau_n ], \quad \tau_i = \frac \quad i = k+1, k+2, \ldots, n $$ и мы обозначим $$ \begin \tag <2>M_k = I — \tau^ <(k)>e_k^T, \end $$ где $$ \begin e_k^T &= [\underbrace<0, \ldots, 0>_, 1, \underbrace<0, \ldots, 0>_],\\ I &= [e_1, e_2 \ldots, e_n] \end $$ то $$ M_k x = \begin 1 & \dots & 0 & 0 & \dots & 0 \\ \vdots & \ddots & \vdots & \vdots & \ddots & \vdots \\ 0 & \dots & 1 & 0 & \dots & 0 \\ 0 & \dots & -\tau_ & 1 & \dots & 0 \\ \vdots & \ddots & \vdots & \vdots & \ddots & \vdots \\ 0 & \dots & -\tau_n & 0 & \dots & 1 \end \begin x_1\\ \vdots \\ x_k \\ x_ \\ \vdots \\ x_n \end = \begin x_1\\ \vdots \\ x_k \\ 0\\ \vdots \\ 0 \end $$

Матрица \( M_k \) — это матрица преобразования Гаусса. Она является нижней унитреугольной. Компоненты \( \tau_, \tau_, \ldots, \tau_n \) — это множители Гаусса. Вектор \( \tau^ <(k)>\) называется вектором Гаусса.

Для реализации данных идей имеется функция, которая вычисляет вектор множителей. Если x — массив из n элементов и x[0] ненулевой, функция gauss возвращает вектор длины \( n-1 \), такой, что если M — матрица преобразования Гаусса, причем M[1:,1] = -gauss(x) и y = dot(M,x) , то y[1:] = 0 :

Применение матриц преобразовния Гаусса.

Умножение на матрицу преобразования Гаусса выполняется достаточно просто. Если матрица \( C \in \mathbb^ \) и \( M_k = I — \tau^ <(k)>e_k^T \), тогда преобразование вида $$ M_k C = (I — \tau^ <(k)>e_k^T)C = C — \tau^ <(k)>(e_k^T C) $$ осуществляет одноранговую модификацию. Кроме того, поскольку элементы вектора \( \tau^ <(k)>\) равны нулю от первого до \( k \)-го равны нулю, то в каждой \( k \)-ой строке матрицы \( C \) задействованы лишь элементы, начиная с \( k+1 \)-го. Следовательно, если «C« — двумерный массив, задающий матрицу \( C \), и «M« задает \( n \times n \)-преобразование Гаусса \( M_1 \), причем «M[1:,1] = -t«, «t« — множитель Гаусса, соответствующий \( \tau^ <(1)T>\), тогда следующая функция заменяет \( C \) на \( M_1C \):

Отметим, что если матрица M[k+1:,k] = -t , тогда обращение вида C[k. ] = gauss_app(C[k. ], t) заменяет \( C \) на \( M_kC \)

Матрицы преобразовния Гаусса \( M_1, M_2, \ldots, M_ \), как правило, можно подобрать так, что матрица \( M_M_\ldots M_1A = U \) является верхней треугольной. Легко убедиться, что если \( M_k = I — \tau^<(k)>e_k^T \), тогда обратная к ней задается следующим выражением \( M_k^ <-1>= I + \tau^ <(k)>e_k^T \) и поэтому $$ \begin \tag <3>A = LU, \end $$ где $$ L = M_1^ <-1>M_2^ <-1>\ldots M_^<-1>. $$

Очевидно, что \( L \) — это нижняя унитреугольная матрица. Разложение (3) называется \( LU \)-разложением матрицы \( A \). Необходимо проверять ведущие элементы матрицы \( A \) (\( a_ \)) на нуль, чтобы избежать деления на нуль в функции gauss . Это говорит о том, что \( LU \)-разложение может не существовать. Известно, что \( LU \)-разложение матрицы \( A \) существует, если главные миноры матрицы \( A \) не равны нулю при этом оно единственно и \( \det = u_ <11>u_ <22>\cdots u_ \).

Рассмотрим пример при \( n=3 \):

Функция numpy.dot

Обратите внимание, что в приведенном примере мы использовали функцию dot модуля numpy , которая выполняет умножение матриц в «правильном смысле», в то время как выражение M1*A производит поэлементное умножение.

Обобщение этого примера позволяет представить \( k \)-й шаг следующим образом:

  • Мы имеем дело с матрицей \( A^ <(k-1)>= M_\cdots M_1A \), которая с \( 1 \)-го по \( (k-1) \)-й столбец является верхней треугольной.
  • Поскольку мы уже получили нули в столбцах с \( 1 \)-го по \( (k-1) \)-й, то преобразование Гаусса можно применять только к столбцам с \( k \)-го до \( n \)-го. На самом деле нет необходимости применять преобразование Гаусса также и \( k \)-му столбцу, так как мы знаем результат.
  • Множители Гаусса, задающие матрицу \( M_k \) получаются по матрице \( A(k:n,k) \) и могут храниться в позициях, в которых получены нули.

С учетом сказанного выше мы можем написать следующую функцию:

Эта функция возвращает \( LU \)-разложение матрицы \( A \). Где же храниться матрица \( L \)? Дело в том, что если \( L = M_1^<-1>M_2^ <-1>\ldots M_^ <-1>\), то элементы с \( (k+1) \)-го до \( n \)-го в \( k \)-том столбце матрицы \( L \) равны множителям Гаусса \( \tau_, \tau_, \ldots, \tau_ \) соответственно. Этот факт очевиден, если посмотреть на произведение, задающее матрицу \( L \): $$ L = (I + \tau^<(1)>e_1^T \cdots (I + \tau^<(n-1)>e_^T)) = I + \sum_^ \tau^<(k)>e_k^T. $$ Поэтому элементы \( l_ = lu_ \) для всех \( i > k \). Здесь \( lu_ \) — элементы матрицы возвращаемой функцией lu .

После разложения матрицы \( A \) с помощью функции lu в возвращаемом массивы будут храниться матрицы \( L \) и \( U \). Поэтому мы можем решить систему \( Ax = b \), используя прямую и обратную подстановки описанные в разделе Треугольные системы:

Замечание

Отметим, что во всех представленных функциях мы выполняли явное преобразование входных параметров в массивы NumPy с элементами типа float . Это позволит правильно работать функциям в случае, если мы по ошибке создадим входные параметры не как массивы, а как списки.

Как известно метод Гаусса является прямым, т.е. дает точное решение системы линейных уравнений. Для проверки реализации решения системы линейных уравнений методом Гаусса мы можем написать следующую функцию:

Замечание

Здесь мы задали матрицу A системы и точное решение expected , на основе которых получили вектор правой части b = np.dot(A,x) . Для сравнения численного решения с точным используется функция np.linalg.norm . В случае вызова с одним аргументом вычисляется \( l_2 \)-норма: \( \| v \|_2 = \sqrt<\sum_^n v_i^2> \).

Выбор ведущего элемента

Как уже упоминалось, \( LU \)-разложение может не существовать. В методе Гаусса с выбором ведущего элемента на очередном шаге исключается неизвестное, при котором коэффициент по модулю является наибольшим. В этом случае метод Гаусса применим для любых невырожденных матриц (\( \det A \ne 0 \)).

Такая стратегия предполагает переупорядочивание данных в виде перестановки двух матричных строк. Для этого используются понятие перестановочной матрицы. Перестановочная матрица (или матрица перестановок) — это матрица, отличающаяся от единичной лишь перестановкой строк, например $$ P = \begin 0 & 0 & 0 & 1\\ 1 & 0 & 0 & 0\\ 0 & 0 & 1 & 0\\ 0 & 1 & 0 & 0 \end. $$

Перестановочную матрицу нет необходимости хранить полностью. Гораздо более эффективно перестановочную матрицу можно представить в виде целочисленного вектора \( p \) длины \( n \). Один из возможных способов такого представления — это держать в \( p_k \) индекс столбца в \( k \)-й строке, содержащий единственный элемент равный \( 1 \). Так вектор \( p = [4, 1, 3, 2] \) соответствует кодировке приведенной выше матрицы \( P \). Также возможно закодировать \( P \) указанием индекса строки в \( k \)-ом столбце, содержащего \( 1 \), например, \( p = [2, 4, 3, 1] \).

Если \( P \) — это матрица перестановок, а \( A \) — некоторая матрица, тогда матрица \( AP \) является вариантом матрицы \( A \) с переставленными столбцами, а \( PA \) — вариантом матрицы \( A \) с переставленными строками.

Перестановочные матрицы ортогональны, и поэтому если \( P \) — перестановочная матрица, то \( P^ <-1>= P^T \).

В этом разделе особый интерес представляют взаимные перестановки. Такие перестановки осуществляют матрицы, получаемые простой переменой мест двух строк единичной матрицы, например $$ E = \begin 0 & 0 & 0 & 1\\ 0 & 1 & 0 & 0\\ 0 & 0 & 1 & 0\\ 1 & 0 & 0 & 0 \end. $$

Взаимные перестановки могут использоваться для описания перестановок строк и столбцов матрицы. В приведенном примере порядка \( 4 \times 4 \) матрица \( EA \) отличается от матрицы \( A \) перестановкой \( 1 \)-й и \( 4 \)-й строк. Аналогично матрица \( AE \) отличается от матрицы \( A \) перестановкой \( 1 \)-го и \( 4 \)-го столбцов.

Если \( P = E_n E_ \cdots E_1 \) и каждая матрица \( E_k \) является единичной с переставленными \( k \)-й и \( p_k \)-й строками, то вектор \( p = [p_1, p_2, \ldots, p_n] \) содержит всю необходимую информацию о матрице \( P \). Действительно, вектор \( x \) может быть замещен на вектор \( Px \) следующим образом: $$ \begin \mathbf\ & k = 1:n\\ & x_k \leftrightarrow x_ \end $$ Здесь символ \( \leftrightarrow \) обозначает «выполнение перестановки»: $$ x_k \leftrightarrow x_\ \Leftrightarrow \ r = x_k, \ x_k = x_, \ x_ = r. $$

Поскольку каждая матрица \( E_k \) является симметричной и \( P^T = E_1 E_2 \cdots E_n \), то также можно выполнить замещение вектора \( x \) на вектор \( P^Tx \): $$ \begin \mathbf\ & k = n:1:-1\\ & x_k \leftrightarrow x_ \end $$

Существуют разные стратегии выбора ведущего элемента. Мы остановимся на стратегии частичного выбора. Пусть матрица $$ A = \begin 3 & 17 & 10 \\ 2 & 4 & -2 \\ 6 & 18 & -12 \end. $$ Чтобы добиться наименьших множителей в первой матрице разложения по Гауссу с помощью взаимных перестановок строк, надо сделать элемент \( a_ <11>\) наибольшим в первом столбце. Если \( E_1 \) — матрица взаимных перестановок, тогда $$ E_1 = \begin 0 & 0 & 1 \\ 0 & 1 & 0 \\ 1 & 0 & 0 \end. $$

Поэтому $$ E_1A = \begin 6 & 18 & -12 \\ 2 & 4 & -2 \\ 3 & 17 & 10 \end $$ и $$ M_1 = \begin 1 & 0 & 0 \\ -1/3 & 1 & 0 \\ -1/2 & 0 & 1 \end \Rightarrow M_1E_1A = \begin 6 & 18 & -12 \\ 0 & -2 & 2 \\ 0 & 8 & 16 \end. $$

Теперь, чтобы получить наименьший множитель в матрице \( M_2 \), необходимо переставить \( 2 \)-ю и \( 3 \)-ю строки и т.д.

Пример иллюстрирует общую идею, основанную на перестановке строк. Обобщая эту идею, получим следующий алгоритм:

\( LU \)-разложение с частичным выбором

Если матрица \( E \in \mathbb^ \), то данный алгоритм вычисляет матрицы преобразования Гаусса \( M_1, M_2 \ldots, M_ \) и матрицы взаимных перестановок \( E_1, E_2, \ldots, E_ \), такие что матрица \( M_E_ \cdots M_1E_1A = U \) является верхней треугольной. При этом нет множителей, превосходящих \( 1 \) по абсолютной величине. Подматрица \( [a_]_^k \) замещается на матрицу \( [u_]_^k \), \( k = 1, 2, \ldots, n \). Подматрица \( [a_]_^n \) замещается на матрицу \( [m_]_^ \), \( k = 1, 2, \ldots , n-1 \). Целочисленный вектор \( piv \) размера \( n-1 \) задает взаимные перестановки. В частности, матрица \( E_k \) переставляет строки \( k \) и \( piv_k \), \( k = 1, 2, \ldots, n-1 \).

for \( k = 1:n \)

  1. Зададим \( \mu \), такое что \( k \leq \mu \leq n \) и \( |a_<\mu k>| = \max_|a_| \)
  2. \( a_ \leftrightarrow a_ <\mu,k:n>\); \( piv_k = \mu \)

if \( a_ \ne 0 \)

Чтобы решить линейную систему \( Ax = b \) после вызова последнего алгоритма, мы должны

1. Вычислить вектор \( y = M_E_ \cdots M_1E_1 b \). 2. Решить верхнюю треугольную систему \( Ux = y \).

Системы линейных уравнений в математике с примерами решения и образцами выполнения

Уравнения первой степени с двумя и тремя неизвестными изучают в восьмилетней школе. Как показано в курсе геометрии, уравнение первой степени с двумя переменными Ах + Ву = С задает прямую линию. Поэтому принято называть уравнение первой степени линейным. Например, линейное уравне­ние относительно неизвестных х, у, z, . . . , и может быть сведено к виду

Числа А, В, С . . . , D называют коэффициентами при неизвестных, а Е — свободным членом уравнения.

Мы рассмотрим системы линейных уравнений со многими неизвестными. Для таких систем становится неудобным обозначать неизвестные через х, у, z, . . . , u. Значительно удобнее перенумеровать неизвестные и обозначить их Ко­эффициенты при неизвестных тоже неудобно обозначить различ­ными буквами А, В, С, . . . , D. Обычно их обозначают одной бук­вой с двумя номерами (индексами). Первый номер обозначает но­мер уравнения, а второй — номер неизвестного. Например, — это коэффициент при в третьем уравнении. Вообще — коэф­фициент при в i -м уравнении. Свободные члены мы будем обо­значать через

В восьмилетней школе мы рассматривали лишь системы уравнений, для которых число уравнений равнялось числу неизвест­ных. Сейчас мы будем изучать системы, состоящие из m линейных уравнений с n неизвестными. Такие системы записываются сле­дующим образом:

Например, для системы

имеем

Нашей задачей является найти все решения системы линейных уравнений (2) или показать, что эта система не имеет решений, что она несовместна. Мы покажем ниже, что возможны три случая: а) система (2) несовместна, б) система (2) имеет единственное решение, в) система (2) имеет бесконечное множество решений.

Теоремы о равносильности систем линейных уравнений

Пусть дана система линейных уравнений:

Умножим i-е уравнение этой системы на любое число и прибавим к j-му уравнению той же системы. Мы получим новое линей­ное уравнение:

Из следствия к теореме 4 п. 7 вытекает, что если заменить j-е уравнение системы (1) уравнением (2), то получится система уравнений, равносильная данной.

Повторно применяя это утверждение, приходим к следующей теореме.

Теорема:

Если к любому уравнению системы (1) прибавить сумму остальных уравнений, взятых с любыми коэффициентами, то получится система линейных уравнений, равносильная исходной.

Отметим еще следующие простые теоремы.

Теорема:

Если среди уравнений системы есть уравнение вида

то после отбрасывания этого уравнения получается система, равносильная исходной.

Эта теорема вытекает из того, что любой набор чисел удовлетворяет уравнению (3).

Теорема:

Если среди уравнений системы есть уравнение вида

где то система несовместна.

Эта теорема вытекает из того, что ни один набор чисел не удовлетворяет уравнению (4).

Пример решения системы линейных уравнений методом Гаусса

В восьмилетней школе системы линейных уравнений (с двумя или тремя неизвестными) решаются или методом подстановки, или ме­тодом алгебраического сложения. Сейчас мы изложим метод Гаус­са, очень близкий к методу алгебраического сложения, но отличаю­щийся от него большей систематичностью. Покажем сначала этот метод на следующем примере.

Пусть надо решить систему уравнений:

Умножим первое уравнение системы на —2 и прибавим его ко вто­рому, потом умножим первое уравнение на —5 и прибавим к тре­тьему, наконец, умножим первое уравнение на —1 и прибавим к четвертому. Система уравнений примет вид:

Мы видим, что в результате преобразований неизвестное осталось лишь в первом уравнении.

Теперь преобразуем тем же путем три последних уравнения. Умножим второе уравнение на —2 и прибавим к третьему, а по­ том умножим второе уравнение на —1 и прибавим к четвертому.

Наконец, умножим третье уравнение на — 1 и прибавим к четвертому. В результате получаем систему:

Системы такого вида называют треугольными.

Из теоремы 5 вытекает, что треугольная система (4) равносиль­на. исходной системе (1). Треугольную систему уравнений легко решить. Из последнего уравнения находим, что Подставляя это значение в третье уравнение, получаем откуда Далее, подставим во второе урав­нение. Мы найдем, что Наконец, из первого уравнения вы­текает, что Итак, заданная система имеет единственное решение

Метод Гаусса (приведение системы к обобщенно-треугольному виду).

Рассмотрим теперь решение методом Гаусса систем линейных уравнений общего вида. Пусть задана система уравнений:

Если то умножим первое уравнение на — и прибавим ко второму, потом умножим его на — и прибавим к третьему, . . . умножим на — и прибавим к m- му. Получится система вида:

Здесь для краткости введены следующие обозначения:

Таким образом, если то удается исключить из всех уравнений системы, начиная со второго. Если же то воз­можны различные случаи, в зависимости от того, какой вид имеет первое уравнение системы. Эти случаи таковы:

а) Все коэффициенты и свободный член первого уравнения равны нулю: В этом случае первое уравнение системы имеет вид:

В силу теоремы 6, п. 2, мы можем его отбросить, не меняя множества решений системы (1).

б) Все коэффициенты равны нулю, а отлично от нуля: Тогда первое уравнение нашей системы имеет вид:

и по теореме 7, п. 2, система несовместна.

в) но среди коэффициентов есть отлич­ные от нуля, скажем Тогда надо поменять номера у не­известных то есть ввести новые неизвестные та­кие, что Разумеется, при этом мы уже получим систему, неравносильную заданной (например, системы

неравносильны). Но переход от одной системы уравнений к другой сводится к перестановке неизвестных. После изменения номеров у неизвестных место коэффициента займет коэффициент отличный от нуля, и мы сможем исключить из всех урав­нений, начиная со второго, неизвестное (то есть ). Таким об­разом, если то либо система несовместна, либо первое урав­нение можно отбросить, либо, наконец, можно переставить неиз­вестные и исключить вместо другое неизвестное .

Вернемся теперь к системе уравнений (2). Если то мы можем повторить описанный процесс и исключить из третьего, четвертого, . . . , m-го уравнений. Потом мы исключим неизвестное из четвертого и дальнейших уравнений и т. д. На каждом шагу мы будем получать системы уравнений, равносильные заданной. При этом возможны следующие случаи:

а) В ходе решения мы получаем уравнение вида

где Тогда система не имеет решений, она несовместна.

б) При решении системы уравнений вида (3) не получается. Тогда через конечное число шагов (не более чем через т — 1 шаг) мы получим систему вида:

где диагональные коэффициенты , отличны от нуля (напомним, что мы отбрасывали уравнения вида и в случае необходимости меняли номера неизвест­ных).

Систему уравнений (4) мы будем называть обобщенно-треугольной системой уравнений. Таким образом, метод Гаусса позволяет либо установить, что данная система линейных уравнений несов­местна, либо заменить ее равносильной обобщенно-треугольной системой.

Назовем число r уравнений в системе (4) рангом заданной системы уравнений. На первый взгляд может показаться, что ранг заданной системы зависит не только от этой системы, но и от того, каким путем ее приводили к обобщенно-треугольной форме (в ка­ком порядке записывали уравнения, как нумеровали неизвестные и т. д.). Оказывается, это не так: при любом способе приведения за­ данной системы линейных уравнений к равносильной ей обобщен­но-треугольной системе уравнений получается система, состоящая из одного и того же числа уравнений. Доказательство этого утверж­дения довольно сложно, и мы его опускаем. Отметим, что ранг r системы не больше числа m уравнений этой системы.

Решение обобщенно-треугольной системы линейных уравне­ний

Покажем теперь, что любая обобщенно-треугольная система уравнений совместна, и выясним, когда она имеет единственное решение. Сначала разберем случай, когда ранг системы r равен числу неизвестных n, r =n. Тогда система (4), п. 4, имеет вид:

то есть является треугольной. При этом Треугольная система уравнений решается очень просто. Из последнего уравнения системы находим, что . Подставим это значение в предпоследнее уравнение. Мы получим, что

После этого последовательно определяем и т.д. вплоть до которое находим из первого уравнения. Мы видим, что тре­угольная система имеет единственное решение. Следовательно, при r = n заданная система уравнений имеет единственное решение. Пусть теперь r

Перенесем слагаемые, содержащие неизвестные в правую часть уравнений. Система примет вид:

Эта система имеет бесконечное множество решений. В самом деле, дадим неизвестным любые значения Тогда мы получим для отыскания остальных неизвест­ных треугольную систему уравнений:

Решая ее, получим искомые значения для Так как зна­чения неизвестных произвольны, то число решений бесконечно.

Например, решим систему уравнений:

Она приводится к обобщенно-треугольной системе:

Значит, ее ранг равен двум. Перенося слагаемые, содержащие в первую часть, получаем треугольную систему относительно

Из этой системы находим:

Любое решение уравнения (5) получится, если придать некоторые значения неизвестным и вычислить по формулам (6).

Подведем итоги исследования:

Всякая система линейных уравнений либо не имеет решений (несовместна), либо имеет единственное решение, либо бесконечное множество решений.

Первый случай будет, если при решении системы методом Га­усса мы придем к уравнению вида

где . Второй случай имеет место, если она совместна и ранг системы (число уравнений в обобщенно-треугольной форме) равен числу неизвестных. Третий случай имеет место, если система сов­местна и ее ранг меньше числа неизвестных.

6. Системы однородных линейных уравнений. Линейное уравнение, свободный член которого равен нулю, называется однородным. Оно имеет вид

Мы рассмотрим сейчас систему таких уравнений:

Система однородных линейных уравнений заведомо разрешима, посколь­ку ей удовлетворяет решение Это решение мы будем на­зывать нулевым. Однако чаще всего нас интересуют именно ненулевые ре­шения системы однородных линейных уравнений.

Если ранг системы однородных линейных уравнений равен числу неиз­вестных, r = n, то, как мы знаем, система имеет единственное решение. Так как одно решение, а именно нулевое, мы уже знаем, то ненулевых решений система не имеет. Если же ранг системы меньше числа неизвестных, то си­стема имеет бесконечное множество решений. Поэтому у нее, кроме нулевого будут и ненулевые решения. Мы доказали, таким образом, следующую те­орему.

Теорема:

Для того чтобы система однородных линейных уравнений имела ненулевое решение, необходимо и достаточно, чтобы ранг r этой системы был меньше числа неизвестных n.

Так как ранг системы заведомо меньше числа уравнений исходной си­стемы, то отсюда получаем

Следствие:

Для того чтобы система m однородных линейных уравнений с n неизвестными имела ненулевое решение, достаточно, чтобы число уравне­ний было меньше числа неизвестных, m

Применяя метод Гаусса, приходим к системе уравнений:

Ее можно записать так:

Отсюда находим, что При любом значении получаем решение системы (*). Отметим, что полученное решение можно представить в следующем виде:

Симметрические многочлены и их приложения к решению систем уравнений

Симметрические многочлены от двух переменных: При решении многих задач геометрии весьма полезным оказывается исполь­зование симметрии и ее свойств. В алгебре также существенную по­мощь в решении задач оказывает учет симметричности тех или иных алгебраических выражений. Разумеется, понятия симметрии в гео­метрии и в алгебре имеют различный смысл. В алгебре оно означает, что данное выражение не меняется при перестановке входящих в него букв. Например, выражение симметрично относитель­но x и у, но не симметрично относительно x и z. Если переставить х и у то получится выражение, отличающееся от заданного лишь по­рядком сомножителей, а если переставить х и г, получаем совсем иное выражение

Мы изучим сейчас симметрические многочлены от двух переменных, то есть такие многочлены f(х, у), что f(х, у) = f(у, x).

Например, многочлен симметричен. Многочлен же не является симметрическим. Если заменить в нем х на у, а у на х, то получится многочлен который не совпадает с первоначальным.

Простейшими симметрическими многочленами от двух переменных х и у являются сумма и произведение этих переменных, то есть х+у и ху. Введем для этих многочленов специальные обо­ значения:

Симметрическими являются многочлены вида Их называют степенными суммами. Принято обозначать многочлен через Таким образом,

Выражение степенных сумм через

Рассмотрим первые три степенные суммы Легко видеть, что их можно выразить через многочлены

Докажем, что это утверждение верно для любых степенных сумм.

Теорема:

Любая степенная сумма может быть представ­лена в виде многочлена от переменных

Иными словами, для любого n существует такой многочлен чтo после подстановки, в него и упрощения он превращается в

Доказательство:

Применим для доказательства метод математической индукции. При n = 1 наше утверждение справедливо, поскольку Таким образом, Предположим теперь, что утверждение доказано для степен­ных сумм Пусть для любой такой суммы най­ден многочлен обладающий тем свой­ством, что Заметим теперь, что

Это равенство можно записать так:

то получаем, что

Мы предположили, что — многочлены от Подставим выражения этих многочленов в полученное равенство, раскроем скобки, приведем подобные члены и сгруппи­руем их в порядке убывания степеней В результате мы получим выражение для в виде многочлена от

Итак, доказываемое утверждение верно при n = 1 и из его справедливости при следует справедливость для n. Зна­чит, оно верно для всех n.

Примеры:

1) Выразим через степенные суммы По формуле (1) имеем

Точно так же находим:

Основная теорема о симметрических многочленах от двух переменных

Теорема 1, п. 7, является частным случаем следующего общего утверждения.

Теорема:

Для любого симметрического многочлена F(х, у) существует такой (вообще говоря, несимметрический) многочлен что F (х, у) =f(х +у, ху).

Доказательство. Пусть F(х, у) — симметрический многочлен. Возьмем какой-нибудь из его членов Если k =l, то этот член имеет вид и может быть записан так:

Если же скажем k > l, то наряду со слагаемым в F(х, у) входит и симметрическое с ним слагаемое Но сум­му можно записать так:

Мы уже умеем выражать через Следовательно, и сумма выражается через Так как это рассуждение применимо к любому слагаемому то и весь многочлен F (х, у) можно выразить через и ст2.

Пример:

Выразить через симметрический многочлен

Применяя формулу для получаем, что

Системы симметрических алгебраических уравнений

Мы уже говорили, что иногда удается упростить решение системы алгебраических уравнений, удачно введя новые неизвестные. Этот путь решения приводит к успеху, если заданная система уравнений симметрична, то есть имеет вид:

где Р(х, у) и Q (х, у) — симметрические многочлены от х и у.

Простейшей системой такого вида является:

Будем рассматривать числа х и у как корни некоторого квадратного уравнения. Тогда по теореме Виета коэффициент при пер­вой степени неизвестного в этом уравнении равен —а, а свободный член равен b. Иными словами, квадратное уравнение с корнями х и у имеет вид:

Пусть корни этого уравнения Тогда либо либо

Рассмотрим теперь более сложную систему:

Так как левые части обоих уравнений симметрично зависят от х и у, то введем вместо х и у новые неизвестные

Выразим через эти неизвестные левые части уравнений (3). Мы получим:

Таким образом, заданная система свелась к следующей:

Сложив эти уравнения, получим квадратное уравнение относительно

Из него следует, что Так как то

Поскольку то наша система свелась к сово­купности двух систем

Решая первую систему, находим два решения:

Вторая система действительных решений не имеет. Точно так же решается система уравнений:

то данную систему можно записать в виде:

Подставляя во второе уравнение значение о 4 = 5, получаем квадратное уравнение:

Из него находим, что Тем самым заданная система свелась к системам:

Решая первую систему, получаем:

Вторая же система не имеет действительных решений.

Выгода введения неизвестных состоит в том, что при такой замене понижается степень уравнения, по­скольку имеет вторую степень относительно х и у. Напри­мер, во втором разобранном примере система пятой степени свелась к квадратному уравнению.

Применение симметрических многочленов к решению иррациональных уравнений

Решение некоторых иррациональных урав­нений можно свести к решению систем симметрических алгебра­ических уравнений. Рассмотрим иррациональное уравнение

Здесь выгодно ввести два вспомогательных неизвестных, положив

Тогда заданное уравнение примет вид: u + v = 5. Кроме того, имеем: Таким образом, мы получили следующую систему уравнений относительно u и v:

Введем новые неизвестные:

Так как , то мы получим новую систему уравнений:

Подставим во второе уравнение значение Получим квадратное уравнение относительно

Решая его, находим Таким образом, задача свелась к решению двух систем уравнений:

Первая из этих систем имеет два решения: Так как то для первоначального уравнения нахо­дим два значения корней:

Вторая система не имеет действительных корней.

Итак, заданное уравнение имеет лишь два корня: и

Дополнение к решению систем линейных уравнений

Системы линейных уравнений — решение заданий и задач по всем темам с вычислением

Метод Жордана-Гаусса

1°. Система из то линейных уравнений с п неизвестными в общем случае записывается так:

Коэффициенты , и свободные члены , — заданные действительные числа. Первый индекс i в записи обозначает номер уравнения, второй — j — номер неизвестной.

Решить систему (1) — значит найти все ее решения, т.е. все такие наборы чисел , которые при подстановке во все уравнения системы превращают их в верные равенства, или доказать, что решений нет.

Система (1) называется:

совместной, если она имеет хотя бы одно решение;

определенно совместной, если она имеет только одно решение;

неопределенно совместной, если она имеет более одного решения;

несовместной, если она не имеет ни одного решения.

2°. Две системы называются равносильными, если они имеют одинаковые решения или обе несовместны.

Переход от одной системы к равносильной осуществляется при помощи множества элементарных преобразований:

умножение обеих частей любого уравнения на отличное от нуля число;

прибавление к одному из уравнений произвольного другого, умноженного на любое число;

удаление (вычеркивание) из системы тривиального уравнения

— если в системе имеются два или более уравнений с пропорциональными коэффициентами, то сохранить нужно только одно из них.

Уравнение не имеет решений. Оно называется противоречивым. Система, содержащая такое уравнение, сама противоречива, т.е. несовместна.

3°. Один шаг метода Жордана-Гаусса состоит в приведении системы (1) к виду

в котором одна неизвестная сохранена с коэффициентом 1 только в p-м уравнении, а из остальных исключена. Систему (2) назовем разрешенной относительно неизвестной , поскольку ее легко выразить через остальные неизвестные данной системы.

Для того, чтобы получить систему (2), требуется следующее:

1) коэффициент при в уравнении с номером р должен быть отличен от нуля; в дальнейшем назовем ведущим, или разрешающим коэффициентом, а р-е уравнение — ведущим уравнением;

2) р-е уравнение надо разделить на ;

3) для получения нулевых коэффициентов при в остальных уравнениях следует из i-го уравнения вычесть ведущее уравнение, сначала разделенное на , а затем домноженное на .

Тогда все остальные коэффициенты и преобразуются по формулам

Эти формулы будем называть формулами Жордана-Гаусса. Расчет по ним удобно выполнять, пользуясь мнемоническим правилом прямоугольника, наглядно показанным на следующих диаграммах:

Смысл диаграмм следующий: новый коэффициент (или ) получается из старого вычитанием из него произведения соседних (по прямоугольнику) коэффициентов, деленного на противолежащий (разрешающий) коэффициент .

4°. На втором шаге сохраним с коэффициентом 1 другую неизвестную в другом уравнении, исключая из остальных.

Через шагов систему (1) можно привести к системе, состоящей из уравнений (остальные тривиальных уравнений, если такие были, отброшены) и содержащей разрешенных неизвестных. Эти неизвестных назовем базисными (используя векторную терминологию, которая появится позже), остальные — свободными, или независимыми. Основная часть метода Жордана-Гаусса завершена.

Если , то система разрешена относительно всех неизвестных, т. е. однозначно совместна.

Если , то, выражая базисные (зависимые) неизвестные через свободные (независимые), получаем «общее» решение системы в соответствующем базисе, которое впоследствии следует параметризовать и из которого можно получать различные частные решения, в том числе базисное (так называется решение, соответствующее нулевому набору свободных неизвестных).

Заметим, что «общее» решение определяется неоднозначно, оно зависит от того, какие неизвестные являются свободными (независимыми, произвольными), а какие — зависимыми (базисными).

5°. Метод Жордана-Гаусса удобно реализовать в виде таблицы, которую назовем таблицей Гаусса. Каждый ее блок содержит результат одного преобразования или одну итерацию. Столбец блока таблицы, состоящий из нулей и одной единицы, будем называть единичным столбцом. Цель преобразований Жордана-Гаусса — получить единичных столбцов. Неизвестные, соответствующие единичным столбцам, являются базисными, остальные — свободными. Последний блок таблицы изображает систему, разрешенную относительно г базисных неизвестных.

Примеры с решениями

Пример:

Решить линейную систему

1. Выполним первую итерацию, т.е. получим первый единичный столбец, выбирая в качестве ведущего коэффициента (в таблице он обведен кружком). Для этого над строками таблицы (над уравнениями системы) выполним следующие действия (они обозначены справа от таблицы):

Решение:

Первый блок таблицы Гаусса данной системы имеет вид («св. ч.» означает «свободные члены» уравнений системы, вертикальная черта соответствует знакам равенства):

1) первую строку сохраняем (переписываем);

2) первую строку, умноженную на 2, прибавим 0 ко второй;

3) первую строку, умноженную на -2, прибавим к третьей;

4) первую строку прибавим к четвертой.

Получаем второй блок таблицы:

2. Приведем к единичному третий столбец, в нем уже имеется один нуль. Ведущий коэффициент обведен кружком. Далее:

1) вторую строку, умноженную на 3, прибавим к первой и запишем вместо первой строки;

2) перепишем вторую строку без изменения;

3) вторую строку, умноженную на —1, прибавим к третьей;

4) четвертую строку перепишем без изменения.

Эти действия выражаются числами и стрелками, показанными справа от второго блока таблицы. Третий блок таблицы имеет вид:

3. Следующая итерация заключается в получении третьего единичного столбца. Для этого примем в качестве ведущего коэффициента и выполним следующие действия: третью строку, умноженную на -5, —1, -2, прибавим к первой, второй и четвертой строкам соответственно. Третью строку переписываем без изменений. Получаем четвертый блок:

4. Наконец, последнюю итерацию выполним, выбирая в качестве ведущего коэффициента . Четвертую строку разделим на -3. Остальные действия очевидны. Получаем:

5. После четырех итераций получили таблицу, соответствующую системе, разрешенной относительно всех неизвестных :

Запишем это также в виде: X = (-2,2,-3,1). Система определенно совместна.

Примечание:

Подставьте эти значения неизвестных в данную систему и убедитесь, что получаются верные числовые равенства.

Пример:

Решить линейную систему

Решение:

Каждый раз в качестве ведущего будем принимать простейший коэффициент, т.е. либо 1, либо — 1. Подчеркнем, что цель преобразований заключается в получении нулей в ведущем столбце. Как получить нулевые коэффициенты в единичном столбце, видно из решения примера 1. Для этого ведущую строку надо умножить на надлежащие числа (иногда на 1 или -1) и прибавить к остальным строкам, не содержащим 0 в этом ведущем столбце. Поэтому ограничимся выделением в каждом блоке ведущего коэффициента, не комментируя сами преобразования и не указывая соответствующие числа со стрелками. Результаты вычислений поместим в единую таблицу Гаусса, которая имеет следующий вид:

Последние две строки удалены как нулевые (они соответствуют тривиальным уравнениям).

Из последнего блока таблицы получаем систему

выражающую «почти» общее решение исходной системы. Смысл слова «почти» заключается в неравноправном участии неизвестных.

Положим ( — произвольные постоянные или параметры).

представляет общее решение системы в параметрическом виде. Все неизвестные выражены (равноправно) через два параметра

Решения, получаемые из общего при фиксированных значениях параметров , называются частными.

Например, при получаем:, , ,

При получаем . Базисное решение соответствует нулевому набору свободных переменных: если то

Ответ запишем так:

Пример:

Решить систему уравнений

Решение:

Вместо таблицы Гаусса будем использовать другую, более компактную интерпретацию ее блоков. Вертикальная черта в блоках соответствует знакам равенства в уравнениях системы. Знак

(читается «тильда») между двумя соседними блоками означает, что системы, соответствующие этим блокам, равносильны. Имеем:

единичный столбец второго блока получен в результате умножения первой строки на —3, —3, -1, -4 и последующего прибавления ко второй, третьей, четвертой и пятой строкам соответственно; во втором блоке произвели почленное деление четвертой и пятой строк на 3 и —3, т. е. сокращение уравнений

Вторая и третья строки четвертого блока отброшены как пропорциональные пятой. Заметим, что выделение ведущего (разрешающего) элемента однозначно определяет действия по обнулению элементов ведущего столбца, поэтому мы отказались от применения чисел и стрелок, обозначающих действия над строками блока.

Последний блок изображает систему, состоящую из трех уравнений с четырьмя неизвестными Соответствующая система приведена к трем базисным неизвестным; разрешая ее относительно этих неизвестных, получаем

Положим затем . Тогда общее р базисное решения принимают вид соответственно:

Заметим, что переменную нельзя получить среди свободных (свободная переменная может принимать любые значения, тогда как ).

Пример:

Решить систему уравнений

Решение:

В предыдущих примерах преобразования Жордана-Гаусса свелись к действиям над уравнениями системы, или строками таблицы, потому что все ведущие коэффициенты были равны 1. Если же ведущие коэффициенты отличны от 1, то действия над строками могут вызывать затруднения, и в таких случаях следует пользоваться формулами преобразования Жордана-Гаусса, т.е. правилом прямоугольника.

С целью экономии места решение этой системы приведем также в блоковой записи:

(последняя строка пропорциональна первой, поэтому она удалена). Подчеркнем, что цель наших преобразований состоит в получении единичных столбцов.

Приведем примеры применения правила прямоугольника в третьем блоке. При этом одна из вершин каждого прямоугольника должна совпасть с ведущим элементом противоположная вершина — с элементом, подлежащим пересчету:

Из последнего блока получаем общее решение системы в базисе

При получаем частное решение Базисное решение имеет вид

Примечание:

Метод Гаусса (усеченный метод Жордана-Гаусса) допускает получение в очередном блоке таблицы Гаусса столбца, отличного от единичного, т.е. неизвестную не обязательно исключать из всех уравнений, кроме одного. В этом случае говорят о приведении системы уравнений к ступенчатому виду. Это важно в смысле экономии времени, когда коэффициенты системы «неудобные», особенно, если система окажется неразрешимой.

Пример:

Решить систему уравнений

Решение:

Нули в столбцах будем получать только под диагональю соответствующей матрицы.

Последняя строка выражает противоречивое уравнение — система несовместна.

Метод Крамера

1°. Если в системе (1) число уравнений равно числу неизвестных

и система имеет единственное решение, то оно может быть найдено при помощи формул Крамера

где — основной определитель системы (3), который символически записывается так:

а получаются из , если в нем заменить соответственно первый, второй, …, n-й столбец на столбец из свободных членов. называется определителем порядка n: он состоит из п строк и п столбцов.

Сначала рассмотрим определение и вычисление определителей различных порядков n.

2°. Если , то состоит из одного элемента (числа) (в этом случае вертикальные черточки означают «определитель», а не «модуль»). По определению

Если то

3°. Для указания способа вычисления определителя третьего и более высоких порядков (см. (5)) введем необходимые понятия минора и алгебраического дополнения.

Минором элемента определителя (5) называется определитель порядка (n — 1), получаемый из (5) вычеркиванием строки с номером i и столбца с номером j.

Величина и называется алгебраическим дополнением элемента .

Например, для определителя третьего порядка

4°. Способ вычисления определителя порядка п выражается следующей теоремой о разложении определителя по строке или столбцу (под линией понимается строка или столбец).

Теорема:

Определитель порядка равен сумме произведений элементов какой-либо линии на их алгебраические дополнения.

Теорема:

Сумма произведений элементов какой-либо линии на алгебраические дополнения другой параллельной линии равна нулю.
Например, для определителя из п. 3° по первой строке. Получаем
воспользуемся разложением

5°. С теоретической точки зрения при вычислении определителя безразлично, какую строку или какой столбец взять для разложения. С практической точки зрения лучше брать ту линию, которая содержит нулевые элементы, и чем их больше, тем лучше.

Например, для вычисления определителя четвертого порядка

лучше брать сначала разложение по третьему столбцу:

Этот определитель третьего порядка разложим по первому столбцу:

6°. При вычислении определителей порядка могут оказаться полезными следующие их свойства.

1) При транспонировании (так называется действие замены строк столбцами и столбцов строками с сохранением их порядка) значение определителя не изменяется. Таким образом, строки и столбцы определителя равноправны.

2) Если определитель содержит нулевую линию (т. е. состоящую из одних нулей) или две параллельные пропорциональные линии, то его значение равно 0.

3) При умножении любой линии на произвольное число значение определителя умножается на это число. Иными словами, общий множитель элементов некоторой линии можно вывести за знак определителя.

4) При перестановке двух параллельных линий значение определителя изменяется на противоположное (определитель меняет знак).

5) Значение определителя не изменится, если к элементам произвольной линии прибавить соответственные элементы любой другой параллельной линии, умноженные на одно и то же число.

7°. Теорема 3 (Крамера). 1) Если для квадратной системы (3) то она имеет единственное решение, которое определяется по формулам (4).

2) Если и хотя бы один из определителей то система несовместна.

3) Если то система (3) неопределенно совместна.

Примечание. В случае 3) решить систему можно методом Жор-дана-Гаусса. Вместе с тем ее можно решить также методом определителей. Только формулы Крамера применимы не к системе (3), а к модифицированной системе (см. пример 4 ниже).

8°. Определители третьего порядка встречаются чаще. Поэтому для них (и только) покажем два простых правила вычисления.

а) Правило параллельных линий заключается в следующем. К исходному определителю приписываем два первых столбца и составляем две группы произведений, как указано на диаграмме:

б) Правило Саррюса (треугольников) заключается в том, что множители произведений, составляющих суммы А и В, образуют фигуры, показанные на следующей диаграмме:

(показана только фигура А)

Примеры с решениями

Пример:

Решить систему уравнений

Решение:

По формулам Крамера: или

Пример:

Решение:

Следовательно, или

Пример:

Решение:

Вычисление следующих определителей основано на свойствах 2) и 5) из п. 6°. Имеем

Стрелка с числом обозначает умножение соответствующей строки на это число и прибавление результата к указанной стрелкой строке. Далее:

Пример:

Решение:

Имеем (предлагаем самостоятельно убедиться в этом):

Система неопределенно совместна. Покажем, как обойтись формулами Крамера в этом случае.

Если первое уравнение прибавим ко второму, то получаем систему

Не прибегая к методу Жордана-Гаусса, перепишем систему так (это будет модифицированная система):

Следовательно, Система имеет беско нечное множество решений.

Общее решение имеет вид или

Пример:

Решение:

Теорема Крамера непосредственно к этой системе не применима, так как система не квадратная. Тем не менее систему можно решить относительно трех каких-либо неизвестных, если соответствующий определитель отличен от нуля. Перепишем систему в виде

Основной определитель

Вторая (модифицированная) система может быть решена по формулам Крамера, если принять в качестве свободных членов выражения, стоящие в правых частях уравнений (они содержат свободные неизвестные, что и оправдывает их название). Рекомендуем проверить равенства:

(перепишите общее решение в параметрической форме);

Метод обратной матрицы

1°. Матрицей размерности называется таблица, состоящая из чисел или выражений, называемых элементами и расположенных в m строках и n столбцах:

Можно обозначать или просто .

Две матрицы называются равными, если они имеют одинаковые размерности и элементы, стоящие на одинаковых местах (i,j), равны.

Матрица называется нулевой, если все ее элементы равны нулю:

Если число строк m матрицы (6) равно числу столбцов n, то такая матрица называется квадратной.

Элементы квадратной матрицы (с одинаковыми строковыми и столбцовыми индексами) составляют главную диагональ. Другая диагональ матрицы называется побочной.

Квадратная матрица Е называется единичной, если все элементы ее главной диагонали равны 1, а все остальные — нулю:

Замена строк столбцами, а столбцов — строками (с сохранением их порядка) называется транспонированием матрицы.

2°. Для матриц определяются три действия: умножение матриц на число, сложение (вычитание) и умножение матриц.

1) Произведение матрицы А на число есть матрица , или , каждый элемент которой равен произведению соответствующего элемента матрицы A на число .

2) Суммой А + В (разностью А — В) матриц А и В одинаковой размерности называется матрица С, каждый элемент которой равен сумме (разности) соответствующих элементов Имеем А + В = В +А.

Например, (2 — 1 4) + (0 2 5) = (2 1 9);

3) Произведение АВ определяется не для произвольных матриц A и В. Оно имеет смысл только в том случае, когда число столбцов

А равно числу строк В. При этом есть матрица С, каждый элемент которой равен сумме последовательных произведений элементов i-й строки матрицы А на соответствующие элементы j-го столбца матрицы В:

А и число строк матрицы В).

сравнивая видим, что, вообще говоря, невыполнимо (число столбцов первой матрицы не равно числу строк второй);

— это «редкий случай», когда

—произведение двух ненулевых матриц может быть нулевой матрицей.

3°. Действия с матрицами обладают следующими свойствами:

2) АЕ = ЕА = А <А — квадратная матрица). Например,

если , то (указание:

3)

Например, в этом можно убедиться на следующих парах матриц:

5°. Квадратная матрица А называется невырожденной, если соответствующий определитель (называемый определителем матрицы и обозначаемый det А) отличен от нуля; если det А = 0, то А называется вырожденной матрицей.

Матрица, обозначаемая называется обратной для матрицы А, если

Теорема:

Если А — невырожденная квадратная матрица, то для нее существует обратная матрица, которая может быть определена по формуле

где алгебраическое дополнение элемента в det А .’

6°. Система из m линейных уравнений с n неизвестными может быть записана в матричной форме так (согласно определениям произведения матриц и равенства матриц):

Теорема:

Если (7) — квадратная система (т = п) и то ее решение может быть определено по формуле

7°. Обратную матрицу можно найти методом элементарных преобразований Жордана-Гаусса, а вычисления производить в таблице Гауcса. Блоки таблицы Гаусса делятся на две равные части. В левую часть блока заносятся элементы квадратной невырожденной матрицы А, для которой надо найти обратную матрицу . Правая часть блока заполняется элементами единичной матрицы той же размерности, что и А. Выполняя преобразования над строками блока с целью получения единичной матрицы в левой части таблицы, в правой ее части получаем искомую обратную матрицу.

Примеры с решениями

Пример:

Решить систему

Решение:

Получили или

Пример:

Решение:

Следовательно, А — невырожденная матрица, поэтому она обладает обратной матрицей .

Вычислим 9 алгебраических дополнений:

Согласно теореме 1

Настоятельно рекомендуем проверить равенства

Таким образом, по теореме 5, имея в виду обозначения (8), получаем

Пример:

Найти , если

Решение:

В левую часть первого блока таблицы Гаусса заносим элементы матрицы А. В правую часть блока записываем единичную матрицу третьего порядка. Переход от одного блока к следующему осуществляем при помощи формул Жордана-Гаусса. Ведущие коэффициенты обведены. Рабочая таблица имеет следующий вид:

Ранг матрицы. Исследование систем

1°. Обратимся к матрице (6) . В ней фиксируем некоторые строк и столбцов. Из элементов, стоящих на пересечениях этих строк и столбцов, можно составить минор (определитель) порядка. Он может равняться нулю или’ нет. Наибольший из порядков всевозможных отличных от нуля миноров , где = 1,2,… ,min(m, п), называется рангом матрицы А и обозначается rank А. Очевидно, что

2°. Простейший способ определения ранга матрицы состоит в приведении ее к ступенчатому виду или к единичным столбцам при помощи последовательности элементарных преобразований, к которым относятся:

— умножение строки на произвольное число, отличное от нуля;

— прибавление к некоторой строке любой другой строки, умноженной на любое число;

— вычеркивание нулевой строки.

Элементарным преобразованиям матрицы соответствуют элементарные преобразования системы уравнений.

Теорема:

Элементарные преобразования матрицы не меняют ее ранг.

Между рангом матрицы А и рангом системы уравнений есть связь, выражаемая следующей теоремой.

Теорема:

Ранг системы уравнений равен rank А.

4°. Иногда важно знать, совместна или нет система уравнений , не интересуясь самим решением этой системы.

Если к матрице А присоединим столбец В свободных членов системы, то получаем расширенную матрицу

Теорема:

Теорема Кронекера-Капелли. Для совместности системы. уравнений необходимо и достаточно, чтобы

4°. Однородной называется система уравнений

Эта система всегда имеет нулевое решение или Х° = (0,0…,0).

В связи с однородной системой возникает вопрос: при каких условиях она имеет нетривиальное (ненулевое) решение? Ответ выражается через соотношение m и n в терминах ранга матрицы А, составленной из коэффициентов системы при неизвестных.

Теорема:

Если то система (9) всегда имеет ненулевое решение.

Теорема:

Система (9) имеет ненулевое решение, если

Свойства множества ненулевых решений однородной системы выражаются теоремой.

Теорема:

1) Если — некоторое решение системы (9), то ( — произвольное действительное число) тоже является решением системы (9).

2) Если — два различных решения системы (9), то где — произвольные действительные числа, также являются решениями системы (9).

5°. Предположим, что однородную систему (9) можно разрешить относительно первых неизвестных ( — ранг системы (9)):

Неизвестные являются свободными, и они могут принимать произвольные действительные значения. Предположим, что набор принимает последовательно значения (1,0,0…..0), (0,1,0…..0), …, (0,0…..0,1). Этим наборам соответствуют частные решения .

Множество этих решений называется фундаментальной системой решений (9).

Теорема:

О структуре общего решения однородной системы. Общее решение однородной системы представляет собой линейную комбинацию решений фундаментальной системы

где — произвольные действительные постоянные.

Рассмотрим теперь неоднородную систему

Система (9) называется однородной системой, соответствующей неоднородной системе (10).

Теорема:

О структуре общего решения неоднородной системы. Общее решение неоднородной системы (10) равно сумме где — общее решение соответствующей однородной системы (9), а — некоторое частное решение системы (10)

Примеры с решениями

Пример:

Определить ее ранг.

Решение:

Миноры более высоких порядков составлять нельзя. Ответ: rank А = 3.

Пример:

Найти ранг матрицы

Решение:

После вычитания первой строки из всех остальных (из последней — с множителем 2) получаем эквивалентную матрицу

Поскольку три строки промежуточной матрицы были пропорциональны, то из них можно получить две нулевые строки, которые мы отбросили.

Ясно, что rank А = 2, ибо

Пример:

Выяснить, разрешима ли система

Решение:

Напишем расширенную матрицу и получим в ней как можно больше единичных столбцов. Каждый раз ведущий коэффициент обведем кружком:

На языке (в терминах) уравнений последней строке соответствует уравнение — это противоречивое уравнение. Однако нас интересует матричная терминология. Напомним, что А — основная матрица, она расположена левее вертикальной черты. Последняя ее строка нулевая, значит rank А не может быть больше, чем 3. А минор порядка 3, не равный нулю, существует:

В расширенной матрице последняя строка ненулевая. Найдем в ней минор , не равный нулю. Вот он:

(разложили по последней строке). Итак Система несовместна (теорема 6).

Пример:

Решение:

Решим сначала однородную систему

Вычтем из третьего уравнения сумму первых двух. Получим тривиальное уравнение, которое отбросим. Затем из второго уравнения вычтем первое. Получим равносильную систему

Свободным переменным дадим последовательно значения (1,0,0), (0,1,0), (0,0,1). Получим три частных решения Они составляют фундаментальную систему решений однородной системы. Общее решение однородной системы имеет вид

Для получения общего решения неоднородной системы нужно какое-то частное решение. Заметим, что удовлетворяет неоднородной системе (откуда взялось это решение; несущественно). Тогда

где — произвольные действительные постоянные (параметры).

Отсюда при различных значениях постоянных получаем различные частные решения исходной системы.

Системы линейных уравнений и их вычисление

Системой линейных алгебраических уравнений, содержащей m уравнений и п неизвестных, называется система вида

где числа называются коэффициентами системы, числа свободными членами. Подлежат нахождению числа .

Такую систему удобно записывать в компактной матричной форме

Здесь А — матрица коэффициентов системы, называемая основной матрицей:

Произведение матриц определено, так как в матрице А столбцов столько же, сколько строк в матрице X (п штук).

Расширенной матрицей системы называется матрица системы, дополненная столбцом свободных членов

Решением системы называется п значений неизвестных при подстановке которых все уравнения системы обращаются в верные равенства. Всякое решение системы можно записать в виде матрицы-столбца

Система уравнений называется совместной, если она имеет хотя бы одно решение, и несовместной, если она не имеет ни одного решения.

Совместная система называется определенной, если она имеет единственное решение, и неопределенной, если она имеет более одного решения. В последнем случае каждое ее решение называется частным решением системы. Совокупность всех частных решений называется общим решением.

Решить систему — это значит выяснить, совместна она или несовместна. Если система совместна, найти ее общее решение.

Две системы называются эквивалентными (равносильными), если они имеют одно и то же общее решение. Другими словами, системы эквивалентны, если каждое решение одной из них является решением другой, и наоборот.

Эквивалентные системы получаются, в частности, при элементарных преобразованиях системы при условии, что преобразования выполняются лишь над строками матрицы.

Система линейных уравнений называется однородной, если все свободные члены равны нулю:

Однородная система всегда совместна, так как является решением системы. Это решение называется нулевым или тривиальным.

Решение систем линейных уравнений. Теорема Кронекера-Капелли

Пусть дана произвольная система m линейных уравнений с п неизвестными

Исчерпывающий ответ на вопрос о совместности этой системы дает теорема Кронекера-Капелли.

Теорема:

Система линейных алгебраических уравнений совместна тогда и только тогда, когда ранг расширенной матрицы системы равен рангу основной матрицы.

Примем ее без доказательства. Правила практического разыскания всех решений совместной системы линейных уравнений вытекают из следующих теорем.

Теорема:

Если ранг совместной системы равен числу неизвестных, то система имеет единственное решение.

Теорема:

Если ранг совместной системы меньше числа неизвестных, то система имеет бесчисленное множество решений.

Правило решения произвольной системы линейных уравнений

  1. Найти ранги основной и расширенной матриц системы. Если то система несовместна.
  2. Если , система совместна. Найти какой-либо базисный минор порядка r (напоминание: минор, порядок которого определяет ранг матрицы, называется базисным). Взять r уравнений, из коэффициентов которых составлен базисный минор (остальные уравнения отбросить). Неизвестные, коэффициенты которых входят в базисный минор, называют главными и оставляют слева, а остальные пr неизвестных называют свободными и переносят в правые части уравнений.
  3. Найти выражения главных неизвестных через свободные. Получено общее решение системы.
  4. Придавая свободным неизвестным произвольные значения, получим соответствующие значения главных неизвестных. Таким образом можно найти частные решения исходной системы уравнений.

Пример:

Исследовать на совместность систему

Решение:

Таким образом, следовательно, система несовместна.

Пример:

Решение:

Берем два первых уравнения:

Следовательно, — общее решение. Положив, например, получаем одно из частных решений:

Решение невырожденных линейных систем. Формулы Крамера

Пусть дана система п линейных уравнений с п неизвестными

или в матричной форме

Основная матрица А такой системы квадратная. Определитель этой матрицы

называется определителем системы. Если определитель системы отличен от нуля, то система называется невырожденной.

Найдем решение данной системы уравнений в случае Умножив обе части уравнения слева на матрицу , получим . Поскольку , то

Отыскание решения системы по формуле (4.1) называют матричным способом решения системы.

Матричное равенство (4.1) запишем в виде

Отсюда следует, что

Но есть разложение определителя

по элементам первого столбца. Определитель получается из определителя путем замены первого столбца коэффициентов столбцом из свободных членов. Итак,

Аналогично: где получен из путем замены второго столбца коэффициентов столбцом из свободных членов;

называются формулами Крамера.

Итак, невырожденная система n линейных уравнений с n неизвестными имеет единственное решение, которое может быть найдено матричным способом (4.1) либо по формулам Крамера (4.2).

Пример:

Решение:

Значит,

Решение систем линейных уравнений методом Гаусса

Одним из наиболее универсальных и эффективных методов решений линейных алгебраических систем является метод Гаусса, состоящий в последовательном исключении неизвестных. Пусть дана система уравнений

Процесс решения по методу Гаусса состоит из двух этапов. На первом этапе (прямой ход) система приводится к ступенчатому (в частности, треугольному) виду.

Приведенная ниже система имеет ступенчатый вид

где Коэффициенты называются главными элементами системы.

На втором этапе (обратный ход) идет последовательное определение неизвестных из этой ступенчатой системы.

Опишем метод Гаусса подробнее. Прямой ход.

Будем считать, что элемент (если , то первым в системе запишем уравнение, в котором коэффициент при отличен от нуля).

Преобразуем систему (4.3), исключив неизвестное во всех уравнениях, кроме первого (используя элементарные преобразования системы). Для этого умножим обе части первого уравнения на и сложим почленно со вторым уравнением системы. Затем умножим обе части первого уравнения на и сложим с третьим уравнением системы. Продолжая этот процесс, получим эквивалентную систему

Здесь — новые значения коэффициентов и правых частей, которые получаются после первого шага.

Аналогичным образом, считая главным элементом , исключим неизвестное из всех уравнений системы, кроме первого и второго, и так далее. Продолжаем этот процесс, пока это возможно.

Если в процессе приведения системы (4.3) к ступенчатому виду появятся нулевые уравнения, т. е. равенства вида 0 = 0, их отбрасывают. Если же появится уравнение вида то это свидетельствует о несовместности системы.

Второй этап (обратный ход) заключается в решении ступенчатой системы. Ступенчатая система уравнений, вообще говоря, имеет бесчисленное множество решений. В последнем уравнении этой системы выражаем первое неизвестное через остальные неизвестные . Затем подставляем значение в предпоследнее уравнение системы и выражаем через затем находим Придавая свободным неизвестным произвольные значения, получим бесчисленное множество решений системы.

Замечанья: 1. Если ступенчатая система оказывается треугольной, т. е. , то исходная система имеет единственное решение. Из последнего уравнения находим , из предпоследнего уравнения далее поднимаясь по системе вверх, найдем все остальные неизвестные

На практике удобнее работать не с системой (4.3), а с расширенной ее матрицей, выполняя все элементарные преобразования над ее строками. Удобно, чтобы коэффициент был равен 1 (уравнения переставить местами, либо разделить обе части уравнения на ).

Пример:

Решить систему методом Гаусса:

Решение:

В результате элементарных преобразований над расширенной матрицей системы

исходная система свелась к ступенчатой:

Поэтому общее решение системы: Если положить, например, то найдем одно из частных решений этой системы

Пример:

Решить систему методом Гаусса:

Решение:

Произведем элементарные преобразования над строчками расширенной матрицы системы:

Полученная матрица соответствует системе

Осуществляя обратный ход, находим

Системы линейных однородных уравнений

Пусть дана система линейных однородных уравнений

Очевидно, что однородная система всегда совместна она имеет нулевое (тривиальное) решение

При каких условиях однородная система имеет и ненулевые решения?

Теорема:

Для того, чтобы система однородных уравнений имела ненулевые решения, необходимо и достаточно, чтобы ранг г ее основной матрицы был меньше числа п неизвестных, т. е. r

Теорема:

Для того, чтобы однородная система п линейных уравнений с п неизвестными имела ненулевые решения, необходимо и достаточно, чтобы ее определитель был равен нулю, т. е.

Если система имеет ненулевые решения, то Ибо при система имеет только единственное, нулевое решение. Если же , то ранг r основной матрицы системы меньше числа неизвестных, т. е. r

Решение:

Так как r

Положив получаем одно частное решение:

Положив получаем второе частное решение: и т. д.

Теория к системам линейных алгебраических уравнений

Пусть дано n неизвестных Система m линейных уравнений с n неизвестными имеет вид

здесь коэффициенты при неизвестных, причем i — номер уравнения, а j — номер неизвестного. Величины — свободные члены. В компактном виде систему можно записать так

или в матричной форме где

Матрица А называется основной (базовой) матрицей системы, X — Матрица-столбец неизвестных, В — матрица-столбец свободных членов. Если к основной матрице системы приписать столбец свободных членов, то получится расширенная матрица системы уравнений

Если все свободные члены равны нулю, то система называется однородной, в противном случае система неоднородна. Линейные системы, полученные одна из другой путем элементарных преобразований (перестановкой двух уравнений, умножением одного из них на число, не равное нулю, почленным сложением двух уравнения), называются эквивалентными (или равносильными). Все эквивалентные системы имеют одинаковые решения. Число линейно независимых уравнений в системе (2.34) называется рангом этой системы.

Система (2.34) называется совместной, если она имеет хотя бы одно решение, и несовместной, если у нее не существует ни одного решения. Линейная система (2.34) является совместной, если ранг расширенной матрицы системы был равен рангу ее основной матрицы, т. е.

Пример:

Определить совместимость системы:

Составим расширенную матрицу системы и проведем с ней ряд элементарных преобразований, не меняющих ранг матрицы

Первую строку оставим без изменения, а во второй и третьей строках с помощью элементарных преобразований (от второй строки отнимем первую, а к третьей прибавим первую строку) в первом столбце получим нули, т. е:

Вычитая из третьей строки вторую, получим

Следовательно, система несовместна. Совместная система называется определенной, если она имеет единственное решение, и неопределенной, если у нее существует по крайней мере два различных решения.

Для совместной системы линейных уравнений возможны следующие случаи.

1.Если то исходная система заведомо имеет линейно зависимых уравнений и их можно исключить из системы. Те уравнения, коэффициенты которых образуют минор порядка r, не равный нулю, являются линейно независимыми и называются базисными. После исключения лишних уравнений систему исследуют снова (см. пункт 2 и 3).

2.Если то система имеет единственное решение.

3.Если то система имеет бесчисленное множество решений.

Пример. Исследовать систему уравнений

Здесь Составим расширенную матрицу и упростим ее путем проведения элементарных преобразований (добавим ко второй строчке первую и вычтем из третьей первую и т. д.)

Система совместна, базисные уравнения -первое и второе. Третье уравнение является их линейной комбинацией и может быть отброшено. Эквивалентная система имеет вид

Решение этой системы:

Пример:

Построим расширенную матрицу

Система совместна, но т.к. то она имеет бесконечное число решений. Действительно, переписав исходную систему в виде

и положив получим решение системы

где k — произвольное число. Выбрав, например, получим такое решение если то и т. д.

Если число уравнений n равно числу неизвестных n, то система имеет вид

Если матрица А невырожденная то существует обратная матрица . Умножим равенство (2.40) на слева и выполним операции с матрицами. Получим,

Решение квадратной системы алгебраических уравнений в матричной форме сводится к построению обратной к А матрицы и последующему умножению ее справа на матрицу свободных членов:

Пример:

Решить систему алгебраических уравнений

Решение:

Вычислим определитель матрицы системы

Найдем алгебраические дополнения элементов матрицы А

Присоединенная матрица и обратная матрица соответственно равны

По формуле (2.37) получим решение системы

Всякая однородная система

совместна, так как всегда имеет хотя бы нулевое решение: Такое решение называется три-виальным. Однородная система имеет ненулевые решения, если ранг этой системы меньше числа неизвестных Любая однородная система, у которой число уравнений меньше числа неизвестных, имеет нетривиальное решение. Квадратная однородная система имеет ненулевое решение, если ее определитель равен нулю.

Пример:

Исследовать и найти решение системы

Решение:

В данном примере Возьмем, на-3 2 пример, минор Одна переменная — «лиш-няя». Так как в минор вошли коэффициенты при то вы-

бираем тогда Так как то за базисные переменные можно выбрать также и положив но нельзя выбрать так как

Решение заданий и задач по предметам:

Дополнительные лекции по высшей математике:

Образовательный сайт для студентов и школьников

Копирование материалов сайта возможно только с указанием активной ссылки «www.lfirmal.com» в качестве источника.

© Фирмаль Людмила Анатольевна — официальный сайт преподавателя математического факультета Дальневосточного государственного физико-технического института

Метод Гаусса для решения СЛАУ

В данной публикации мы рассмотрим, что такое метод Гаусса, зачем он нужен, и в чем заключается его принцип. Также мы на практическом примере продемонстрируем, как метод можно применить для решения системы линейных уравнений.

Описание метода Гаусса

Метод Гаусса – классический способ последовательного исключения переменных, применяемый для решения системы линейных уравнений. Назван так в честь немецкого математика Карла Фридриха Гаусса (1777 – 1885).

Но для начала напомним, что СЛАУ может:

  • иметь одно единственное решение;
  • иметь бесконечное множество решений;
  • быть несовместной, т.е. не иметь решений.

Практическая польза

Метод Гаусса – отличный способ решить СЛАУ, которая включает более трех линейных уравнений, а также систем, не являющихся квадратными.

Принцип метода Гаусса

Метод включает следующие этапы:

    прямой – расширенная матрица, соответствующая системе уравнений, путем элементарных преобразований над строками приводится к верхнему треугольному (ступенчатому) виду, т.е. под главной диагональю должны находиться только элементы, равные нулю.

Пример решения СЛАУ

Давайте решим систему линейных уравнение ниже, воспользовавшись методом Гаусса.

Решение

1. Для начала представим СЛАУ в виде расширенной матрицы.

2. Теперь наша задача – это обнулить все элементы под главной диагональю. Дальнейшие действия зависят от конкретной матрицы, ниже мы опишем те, что применимы к нашему случаю. Сначала поменяем строки местами, таким образом расположив их первые элементы в порядке возрастания.

3. Вычтем из второй строки удвоенную первую, а из третьей – утроенную первую.

4. Прибавим к третьей строке вторую.

5. Отнимем из первой строки вторую, и одновременно с этим действием разделим третью строку на -10.

6. Первый этап завершен. Теперь нам нужно получить нулевые элементы над главной диагональю. Для этого из первой строки вычтем третью, умноженную на 7, а ко второй прибавим третью, умноженную на 5.

7. Финальная расширенная матрица выглядит следующим образом:

8. Ей соответствует система уравнений:

Ответ: корни СЛАУ: x = 2, y = 3, z = 1.


источники:

http://lfirmal.com/reshenie-sistem-linejnyh-uravnenij/

http://microexcel.ru/metod-gaussa/