Корни характеристического полинома системы заданной уравнением

VMath

Инструменты сайта

Основное

Навигация

Информация

Действия

Содержание

Характеристический полином, собственные числа, собственные векторы матрицы

В настоящем разделе $ n_<> $ означает порядок квадратной матрицы $ A_<> $.

Характеристический полином

определяется для произвольной квадратной матрицы $ A_<> $ как 1) $ \det (A_<>-\lambda E) $, где $ E_<> $ – единичная матрица одинакового с $ A_<> $ порядка.

Пример. Для $ n=2_<> $:

Теорема 1.

Пример. Характеристический полином матрицы Фробениуса

$$ \mathfrak F= \left( \begin 0 & 1 & 0 & 0 & \dots & 0 & 0 \\ 0 & 0 & 1 & 0 & \dots & 0 & 0 \\ 0 & 0 & 0 & 1 & \dots & 0 & 0 \\ \vdots& &&&\ddots & & \vdots \\ 0 & 0 & 0 & 0 & \dots & 0 & 1 \\ a_n & a_ & a_ & & \dots & a_2 & a_1 \end \right)_ $$ равен $ (-1)^n(\lambda^n-a_1\lambda^-\dots-a_) $.

Характеристический полином линейного оператора

определяется как характеристический полином матрицы этого оператора в произвольном базисе линейного пространства, в котором этот оператор задан. Подробнее ☞ ЗДЕСЬ.

Характеристический полином линейного однородного разностного уравнения

$ n_<> $-го порядка $$ x_=a_1 x_+ \dots+ a_n x_K, \quad a_n \ne 0, $$ определяется как $$ \lambda^n — a_1 \lambda^ — \dots — a_n . $$ Подробнее ☞ ЗДЕСЬ.

Свойства

Теорема 2. Характеристический полином матрицы не меняется

1. при ее транспонировании: $$ \det (A-\lambda E) = \det (A^<\top>-\lambda E_<>) \, ;$$ 2. при переходе к подобной матрице: если $ B=C^<-1>AC^<> $ при произвольной неособенной матрице $ C_<> $, то $$ \det (A-\lambda E) \equiv \det (B-\lambda E_<>) \, . $$

Теорема 3. Пусть матрица $ A_<> $ имеет порядок $ m\times n_<> $, а $ B_<> $ — порядок $ n\times m_<> $. Тогда эти матрицы допускают умножение в любом порядке, т.е. определены $ AB_<> $ и $ BA_<> $ и оба произведения будут квадратными матрицами — порядков $ m_<> $ и $ n_<> $ соответственно. Тогда характеристические полиномы этих произведений различаются лишь на степень $ \lambda_<> $:

$$ \lambda^n \det (AB — \lambda E_)\equiv \lambda^m \det (BA — \lambda E_) \ . $$

Если матрицы $ A_<> $ и $ B_<> $ — квадратные одинакового порядка, то характеристические полиномы матриц $ AB_<> $ и $ BA_<> $ тождественны.

Теорема 4. Если характеристический полином матрицы $ A_<> $ равен

$$ f(\lambda)=(-1)^n \lambda^n+a_1\lambda^+\dots+a_\lambda+a_n $$ и $ a_ \ne 0 $, то характеристический полином матрицы $ A^<-1>_<> $ равен $$ f^<\ast>(\lambda)=\frac<(-\lambda)^n> f(1/\lambda) = \frac<(-1)^n> \left[ (-1)^n+a_1 \lambda + \dots+ a_\lambda^+a_n\lambda^ \right] \ . $$

Теорема Гамильтона-Кэли

Теорема 5. Результатом подстановки в характеристический полином $ \det (A_<>-\lambda E) $ самой матрицы $ A_<> $ будет нулевая матрица:

$$ \det (A-\lambda E)= (-1)^n \lambda^n +a_1 \lambda^+\dots+a_\lambda+ a_n \ \Rightarrow \ $$ $$ \ \Rightarrow \ (-1)^n A^n +a_1 A^+\dots+a_A+ a_n E = <\mathbb O>_ \ . $$

матрица является корнем своего характеристического полинома.

Доказательство ☞ ЗДЕСЬ.

Пример. Для $ n_<>=2 $:

$$ \left(\begin a_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right)^2 — (a_<11>+a_<22>)\left(\begin a_ <11>& a_ <12>\\ a_ <21>& a_ <22>\end \right) + (a_<11>a_<22>-a_<12>a_<21>) \left(\begin 1 & 0 \\ 0 & 1 \end \right) = \left(\begin 0 & 0 \\ 0 & 0 \end \right) \ . $$

Собственное число

определяется для квадратной матрицы $ A_<> $ как произвольный корень ее характеристического полинома $ \det (A_<>-\lambda E) $. Набор всех собственных чисел матрицы $ A_<> $ (с учетом их кратностей) называется спектром матрицы (таким образом спектр матрицы $ A_<> $ порядка $ n_<> $ всегда состоит из $ n_<> $ чисел, часть из которых могут быть одинаковыми). Максимальный из модулей собственных чисел матрицы $ A_<> $ называется ее спектральным радиусом, он иногда обозначается $ \rho(A) $.

Пример. Найти спектр матрицы

$$ A= \left(\begin 0&1&2&3\\ -1&0&4&7\\ -2&-4&0&2\\ -3&-7&-2&0 \end\right). $$ Решение. Характеристический полином $$ \det (A-\lambda E)=\left|\begin -\lambda&1&2&3\\ -1&-\lambda&4&7\\ -2&-4&-\lambda&2\\ -3&-7&-2&-\lambda \end\right|=\lambda^4+ 83\lambda^2 $$ имеет корни $ \lambda_1=0, \lambda_2 = <\mathbf i>\sqrt<83>, \lambda_3 = — <\mathbf i>\sqrt <83>$, причем $ \lambda_ <1>$ — второй кратности.

Ответ. Спектр матрицы $ A_<> $: $ \ <0,0, <\mathbf i>\sqrt<83>,- <\mathbf i>\sqrt <83>\> $. Спектральный радиус матрицы $ A_<> $: $ \rho(A)= \sqrt <83>$.

Теорема 6. Если $ \<\lambda_<1>,\lambda_<2>,\dots,\lambda_ \> $ — спектр матрицы $ A_<> $, то

$$ \lambda_1+\lambda_<2>+\dots+\lambda_n = \operatorname(A)=a_<11>+a_<22>+\dots+a_, $$ $$ \lambda_1\cdot\lambda_<2>\times \dots \times \lambda_n = (-1)^n\det (A) \ . $$

Доказательство следует из представления характеристического полинома через миноры матрицы и формул Виета. ♦

Для того, чтобы матрица $ A_<> $ была неособенной необходимо и достаточно, чтобы среди ее собственных чисел не было нулевого.

Теорема 7. Пусть $ g(x)=b_<0>x^m+\dots+b_m \in <\mathbb C>[x] $ — произвольный полином. Вычислим полином от матрицы $ A_<> $:

$$ g(A)=b_<0>A^m+\dots+b_m E \, . $$ Тогда если $ \<\lambda_<1>,\dots,\lambda_ \> $ — спектр матрицы $ A_<> $, то $ \),\dots,g(\lambda_n) \> $ — спектр матрицы $ g(A_<>) $.

Результат теоремы обобщается и на более широкий класс функций $ g_<>(x) $ — фактически на любую функцию, которая, вместе со своими производными, может быть определена на спектре матрицы $ A_<> $. В частности, если $ \det A_<> \ne 0 $, то спектр матрицы $ A^<-1>_<> $ совпадает с $ \<1/\lambda_j\>_^n $.

Имеет место следующее равенство, связывающее степени матрицы $ A_<> $ с суммами Ньютона ее характеристического полинома:

$$ \operatorname(A^k)=\lambda_1^k+\dots+\lambda_n^k \ . $$ Здесь $ \operatorname_<> $ обозначает след матрицы (т.е. сумму ее диагональных элементов). Утверждение остается справедливым и для отрицательных показателей $ k_<> $ при условии, что $ \det A_<> \ne 0 $.

Имеет место следующее равенство:

$$ \det g(A) = (-1)^ <\mathcal R>(f,g_<>) , $$ где $ <\mathcal R>(f,g_<>) $ означает результант полиномов $ f(x) =\det (A-x_<> E) $ и $ g_<>(x) $.

Теорема 8. Собственные числа вещественной симметричной матрицы $ A_<> $ все вещественны.

Доказательство ☞ ЗДЕСЬ.

Теорема 9. Собственные числа вещественной кососимметричной матрицы $ A_<> $ все мнимы, за исключением, возможно, $ \lambda_<> = 0 $.

Доказательство ☞ ЗДЕСЬ.

Теорема 10. Собственные числа вещественной ортогональной матрицы все равны $ 1_<> $ по абсолютной величине (модулю). Характеристический полином ортогональной матрицы является возвратным если $ +1 $ не является его корнем или является корнем четной кратности. Хотя бы одно собственное число ортогональной матрицы нечетного порядка равно $ +1 $ или $ (-1) $.

Доказательство ☞ ЗДЕСЬ.

Теорема 11. Спектр циклической матрицы

$$ \left(\begin a_1 & a_2 & a_3 & \dots & a_n \\ a_n & a_1 & a_2 & \dots & a_ \\ a_ & a_n & a_1 & \dots & a_ \\ \vdots & & & & \vdots \\ a_2 & a_3 & a_4 & \dots & a_1 \end \right) \ . $$ совпадает с набором чисел $$ \) \> ,$$ при $$ f(x)=a_<1>+a_2x+a_3x^2+\dots+a_nx^ $$ и $$ \varepsilon_k=\cos \frac<2\,\pi k> + <\mathbf i>\sin \frac<2\,\pi k> $$ — корне n-й степени из единицы.

Доказательство ☞ ЗДЕСЬ.

Локализация собственных чисел

Теорема 12. [1]. Собственные числа матрицы являются непрерывными функциями ее элементов. Иначе: пусть

$$A=\left[a_ \right]_^n \quad , \quad B=\left[b_ \right]_^n \ . $$ Обозначим $$M= \max_> \left\ <|a_|, |b_ | \right\> \quad , \quad \delta = \frac<1>\sum_^n |a_ — b_ | \ . $$ Тогда любому собственному числу $ \lambda_<\ast>^<> $ матрицы $ A_<> $ можно поставить в соответствие такое собственное число $ \mu_<\ast>^<> $ матрицы $ B_<> $, что $$ |\lambda_<\ast>-\mu_ <\ast>| \le (n+2) M \sqrt[n] <\delta>\ . $$

Собственно факт непрерывной зависимости собственных чисел от элементов матрицы следует из представления характеристического полинома из теоремы ☞ ПУНКТА — коэффициенты этого полинома полиномиально (и, следовательно, непрерывно) зависят от элементов матрицы. Далее используем теорему о непрерывной зависимости корней полинома от его коэффициентов.

Выясним теперь на примере, насколько малым может быть возмущение элементов матрицы чтобы сохранились хотя бы количество вещественных корней ее характеристического полинома.

Пример [Уилкинсон] [2]. Найти собственные числа матрицы

$$ A= \left( \begin 20 & 20 & & & & \\ & 19 & 20 & & & \\ & & 18 & 20 & & \\ & & & \ddots & \ddots & \\ & & & & 2 & 20 \\ <\color\varepsilon > & & & & & 1 \\ \end \right)_ <20\times 20>$$ при $ <\color\varepsilon >=10^ <-10>$ (все неуказанные элементы матрицы считаются равными нулю).

Решение. Характеристический полином $$ \det(A-\lambda E) = \prod_^ <20>(j-\lambda) — 20^ <19> <\color\varepsilon > = $$ $$ =\lambda^<20>—<\scriptstyle 210>\,\lambda^<19>+<\scriptstyle 20615>\,\lambda^<18>—<\scriptstyle 1256850>\, \lambda^ <17>+<\scriptstyle 53327946>\, \lambda^<16>—<\scriptstyle 1672280820>\, \lambda^<15>+ <\scriptstyle 40171771630>\, \lambda^<14>—<\scriptstyle 756111184500>\, \lambda^<13>+ $$ $$ +<\scriptstyle 11310276995381>\, \lambda^ <12>— <\scriptstyle 135585182899530>\, \lambda^ <11>+<\scriptstyle 1307535010540395>\, \lambda^<10>—<\scriptstyle 10142299865511450>\, \lambda^9 + $$ $$ +<\scriptstyle 63030812099294896>\, \lambda^8 — <\scriptstyle 311333643161390640>\, \lambda^7+<\scriptstyle 1206647803780373360>\, \lambda^6 —<\scriptstyle 3599979517947607200>\, \lambda^5 +<\scriptstyle 8037811822645051776>\, \lambda^4- $$ $$ —<\scriptstyle 12870931245150988800>\, \lambda^3 +<\scriptstyle 13803759753640704000>\, \lambda^2 —<\scriptstyle 8752948036761600000>\,\lambda + <\scriptstyle 2432377720176640000>$$ очень похож на полином из другого ☞ ПРИМЕРА Уилкинсона. Он имеет корни $$ \lambda_1=0.995754, \ \lambda_2=2.109241,\ \lambda_3=2.574881,\ $$ $$ \lambda_<4,5>=3.965331\pm 1.087735\, \mathbf i,\ \lambda_<6,7>=5.893977\pm 1.948530 \, \mathbf i,\ $$ $$ \lambda_<8,9>=8.118073 \pm 2.529182 \, \mathbf i,\ \lambda_<10,11>=10.5\pm 2.733397 \, \mathbf i,\ $$ $$ \lambda_<12,13>=12.881926\pm 2.529182 \, \mathbf i,\ \lambda_<14,15>=15.106022 \pm 1.948530 \, \mathbf i,\ $$ $$ \lambda_<16,17>=17.034669\pm 1.087735 \, \mathbf i,\ $$ $$ \lambda_<18>=18.425118,\ \lambda_<19>=18.890758,\ \lambda_<20>=20.004245 \ . $$ Итак, нановозмущение 2) в одном-единственном элементе матрицы приводит к существенному изменению спектра: из $ 20 $ вещественных собственных чисел «остаются в живых» только $ 6_<> $; кроме того, у образовавшихся мнимых корней оказываются достаточно большими мнимые части. В данном примере допустимые возмущения для $ <\color\varepsilon > $, т.е. такие, при которых сохранится свойство вещественности всех корней характеристического полинома, находятся в пределах 3) $$ -8.636174\times 10^<-14>\ ♦

Теорема 13 [Гершгорин]. 4) Обозначим $ \mathbb D_ $ круг на комплексной плоскости $ \mathbb C_<> $ с центром в точке $ a_^<> $ и радиуса

$$ r_j=\sum_<\ell=1 \atop \ell\ne j>^n \left|a_\right| \ .$$ Тогда спектр матрицы $ A_<> $ лежит внутри объединения этих кругов: $$ \ <\lambda_1,\dots, \lambda_n \>\subset \bigcup_^n \mathbb D_j \ . $$ Иными словами: любое собственное число матрицы должно удовлетворять хотя бы одному из неравенств $$ |z- a_ | ☞ ЗДЕСЬ.

Согласно этой теореме, главные миноры матрицы $ A-\lambda\, E $ играют роль системы полиномов Штурма для характеристического полинома симметричной матрицы $ A_<> $.

Если все главные миноры $ A_1,A_2,\dots,A_ $ симметричной матрицы $ A_<> $ отличны от нуля, то число положительных собственных чисел матрицы $ A_<> $ равно числу знакопостоянств, а число отрицательных собственных чисел — числу знакоперемен в ряду $ 1,A_1,\dots,A_n $:

$$ \operatorname \< \det (A-\lambda E) =0 \ | \ \lambda>0 \> = <\mathcal P>(1,A_1,\dots,A_n), $$ $$ \operatorname \ < \det (A-\lambda E) =0 \ | \ \lambda ненулевойстолбец $$ X_<\ast>= \left( \begin x_<1>^ <\ast>\\ \vdots \\ x_^ <\ast>\end \right) \in \mathbb^n $$ такой, что $$ AX_<\ast>=\lambda_ <\ast>X_ <\ast>\quad \iff \quad (A -\lambda_<\ast>E) X_ <\ast>= \mathbb O_ \ . $$ По определению собственного числа, $ \det (A^<> -\lambda_<\ast>E) = 0 $ и, следовательно, система однородных уравнений $ (A -\lambda_<\ast>E) X^<> = \mathbb O $ всегда имеет нетривиальное решение; более того, этих решений бесконечно много. Таким образом, одному и тому же собственному числу матрицы принадлежит бесконечное множество собственных векторов. Эту бесконечность можно описать с помощью фундаментальной системы решений (ФСР).

Пример. Найти собственные векторы матрицы

Решение. Спектр матрицы найден выше. $$(A-0 \cdot E)X=\mathbb O \quad \Longrightarrow \ \mbox< ФСР>= \ \left\< <\mathfrak X>_1=\left(\begin 4 \\ -2 \\ 1 \\ 0 \end\right), \ <\mathfrak X>_2=\left(\begin 7 \\ -3 \\ 0 \\ 1 \end \right) \right\>.$$ Любой вектор вида $ \alpha_ <1><\mathfrak X>_1 + \alpha_2 <\mathfrak X>_2 $ будет собственным, принадлежащим $ \lambda_<>=0 $. $$ \begin (A- \mathbf i\, \sqrt <83>E)X=\mathbb O \\ \\ \Downarrow \\ \\ <\mathfrak X>_3= \left(\begin 1- \mathbf i \, \sqrt <83>\\ 8-2\, \mathbf i \, \sqrt <83>\\ 12 \\ 17+\mathbf i \, \sqrt <83>\end\right) \end \qquad \begin (A+\mathbf i \sqrt <83>E)X=\mathbb O \\ \\ \Downarrow \\ \\ <\mathfrak X>_4= \left(\begin 1+\mathbf i \, \sqrt <83>\\ 8+2\mathbf i \, \sqrt <83>\\ 12 \\ 17- \mathbf i \,\sqrt <83>\end\right) \end \ . $$ ♦

Еще один способ нахождения собственного вектора основан на теореме Гамильтона-Кэли.

Теорема 15. Пусть $ \lambda_<\ast>^<> $ — собственное число матрицы $ A_<> $. Обозначим частное от деления характеристического полинома на линейный множитель $ \lambda_<> — \lambda_ <\ast>$ через $ f_<\ast>(\lambda)^<> $:

$$ f_<\ast>(\lambda) \equiv f(\lambda) / (\lambda-\lambda_<\ast>) \ . $$ Тогда любой ненулевой столбец матрицы $ f_<\ast>(A)^<> $ является собственным вектором, принадлежащим $ \lambda_<\ast>^<> $.

Доказательство следует из равенства $$(A-\lambda_ <\ast>E)f_<\ast>(A)=\mathbb O_ . $$ На основании определения любой ненулевой столбец $ f_<\ast>(A)^<> $ должен быть собственным вектором матрицы $ A_<> $. ♦

Пример. Найти собственные векторы матрицы

$$ A=\left( \begin 9 & 22 & -6 \\ -1 &-4 & 1 \\ 8 & 16 & -5 \end \right) . $$

Решение. $$ \det (A-\lambda E)=-\lambda^3+ 7\, \lambda + 6 \equiv -(\lambda_<>-3) (\lambda+2)(\lambda+1) \, .$$ Пренебрегая знаком – , имеем: $$ \begin f_1(\lambda)=\lambda^2+3\lambda+2 & u & f_1(A)= \left( \begin 40 & 80 & -20 \\ 0 &0 & 0 \\ 40 & 80 & -20 \end \right) \ , \\ f_2(\lambda)=\lambda^2-2\lambda-3 & u & f_2(A)= \left( \begin -10 & -30 & 10 \\ 5 &15 & -5 \\ 0 & 0 & 0 \end \right) \ , \\ f_3(\lambda)=\lambda^2-\lambda-6 & u & f_3(A)= \left( \begin -4 & -8 & 4 \\ 4 & 8 & -4 \\ 8 & 16 & -8 \end \right) \ . \end $$

Если $ \lambda_<\ast>^<> $ является простым корнем характеристического полинома 5) , то ненулевые столбцы $ f_<\ast>(A)^<> $ будут пропорциональными. Или, что то же, $ \operatorname f_<\ast>(A)^<> = 1 $.

Тогда очевидно, что и строки матрицы $ f_<\ast>(A)^<> $ тоже должны быть пропорциональны!

Доказать, что любая ненулевая строка матрицы $ f_<\ast>(A)^<> $ является собственным вектором матрицы $ A^<^<\top>>_<> $, принадлежащим $ \lambda_<\ast>^<> $. Доказать, что собственный вектор матрицы $ A_<> $ ортогонален собственному вектору матрицы $ A^<\top>_<> $, если эти векторы принадлежат различным собственным числам 6) .

На практике вычисление полинома $ f_<\ast>(\lambda)^<> $ может быть осуществлено с помощью схемы Хорнера.

Пример. Вычислить собственный вектор матрицы

$$ A=\left( \begin 23 & 75 & -92 \\ 6 & 74 & 72 \\ 37 & -23 & 87 \end \right) , $$ принадлежащий ее вещественному собственному числу.

Решение. Характеристический полином $$ f(\lambda)= -\lambda^3+184\,\lambda^2-14751\,\lambda+611404 $$ имеет единственное вещественное собственное число $ \lambda_ <\ast>\approx 96.8817 $. Составляем схему Хорнера $$ \begin & -1 & 184 & -14751 & 611404 \\ \hline 96.8817 & -1 & 87.1183 & -6310.8310 & -0.0352 \end $$ За счет ошибок округления мы получили ненулевое значение для $ f(\lambda_<\ast>) $. В качестве частного от деления $ f(\lambda) $ на $ \lambda-\lambda_ <\ast>$ берем $$ f_<\ast>(\lambda)= -\lambda^2 + 87.1183\, \lambda — 6310.8310 \ . $$ Подставляем в него матрицу $ A_<> $ и вычисляем первый столбец матрицы $$ -A^2+87.1183\,A -6310\, E = \left( \begin -1882.1101 & * & * \\ -2723.2902 & * & * \\ -708.6229 & * & * \end \right) \ .$$ Проверяем: $$ \left( \begin 23 & 75 & -92 \\ 6 & 74 & 72 \\ 37 & -23 & 87 \end \right) \left( \begin -1882.1101 \\ -2723.2902 \\ -708.6229 \end \right) — 96.8817 \left( \begin -1882.1101 \\ -2723.2902 \\ -708.6229 \end \right)= \left( \begin 0.0356 \\ 0 \\ -0.0002 \end \right) \ . $$ ♦

Можно развить последний метод далее: найти универсальную формулу для собственного вектора как функции ее собственного числа. Действительно, найдем частное от деления характеристического полинома $$ f(\lambda) =a_0\lambda^n+a_0\lambda^+\dots+ a_n, \ \quad a_0=(-1)^n $$ на линейный полином $ \lambda- \lambda_ <\ast>$, где $ \lambda_ <\ast>$ — произвольное число из $ \mathbb C $. С помощью той же схемы Хорнера, получаем $$ q(\lambda)=a_0\lambda^+(a_0\lambda_<\ast>+a_1)\lambda^+(a_0\lambda_<\ast>^2+a_1\lambda_<\ast>+a_2)\lambda^+\dots+ (a_0\lambda_<\ast>^+a_1\lambda_<\ast>^+\dots+a_) \, . $$ Если $ \lambda_ <\ast>$ является собственным числом матрицы $ A_<> $, то любой ненулевой столбец матрицы $$ q(A)= a_0A^+(a_0\lambda_<\ast>+a_1)A^+(a_0\lambda_<\ast>^2+a_1\lambda_<\ast>+a_2)A^+\dots+ (a_0\lambda_<\ast>^+a_1\lambda_<\ast>^+\dots+a_)E $$ будет собственным вектором, принадлежащим $ \lambda_ <\ast>$.

Пример. Найти представление всех собственных векторов матрицы

$$ A=\left( \begin 9 & 22 & -6 \\ -1 &-4 & 1 \\ 8 & 16 & -5 \end \right) $$ в виде функции ее собственных чисел.

Решение. Характеристический полином матрицы был вычислен выше: $ f(\lambda)=-\lambda^3+ 7\, \lambda + 6 $. Имеем, $$ q(\lambda)=-\lambda^2-\lambda_<\ast>\lambda+(7-\lambda_<\ast>^2) $$ и $$ q(A)=-A^2-\lambda_<\ast>A+(7-\lambda_<\ast>^2)E= \left(\begin -\lambda_<\ast>^2-9\lambda_<\ast>-4 & -22\lambda_<\ast>-14 & 6\lambda_<\ast>+2 \\ \lambda_<\ast>-3 & -\lambda_<\ast>^2+4\lambda_<\ast>-3 & -\lambda_<\ast>+3 \\ -8\lambda_<\ast>-16 & -16\lambda_<\ast>-32 & -\lambda_<\ast>^2+5\lambda_<\ast>+14 \end \right) \, . $$ Берем произвольный столбец этой матрицы, например, первый: $$ X_<\ast>(\lambda_<\ast>)= \left(\begin -\lambda_<\ast>^2-9\lambda_<\ast>-4 \\ \lambda_<\ast>-3 \\ -8\lambda_<\ast>-16 \end \right) \, . $$ Утверждается, что $ X_ <\ast>(\lambda_<\ast>) $ — универсальное представление всех собственных векторов матрицы. Действительно, $$ X_<\ast>(-1) = \left(\begin 4 \\ -4 \\ -8 \end \right),\ X_<\ast>(-2) = \left(\begin 10 \\ -5 \\ 0 \end \right),\ X_<\ast>(3) = \left(\begin -40 \\ 0 \\ -40 \end \right) \, . $$ ♦

Теорема 16. Пусть $ g(x)=b_0x^m+\dots+b_ \in <\mathbb C>[x] $ – произвольный полином. Если $ X_<\ast>\in \mathbb C^ $ — собственный вектор матрицы $ A_<> $, соответствующий собственному числу $ \lambda_<\ast>^<> $, то он же будет собственным и для матрицы $ g(A)^<> $, принадлежащим собственному числу $ g(\lambda_<\ast>)^<> $.

Доказательство. Домножим равенство $ A<\mathfrak X>_<\ast>=\lambda_<\ast>^<><\mathfrak X>_ <\ast>$ слева на матрицу $ A_<> $: $$ A^2<\mathfrak X>_<\ast>=\lambda_<\ast>A<\mathfrak X>_<\ast>=\lambda_<\ast>^2<\mathfrak X>_ <\ast>.$$ По индукции доказывается и общее равенство: $$ A^k<\mathfrak X>_<\ast>=\lambda_<\ast>^k<\mathfrak X>_ <\ast>.$$ Домножим его на $ b_^<> $ и просуммируем по $ k_<> $ от $ 0_<> $ до $ m_<> $: $$ g(A)<\mathfrak X>_<\ast>=g(\lambda_<\ast>)<\mathfrak X>_ <\ast>,$$ что и доказывает утверждение теоремы. ♦

Если матрица $ A $ невырождена, то теорема остается справедливой и для произвольного полинома от $ A^ <-1>$. В частности, собственные векторы $ A^ <-1>$ совпадают с собственными векторами матрицы $ A $.

Теорема 17. Собственные векторы, принадлежащие различным собственным числам матрицы $ A_<> $, линейно независимы.

Теорема 18. Собственные векторы, принадлежащие различным собственным числам вещественной симметричной матрицы $ A_<> $, ортогональны, т.е. если $ \mathfrak X_1 $ принадлежит собственному числу $ \lambda_ <1>$, а $ \mathfrak X_2 $ принадлежит собственному числу $ \lambda_ <2>$ и $ \lambda_1 \ne \lambda_2 $, то

$$ \langle \mathfrak X_1, \mathfrak X_2 \rangle =0 \ , $$ где $ \langle \ ,\ \rangle $ означает скалярное произведение, определяемое стандартным образом: $ \langle X,Y \rangle =x_1y_1+\dots+x_ny_n $.

Доказательство ☞ ЗДЕСЬ.

Теорема Перрона-Фробениуса

Теорема 19 [Перрон, Фробениус]. Для положительной матрицы $ A_<> $ существует положительное собственное число $ \lambda_ <+>$ такое, что все остальные собственные числа этой матрицы меньше $ \lambda_ <+>$ по абсолютной величине (модулю). Соответствующий этому собственному числу собственный вектор может быть выбран положительным:

$$ \exists \mathfrak X_ <+>> \mathbb O: \quad A \mathfrak X_ <+>= \lambda_ <+>\mathfrak X_ <+>\ . $$

Число $ \lambda_ <+>$ из теоремы называется собственным числом Перрона или собственным числом Перрона-Фробениуса матрицы $ A_<> $, а соответствующий ему произвольный положительный собственный вектор — собственным вектором Перрона-Фробениуса матрицы $ A_<> $.

Спектральный радиус положительной матрицы $ A_<> $ совпадает с ее собственным числом Перрона-Фробениуса:

Пример. Найти собственное число и вектор Перрона-Фробениуса для матрицы

$$ A= \left(\begin 2 & 7 & 18 & 28 \\ 1 & 8 & 2 & 8 \\ 3 & 1 & 4 & 1 \\ 5 & 9 & 26 & 5 \end \right) \, . $$

Решение. Характеристический полином матрицы $ A_<> $ $$ \det(A-\lambda E)=\lambda^4-19\, \lambda^3-175\, \lambda^2-285\, \lambda+10390 $$ имеет корнями $$ \lambda_ <1,2>\approx -6.260463 \pm 5.452465 \mathbf i,\ \lambda_3 \approx 5.878976, \lambda_4 \approx 25.641950 \ . $$ Числом Перрона-Фробениуса является $ \lambda_4 $, а соответствующий ему собственный вектор Перрона-Фробениуса можно взять равным $$ \left( \begin 1 \\ 0.365240 \\ 0.184802 \\ 0.634244 \end \right) \quad \mbox < или >\quad \left( \begin 2.737922 \\ 1 \\ 0.505974 \\ 1.736510 \end \right) \quad \mbox < или >\left( \begin 5.411185 \\ 1.976383 \\ 1 \\ 3.432010 \end \right) \quad \mbox < или >\quad \left( \begin 1.576681 \\ 0.575868 \\ 0.291374 \\ 1 \end \right) \quad \mbox < или >\quad \left( \begin 0.798133 \\ 0.291510 \\ 0.147496\\ 0.506210 \end \right) \quad \mbox < или >\dots $$ (напоминаю: собственный вектор определяется с точностью до ненулевого сомножителя!). Последний вектор имеет длину равную $ 1_<> $. ♦

1. Собственное число Перрона-Фробениуса всегда простое для характеристического полинома матрицы $ A_<> $. Отсюда следует, что собственный вектор Перрона-Фробениуса определяется единственным образом — с точностью до домножения на положительный скаляр.

2. Любой собственный вектор положительной матрицы $ A_<> $, не соответствующий собственному числу Перрона-Фробениуса, не может состоять исключительно только из положительных элементов. Иными словами, хотя бы одна компонента такого вектора должна быть либо отрицательной либо мнимой.

3. Для собственного числа Перрона-Фробениуса справедливо неравенство $$ \min_> \sum_^n a_ \le \lambda_ <+>\le \max_> \sum_^n a_ \ . $$

4. Собственное число Перрона-Фробениуса матрицы $ A_<> $ совпадает с собственным числом Перрона-Фробениуса матрицы $ A^ <\top>$.

Какие из перечисленных свойств можно распространить на случай неотрицательных матриц ? Каждую такую матрицу можно рассматривать как предел последовательности (строго) положительных матриц. Воспользовавшись теоремой о непрерывной зависимости собственных чисел матрицы от ее элементов, можем сделать вывод, о том, что для неотрицательной матрицы $ A_<> $ всегда найдется вещественное неотрицательное собственное число, которое будет являться максимальным по модулю среди всех собственных чисел матрицы. Другое дело, что в данном случае — в отличие от случая положительных матриц — такое мажорирующее собственное число может оказаться не единственным.

Пример. Спектр неотрицательной матрицы

$$ A=\left( \begin 0 & 1 \\ 1 & 0 \end \right) $$ состоит из чисел $ \lambda_1=+1 $ и $ \lambda_1=-1 $ одинакового модуля. ♦

Однако, по-прежнему, хотя бы одно неотрицательное вещественное число $ \lambda_ <+>$ со свойством $ \rho(A) = \lambda_ <+>$ существовать будет; более того, ему будет соответствовать неотрицательный собственный вектор $ \mathfrak X \ge \mathbb O $. Это число (вектор) по-прежнему называются числом (вектором) Перрона-Фробениуса 7) матрицы $ A_<> $.

Частным случаем неотрицательных матриц являются стохастические матрицы, т.е. неотрицательные матрицы, в которых сумма элементов каждой строки равна $ 1_<> $: $$ P=\left[p_\right]_^n, \\ge 0 \>_^n,\ \sum_^n p_ = 1 \ npu \quad j \in \ <1,2,\dots,n\>\ . $$

Теорема 20. Собственное число Перрона-Фробениуса стохастической матрицы равно $ 1_<> $. Этому собственному числу соответствует собственный вектор $ X=[1,1,\dots,1]^ <\top>$.

Доказательство существования собственного числа равного $ 1_<> $ и соответствующего ему собственного вектора $ X=[1,1,\dots,1]^ <\top>$ следует из равенства $$ P \left( \begin 1 \\ 1 \\ \vdots \\ 1 \end \right) = \left( \begin 1 \\ 1 \\ \vdots \\ 1 \end\right) \ . $$ Далее, из теоремы Гершгорина следует, что любое собственное число $ \lambda_<>\in \mathbb C $ стохастической матрицы должно удовлетворять неравенству $$|\lambda — p_|\le \sum_ |p_|=1-p_ $$ хотя бы при одном $ j_<> $. Воспользовавшись следствием к неравенству треугольника получаем: $$|\lambda| — |p_|\le |\lambda — p_| \le 1-p_ \ \Rightarrow \ |\lambda| \le 1 \ . $$ ♦

Методы вычисления характеристического полинома

Вычисление коэффициентов характеристического полинома матрицы $ A_<> $ непосредственным разложением определителя $ \det (A-\lambda_<> E) $ на $ n!_<> $ слагаемых — крайне неэффективно. Элементами этого разложения являются выражения, полиномиально зависящие от параметра $ \lambda_<> $. На каждом этапе вычислений мы получаем проблему символьных вычислений: хранения таких полиномов и действий над ними.

Основной метод вычисления числовых определителей — метод Гаусса — также неэффективен в приложении к вычислению определителя, элементы которого зависят от параметра. Источником вычислительных проблем является неудобное расположение переменной $ \lambda_<> $ — на главной диагонали матрицы. Первый же шаг метода Гаусса приводит к делению на элемент $ a_ <11>— \lambda $, и, в дальнейшем, элементы преобразованной матрицы будут уже не полиномами, а рациональными функциями относительно $ \lambda_<> $. Следующие шаги метода приводят к возрастанию степеней знаменателей. Необходимость в организации хранения рациональных функций и программировании действий с ними кажется тем более неоправданной, если вспомнить, что окончательный ответ — выражение для $ \det (A-\lambda_<> E) $ — должно быть полиномом по $ \lambda_<> $; т.е. знаменатели дробей в конечном ответе сократятся.

А в качестве усугубляющего положение обстоятельства «на заднем плане» маячит проблема точности вычислений коэффициентов характеристического полинома — чувствительность его корней к возмущению его коэффициентов бывает весьма высокой.

Какой выход предлагается? — Предварительно преобразовать определитель $ \det (A-\lambda_<> E) $ к виду, когда переменная $ \lambda_<> $ оказывается «выметенной» с диагонали на крайний ряд (в столбец или в строку). При этом допускается увеличение размеров (порядка) определителя. Такое представление дает возможность разложения определителя по этому исключительному ряду, и, тем самым, позволяет свести задачу к вычислению числовых определителей — а уж для этой задачи применение метода Гаусса вполне эффективно.

Метод Леверье

Метод основан на формуле (см. следствие к теореме $ 7 $ ☞ ЗДЕСЬ ): $$ \operatorname (A^k)=\lambda_1^k+\dots+\lambda_n^k=s_k \ , $$ т.е. след $ k_<> $-й степени матрицы $ A_<> $ равен $ k_<> $-й сумме Ньютона ее характеристического полинома $ f(\lambda)=\det (A-\lambda E ) $. Вычисляем последовательные степени матрицы $ A_<> $: $$s_1=\operatorname (A),\ s_2=\operatorname (A^2),\ \dots, s_n=\operatorname (A^n) \ .$$ Неизвестные коэффициенты $ f(\lambda)=(-1)^n(\lambda^n+a_1\lambda^+ \dots+a_n) $ находим по рекурсивным формулам Ньютона: $$ a_1=-s_1, a_2=-(s_2+a_1s_1)/2, $$ $$ a_k=-(s_+a_1s_+a_2s_+\dots+a_s_1)/k \ npu \ k \le n. $$ Очевидно, что не имеет смысла вычислять все элементы матрицы $ A^ $ — достаточно обойтись лишь элементами ее главной диагонали.

Пример [Леверье]. Найти характеристический полином матрицы

$$ A=\left(\begin -5.509882&1.870086&0.422908&0.008814 \\ 0.287865&-11.811654&5.711900&0.058717 \\ 0.049099&4.308033&-12.970687&0.229326 \\ 0.006235&0.269851&1.397369&-17.596207 \end \right) \ . $$

Решение. $$ A^2=\left(\begin 30.91795128&-30.56848188&2.878480155&0.0031325713\\ -4.705449283&164.6764010&-141.3504639&-0.4143169528\\ 0.3341843103&-106.6094396&193.1869924& -6.756396001\\ 0.0022236138&-1.904168948&-41.16923134& 309.9628536 \end \right), $$ $$ A^3=\left(\begin -179.0125092&431.2849919&-198.8601505& -0.9173897610\\ 66.38829278&-2562.954533& 2771.458834& -15.49709921\\ -23.08728044&2090.291485&-3124.010318& 156.9329019\\ -0.649145142&-71.21907809&956.2502143& -5463.723497 \end \right), $$ $$ A^4=\left(\begin 1100.720103& \ast& \ast& \ast \\ \ast& 42332.23816& \ast& \ast \\ \ast& \ast& 52669.62534& \ast \\ \ast& \ast& \ast& 96355.91518 \end \right) \ . $$ Вычисляем следы матриц: $$s_1=-47.888430,\ s_2=698.7441983,\ s_3=-11329.70086,\ s_4= 192458.4988 \ ,$$ и по формулам Ньютона получаем: $$a_1= 47.888430,\ a_2 = 797.278764_ <\displaystyle 8>,\ a_3 = 5349.45551_<\displaystyle 3>,\ a_4 = 12296.550_ <\displaystyle 68>\ . $$ ♦

После нахождения коэффициентов характеристического полинома можно найти его корни каким-либо 8) методом. Если $ \lambda_<\ast>^<> $ — одно из собственных чисел, то для нахождения соответствующего собственного вектора воспользуемся алгоритмом из ☞ ПУНКТА. Предположив дополнительно, что это собственное число простое 9) , обозначим $$ f_<\ast>(\lambda)= f(\lambda)/(\lambda-\lambda_<\ast>)=(-1)^n(\lambda^ +p_1\lambda^+\dots+p_\lambda+p_) $$ т.е. частное от деления $ f(\lambda_<>) $ на $ \lambda-\lambda_ <\ast>$. Тогда любой ненулевой столбец матрицы $ f_<\ast>(A)^<> $ будет собственным вектором, принадлежащим $ \lambda_<\ast>^<> $. Как правило, собственным вектором можно взять комбинацию

Степени матрицы $ A_<> $ уже нами посчитаны при вычислении коэффициентов характеристического полинома.

Пример. Для приведенного выше примера находим собственные числа:

$$ \lambda_1=-17.86326,\ \lambda_2=-17.15242,\ \lambda_3=-7.57404,\ \lambda_4= -5.29869 \ . $$ Коэффициенты $ f_1(\lambda) $ можно определить по схеме Хорнера: $$ \begin &1 & 47.888430 & 797.2787648 & 5349.455513 & 12296.55068 \\ \hline -17.86326 & 1 & \underbrace<30.025170>_>& \underbrace<260.9313465>_> &\underbrace<688.371028>_>& \approx 0 \\ \end $$ Собственным вектором, принадлежащим $ \lambda_ <1>$, будет $$\left[ -0.0256_<\displaystyle 67>,\ 0.21938_<\displaystyle 0>,\ -0.24187_<\displaystyle 1>,\ 1.044526 \right]^<^<\top>> \ .$$ ♦

Теорема 21. Характеристический полином явно выражается через суммы Ньютона с помощью следующего представления:

$$ f(\lambda)=\frac<1>\left| \begin s_1 &1 & & & &\\ s_2&s_1& 2 & &\mathbb O & \\ s_3&s_2&s_1&3& & \\ \vdots& & & \ddots &\ddots & \\ s_n&s_& s_ & \dots &s_1&n \\ \lambda^n&\lambda^&\lambda^& \dots &\lambda&1 \end \right|_ <(n+1)\times (n+1)>\ . $$

Биографические заметки о Леверье ☞ ЗДЕСЬ.

Метод Крылова

Рассмотрим произвольный ненулевой столбец $ Y_0=\left[ y_<1>^<[0]>,\dots,y_^ <[0]>\right]^<^<\top>> \in \mathbb C^n $. Cоставим итерационную векторную последовательность $$ Y_1=A\cdot Y_0,\ Y_2=A\cdot Y_1, \dots,\ Y_=A\cdot Y_ \ . $$

Теорема 22. Определитель

$$ \det \left[\begin Y_0&Y_<1>&\dots&Y_&Y_\\ 1& \lambda&\dots&\lambda^&\lambda^n \end \right]_ <(n+1)\times (n+1)>$$ совпадает — с точностью до постоянного множителя — с характеристическим полиномом матрицы $ A_<> $. Здесь $ |_<> $ означает конкатенацию.

Доказательство. Легко видеть, что $$ Y_K=A^KY_0 \quad npu \quad K \in \ <1,\dots,n\>\ . $$ Если $$ f(\lambda)=\det(A-\lambda E) =(-1)^n \lambda^n+a_1 \lambda^+a_2 \lambda^+\dots+a_n \ , $$ то по теореме Гамильтона-Кэли: $$ (-1)^n A^n+a_1A^+\dots+a_nE=\mathbb O_ \ . $$ Это равенство останется справедливым и после умножения его на произвольный вектор, в том числе на $ Y_ <0>$: $$ (-1)^n A^n\cdot Y_0+a_1A^ \cdot Y_0 +\dots+a_n\cdot Y_0=\mathbb O_ \iff $$ $$ \iff \quad (-1)^n Y_n+a_1Y_ +\dots+a_nY_0=\mathbb O \ . $$ Последнее равенство представляет линейную систему относительно неизвестных коэффициентов характеристического полинома. Можно решать ее по формулам Крамера, но мы пойдем другим путем. Дополним эту систему тождеством $ f(\lambda)=(-1)^n \lambda^n+a_1 \lambda^+a_2 \lambda^+\dots+a_n $. Рассмотрим получившуюся систему как линейную однородную относительно столбца $ \left[ a_n,a_,\dots,a_1,1\right]^ <\top>$. Поскольку эта система имеет нетривиальное решение, то ее определитель должен равняться нулю: $$ 0=\det \left[\begin Y_0&Y_<1>&\dots&Y_&(-1)^nY_\\ 1& \lambda&\dots&\lambda^&(-1)^n\lambda^n-f(\lambda) \end \right]= $$ (представляем последний столбец в виде суммы двух столбцов и используем свойство 5 определителя) $$ =\det \left[\begin Y_0&Y_<1>&\dots&Y_&(-1)^nY_\\ 1& \lambda&\dots&\lambda^&(-1)^n\lambda^n \end \right]-f(\lambda) \det \left[\begin Y_0&Y_<1>&\dots&Y_ \end \right] \ . $$ Таким образом, $$ f(\lambda)=(-1)^n \frac<\det \left[\begin Y_0&Y_<1>&\dots&Y_&Y_\\ 1& \lambda&\dots&\lambda^&\lambda^n \end \right]><\det \left[\begin Y_0&Y_<1>&\dots&Y_ \end \right]> \ , $$ если только знаменатель в этой дроби не обратится в нуль. ♦

Пример. Найти характеристический полином матрицы примера Леверье

$$ A=\left(\begin -5.509882&1.870086&0.422908&0.008814 \\ 0.287865&-11.811654&5.711900&0.058717 \\ 0.049099&4.308033&-12.970687&0.229326 \\ 0.006235&0.269851&1.397369&-17.596207 \end \right) \ . $$

Решение. Возьмем $ Y_0=\left[ 1,0,0,0 \right]^ <\top>$. Имеем $$ \begin Y_1=A Y_0= & Y_2=AY_1= & Y_3=AY_2= & Y_4=AY_3= \\ \left(\begin -5.509882\\ 0.287865 \\ 0.049099 \\ 0.006235 \end \right), & \left(\begin 30.917951\\ -4.705449 \\ 0.334184 \\ 0.002223 \end \right), & \left(\begin -179.012509\\ 66.388293 \\ -23.087280\\ -0.649145 \end \right), & \left(\begin 1100.720101\\ -967.597333\\ 576.522644\\ -4.040153 \end \right)\ . \end $$ $$ \det \left[\begin Y_0&Y_<1>&Y_2& Y_<3>& Y_<4>\\ 1& \lambda&\lambda^2 &\lambda^<3>&\lambda^4 \end \right]= \left| \begin 1 & -5.509882 & 30.917951 & -179.012509 & 1100.720101 \\ 0 & 0.287865 & -4.705449 & 66.388293 & -967.597333\\ 0 & 0.049099 & 0.334184 & -23.087280 & 576.522644\\ 0 & 0.006235 & 0.002223 & -0.649145 & -4.040153 \\ 1 & \lambda & \lambda^2 & \lambda^3 & \lambda^4 \end \right|= $$ $$ =0.348621 \lambda^4+16.694915\lambda^3+277.948166\lambda^2+1864.932835\lambda+4286.836454 = $$ $$ =0.348621 \left(\lambda^4+47.888430\lambda^3+797.27876_<\displaystyle 3>\lambda^2+5349.4555_<\displaystyle 0>\lambda+12296.550_ <\displaystyle 5>\right) \ . $$ ♦

После нахождения характеристического полинома можно найти его корни каким-либо 10) методом. Пусть $ \lambda_<\ast>^<> $ — одно из собственных чисел, и оно — простое; тогда для нахождения соответствующего собственного вектора можно воспользоваться тем же приемом, что был задействован в предыдущем ПУНКТЕ. Вычислим 11) частное от деления $ f(\lambda_<>) $ на $ \lambda-\lambda_ <\ast>$ $$ f_<\ast>(\lambda)= f(\lambda)/(\lambda-\lambda_<\ast>)=(-1)^n(\lambda^ +p_1\lambda^+\dots+p_\lambda+p_) \ . $$ Тогда любой ненулевой столбец матрицы $ f_<\ast>(A)^<> $ будет собственным вектором, принадлежащим $ \lambda_<\ast>^<> $. Но тогда и произвольная комбинация столбцов этой матрицы тоже будет собственным вектором (если только не обратится в нулевой вектор). В частности, это относится и к комбинации, записываемой в матричном виде $$ (-1)^n f_<\ast>(A) Y_0 = A^Y_0 +p_1A^Y_0+\dots+p_Y_0=Y_+p_1Y_+\dots+p_Y_0 \ . $$ А комбинируемые векторы уже посчитаны.

Теперь обсудим исключительные случаи. При неудачном выборе $ Y_ <0>$ определитель $$ \det \left[\begin Y_0&Y_<1>&\dots&Y_ \end \right] $$ может обратиться в нуль. Эта неприятность обязательно произойдет если, например, наш выбор пал на вектор $ Y_0 $, совпадающий с собственным вектором матрицы $ A_<> $. Вероятность такого события — нулевая. В общем же случае, трудно ожидать, чтобы $ n_<> $ почти произвольных столбцов $ Y_0,Y_<1>,\dots,Y_ $ оказались линейно зависимыми — если только сама матрица $ A_<> $ не обладает «скрытым дефектом» — типа рассмотренного в следующем примере.

Пример. Найти характеристический полином матрицы

Решение. При любом выборе $ Y_0 $ векторы $ \ $ оказываются линейно зависимыми: $$ Y_0= \left(\begin 1\\ 0\\ 0 \end \right), Y_1= \left(\begin 2\\ 1\\ 1 \end \right), Y_2= \left(\begin 6\\ 5\\ 5 \end \right),\dots ; Y_0= \left(\begin 1\\ 1\\ 1 \end \right),\ Y_1= \left(\begin 4\\ 4\\ 4 \end \right),\dots $$ Объяснение этого феномена состоит в том, что для матрицы $ A_<> $ ее аннулирующий полином имеет степень меньшую ее порядка: $$ A^2-5\ A+4 E = \mathbb O \ . $$ Домножение этого равенства на произвольный столбец $ Y_0 $ и доказывает линейную зависимость системы $ \ $. ♦

Такая ситуация возможна только в случае, когда характеристический полином матрицы $ A_<> $ имеет кратные корни (в рассмотренном выше примере $ \lambda_<>=1 $ являлся двойным корнем $ \det (A-\lambda_<> E) $); она исключительно редко встречается на практике.

Поиск всех собственных чисел

Существуют методы нахождения спектра матрицы, не требующие предварительного построения характеристического полинома.

QR-алгоритм

Этот алгоритм основан на QR-разложении матрицы $ A $.

Теорема 23. Спектр матрицы $ A $ совпадает со спектром матрицы $ P^ <\top>A P $ при произвольной ортогональной матрице $ P $.

Доказательство. $$ \det (P^ <\top>A P-\lambda E)=\det (P^ <\top>A P- \lambda P^ <\top>E P)=\det P^ <\top>(A -\lambda E ) P = \det (A -\lambda E ) P P^ <\top>= \det (A -\lambda E ) \, . $$ ♦

Пусть QR-разложение матрицы $ A $ имеет вид $$ A=Q_1R_1 \, , $$ где $ Q_1 $ — ортогональная, а $ R_1 $ — верхнетреугольная матрицы. Тогда матрица $$ A_2=R_1Q_1 $$ имеет тот же спектр, что и матрица $ A $. Действительно, поскольку $$ A_2=Q_1^ <\top>A Q_1 , $$ то сработает предыдущая теорема. Вычислим QR-разложение матрицы $ A_2 $ $$ A_2=Q_2R_2 $$ и переставим местами матрицы этого произведения: $$ A_3=R_2Q_2 \, . $$ Матрица $$ A_3= Q_2^ <\top>A_2 Q_2=Q_2^ <\top>Q_1^ <\top>A Q_1 Q_2 $$ продолжаем иметь те же собственные числа, что и матрица $ A $. Утверждается, что бесконечная последовательность матриц $$ \Q_\>_^ <\infty>$$ как правило, сходится к матрице $ A_ <\infty>$, которая будет верхнетреугольной.

Теорема 24 [4]. Если все собственные числа матрицы $ A $ различны по модулю, то матрица $ A_ <\infty>$ является верхнетреугольной и на ее главной диагонали стоят собственные числа матрицы $ A $.

Пример. Найти все собственные числа матрицы $$ A=\left(\begin 2 & 3 &-1\\ 7 & 3 & 3 \\ -1 & -2 & 4 \end \right) \, . $$

Решение. $$ A_1=A\approx \underbrace<\left(\begin 0.272165 & 0.759752 & 0.590511 \\ 0.952579 & -0.299517 & -0.053683 \\ -0.136083& -0.577119 & 0.805242 \end \right)>_ \underbrace<\left(\begin 7.348469 & 3.946400 & 2.041241\\ 0 & 2.534941 & -3.966781 \\ 0 & 0 & 2.469409 \end \right)>_ $$ Теперь переставляем матрицы произведения местами и строим QR-разложение получившейся матрицы: $$ \quad \Rightarrow \quad A_2 = R_1Q_1\approx \left(\begin 5.481481 & 3.222957 & 5.771191 \\ 2.954542 & 1.530046 & -3.3303021 \\ -0.336044 & -1.425143 & 1.988472 \end \right)\approx $$ $$ \approx\underbrace<\left(\begin -0.878992 & 0.022595 & 0.476300\\ 0.473781 & -0.154267 & -0.867026 \\ 0.053886 & -0.987771 & 0.146304 \end \right)>_ \underbrace<\left(\begin -6.236096& -3.634658 & -3.387848\\ 0 & 1.244502 & -1.319999\\ 0 & 0 & 5.927198 \end \right)>_ $$ Продолжим процесс: $$ \quad \Rightarrow \quad A_3 = R_2Q_2\approx \left(\begin 7.020952& 3.766220 & -0.314568\\ -0.660752 & 1.111870 & -1.272137\\ 0.319398 & -5.854713 & 0.867177 \end \right) \approx $$ $$ \approx \underbrace<\left(\begin -0.994581 & -0.065879 & 0.080426 \\ 0.093601 & -0.230749 & 0.968501 \\ -0.045246 & 0.970780 & 0.235665 \end \right)>_ \underbrace<\left(\begin -7.059205 & -3.376839 & 0.154554 \\ 0 & -6.188319 & 1.156106 \\ 0 & 0 & -1.053002 \end \right)>_ $$ Замечаем тенденцию убывания элементов матриц $ \ $, стоящих под главной диагональю. $$ \Rightarrow \dots \Rightarrow A_ <10>\approx \left(\begin \mathbf<6.>_ <246022>& 2.758769 & -2.160057\\ -0.0467437 & \mathbf<4.4>_ <09292>& -5.341014\\ 0.000018 &-0.005924 & \mathbf<-1.6>_ <55314>\end \right) \approx $$ $$ \underbrace<\left(\begin -0.999972 & -0.007483 & 0.000007 \\ 0.007483 & -0.999971 & 0.001339 \\ -0.000003 & 0.001339 & 0.999999 \end \right)>_> \underbrace<\left(\begin -6.246197 & -2.725694 & 2.120031\\ 0 & -4.429817 & 5.354807 \\ 0 & 0 & -1.662479 \end \right)>_> \, . $$ Матрица $ Q_j $ уже близка к диагональной (с элементами $ \pm 1 $), верхнетреугольность матрицы $ A_j $ также заметна, но точность приближения еще не достаточна. $$ \Rightarrow \dots \Rightarrow A_ <20>\approx \left(\begin \mathbf<6.17>_ <5608>& 2.805821 & -2.020513 \\ -0.001776 & \mathbf<4.48>_ <4917>& -5.388407\\ 0 & 0 & -\mathbf <1.660525>\end \right) \approx $$ Точность приближения минимильного собственного числа существенно выше точностей приближения остальных чисел. $$ \Rightarrow \dots \Rightarrow A_ <30>\approx \left(\begin \mathbf<6.172>_ <778>& 2.807524 & -2.015076\\ -0.000073 & \mathbf<4.487>_ <747>& -5.390442\\ 0 & 0 & -\mathbf <1.660525>\end \right) \, . $$ ♦

К сожалению условие теоремы достаточно ограничительно: собственные числа вещественной матрицы $ A $ могут оказаться и мнимыми, но тогда они одинаковы по модулю.

Как это обстоятельство сказывается на структуре матрицы $ A_ <\infty>$ и дальнейшее развитие метода ☞ ЗДЕСЬ

Частичная проблема собственных чисел

Задача. Найти максимальное по модулю собственное число матрицы $ A_<> $.

Предположение . Будем считать сначала, что максимальное по модулю собственное число матрицы единственно.

Излагаемый ниже метод поиска этого собственного числа называется методом степенны́х итераций 12) .

Рассмотрим произвольный ненулевой столбец $ Y_0=\left[ y_<1>^<[0]>,\dots,y_^ <[0]>\right]^<^<\top>> \in \mathbb C^n $. Cоставим такую же итерационную векторную последовательность, как и в методе Крылова $$ Y_1=A\cdot Y_0,\ Y_2=A\cdot Y_1, \dots,\ Y_=A\cdot Y_,\dots , $$ (только теперь, в отличие от метода Крылова, считаем ее неограниченно продолжающейся) и выделим последовательность первых элементов этих векторов: $$y_<1>^<[1]>,y_<1>^<[2]>,\dots,y_<1>^<[K]>,\dots $$

Теорема 25. Как правило, предел

$$ \lim_\frac^<[K+1]>>^<[K]>> $$ существует и он равен максимальному по модулю собственному числу матрицы $ A_<> $.

Доказательство. Перенумеруем собственные числа $ \lambda_<1>,\dots,\lambda_n $ матрицы $ A_<> $ так, чтобы $ \lambda_ <1>$ обозначило максимальное по модулю: $$|\lambda_1|= \max_> |\lambda_j| \ , \quad |\lambda_1|>|\lambda_j| \quad npu \quad j\in \ <2,\dots,n\>\ . $$ Очевидно, $$ Y_=A^K\cdot Y_0 \ ; $$ отсюда следует, что любой элемент столбца $ Y_ $ может быть линейно выражен через $ \lambda_<1>^K,\dots,\lambda_n^K $. В частности, это справедливо и для первого элемента: $$ y_<1>^<[K]>=C_1\lambda_1^K+C_2\lambda_2^K+\dots+C_n\lambda_n^K \ . $$ В этом представлении $ \_^n $ — будут константами из $ \mathbb C_<> $ в случае если все собственные числа являются простыми, и полиномами из $ \mathbb C[K] $ в случае, если имеются кратные собственные числа. Действительно, в первом случае существует базис пространства $ \mathbb C^n $, состоящий из собственных векторов матрицы $ A_<> $: $$ A<\mathfrak X>_j=\lambda_j<\mathfrak X>_j \quad npu \quad j\in \ <1,\dots,n\>. $$ Вектор $ Y_0 $ можно разложить по этому базису: $$Y_0=\alpha_1<\mathfrak X>_1+\dots+\alpha_n<\mathfrak X>_n \ .$$ Тогда последовательным домножением на матрицу $ A_<> $ получаем : $$\begin Y_1=AY_0&=& \alpha_1 \lambda_1<\mathfrak X>_1+\dots+\alpha_n\lambda_n<\mathfrak X>_n, \\ \dots & & \dots \\ Y_K=A^KY_0&=& \alpha_1 \lambda_1^K<\mathfrak X>_1+\dots+\alpha_n\lambda_n^K<\mathfrak X>_n \end $$ откуда и следует доказываемое равенство.

Во втором случае — когда имеются кратные собственные числа матрицы $ A_<> $ — придется применять «тяжелую артиллерию» в виде жордановой нормальной формы; см. теорему $ 5 $ ☞ ЗДЕСЬ. Для простоты рассуждений, будем в оставшейся части доказательства считать все собственные числа матрицы различными. Имеем тогда $$ \lim_ \frac^<[K+1]>>^<[K]>>= \lim_ \frac <\lambda_1^\left[C_1+ C_2(\lambda_2/\lambda_1)^+\dots+ C_n(\lambda_n/\lambda_1)^ \right]> <\lambda_1^\left[C_1+C_2(\lambda_2/\lambda_1)^+\dots+ C_n(\lambda_n/\lambda_1)^ \right]> =\lambda_1 $$ поскольку $$ \lim_ \left| \frac<\lambda_j> <\lambda_1>\right|^K = 0 \quad npu \quad j\in \ <2,\dots,n\>\ . $$ Исключительным случаем является ситуация $ C_1=0 $, в этом случае утверждение теоремы может оказаться несправедливым 13) . ♦

Как правило, вектор

$$ \left[1, \lim_\frac^<[K]>>^<[K]>>,\dots, \lim_\frac^<[K]>>^<[K]>>\right]^<^<\top>> $$ будет собственным, принадлежащим максимальному по модулю собственному числу матрицы $ A_<> $.

Пример. Для матрицы

$$ A=\left(\begin 2 & 3 &-1\\ 7 & 3 & 3 \\ -1 & -2 & -4 \end \right) $$ найти максимальное по модулю собственное число и принадлежащий ему собственный вектор.

Решение. Возьмем в качестве стартового столбца $ Y_0=[1,0,0]^<^<\top>> $. Имеем: $$ Y_1=AY_0=\left( \begin 2 \\ 7 \\ -1 \end \right),\ Y_2=AY_1=\left( \begin 26 \\ 32 \\ -12 \end \right),\ Y_3=AY_2=\left( \begin 160 \\ 242 \\ -42 \end \right),\dots, $$ $$ Y_<19>=\left( \begin <\scriptstyle 4259667747238636>\\ <\scriptstyle 6435097324667832>\\ <\scriptstyle -1571397155909260>\end \right),\ Y_<20>=AY_<19>=\left( \begin <\scriptstyle 29396024624390028>\\ <\scriptstyle 44408774736946168>\\ <\scriptstyle -10844273772937260>\end \right) $$ Смотрим на отношения первых элементов векторов: $$ \begin K & 1 & 2 & 3 & 4 & 5 & \dots & 15 & \dots & 19 \\ \hline y_<1>^<[K+1]>/y_<1>^ <[K]>& 2 & 13 & 6.153846 & 6.8 & 7.180147 & \dots & 6.900726 & \dots & \mathbf<6.90101>_ <\displaystyle 3>\end $$ Далее, в соответствии со следствием, собственный вектор, принадлежащий найденному числу $$ \approx \left[1, \frac^<[20]>>^<[20]>>,\frac^<[20]>>^<[20]>>\right]^<^<\top>> \approx \left[1, 1.51070_<\displaystyle 6>, -0.368902 \right]^<^<\top>> $$ ♦

Теперь обсудим исключительные случаи алгоритма.

1. Нарушение сходимости итерационного процесса за счет неудачного выбора стартового вектора. Если в качестве $ Y_ <0>$ оказался случайно взят собственный вектор $ \mathfrak X_ <\ast>$ матрицы $ A_<> $, принадлежащий произвольному ее собственному числу $ \lambda_ <*>$, то предел последовательности из теоремы будет равен именно этому числу; если при этом $ |\lambda_ <*>| \ne \max_ <1\le j \le n>| \lambda_j | $, то мы выйдем за пределы смысла выражения «как правило». Понятно, что вероятность настолько плохого выбора нулевая, но и выбор $ Y_0 $ вблизи $ \mathfrak X_ <\ast>$ также может существенно замедлить скорость сходимости. Поэтому если возникает ситуация медленной «стабилизации» значащих цифр в десятичном приближении собственного числа, попробуйте сменить начальный вектор.

2. Нарушение условия предположения , выдвинутого в начале пункта: максимальное по модулю собственное число неединственно.

Пример. Найти максимальное по модулю собственное число матрицы примера Леверье

$$ A=\left(\begin -5.509882&1.870086&0.422908&0.008814 \\ 0.287865&-11.811654&5.711900&0.058717 \\ 0.049099&4.308033&-12.970687&0.229326 \\ 0.006235&0.269851&1.397369&-17.596207 \end \right) \ . $$

Решение. Для столбца $ Y_0=[1,0,0,0]^<^<\top>> $ имеем $$y_<1>^<[100]>/y_<1>^<[99]>=-17.8_ <\displaystyle 3113>\ ,$$ т.е. на $ 100 $-й итерации получаем лишь $ 3_<> $ истинные десятичные цифры в представлении собственного числа. При этом компонентами векторов $ Y_ $ являются числа порядка $ 10^ <123>$. Если мы посмотрим на ответ примера Леверье, то увидим, что имеются два собственных числа матрицы, близких по модулю. ♦

К сожалению, вероятность того факта, что у случайно выбранной матрицы два ее собственных числа будут иметь одинаковый модуль становится ненулевой если эта матрица выбирается из множества вещественных матриц. Дело в том, что в этом случае ее характеристический полином будет иметь вещественные коэффициенты, а мнимые корни такого полинома всегда пáрные — для любого невещественного корня $ \lambda_<\ast>^<> $ полинома, комплексно сопряженное к нему число $ \overline<\lambda_<\ast>> $ также будет корнем. При этом $ |\lambda_<\ast>|= |\overline<\lambda_<\ast>> | $.

Пример. Для матрицы

Предположение 2 . Пусть два максимальных по модулю собственных числа матрицы разнесены по величине, например $$ |\lambda_1| > | \lambda_2 | > | \lambda_ j | \quad npu \ j \in \ <2,\dots, n \>. $$

Обобщение степенного метода основывается на использовании последовательностей из каких-то двух компонент векторов $ Y_=AY_K $, например, наряду с уже использованной выше последовательностью первых компонент $$y_<1>^<[1]>,y_<1>^<[2]>,\dots,y_<1>^<[K]>,\dots $$ возьмем еще и аналогичную для вторых: $$y_<2>^<[1]>,y_<2>^<[2]>,\dots,y_<2>^<[K]>,\dots $$

Теорема 26 [Эйткен]. При практически любом выборе стартового вектора $ Y_0 \ne \mathbb O $ для последовательности

Доказательство. Построим квадратное уравнение $$ p_0x^2+p_1x+p_2 = 0 $$ имеющее корнями $ \lambda_1 $ и $ \lambda_2 $. Если существует базис рпостранства $ \mathbb C^n $ $$Y_0=\alpha_1<\mathfrak X>_1+\alpha_2<\mathfrak X>_2+\dots+\alpha_n<\mathfrak X>_n \ .$$ Тогда последовательным домножением на матрицу $ A_<> $ получаем : $$\begin Y_K=& \alpha_1 \lambda_1^K<\mathfrak X>_1 &+\alpha_2 \lambda_2^K<\mathfrak X>_2+\dots &+\alpha_n\lambda_n^K<\mathfrak X>_n, \\ Y_=& \alpha_1 \lambda_1^<\mathfrak X>_1 &+\alpha_2 \lambda_2^<\mathfrak X>_2+\dots &+\alpha_n\lambda_n^<\mathfrak X>_n,\\ Y_=& \alpha_1 \lambda_1^<\mathfrak X>_1 & +\alpha_2 \lambda_2^<\mathfrak X>_2+\dots &+\alpha_n\lambda_n^<\mathfrak X>_n. \end $$ Отбрасываем из правых частей равенств слагаемые порядков возрастания ниже, чем $ \lambda_2^K, \lambda_2^, \lambda_2^ $ соответственно, домножаем получившиеся приближенные равенства $$\begin Y_K & \approx \alpha_1 \lambda_1^K<\mathfrak X>_1 &+\alpha_2 \lambda_2^K<\mathfrak X>_2, & \color \times p_2 \\ Y_& \approx \alpha_1 \lambda_1^<\mathfrak X>_1 &+\alpha_2 \lambda_2^<\mathfrak X>_2, & \color \times p_1\\ Y_ & \approx \alpha_1 \lambda_1^<\mathfrak X>_1 & +\alpha_2 \lambda_2^<\mathfrak X>_2, & \color \times p_0 \end $$ и складываем: $$ p_2 Y_K + p_1Y_ + p_0 Y_ \approx \mathbb O \, . $$ В получившемся векторном равенстве выбираем первые две компоненты: $$ \left\< \begin p_2 y_1^ <[K]>+ p_1 y_1^ <[K+1]>+ p_0 y_1^ <[K+2]>\approx 0 \, , \\ p_2 y_2^ <[K]>+ p_1 y_2^ <[K+1]>+ p_0 y_2^ <[K+2]>\approx 0 \, , \end \right. $$ которые и позволят определить приближенное значение набора $ p_0,p_1,p_2 $. С точностью до числового сомножителя, искомый полином можно представить в виде определителя $$ p_0x^2+p_1x+p_2 \approx \left|\begin y_1^ <[K]>& y_1^ <[K+1]>& y_1^ <[K+2]>\\ y_2^ <[K]>& y_2^ <[K+1]>& y_2^ <[K+2]>\\ 1 & x & x^2 \end \right| \, . $$ Формулы Виета завершат доказательство. ♦

При выполнении условия предположения 2 имеет место равенство

Пример. Для матрицы

$$ A=\left(\begin 2 & 3 &-1\\ 7 & 3 & 3 \\ -1 & -2 & 4 \end \right) $$ найти первые два по порядку убывания модулей собственных числа.

Задачи

Источники

[2]. Уилкинсон Дж.Х. Алгебраическая проблема собственных значений. М.Наука. 1970, с.93-94

[3]. Фаддеев Д.К., Фаддеева В.Н. Вычислительные методы линейной алгебры. М.ГИФМЛ. 1960

[4]. Хорн Р., Джонсон Ч. Матричный анализ. М.Мир.1989

Характеристического полинома

Найдем решение однородного разностного уравнения в виде , где z – некоторое число. Подставляя x(t) в разностное уравнение (2.1) при f(t)=0 и сокращая на z t , получаем характеристическое уравнение

.

Если его корни z1, z2 вещественные и различные, то общее решение имеет вид

.

Если z1 = z2, то в решении появляется линейный множитель

.

В случае пары комплексно-сопряженных корней z1,2 = a±ib решение может быть записано в вещественной форме

.

Здесь r – модуль комплексного числа z1, а j – его аргумент.

Формулы для уравнений более высоких порядков выглядят также, просто увеличивается число слагаемых в решении.

Пример 1. Решим разностное уравнение .

Характеристическое уравнение имеет вид .

Его корни вещественные и различные: z1 = 3, z2 = 2.

Общее решение: .

Пример 2. Решим разностное уравнение .

Характеристическое уравнение имеет вид .

Его корни комплексные: .

Их положение на комплексной плоскости z1,2 = a±ib показано на рис. 2.1.

Модуль и аргумент корней можно найти непосредственно на рис. 2.1:

r = 2, . Общее решение: .

Произвольные постоянные сі находят, задавая начальные условия. Пусть, например, в примере 2 заданы начальные условия х(0)=2; х(1)=4. Записываем общее решение для t=0 и t=1:

.

Рис. 2.1. Модуль и аргумент корней

Отсюда находим с2 = 2, с1 = . Следовательно, решение имеет вид .

Общее решение неоднородного разностного уравнения представляет собой сумму общего решения соответствующего однородного уравнения и любого частного решения неоднородного уравнения. Частное решение ищут в том же виде, что и правая часть, т.е. функция f(t) в уравнении (2.1):

– если f(t) – постоянная, то в виде константы;

– если f(t) – экспонента, то в виде экспоненты с тем же показателем;

– если f(t) =sin kt или cos kt, то в виде c1sinkt+c2coskt.

Коэффициенты с1 и с2 находят, подставляя частные решения в разностное уравнение и приравнивая одноименные функции справа и слева.

Пример 3. Дано неоднородное разностное уравнение второго порядка

.

Находим корни характеристического полинома

.

Частное решение ищем в виде хчаст. Подставляя его в исходное уравнение, находим, что хчаст=2.

Общее решение неоднородного уравнения получаем как сумму частного решения и общего решения соответствующего однородного уравнения

.

Коэффициенты с1, с2 находим из уравнений 1=2+с2, , откуда .

1.2. Решение разностных уравнений с помощью z-преобразования

При описании дискретных систем и решении разностных уравнений широко применяется аппарат z-преобразования – это дискретный аналог преобразования Лапласа. Например, умножение изображения F(p) на оператор Лапласа р соответствует дифференцированию непрерывной функции f(t). Умножение изображения F(z) на оператор z соответствует сдвигу функции f(t) (которая может быть непрерывной, дискретной или решетчатой) на один такт.

Таким образом, если операторы р и 1/р – это операторы дифференцирования и интегрирования, то операторы z и z -1 – это операторы сдвига влево и вправо. С инженерной точки зрения оператор z -1 представляет собой элемент задержки.

Существуют также определенные параллели между изображениями функций F(p) и F(z). Например, изображению по Лапласу F(p) = 1 соответствует дельта-функция f(t) = d(t), а изображению F(z) = 1, соответствует единичный импульс. В том и другом случае оригиналом является элементарное импульсное воздействие.

Краткая таблица z-преобразований других функций приведена на стр.22 (табл.1.2).

Пусть дано разностное уравнение n-го порядка

(2.3)

с начальными условиями .

Алгоритм его решения с помощью z-преобразования следующий:

– применим z-преобразование к уравнению (2.3), заменяя f(t) на F(z), y(t) на Y(z); y(t+1) на z(Y(z)-y0) и т.д.;

– из полученного алгебраического уравнения выразим Y(z);

– выполним разложение Y(z) на простые дроби;

– пользуясь табл.1.2 (стр.22), выполним обратное z-преобразование.

Результатом будет искомое решение разностного уравнения.

Пример 4. Требуется решить разностное уравнение второго порядка

с нулевыми начальными значениями y0, y1 и входным сигналом un = 1.

– применяем к нему z-преобразование

;

– выражаем Y(z) и подставляем :

;

– представляем правую часть в виде суммы простых дробей с переменной z в числителе:

,

разложение можно выполнить методом неопределенных коэффициентов или в пакете Matlab с помощью команды [R,P,K]=residue(B,А),где векторы В и А – коэффициенты полиномов числителя и знаменателя в порядке убывания степени z; синтаксис команды residueдля Y(z) данного примера следующий: [R,P,K]=residue([1],[1 -6 11 -6]),в результате получим R – коэффициенты числителей суммы простых дробей, P – знаменатели простых дробей, K – свободный член;

– с помощью z-преобразований (табл.1.2, стр.22) или команды iztrans тулбокса SYMBOLIC пакета Matlab находим оригиналы каждого из слагаемых и суммируем их: .

МЕТОДИЧЕСКИЕ УКАЗАНИЯ

Задание и таблица вариантов

Дискретная система задана неоднородным разностным уравнением вида . Для ее исследования необходимо решить заданное разностное уравнение с помощью характеристического полинома (см. п.1.1).

Коэффициенты разностного уравнения a и b указаны в табл. 2.1.

Таблица вариантов 2.1

Коэффициенты a и b разностного уравнения

Задание и таблица вариантов

Дискретная система задана неоднородным разностным уравнением вида . Необходимо найти реакцию системы на входной сигнал un = 1, решив разностное уравнение, используя z-преобразование и последовательно рассчитав точки y2, …, y5 (см. п.1.2).

Коэффициенты разностного уравнения a и b указаны в табл. 2.2.

Таблица вариантов 2.2

Коэффициенты a и b разностного уравнения

b-1.3-0.7-0.2-2-1.61.6-1.61.9-2.82.5
a0.3-0.6-0.480.960.60.550.480.61.8
b0.5-0.72-1.28-22.88-0.5-0.72-1.28-2-2.88
a-0.27-0.4-0.7-1.11.6-0.25-0.37-0.66-1.11.5

Привести числовое решение разностного уравнения, дискретную передаточную функцию, ее разложение на простые дроби и график yn.

Контрольные вопросы

Даны разностные уравнения:

1) ,2) ,
3) ,4) ,
5) ,6) ,
7) ,8) ,
9) ,10)
11) ,12) ,
13) 14)

Требуется решить уравнение:

а) с помощью характеристического уравнения;

корней характеристического уравнения

Одним из косвенных показателей качества систем управления является степень удаленности корней характеристического уравнения замкнутой САУ от мнимой оси комплексной плоскости. Пусть ближайшие к мнимой оси комплексно-сопряженные корни устойчивой системы имеют значение

. (7.1)

Расстояние (рис. 8.2) ближайших к мнимой оси комплексно-сопряженных корней называется степенью устойчивости системы.

Угол φ, образуемый лучами, проведенными из начала координат через эти корни, характеризует колебательность системы. Степенью колебательности системы (коэффициентом затухания колебаний) называют количественную характеристику, определяемую выражением

. (7.2)

Чтобы система обладала заданной колебательностью, все корни характеристического уравнения должны вписываться в угол 2φ (см. рис. 7.2). Для большинства систем управления допустимое перерегулирование не должно превышать (10…20)%, что соответствует m=0,2…0,5.

Рис. 7.2. Область расположения корней

с заданными показателями и

При корневых методах оценки качества системы, т. е. по расположению корней характеристического полинома, исходят из следующих соображений.

Решение однородного уравнения, характеризующего свободное движение системы, представляет собой сумму затухающих экспонент вида (6.2). Полагая, что качество САУ в основном определяется ближайшим к мнимой оси вещественным корнем или ближайшей к мнимой оси парой комплексно-сопряженных корней (доминирующих корней), можно записать

.

Полагая, что зона δ установления переходного процесса составляет (2…5)% от установившегося значения , можно найти требуемое соотношение степени устойчивости системы и времени регулирования tр:

. (7.3)

Следовательно, задаваясь временем регулирования, можно рассчитать минимальное (по модулю) значение вещественных частей корней характеристического уравнения.

Аналогично можно связать степень колебательности m системы со степенью затухания колебаний. Пусть по условиям технологии требуется, чтобы каждая последующая амплитуда колебаний затухала в k раз по сравнению с предыдущей. Тогда

. (7.4)

Пусть k=10, тогда в соответствие с (7.4) получим m=0,336 и

.

Таким образом, задаваясь временем регулирования и соотношением амплитуд колебаний k, можно определить допустимую область расположения корней на комплексной плоскости или решить обратную задачу расчета параметров и k переходного процесса по расположению доминирующих корней характеристического уравнения. Следует отметить, что данный подход дает приемлемую точность оценки качества регулирования, если действительные части остальных корней характеристического уравнения больше действительной части доминирующих корней, по крайней мере, в 5 раз [6].

Для построения в плоскости параметров областей, обеспечивающих требуемые показатели качества регулирования целесообразно использовать метод D-разбиения [6]. В качестве примера используем уравнение Вышнеградского, описывающего в параметрической форме характеристический полином 3-го порядка,

. (7.5)

где A и B – обобщенные параметры характеристического уравнения.

Подставим выражение для комплексного корня в (7.5). Тогда получим

.

Приравнивая нулю вещественную и мнимую части, получим

, (7.6)

Полагая в (7.6), получим границу области устойчивости системы в параметрической форме

(7.7)

— уравнение гиперболы Вышнеградского (кривая 1, рис. 7.3).

Рис. 7.3. Границы областей устойчивости,

колебательности и апериодичности на

Полагая в (7.6), получим границу области апериодичности системы в параметрической форме (кривые 2 и 3 на рис. 7.3)

.

Поскольку на кривой 1 ω ≠ 0, а на кривых 2 и 3 ω = 0, то области I и III являются областями комплексных, а область II – вещественных корней (см. рис. 7.3). Следовательно, если параметры A, B принадлежат области II, то переходные процессы имеют апериодический характер, причем, чем эти параметры больше, тем процессы более затянуты. Если параметры принадлежат области I, то переходные процессы имеют колебательный характер, причем, чем больше A и меньше B, тем выше колебательность. Область III является областью монотонности решения однородного дифференциального уравнения, соответствующего (7.5), а, следовательно, переходные процессы, имея колебательный характер, тем не менее, затухают монотонно (без перерегулирования).

Диаграмма Вышнеградского [19] помимо приведенных кривых содержит кривые равных вещественных частей комплексных корней (равной степени устойчивости), причем для двух случаев расположения корней, когда ближайшими к мнимой оси являются комплексные корни и, когда ближайшим к мнимой оси расположен вещественный корень (на рис. 7.3 эти кривые не показаны). В частности, на границе областей I и III (кривая 4) все три корня равно удалены от мнимой оси.

Требования повысить быстродействие и одновременно снизить перерегулирование в системе являются противоречивыми друг другу, что заставляет искать компромисс. В общем случае, с точки зрения переходного процесса наилучшей считается САУ, у которой все корни характеристического уравнения n-го порядка равны друг другу (на практике редко реализуется), т. е.

, i=1, 2, 3…n.

В этом случае перерегулирование не превышает 10%, а время нарастания регулирования является минимальным.

Если все корни являются вещественными, то система характеризуется отсутствием перерегулирования, т. е. апериодическими переходными процессами. Время регулирования будет тем меньше, чем меньше среднегеометрический корень или, иначе, чем ближе к мнимой оси расположен центр корней.

При анализе качества системы корневыми методами необходимо учитывать влияние нулей передаточной функции на переходный процесс.

Прежде всего, нужно проверить, насколько близки нули к полюсам.

Если нуль и полюс совпадают, то их нужно сократить, и они не будут влиять на качество системы. Порядок системы при этом, естественно, будет понижен.

Если полюсы и нули передаточной функции не совпадают, то полюсы определяют отдельные составляющие переходного процесса (апериодические и гармонические), а нули определяют удельный вес каждой из этих составляющих. Чем ближе нуль передаточной функции расположен к какому-либо полюсу, тем меньше его вклад в переходную характеристику составляющей, соответствующей данному полюсу.

7.2.2. Интегральные оценки качества

В основе интегральных оценок качества лежит предположение, что качество регулирования тем выше, чем меньше площадь между кривой переходного процесса и заданным значением регулируемой переменной. Интегральные оценки качества являются строгой математической формулировкой понятия качества системы, и их минимизация позволяет определить оптимальные параметры системы управления, т. е. решить задачу параметрического синтеза системы. Для этой цели применяются процедуры безусловной и условной оптимизации [2, 6, 10-12, 19-21].

Наибольшее применение для косвенной оценки качества САУ находят интегральные оценки вида [6, 11, 12, 19]:

; (7.8)

; (7.9)

; (7.10)

; (7.11)

, (7.12)

где — текущая ошибка регулирования, являющаяся функцией времени,

С – некоторый весовой коэффициент, характеризующий допустимую скорость изменения ошибки регулирования, а, следовательно, выходной координаты в переходном процессе.

В критерии (7.8) подынтегральное выражение линейно относительно ошибки регулирования и такая оценка применяется только для апериодического переходного процесса, когда ошибка имеет положительный знак.

Интегральная квадратичная оценка (ИКО) вида (7.9) применяется при колебательном характере переходных процессов, характеризующихся сменой знака ошибки регулирования. Интегральная квадратичная оценка (7.10) применяется в тех случаях, когда требуется учитывать ограничения энергии управления.

Широко используемым видом оценки качества является интеграл от модуля ошибки (ИМО) – (7.11), позволяющем учесть смену знака подынтегральной функции.

Чтобы уменьшить вклад начальной ошибки в интеграл (7.11) и учесть связанную с этим ошибку была предложена [6] оценка в виде интеграла от взвешенного модуля ошибки (ИВМО) в виде (7.12).

Рассмотрим пример. Пусть передаточная функция замкнутой системы 2-го порядка имеет вид:

, (7.13)

где — коэффициент затухания.

Нормированное значение собственной частоты принято . На рис. 7.4 приведены кривые, отражающие изменение двух из приведенных выше интегральных оценок системы (ИКО и ИВМО) в функции коэффициента затухания [6].

Рис. 7.4. Интегральные оценки

качества системы второго порядка

Как видим, оценка ИВМО по сравнению с ИКО имеет ярко выраженный минимум (хорошую избирательность), соответствующий = 0,707, что для данной системы 2-го порядка обеспечивает наиболее быстрое протекание переходного процесса с перерегулированием около 4,3%.

Рассмотрим еще один пример. Пусть передаточная функция замкнутой системы имеет достаточно общий вид нерекурсивного фильтра n-го порядка:

. (7.14)

Безусловная оптимизация систем первого-четвертого порядка (n=1…4), описываемых передаточными функциями (7.14), по критерию ИВМО дает оптимальные значения коэффициентов полиномов знаменателей этих передаточных функций, приведенные в табл. 7.1. Значения коэффициентов нормированы относительно собственной частоты колебаний .

На рис. 7.5 приведены кривые переходных процессов, соответствующих оптимальным по критерию ИВМО фильтрам первого-четвертого порядка.

Порядок системыПолином знаменателя передаточной функции
n=1
n=2
n=3
n=4

Значения коэффициентов нормированы относительно собственной частоты колебаний . На рис. 7.5 приведены кривые переходных процессов, соответствующие оптимизации фильтров первого-четвертого порядка по критерию ИВМО.

Рис. 7.5. Переходные характеристики, соответствующие

оптимизации систем по ИВМО

Графики построены в зависимости от нормированного времени .

Кроме приведенных оценок для оптимизации систем управления применяются и другие интегральные критерии качества, в частности, лежащие в основе синтеза фильтров Баттерворта, широко применяемых при настройке контуров электромеханических систем управления.

8. Метод пространства состояний

Широкое распространение компьютеров и мощных систем программирования побуждает к исследованию САУ во временной области, а, следовательно, к непосредственному использованию описания динамических систем управления в форме обыкновенных дифференциальных уравнений без перехода к операторной форме. Кроме того, как уже отмечалось, векторно-матричные формы описания и исследования применимы не только к одномерным, линейным, стационарным САУ, но и к широкому классу многомерных, нелинейных и нестационарных САУ.

Чтобы получить пригодную для компьютерного синтеза и анализа модель САУ, необходимо представить ее в переменных состояния системы, используя далеко не единственный набор переменных. Следует отметить, что описание систем во временной области в векторно-матричной форме лежит в основе современной теории управления и оптимизации. В настоящей главе рассмотрены вопросы применения метода пространства состояния к непрерывным системам управления.

8.1. Векторно-матричное описание САУ

Состояние системы – это совокупность значений переменных системы (координат состояния), существенных с точки зрения решаемой задачи. В общем случае, в это число включают не только выходные и внутренние переменные САУ, но и задающие воздействия, и доминирующие возмущающие воздействия внешней среды. Чем полнее достоверной информации о состоянии системы в текущий момент времени, тем проще определить будущие значения всех ее переменных. Инженерно-технический персонал, разрабатывающий и эксплуатирующий технические системы управления, оперирует, как правило, с такими физическими переменными, которые могут быть измерены с помощью соответствующих датчиков. К таким физическим переменным САУ относят ускорение, скорость, перемещение, давление, расход, температуру, уровень и т. п. Координатами датчиков технологических координат САУ являются другие переменные — напряжение, ток, частота следования импульсов, двоичный код и т. п., что дает исследователю возможность выбора для синтеза и анализа необходимого набора координат состояния САУ.

Векторно-матричная модель многомерной, нелинейной, нестационарной САУ записывается в виде [6, 10, 11, 19]

,

, (8.1)

где X(t), U(t),F(t), Y(t) – соответственно векторы состояния, управления, возмущения и выходных (управляемых) координат системы,

– вектор первых производных координат состояния,

– нелинейные, нестационарные функции координат состояния, управления и возмущения системы.

В уравнении (8.1) вектор управления U(t) является, в общем случае, некоторой нелинейной нестационарной функцией задающих координат, координат состояния и возмущения САУ и призван обеспечить оптимальное управление системой. Описание многомерных, нелинейных, нестационарных САУ в форме (8.1) не позволяет, как правило, получить инженерное решение задачи структурно-параметрического синтеза оптимального управления U(t) или такое решение приводит к неоправданным затратам на реализацию (в техническом или экономическом аспектах). В большинстве случаев такие модели сводят к одномерным или многомерным линейным (линеаризованным) квазистационарным моделям, для которых имеются развитые методы и инженерные методики синтеза оптимального управления.

Линейную (линеаризованную) модель многомерной стационарной (квазистационарной) САУ представляют в виде системы обыкновенных дифференциальных уравнений первого порядка в форме Коши:

,

, (8.2)

.

Эту же систему дифференциальных уравнений можно представить в векторно-матричной форме [6, 11, 19]:

, (8.3)

где — векторы (векторы-столбцы) соответственно состояния и управления САУ,

, ;

— символ транспонирования (иногда для обозначения транспонирования применяют буквенный символ “т”);

— стационарные матрицы соответственно состояния и управления,

, .

В общем случае, на объект управления помимо управляющих воздействий действуют возмущающие воздействия. В этом случае векторно-матричную модель системы представляют в виде

, (8.4)

где — вектор-столбец возмущающих воздействий САУ, C – стационарная матрица возмущений,

,

.

Выходные (управляемые) переменные не всегда непосредственно принадлежат вектору состояния. В линейных САУ они линейно связаны с переменными состояния, управляющими и возмущающими переменными. В этом случае к уравнениям (8.3), (8.4) присоединяют алгебраические линейные уравнения

(8.5)

или , (8.6)

где — вектор выходных переменных САУ, ;

K, L, M – стационарные матрицы соответственно размерностей (r n), (r m), (r d).

Следует отметить, что приведенные уравнения (8.1)…(8.6) дают описание лишь объекта управления или разомкнутой системы, если вектор управления U(t) не является функцией координат состояния САУ. В замкнутых линейных САУ управление обычно формируют как линейную форму координат состояния и, в общем случае, возмущения САУ.

В качестве примера приведем векторно-матричное описание ранее рассматриваемого электродвигателя постоянного тока как объекта регулирования по цепи якоря. Пусть выходной (регулируемой) координатой является скорость вращения двигателя. Полагая, что напряжение возбуждения , а магнитный поток , математическую модель электродвигателя можно представить в виде:

,

. (8.7)

Воспользуемся векторно-матричной моделью линейных САУ в виде (8.4), (8.5). Зададимся векторами состояния, управления и возмущения в виде:

; ;

(8.8)

По уравнениям (8.7) найдем матрицы состояния, управления и возмущения:

; ; . (8.9)

Поскольку выходная переменная всего одна и ей является координата состояния , уравнение выхода преобразуется к скалярной форме

. (8.10)

По описанию системы в форме векторно-матричных уравнений (ВМУ) можно непосредственно получить эквивалентную передаточную функцию (ПФ) и, наоборот, зная ВМУ системы, можно получить ее ПФ. Для этого в системе MATLAB имеется две функции: функция tf и функция ss.

Пусть ВМУ системы имеет вид (8.3), (8.5). Применительно к системе MATLAB ВМУ записывают в виде

Для получения ВМУ в системе MATLAB необходимо определить функцию ss(A,B,C,D). Для преобразования ВМУ к ПФ системы необходимо записать:

sys­_ss=ss(A,B,C,D); % Формирование ВМУ системы;

sys_tf=tf(sys­_ss), % Преобразование ВМУ к ПФ системы.

Для обратного преобразования ПФ к ВМУ необходимо записать:

sys_tf=tf(num,den); % Формирование ПФ системы;

sys_ss=ss(sys_tf); Преобразование ПФ к ВМУ системы.

Рассмотрим пример. Пусть ПФ системы имеет вид

.

Тогда запишем скрипт преобразования ПФ к ВМУ и обратного преобразования ВМУ к ПФ:

sys_tf=tf(num,den); % Формирование ПФ системы;

sys_ss=ss(sys_tf); %Преобразование ПФ к ВМУ системы;


источники:

http://lektsii.org/6-12986.html

http://poisk-ru.ru/s49289t1.html