Линейные операторы
1. Понятие линейного оператора
Пусть R и S линейные пространства, которые имеют размерность n и m соответственно. Оператором A действующим из R в S называется отображение вида , сопоставляющее каждому элементу x пространства R некоторый элемент y пространства S. Для этого отображения будем использовать обозначение y= A(x) или y= Ax.
Определение 1. Оператор A действующий из R в S называется линейным, если для любых элементов x1 и x2 пространства R и любого λ из числового поля K выполняются соотношения
Если пространство S совпадает с пространством R, то линейный оператор, который действует из R в R называют линейным преобразованием пространства R.
Пусть заданы два векторных пространства n-мерный R и m-мерный S, и пусть в этих пространствах заданы базисы и соответственно. Пусть задано отображение
y=Ax, | (1) |
где A — m×n -матрица с коэффициентами из поля K. Тогда каждому элементу из R соответствует элемент y=Ax из S. Отображение (1) определяет оператор A. Покажем, что этот оператор обладает свойством линейности. Действительно, учитывая свойства умножения матриц, можно записать:
, | (2) |
. |
Покажем теперь обратное, т.е. что для любого линейного оператора A, отображающего пространство R в S и произвольных базисов и в R и S соответственно, существует такая матрица A с элементами из численного поля K, что определяемое этой матрицей линейное отображение (1) выражает координаты отображенного вектора y через координаты исходного вектора x.
Пусть x − произвольный элемент в R. Тогда
(3) |
является разложением x в по базису .
Применим оператор A к базисным векторам :
(4) |
где aij − координаты полученного вектора в базисе .
Тогда применяя оператор A к элементу x и учитывая (3) и (4), имеем
Сделаем следующее обозначение:
(6) |
Тогда равенство (5) примет следующий вид:
(7) |
Из равенства (7) следует, что любой элемент из пространства R при отображении оператором A, в пространстве S и в базисе имеет координаты yi, i=1,2. m. В свою очередь, из (6) следует, что этим координатам соответствуют линейные комбинации координатов элемента xj, j=1,2. n с коэффициентами aij i=1,2. m; j=1,2. n.
Построим матрицу A с элементами aij:
(8) |
Тогда выражение (6) можно записать в матричном виде:
y=Ax. | (9) |
Матрица A называется матрицей линейного оператора в заданных базисах и .
2. Сложение линейных операторов
Пусть A и B два линейных оператора действующих из R в S и пусть A и B — mxn − матрицы соответствующие этим операторам.
Определение 2. Суммой линейных операторов A и B называется оператор C, определяемый равенством
Cx= Ax+ Bx, x∈R, | (10) |
где x∈R означает, что x принадлежит пространстве R.
Сумма линейных операторов обозначается так C=A+B. Легко убедится, что сумма линейных операторов также является линейным оператором.
Применим оператор C к базисному вектору ej, тогда:
Cej= Aej+ Bej= | n | (aij+bij) ej |
∑ | ||
j= 1 |
Следовательно оператору C отвечает матрица ,где i=1,2. m, j=1,2. n, т.е.
C=A+B. | (11) |
3. Умножение линейных операторов
Пусть заданы три линейных пространства R, S и T. Пусть линейный оператор B отображает R в S, а линейный оператор A отображает S в T.
Определение 3. Произведением операторов A и B называется оператор C, для которого выполняется следующее равенство при любом x из R:
Cx= A( Bx), x ∈ R. | (12) |
Произведение линейных операторов обозначается C=AB. Легко убедится, что произведение линейных операторов также является линейным оператором.
Таким образом оператор C отображает пространство R в T. Выберем в пространствах R, S и T базисы и обозначим через A, B и C матрицы операторов A, B и C соответствующие этим базисам. Тогда отображения линейных операторов A, B, C
y=Bx, z=Ay, z=Cx |
можно записать в виде матричных равенств
y=Bx, z=Ay, z=Cx |
где x, y, z − векторы x, y, z − представленные в виде координатных столбцов. Тогда
Cx=A(Bx)=(AB)x. |
Учитывая произвольность х, получим
C=AB. | (13) |
Следовательно произведению операторов C=AB соответствует матричное произведение C=AB.
4. Умножение линейного оператора на число
Пусть задан линейный оператор A отображающий R в S и некоторое число λ из поля K.
Определение 4. Произведением оператора A на число λ называется оператор C, для которого выполняется следующее равенство при любом x из R:
Cx=λ ( Ax) | (14) |
Таким образом оператор C отображает пространство R в S. Выберем в пространствах R и S базисы и обозначим через A матрицу оператора A соответствующее этим базисам векторные равенства
y=Ax, z=λy, z=Cx |
можно записать в виде матричных равенств
y=Ax, z=λy, z=Cx |
где x, y, z − векторы x, y, z − представленные в виде координатных столбцов. Тогда
Cx=λ(Ax)=(λA)x. |
Учитывая произвольность х, получим
C=λA. | (15) |
Следовательно произведению оператора C на число λ соответствует произведение матрицы A на число λ.
5. Нулевой оператор
Оператор, отображающий все элементы пространства R в нулевой элемент пространства S называется нулевым оператором и обозначается через O. Действие нулевого оператора можно записать так:
6. Противоположный оператор
Противоположным оператору A называется оператор −A удовлетворяющий равенству:
7. Ядро линейного оператора
Определение 5. Ядром линейного оператора A называется множество всех тех элементов x пространства R, для которых выполняется следующее равенство: Ax=0.
Ядро линейного оператора также называют дефектом оператора. Ядро линейного оператора обозначается символом ker A.
8. Образ линейного оператора
Определение 6. Образом линейного оператора A называется множество всех элементов y пространства R, для которых выполняется следующее равенство: y=Ax для всех x из R.
Образ линейного оператора обозначается символом im A.
9. Ранг линейного оператора
Определение 7. Рангом линейного оператора A обозначаемое символом rang A называется число равное размерности образа im A оператора A, т.е.: rang A=dim(im A).
VMath
Инструменты сайта
Основное
Навигация
Информация
Действия
Содержание
Линейный оператор
Линейное отображение линейного (векторного) пространства $ \mathbb V_<> $ в себя $$ \mathcal A : \mathbb V \longmapsto \mathbb V $$ называется линейным преобразованием $ \mathbb V_<> $ или линейным оператором 1) на $ \mathbb V_<> $.
Напомню свойство линейности: $$ \mathcal A (X_1 +X_2)= \mathcal A(X_1) + \mathcal A(X_2),\quad \mathcal A (\alpha_1 X_1)= \alpha_1 \mathcal A (X_1), $$ или, в эквивалентном виде: $$ \mathcal A(\alpha_1 X_1 + \alpha_2 X_2)= \alpha_1 \mathcal A(X_1) + \alpha_2 \mathcal A(X_2) $$ для $ \forall \ \
Примеры линейных операторов
Бóльшую часть примеров пункта ☞ ПРИМЕРЫ ЛИНЕЙНЫХ ОТОБРАЖЕНИЙ представляют именно линейные операторы. Укажу еще несколько, к которым буду часто обращаться.
Пример 1. В пространстве $ \mathbb R^ <3>$ рассмотрим следующие действия над вектором 2) $ (x_<>,y,z) $:
Все это — примеры линейных операторов. Но вот отображение сдвига $ (x,y,z) \mapsto (x+1,y,z+2) $ оператором не является поскольку $$ <\color
Пример 2. В пространстве $ \mathbb R^ <3>$ отображение ортогонального проецирования на плоскость $ x+y-7\, z=0 $ будет линейным оператором (а вот на плоскость $ x+y-7\, z=1 $ — не будет!). Вообще, в произвольном пространстве $ \mathbb V_<> $ разбитом в прямую сумму нетривиальных подпространств $ \mathbb V= \mathbb V_1 \oplus \mathbb V_2 $ отображение, сопоставляющее вектору $ X_<> $ его проекцию на подпространство $ \mathbb V_1 $ параллельно подпространству $ \mathbb V_2 $, будет оператором.
Пример 3. В пространстве $ \mathbb P_3 $ полиномов с вещественными коэффициентами степеней $ \le 3 $ отображение $ \mathcal A_<> $ действует по правилу
$$ \mathcal A (f(x)) = f(x) (x^2-2) \pmod
Пример 4. Задачу интерполяции можно интерпретировать как построение некоторого отображения. В интерполяционной таблице
$$ \begin
По аналогии с задачей алгебраической интерполяции, можно поставить и задачу тригонометрической интерполяции. Имеем здесь «точку входа» в теорию дискретного преобразования Фурье. ♦
В пространстве $ \mathbb P_2 $ оператор действует следующим образом:
$$ \mathcal A (x^2+x+1) =2\,x+1,\ \mathcal A (x^2-x-1) =2\,x^2-1,\ \mathcal A (x+1) =-x^2+x+1 \ . $$ Вычислить $ \mathcal A (x^2) $ и $ \mathcal A (x^2+1) $.
Пример 5. В пространстве полиномов степени не выше $ n_<> $ с вещественными коэффициентами от $ m_<> $ переменных $ x_1,x_2,\dots,x_
$$ f(x_1,x_2,\dots,x_m) \mapsto \frac<\partial^2 f> <\partial x_1^2>+\frac<\partial^2 f><\partial x_2^2>+ \dots+ \frac<\partial^2 f> <\partial x_m^2>$$ яыляется линейным оператором. Этот оператор известен как оператор Лапласа и для него используется символьное обозначение $$ \Delta = \frac<\partial^2 > <\partial x_1^2>+\frac<\partial^2 ><\partial x_2^2>+ \dots+ \frac<\partial^2 > <\partial x_m^2>\, . $$
Пример 6. В линейном пространстве квадратных матриц порядка $ n_<> $ с вещественными элементами рассмотрим коммутирующее отображение
$$ \mathcal K (X) = AX-XA \ , $$ а также отображение Ляпунова $$ \mathcal V (X) = A^<\top>X+XA $$ при произвольной фиксированной квадратной матрице $ A_<> $ и $ <>^ <\top>$ означающем транспонирование. Легко проверить, что оба отображения $ \mathcal K $ и $ \mathcal V $ являются операторами. ♦
Основные определения
Все введенные для линейного отображения понятия переносятся на этот частный случай. Например, ядром оператора называется множество векторов, отображаемых оператором в нулевой вектор: $$\mathcal
Теорема 1. Множества $ \mathcal
Доказать, что для оператора в $ \mathbb R^4 $
$$ \mathcal A \left(\begin
Для оператора $ \mathcal A_<> $ его дефектом его называется размерность ядра, а его рангом — размерность образа: $$ \operatorname
Пример. В пространстве $ \mathbb R^ <3>$ оператор проецирования на плоскость:
$$ \mathcal A \left(x, y, z\right) \longmapsto \left(x, y, 0 \right) $$ является вырожденным поскольку его ядро нетривиально: $ \mathcal
Следующий результат является следствием теоремы $ 4 $ из ☞ ПУНКТА.
Теорема 2. Имеет место равенство:
$$ \dim \mathbb V=\dim \left( \mathcal
Говорят, что операторы $ \mathcal A $ и $ \mathcal B $ коммутируют если $ \mathcal A \, \mathcal B = \mathcal B \, \mathcal A $.
Пример. В пространстве полиномов $ \mathbb P_
$$\mathcal A = x\frac
Оператор $ \mathcal E $, отображающий произвольный вектор $ X\in \mathbb V_<> $ в себя : $ \mathcal E(X)= X $, называется тождественным на $ \mathbb V_<> $. Оператор $ \mathcal B $ называется (левым) обратным оператору $ \mathcal A_<> $, если $ \mathcal B\mathcal A=\mathcal E $. В этом случае оператор $ \mathcal A_<> $ называют обратимым и записывают: $ \mathcal B=\mathcal A^ <-1>$.
Не всякий оператор обратим.
Пример. В пространстве $ \mathbb R^ <3>$ для оператора проецирования на плоскость:
$$ \mathcal A \left(x, y, z\right) \longmapsto \left(x, y, 0 \right) $$ обратного не существует, т.к. $ \mathcal A(0,0,1)=(0,0,0) $ и ни при каком выборе оператора $ \mathcal B $ нельзя добиться выполнения равенства $ \mathcal B(0,0,0)=(0,0,1) $. ♦
Показать, что обратным для оператора
$$\frac<1>
Теорема 4. Оператор $ \mathcal A_<> $ обратим тогда и только тогда, когда когда он невырожден: $ \operatorname
При $ K\in \mathbb N $ и $ K>1 $, $ K_<> $-я степень оператора $ \mathcal A $ определяется рекурсивной формулой $$\mathcal A^<\, K>=\mathcal A (\mathcal A^<\, K-1>)\ .$$ Если, вдобавок, $ \mathcal A $ невырожден, то отрицательная степень оператора определяется формулой $$\mathcal A^<-K>=\left(\mathcal A^<-1>\right)^K \ . $$ Полагают также $ \mathcal A^<\, 0>= <\mathcal E>$ для любого $ \mathcal A \ne <\mathcal O>$.
Теорема 5. Степени оператора $ \mathcal A $ коммутируют:
$$\mathcal A^ <\, K>\mathcal A^<\, L>=\mathcal A^<\, L>\mathcal A^<\, K>=\mathcal A^ <\, K+L>\ .$$
Пример. $ K_<> $-й степенью оператора дифференцирования в пространстве полиномов $ \mathbb P_
$$\left( \frac
Пример. В произвольном пространстве $ \mathbb V_<> $ разбитом в прямую сумму нетривиальных подпространств $ \mathbb V= \mathbb V_1 \oplus \mathbb V_2 $ оператор проецирования $ \mathcal P $ на подпространство $ \mathbb V_1 $ параллельно подпространству $ \mathbb V_2 $ обладает свойством $ \mathcal P^2 = \mathcal P $ (проецирование проекции оставляет ее на месте). ♦
Оператор $ \mathcal A $, обладающий свойством $ \mathcal A^2 = \mathcal A $, называется идемпотентным 3) .
Пример. В пространстве $ \mathbb P_3 $ полиномов с вещественными коэффициентами степени $ \le 3 $ отображение $ \mathcal A_<> $ действует по правилу
$$ \mathcal A (f(x)) = f(x) (x^2-2) \pmod \subset \mathbb R[x] $ и $ \deg r(x) \le 3 $, то $$ f(x)(x^2-2)^2 \equiv q(x)(x^4-x^3-x^2+x)(x^2-2)+ r(x)(x^2-2) \ . $$ Но тогда $$ \mathcal A^2 (f(x))= \mathcal A (r(x)) = r(x) (x^2-2) \pmod
Пусть задан произвольный полином $ g(x)=b_<0>x^m+b_1x^
Доказать, что операторные полиномы коммутируют: $ g_1(\mathcal A )g_2(\mathcal A )=g_2(\mathcal A )g_1(\mathcal A ) $.
Доказать, что для любого $ \mathcal A \in <\mathcal H>om(\mathbb V,\mathbb V) $ всегда найдется полином $ g_<>(x) $, $ \deg g \le n^2+1 $ такой, что $ g(\mathcal A)= <\mathcal O>$.
Сформулируем еще один результат, являющийся частным случаем приведенного в пункте ☞ СВОЙСТВА ЛИНЕЙНЫХ ОТОБРАЖЕНИЙ.
Теорема 6. Пусть $ \
$$ \mathcal A(X_1)=Y_1,\mathcal A(X_2)=Y_2, \dots,\mathcal A(X_n)=Y_n \ .$$
Доказательство. Искомый оператор строится следующим образом. Если $ X=x_1X_1+x_2X_2+\dots+x_nX_n $ — разложение произвольного вектора $ X \in \mathbb V $ по базису, то $$ \mathcal A(X)=x_1 Y_1+x_2Y_2+\dots+ x_nY_n \ . $$ Единственность этого оператора доказывается от противного. Любой другой оператор $ \mathcal B $, удовлетворяющий условиям $ \<\mathcal B(X_j)=Y_j\>_
Таким образом, оператор — как функция, действующая в $ n_<> $-мерном линейном пространстве, однозначно определяется заданием на $ n_<> $ линейно независимых векторах. В доказательстве теоремы дается и конструктивный способ представления оператора по этим значениям (т.е. строится его «интерполяционная формула» ).
Матрица оператора
Рассмотрим оператор $ \mathcal A $ на $ \mathbb V_<> $ и пусть $ \
Найдем координаты образов базисных векторов $ \mathcal A (X_1),\dots,\mathcal A (X_n) $ в том же базисе $ \
Пример. Известны образы базисных векторов $ \mathbb R^ <3>$ под действием оператора $ \mathcal A_<> $:
$$\mathcal A \left( \begin
Решение. Элементы матрицы $ <\mathbf A>$ ищутся по формулам из определения, которые можно переписать в матричном виде: $$\left[ X_1,\dots,X_n \right] <\mathbf A>=\left[ \mathcal A (X_1),\dots,\mathcal A (X_n) \right] \ .$$ Откуда $$<\mathbf A>= \left[ X_1,\dots,X_n \right]^ <-1>\left[ \mathcal A (X_1),\dots,\mathcal A (X_n) \right] \ ,$$ и для нашего примера эта формула дает $$ <\mathbf A>= \left(\begin
В пространстве $ \mathbb P_3 $ полиномов с вещественными коэффициентами степени $ \le 3 $ оператор $ \mathcal A_<> $ действует по правилу
$$ \mathcal A (f(x)) = f(x) (x^3+2\,x^2+1) \pmod
Ответ. $$ \left(\begin
Теорема 1. Координаты произвольного вектора $ X=x_1X_1+\dots+x_nX_n $ и его образа $ Y=\mathcal A(X)=y_1X_1+\dots+y_nX_n $ связаны формулой
$$ \left(\begin
Как изменяется матрица оператора при переходе к новому базису?
Доказательство ☞ ЗДЕСЬ.
Пример. Оператор $ \mathcal A $ в базисе пространства $ \mathbb R^ <3>$
Матрицы $ <\mathbf A>$ и $ <\mathbf B>$, связанные соотношением $ <\mathbf B>=C^<-1>\cdot <\mathbf A>\cdot C $ при какой-то неособенной матрице $ C_<> $, называются подобными, этот факт будем записывать: $ <\mathbf A>\doteq <\mathbf B>$.
Доказать, что отношение подобия есть отношение эквивалентности, и если $ <\mathbf A>\doteq <\mathbf B>$ то $ g(<\mathbf A>)\doteq g(<\mathbf B>) $ при любом полиноме $ g_<>(x) $.
Теорема 3. Для оператора $ \mathcal A_<> $ ранг его матрицы является инвариантом, т.е. не зависит от выбора базиса пространства. Этот ранг совпадает с рангом оператора $ \mathcal A_<> $.
Доказательство. Если $ <\mathbf A>$ и $ <\mathbf B>$ — матрицы оператора в двух разных базисах, то они являются подобными: $ <\mathbf B>=C^<-1> <\mathbf A>C $. По свойству ранга матрицы имеем: $ \operatorname
Дефект оператора $ \mathcal A_<> $ совпадает с дефектом его матрицы в произвольном базисе пространства.
Теорема 4. Для оператора $ \mathcal A_<> $ определитель и след его матрицы являются инвариантами, т.е. не зависят от выбора базиса пространства.
Доказательство. Действительно, для подобных матриц $ <\mathbf A>$ и $ <\mathbf B>$, на основании теоремы Бине-Коши имеем: $$ \det (<\mathbf B>) = \det (C^<-1> <\mathbf A>C) = \det (C^<-1>) \cdot \det (<\mathbf A>) \cdot \det (C) =\det (<\mathbf A>) . $$ Далее, по свойству следа матрицы: $$ \operatorname
Этот результат позволяет ввести понятие определителя и следа оператора $ \mathcal A_<> $ — посредством матрицы этого оператора в произвольном базисе пространства. Такое определение оказывается корректным поскольку оба значения не зависят от выбора базиса.
Иными словами: «физический» смысл определителя оператора заключается в том, что модуль его значения представляет коэффициент расширения 4) объема (в настоящем примере — площади) тела (соответственно, плоской фигуры) под воздействием этого оператора.
Теорема 5. Оператор обратим тогда и только тогда, когда когда его определитель отличен от нуля.
Теорема 6. Линейное пространство $ <\mathcal H>om(\mathbb V,\mathbb V) $ операторов на $ \mathbb V_<>, \dim \mathbb V = n $ изоморфно линейному пространству квадратных матриц порядка $ n_<> $ (с элементами из $ \mathbb R_<> $ или из $ \mathbb C_<> $).
Это утверждение является простым следствием теоремы 2, приведенной в пункте ☞ МАТРИЦА ЛИНЕЙНОГО ОТОБРАЖЕНИЯ. Однако в случае операторов установленный изоморфизм сохранит не только результат операции сложения, но и результат операции умножения: $$ . \mbox < если >\mathcal A_1 \leftrightarrow \mathbf A_1,\ \mathcal A_2 \leftrightarrow \mathbf A_2, \mbox < то >\mathcal A_1+ \mathcal A_2 \leftrightarrow \mathbf A_1 + \mathbf A_2,\ \lambda \mathcal A_1 \leftrightarrow \lambda \mathbf A_1 \ , \ \mathcal A_1 \mathcal A_2 \leftrightarrow \mathbf A_1 \mathbf A_2 \ . $$ Я сформулирую этот «усиленный вариант» изоморфизма в виде набора свойств, которыми буду пользоваться по мере возникновения потребности.
Теорема 7. В любом базисе пространства
а) матрица нулевого оператора $ \mathcal O $ является нулевой матрицей $ \mathbb O_<> $, а матрица тождественного оператора $ \mathcal E $ является единичной матрицей $ E_<> $; обратно: если матрица оператора в этом базисе — нулевая (единичная), то оператор является нулевым (соответственно, тождественным);
б) матрица произведения операторов совпадает с произведением матриц этих операторов 5) ;
в) коммутирующим операторам соответствуют коммутирующие матрицы;
г) если $ <\mathbf A>$ — матрица оператора, то $ <\mathbf A>^ <-1>$ — матрица обратного оператора;
д) если $ <\mathbf A>$ — матрица оператора $ \mathcal A $, то матрицей операторного полинома $ g (\mathcal A) $ является матрица $ g(<\mathbf A>) $ .
Матрица оператора и матрица перехода от базиса к базису
Эти матрицы как-то взаимодействовали между собой в предыдущем пункте, хотя вторая была определена совершенно в другом разделе. Обе матрицы квадратные, обе имеют в определении «завязку» на базис пространства $ \mathbb V_<> $. У начинающих изучать теорию часто возникает путаница при различении этих определений.
«Физический» смысл этих понятий различен. Образно говоря, если рассматривать оператор как процесс (точнее: установленную связь между входными и выходными значениями процесса), то выбор базиса можно интерпретировать как выбор точки зрения на этот процесс (можно трактовать эти слова как формализацию выражения «рассмотрим этот процесс под другим углом»).
Тем не менее, с чисто формальной точки зрения, матрица $ C_<> $ перехода от базиса $ \
Я буду записывать матрицы операторов и матрицы переходов от базиса к базису в разных стилях: $ \mathbf A, \mathbf B,\dots $ и, соответственно, $ C, P, T, \dots $ — с целью быстрого распознавания их «физической» сущности.
Матрица оператора проецирования
Настоящий пункт может быть пропущен при первоначальном чтении.
Теорема. Рассмотрим линейную оболочку линейно независимой системы столбцов $ \
$$ \mathbb M =\left\ < \lambda_1 Y_1 + \dots + \lambda_k Y_k \ \big| \ \<\lambda_1,\dots,\lambda_k\>\subset \mathbb R \right\>= \mathcal L (Y_1,\dots,Y_k) \, . $$ Пусть скалярное произведение векторов $ X_<> $ и $ Y_<> $ задается стандартным способом, т.е. $ \langle X,Y \rangle =x_1y_1+\dots+x_ny_n $. Ближайшей к точке $ X_0 \subset \mathbb R^n $ точкой многообразия (или ортогональной проекцией точки $ X_0 $ на многообразие) $ \mathbb M_<> $ является $$ X_ <\ast>= \mathbf L (\mathbf L^ <\top>\mathbf L )^ <-1>\mathbf L^ <\top>X_0 \, . $$ Здесь $ \mathbf L=[Y_1 |\dots |Y_k]_
Доказательство. Пусть $ X_0=X_0^<^<\parallel>>+X_0^<^<\bot>> $, где $ X_0^<^<\parallel>> $ — ортогональная проекция точки $ X_0 $ на $ \mathbb M $, а $ X_0^<^<\bot>> $ — ортогональная составляющая. Тогда $$ \mathbf L^ <\top>X_0^<^<\bot>>=\mathbb O $$ поскольку $ Y_1^ <\top>X_0^<^<\bot>>=0,\dots, Y_k^ <\top>X_0^<^<\bot>>=0 $. Далее, $ X_0^<^<\parallel>> $ можно разложить по базису $ \
Матрица $ P=\mathbf L (\mathbf L^ <\top>\mathbf L )^ <-1>\mathbf L^ <\top>$ является матрицей оператора ортогонального проецирования на многообразие $ \mathbb M_<> $ в стандартном базисе $$ \bigg\<<\mathfrak e>_j = \big[\underbrace<0,\dots,0,1>_
Пример. В $ \mathbb R^ <3>$ найти матрицу проецирования на плоскость $ x+y+z=0 $.
Решение. Параметрическое задание плоскости: $$ \mathbb M=\< \lambda_1 \underbrace<[1,-1,0]^<\top>>_
Матрица оператора отражения (оператора Хаусхолдера)
Настоящий пункт может быть пропущен при первоначальном чтении.
В пространстве $ \mathbb R^n $ со стандартным скалярным произведением рассмотрим плоскость, заданную уравнением $$ C^<\top>X= c_1x_1+c_2x_2+\dots+c_nx_n = 0 $$ при векторе нормали $ C^<\top>=(c_1,c_2,\dots,c_n) $ единичной длины: $ |C|^2= C^<\top>C=1 $. Действие оператора зеркального отражения или оператора Хаусхолдера 6) относительно этой плоскости на вектор (точку) $ X \in \mathbb R^n $ определим правилом $$ \mathcal H( X^<^<\parallel>> + X^<^<\bot>>)= X^<^<\parallel>> — X^<^<\bot>> \ ; $$ здесь $ X^<^<\parallel>> $ — ортогональная проекция вектора $ X_<> $ на заданную плоскость, а $ X^<^<\bot>> $ — ортогональная составляющая вектора $ X_<> $ относительно этой плоскости.
Теорема. Оператор $ \mathcal H $ задается уравнением
$$ \mathcal H(X)=X-2\, \langle X,C \rangle C=X-2\, C (C^<\top>X)= X-2\, C^<\top>XC \, . $$
Доказательство. $$ \mathcal H( X^<^<\parallel>> + X^<^<\bot>>)=X^<^<\parallel>> + X^<^<\bot>>-2\, \langle X^<^<\parallel>>,C \rangle C-2\, \langle X^<^<\bot>>,C \rangle C = $$ Поскольку $ X^<^<\parallel>> $ ортогонален, а вектор $ X^<^<\bot>> $ коллинеарен вектору $ C $ единичной длины, то $$= X^<^<\parallel>> + X^<^<\bot>> — 2\, X^<^<\bot>> = X^<^<\parallel>> — X^<^<\bot>> \, . $$ ♦
Теорема. Матрица оператора $ \mathcal H $ в стандартном базисе
$$ \bigg\<<\mathfrak e>_j = \big[\underbrace<0,\dots,0,1>_
Пример. Найти зеркальное отражение точки $ [3,2,3] $ относительно плоскости $ 2\,x-2\,y+z = 0 $.
Решение. Здесь $ C^<\top>=[2/3,-2/3,1/3] $ и $$ \mathcal H(X)= \left( \begin
Матрица $ \mathbf H_
Инвариантное подпространство
Задача. Подобрать базис пространства $ \mathbb V_<> $ так, чтобы матрица заданного оператора $ \mathcal A_<> $ имела наиболее простой вид.
Исследуем действие оператора $ \mathcal A $ на произвольное подпространство $ \mathbb V_1 \subset \mathbb V $: $$\mathcal A (\mathbb V_1)= \left\
Подпространство $ \mathbb V_1 $ называется инвариантным подпространством оператора $ \mathcal A $, если оно отображается этим оператором в себя: $$ \mathcal A(\mathbb V_1)\subset \mathbb V_1 \ .$$
$ \mathbb V_1=\ <\mathbb O \>$ и $ \mathbb V_1=\mathbb V $ — тривиальные инвариантные подпространства произвольного оператора $ \mathcal A $.
Нас будут интересовать нетривиальные инвариантные подпространства.
Пример. Оператор
$$\left(\begin
а) ось вращения $ \mathbb V_1=\<(0,0,z)^<^<\top>> \mid z \in \mathbb R\> $, $ \dim \mathbb V_1=1 $ и
б) плоскость, перпендикулярная оси вращения $ \mathbb V_2=\<(x,y,0)^<^<\top>> \mid \
Пример. Оператор
$$\left(\begin
Пример. Оператор в $ \mathbb R^
$$X \longmapsto \left( \begin
Теорема. $ \mathcal
Доказать, что сумма двух инвариантных подпространств является инвариантным подпространством.
Теорема. Если пространство $ \mathbb V_<> $ раскладывается в прямую сумму подпространств, инвариантных относительно оператора $ \mathcal A $, то существует базис пространства, в котором матрица оператора будет блочно-диагональной.
Теорема обобщается очевидным образом на произвольное число слагаемых подпространств: $ \mathbb V=\mathbb V_1\oplus \mathbb V_2 \oplus \dots \oplus \mathbb V_k $. Если при этом $ \dim \mathbb V_1= \dots = \dim \mathbb V_k=1 $, то матрица оператора в базисе, полученном объединением базисных векторов слагаемых подпространств, становится диагональной — это и является решением задачи, поставленной в начале пункта.
Собственное число и собственный вектор
Задача. Найти одномерные инвариантные подпространства оператора.
Вектор $ X_<>\in \mathbb V $ называется собственным вектором оператора $ \mathcal A_<> $, если $$ <\mathbf a)>X \ne \mathbb O, \quad u \quad <\mathbf b)>\ \exists \ \lambda \in \mathbb C \qquad \mbox < такое, что >\qquad \mathcal A(X)=\lambda X \ .$$ В этом случае число $ \lambda_<> $ называется собственным или характеристическим числом оператора, соответствующим (или принадлежащим) данному собственному вектору; обратно, говорят, что вектор $ X_<> $ принадлежит собственному числу $ \lambda_<> $.
Пример. Оператор
$$\left(\begin
Если рассмотреть эти точки как концы векторов, имеющих начало в $ \mathbb O_<> $, то смещения точек под действием оператора можно представить в виде двух составляющих: растяжения (т.е. увеличения расстояния до начала координат) и поворота вокруг начала координат на некоторый угол. И только по двум направлениям плоскости поворота не происходит. Точки окружности с координатами $$ \pm \left( 0.823, -0.568 \right)^ <\top>\quad u \quad \pm \left( 0.960, 0.278 \right)^ <\top>$$ будут смещаться без поворота. Эти точки и задают координаты конца собственного вектора. А соответствующие им собственные числа $ 2.725 $ и $ 0.275 $ определяют коэффициенты сдвига. Если вообразить оператор как деформацию физической среды, заполняющей плоскость, то можно сказать, что cобственный вектор задает направление, на котором действие оператора сводится к растяжению, при этом коэффициент растяжения и будет собственным числом.
Анимация процесса ☞ ЗДЕСЬ (1500 Kb, gif).
Пример другого оператора $$ \left(\begin
Доказать, что $ \operatorname
Теорема. Любой собственный вектор оператора порождает его одномерное инвариантное подпространство, и обратно: любой ненулевой вектор одномерного инвариантного подпространства оператора является собственным вектором.
Пример. В пространстве $ \mathbb P_3 $ полиномов с вещественными коэффициентами степени $ \le 3 $ оператор $ \mathcal A_<> $ действует по правилу
$$ \mathcal A (f(x)) = f(x) (x^2-2) \pmod
Решение. В пространстве $ \mathbb P_3 $ векторами являются полиномы, а условие того, что полином $ f_<>(x) $ является собственным, принадлежащим числу $ \lambda_<> $, записывается в виде: $$ f(x)(x^2-2)\equiv \lambda f(x) \pmod
С числом $ \lambda_2=-1 $ поступаем аналогично. Условие делимости полинома $ f(x)(x^2-1) $ на $ x(x+1)(x-1)^2 $ дает также бесконечное множество: $$ \ < (t_1x+t_2)x(x-1) \ \mid \ \
Задача. Для произвольного оператора выяснить условия существования его собственного числа и разработать конструктивный метод его нахождения.
Теорема. В комплексном линейном пространстве любой оператор имеет по крайней мере один собственный вектор.
Уравнение $ \det (<\mathbf A>-\lambda E)= 0 $ называется характеристическим или вековым уравнением, а полином в левой его части — характеристическим полиномом матрицы $ <\mathbf A>$. Любой корень характеристического полинома матрицы называется собственным числом этой матрицы. Набор всех собственных чисел матрицы (корней характеристического полинома с учетом кратностей) называется спектром матрицы. Ненулевой вектор $ X \in \mathbb C^n $, удовлетворяющий условию $ <\mathbf A>X= \lambda X $, где $ \lambda $ — собственное число матрицы, называется собственным вектором матрицы, соответствующим (или принадлежащим) данному собственному числу.
Пример. Применим полученный результат для получения альтернативного решения предыдущего примера.
Решение. Базисом в пространстве $ \mathbb P_3 $ выберем $ \ <1,\,x,\,x^2,\, x^3\>$. Образы базисных векторов под действием оператора $ \mathcal A (f(x)) = f(x) (x^2-2) \pmod
Итак, два формально различных подхода к решению одного и того же примера не привели к противоречию. Хотелось бы, однако, гарантировать глобальную непротиворечивость определения собственных чисел и векторов — т.е. независимость (инвариантность) этих объектов относительно способов их нахождения, и, в частности, от выбора базиса пространства $ \mathbb V_<> $.
Теорема. Характеристические полиномы подобных матриц одинаковы.
Доказательство. $ <\mathbf A>\doteq <\mathbf B>\iff \exists $ неособенная матрица $ C_<> $, такая что $ <\mathbf B>=C^ <-1> <\mathbf A>C $. Имеем: $$\det (<\mathbf B>-\lambda E)=\det (C^ <-1> <\mathbf A>C-\lambda E)=$$ $$= \det (C^ <-1> <\mathbf A>C-\lambda C^<-1>EC)=\det \left[ C^ <-1>( <\mathbf A>-\lambda E)C \right] = \det (<\mathbf A>-\lambda E) \ .$$ ♦
Иначе говоря, для оператора $ \mathcal A_<> $ характеристический полином его матрицы не зависит от выбора базиса пространства. Поэтому можно говорить о характеристическом полиноме оператора $ \mathcal A_<> $.
Теорема [Гамильтон, Кэли]. Результатом подстановки оператора в собственный характеристический полином будет нулевой оператор.
Пример. Для рассмотренного в предыдущих примерах оператора
$$ \mathcal A (f(x)) = f(x) (x^2-2) \pmod
$$ \lambda^4+5\,\lambda^3+9\,\lambda^2+7\,\lambda+2 \, .$$ Проверим утверждение теоремы Гамильтона-Кэли — должно быть выполнено условие $$ \mathcal A^4+5\,\mathcal A^3+9\,\mathcal A^2+7\,\mathcal A +2\, \mathcal E = \mathcal O \ . $$ Степени данного оператора $ \mathcal A_<> $ обсуждались в примере ☞ ПУНКТА. Переписанное в терминах остатков, последнее условие превращается в $$ (x^2-2)^4f(x)+5\,(x^2-2)^3f(x)+9\,(x^2-2)^2f(x)+7\,(x^2-2)f(x) + $$ $$+2\,f(x) \equiv 0 \pmod
Диагонализуемость матрицы оператора
Теорема 1. Собственные векторы оператора, принадлежащие различным собственным числам, линейно независимы.
Теорема 2. Если оператор имеет $ n=\dim \mathbb V $ линейно независимых собственных векторов, то в базисе ими образуемом матрица оператора диагональна. Обратно: если матрица оператора в некотором базисе диагональна, то каждый вектор этого базиса является собственным для оператора.
Базис линейного пространства, состоящий из собственных векторов оператора $ \mathcal A_<> $, называется каноническим.
[Матричная версия теоремы]. Пусть $ A_<> $ — квадратная матрица. Неособенная матрица $ C_<> $, удовлетворяющая равенству
$$C^ <-1>A C= A_
Доказательство. Проведем формальное доказательство данного конкретного частного случая. Рассмотрим матричное равенство $$ A C= CA_
При выполнении условия предыдущего следствия говорят, что матрица $ A_<> $ диагонализуема или приводится к диагональной форме 7) .
Теорема позволяет сформулировать достаточное условие диагонализуемости.
Теорема 3. Если характеристический полином оператора не имеет кратных корней, то матрица оператора диагонализуема.
Это условие не является необходимым, как показывает пример тождественного оператора .
Случай существования кратного корня у характеристического полинома является «пограничным»: существуют примеры как диагонализуемых, так и недиагонализуемых матриц. Так, для матриц $$ A= \left( \begin
В случае наличия у характеристического полинома оператора кратного корня, анализ оператора на возможность диагонализуемости его матрицы усложняется.
Теорема 4. Множество собственных векторов оператора, принадлежащих его собственному числу $ \lambda_<\ast>^<> $ , дополненное нулевым вектором, образует линейное подпространство пространства $ \mathbb V_<> $.
Это подпространство $$ \mathbb V_ <\ast>= \mathcal
Если оператор (в некотором базисе пространства) задан своей матрицей $ \mathbf A^<> $, то базисные векторы собственного подпространства $ \mathbb V_ <\ast>$ вычисляются посредством нахождения фундаментальной системы решений (ФСР) системы линейных уравнений $$ (\mathbf A- \lambda_ <\ast>E) X=\mathbb O \ . $$
Теорема 5. Матрица оператора диагонализуема тогда и только тогда, когда для каждого ее собственного числа алгебраическая кратность равна геометрической кратности:
Диагонализуема ли матрица оператора $$ \mathcal A (f(x)) = f(x) (x^2-2) \pmod
Пример. Найти все вещественные значения параметра $ <\color
Решение. Характеристический полином $ f(\lambda)=-\lambda^3+3\, \lambda-2\,(3\, <\color
Ответ. Матрица диагонализуема при всех значениях параметра, за исключением $ <\color
Диагонализуемость матрицы оператора над полем вещественных чисел
В предыдущем пункте мы рассматривали операторы, не всегда акцентируя внимания на поле, над которым они были определены — над $ \mathbb R_<> $ или над $ \mathbb C_<> $. Сама теорема существования собственного числа гарантирует нам только лишь наличие этих чисел в поле $ \mathbb C_<> $. Как следствие, даже если рассматриваются операторы над полем $ \mathbb R_<> $ (что чаще всего и случается на практике), то существование для них вещественного канонического базиса вовсе не гарантировано.
Задача. Найти условия диагонализуемости матрицы оператора $ \mathcal A $ над полем вещественных чисел.
Необходимое условие следует из теоремы $ 2 $ предыдущего пункта: все собственные числа матрицы должны быть вещественными.
Теорема $ 3 $ позволяет сформулировать и достаточный критерий диагонализуемости матрицы оператора $ \mathcal A $ над $ \mathbb R_<> $.
Теорема. Если характеристический полином оператора имеет только простые вещественные корни, то матрица оператора диагонализуема над $ \mathbb R_<> $.
Условие различности и вещественности корней произвольного полинома $ f(\lambda)=\lambda^n+a_1\lambda^
Пример. Найти все вещественные значения параметра $ <\color
$$ \left( \begin
Решение. На основании теоремы нам нужно установить условия вещественности корней характеристического полинома $ f(\lambda)=-\lambda^3+3\, \lambda-2\,(3\, <\color
Ответ. Матрица диагонализуема над $ \mathbb R_<> $ при $ <\color
Жорданова нормальная форма
Если матрица оператора оказывается недиагонализуемой над $ \mathbb C_<> $, то к какому простейшему виду ее можно привести ? — Этим видом является, например, ☞ ЖОРДАНОВА НОРМАЛЬНАЯ ФОРМА.
Задачи
Источники
[1]. Гантмахер Ф.Р. Теория матриц. 4-е изд. М.Наука. 1988.
[2]. Фаддеев Д.К., Фаддеева В.Н. Вычислительные методы линейной алгебры. М.ГИФМЛ.1960
[3]. Хорн Р., Джонсон Ч. Матричный анализ. М.Мир.1989
[4]. Мишина А.П., Проскуряков И.В. Высшая алгебра. М.Наука. 1965
http://vmath.ru/vf5/mapping/operator