Как привести квадратное уравнение к каноническому виду

Приведение кривой второго порядка к каноническому виду

Пример . Дано уравнение кривой 3x 2 +10xy+3y 2 -2x-14y-13=0 в системе координат (0,i,j), где i =(1,0) и j =(0,1).
1. Определить тип кривой.
2. Привести уравнение к каноническому виду и построить кривую в исходной системе координат.
3. Найти соответствующие преобразования координат.

Решение. Приводим квадратичную форму B=3x 2 +10xy+3y 2 к главным осям, то есть к каноническому виду. Матрица этой квадратичной формы . Находим собственные числа и собственные векторы этой матрицы:

Характеристическое уравнение:
; λ1=-2, λ2=8. Вид квадратичной формы: .
Исходное уравнение определяет гиперболу.
Заметим, что вид квадратичной формы неоднозначен. Можно записать 8x1 2 -2y1 2 , однако тип кривой остался тот же – гипербола.
Находим главные оси квадратичной формы, то есть собственные векторы матрицы B. .
Собственный вектор, отвечающий числу λ=-2 при x1=1: x 1=(1,-1).
В качестве единичного собственного вектора принимаем вектор , где – длина вектора x 1.
Координаты второго собственного вектора, соответствующего второму собственному числу λ=8, находим из системы
.
x 2=(1,1); .
Итак, имеем новый ортонормированный базис ( i 1, j 1).
По формулам (5) пункта 4.3.3. переходим к новому базису:
или

Задание. Привести к каноническому виду уравнение линии 17x 2 + 12xy + 8y 2 — 20 = 0.
Решение.Пример 2

Задание. Привести к каноническому виду уравнение линии второго порядка, используя теорию квадратичных форм и определить её вид. Уравнение кривой второго порядка путем выделения полного квадрата привести к каноническому виду. Решение

Задание. Привести уравнение к каноническому виду: 16x 2 — 9y 2 -64x — 8y +199 = 0.
Решение.Скачать решение

Задание. Установить, что каждое из следующих уравнений определяет гиперболу, и найти координаты ее центра С, полуоси, эксцентриситет, уравнения асимптот и уравнения директрис. Изобразить гиперболу на чертеже, указав фокусы, асимптоты и директрисы.
Решение:Скачать решение

Задание. Установить, что каждое из следующих уравнений определяет эллипс, и найти координаты его центра С, полуоси, эксцентриситет, уравнения директрис. Изобразить эллипс на чертеже, указав оси симметрии, фокусы и директрисы.
Решение:Скачать решение

VMath

Инструменты сайта

Основное

Навигация

Информация

Действия

Содержание

Квадратичная форма

$ \mathbb A_<> $ означает одно из множеств: $ \mathbb Q_<> $ рациональных, или $ \mathbb R_<> $ вещественных, или $ \mathbb C_<> $ комплексных чисел.

Определение

Квадратичной формой над множеством $ \mathbb A_<> $ называют однородный полином второй степени с коэффициентами из $ \mathbb A_<> $; если переменные обозначить $ x_1,\dots,x_ $, то общий вид квадратичной формы от этих переменных: $$ f(x_1,\dots,x_ )= \sum_ <1\le j \le k \le n>f_x_jx_k= $$ $$\begin \displaystyle= f_<11>x_1^2&+f_<12>x_1x_2&+ \dots & +f_<1n>x_1x_n+ \\ &+f_<22>x_2^2 &+ \dots & +f_<2n>x_2x_n+ \\ &+\dots & & +\dots + \\ & & +f_x_jx_k & + \dots+ \\ & & &+f_x_n^2. \end $$

Пример. Функции

$$x_1^2-x_1x_2+x_3^2 \, , \quad \sqrt<3>\, x_2^2 — \pi\, x_3^2 \, , \quad -x_1x_2 \, , \quad \mathbf i \, x_1^2$$ являются квадратичными формами. Функции $$x_1^2-3\, x_1+1 \, , \quad 5\, x_1^2x_2^2 \, , \quad \frac \, , \quad \sqrt $$ не являются квадратичными формами.

Заметим, что в выражении для квадратичной формы присутствуют как квадраты переменных $ x_1^2,\dots,x_n^2 $ так и их смешанные произведения $ x_j x_k $. Говорят, что квадратичная форма $ f(x_1,\dots,x_ ) $ имеет канонический вид если $$f(x_1,\dots,x_ )\equiv f_<11>x_1^2+f_<22>x_2^2+\dots+f_x_n^2 \quad npu \quad \left\\right\>_^n \subset \mathbb A \ , $$ т.е. все коэффициенты при смешанных произведениях переменных равны нулю; в этом случае говорят также, что форма является «суммой квадратов» 1) .

Оказывается, что в любой квадратичной форме можно так сгруппировать входящие в нее одночлены, что в результате получится ее (эквивалентное) представление в виде суммы квадратов.

Пример.

$$ 2\, x_1^2+4\, x_1x_2 +x_2^2 \equiv 2\, (x_1+x_2)^2-x_2^2 \equiv -2\,x_1^2 + (2\,x_1+x_2)^2 \ ; $$ $$ x_1^2+2 \mathbf i x_1x_2 — x_2^2 \equiv (x_1+ \mathbf i x_2)^2 \ ; $$ $$-x_1^2+6\,x_1x_2+6\,x_1x_3+2\,x_2^2+4\,x_2x_3+2\,x_3^2\equiv $$ $$ \equiv (x_1+x_2+x_3)^2-2\,(x_1-x_2-x_3)^2+3\,(x_2+x_3)^2 \equiv $$ $$\equiv -(x_1+3\,x_2+3\,x_3)^2+11\,(x_2+x_3)^2 \ ; $$ $$ x_1x_2 \equiv \frac<1> <4>(x_1+x_2)^2- \frac<1> <4>(x_1-x_2)^2 \ . $$

А в общем случае: $$ f(x_1,\dots,x_ )\equiv $$ $$ \begin \equiv a_1(c_<11>x_1+c_<12>x_2+\dots+c_<1n>x_n)^2 +\\ +a_2(c_<21>x_1+c_<22>x_2+\dots+c_<2n>x_n)^2+ \\ +\dots+ \\ +a_n(c_x_1+c_x_2+\dots+c_x_n)^2 \end $$ при $ \_^n,\\>_^n $ — константах. Такое представление оказывается достаточно удобным для анализа квадратичной формы — например, в случае вещественных форм, при проверке выполнимости неравенства вида $ f(x_1,\dots,x_ ) \ge 0 $. Приведенные выше примеры показывают неоднозначность представления в виде суммы квадратов: вид квадратов и даже их количество для одной и той же формы могут быть различными. С целью обеспечения частичной унификации установим некоторое дополнительное ограничение, а именно, потребуем, чтобы линейные однородные формы $$ c_<11>x_1+c_<12>x_2+\dots+c_<1n>x_n, \ c_<21>x_1+c_<22>x_2+\dots+c_<2n>x_n,\dots, c_x_1+c_x_2+\dots+c_x_n $$ были линейно независимыми. При таком ограничении любое представление квадратичной формы в виде суммы квадратов называется каноническим видом квадратичной формы.

Задача. Для произвольной квадратичной формы $ f(x_1,\dots,x_ ) $ построить (хотя бы один) ее канонический вид.

$$ x^2 -2\,xy+3\,y^2+x-4\,y-15=0 $$ определить к какому типу (эллипс, гипербола, парабола,…) она относится.

Метод Лагранжа приведения квадратичной формы к каноническому виду

Существует универсальный алгоритм, приводящий произвольную квадратичную форму к каноническому виду.

1. Пусть $ f_<11>\ne 0 $. Выделим в $ f(x_1,\dots, x_n)_<> $ все слагаемые, содержащие $ x_ <1>$: $$ f_<11>x_1^2+f_<12>x_1x_2+ \dots +f_<1n>x_1x_n+ \sum_ <2\le j\le k \le n>f_x_jx_k = $$ $$ = f_<11>\left(x_1^2+\frac>>x_1x_2+\dots+ \frac>>x_1x_n \right)+\dots= $$ $$ =f_<11>\left[ \left(x_1+\frac><2f_<11>>x_2+\dots+ \frac><2f_<11>>x_n \right)^2-\left(\frac><2f_<11>>x_2+\dots+ \frac><2f_<11>>x_n \right)^2 \right]+\dots= $$ $$ =f_ <11>\left(x_1+\frac><2f_<11>>x_2+\dots+ \frac><2f_<11>>x_n\ \right)^2 — f_<11>\left(\frac><2f_<11>>x_2+\dots+ \frac><2f_<11>>x_n \right)^2 +\dots $$ В последнем представлении первое слагаемое представляет собой квадрат линейной формы по переменным $ x_<1>,x_2,\dots,x_n $; все оставшиеся слагаемые не зависят от $ x_ <1>$, т.е. составляют квадратичную форму от переменных $ x_<2>,\dots,x_n $. Таким образом, исходная задача для формы $ n_<> $ переменных оказывается сведенной к случаю формы $ (n-1)_<> $-й переменной; последняя преобразуется по аналогичному принципу.

2. Если $ f_<11>=0 $, но $ \exists k:\ f_\ne 0 $, т.е. при хотя бы одном квадрате переменной коэффициент отличен от нуля. Алгоритм модифицируется таким образом, что выделение полного квадрата начинается с переменной $ x_ $ вместо $ x_ <1>$ — первая ничем не лучше (и не хуже) $ k_<> $-й!

3. Совсем исключительный случай: квадраты переменных вообще отсутствуют, т.е. $ f_<11>=\dots=f_=0 $. Выбираем один из ненулевых коэффициентов при смешанных произведениях переменных: пусть $ f_\ne 0 $. Представляем $ x_k=(x_j+x_k)-x_j $ и заменяем все вхождения переменной $ x_ $ на $ X_k-x_j $ при вспомогательной переменной $ X_k=x_j+x_k $. В новой квадратичной форме уже присутствует квадрат переменной $ x_ $ с ненулевым коэффициентом. Тем самым этот случай сводится к предыдущему. После приведения новой формы к сумме квадратов возвращаемся к «старой» переменной $ x_ $.

Пример. Привести форму

$$ f=4\,x_1^2+2\,x_2^2+x_3^2+x_4^2-4\,x_1x_2-4\,x_1x_3+4\,x_1x_4+4\,x_2x_3-4\,x_3x_4 $$ к каноническому виду.

Решение. $$ \begin f&=&4\left(x_1^2-x_1x_2-x_1x_3+x_1x_4\right)+2x_2^2+x_3^2+x_4^2+4x_2x_3-4x_3x_4=\\ &=&4\bigg[ \left(x_1-\frac<1><2>\, x_2-\frac<1><2>\,x_3+ \frac<1><2>\,x_4\, \right)^2- \left(-\frac<1><2>\, x_2-\frac<1><2>\, x_3+\frac<1><2>\, x_4\right)^2 \bigg] + \\ &+&2\,x_2^2+x_3^2+x_4^2+4\,x_2x_3-4\,x_3x_4= \\ &=&4\,\left(x_1-\frac<1><2>\, x_2-\frac<1><2>\,x_3+ \frac<1><2>\,x_4\, \right)^2+\\ & & + \Big[\left(x_2+x_3+x_4\, \right)^2- \left(x_3+x_4 \right)^2\Big]-2\,x_3x_4 = \\ &=&4\,\left(x_1-\frac<1><2>\, x_2-\frac<1><2>\,x_3+ \frac<1><2>\,x_4\, \right)^2+ \left(x_2+x_3+x_4\, \right)^2- \\ &&-x_3^2-4\,x_3x_4-x_4^2= \\ && 4\,\left(x_1-\frac<1><2>\, x_2-\frac<1><2>\,x_3+ \frac<1><2>\,x_4\, \right)^2+ \left(x_2+x_3+x_4\, \right)^2- \\ &&-\Big[ \left(x_3+ 2\, x_4\, \right)^2-4\, x_4^2\Big] -x_4^2 = \\ &=&4\,\left(x_1-\frac<1><2>\, x_2-\frac<1><2>\,x_3+ \frac<1><2>\,x_4\, \right)^2+ \left(x_2+x_3+x_4\, \right)^2-\left(x_3+ 2\, x_4\, \right)^2+3\,x_4^2 \end $$

Ответ. $ f\equiv 4\,\left(x_1-\frac<1><2>\, x_2-\frac<1><2>\,x_3+ \frac<1><2>\,x_4\, \right)^2+ \left(x_2+x_3+x_4\, \right)^2-\left(x_3+ 2\, x_4\, \right)^2+3\,x_4^2 $.

Пример. Привести форму

$$ f=x_1^2+x_2^2-4\,x_3^2+2\,x_1x_2+6\,x_1x_3+4\,x_2x_3 $$ к каноническому виду.

Решение. $$ f\equiv (x_1+x_2+3\,x_3)^2-(x_2+3\,x_3)^2+x_2^2-4\,x_3^2+4\,x_2x_3 \equiv $$ $$ \equiv (x_1+x_2+3\,x_3)^2-2\,x_2x_3 -13\,x_3^2 \equiv $$ В соответствии с алгоритмом, на следующем шаге нужно выделять слагаемые, содержащие переменную $ x_ <2>$, но коэффициент при $ x_2^2 $ в правой части формулы обратился в нуль. Поэтому — в соответствии с пунктом 2 метода — приходится выделять квадрат на основе переменной $ x_ <3>$: $$ (x_1+x_2+3\,x_3)^2-13\, \left(x_3-\frac<1><13>x_2\right)^2+13\cdot \frac<1><13^2>x_2^2 \ . $$

Ответ. $ (x_1+x_2+3\,x_3)^2-13\, \left(x_3-\frac<1><13>x_2\right)^2+ \frac<1><13>x_2^2 $.

Пример. Привести форму

$$ f=x_1x_2-3\,x_1x_3+2\,x_2x_3 $$ к каноническому виду.

Решение. Коэффициенты при квадратах переменных все равны нулю. Действуем в соответствии с пунктом 3 метода Лагранжа. Поскольку коэффициент при $ x_1x_2 $ отличен от нуля, делаем замену переменной $ x_2=X_2-x_1 $ при $ X_2=x_1+x_2 $: $$ f\equiv -x_1^2+x_1X_2-5\,x_1x_3+2\,X_2x_3 \ . $$ Дальнейший ход решения — в соответствии с пунктом 1 метода Лагранжа: $$ -\left(x_1-\frac<1><2>X_2+\frac<5><2>x_3\right)^2+\left(-\frac<1><2>X_2+\frac<5><2>x_3\right)^2+2\,X_2x_3 \equiv $$ $$ \equiv -\left(x_1-\frac<1><2>X_2+\frac<5><2>x_3\right)^2+\frac<1><4>X_2^2-\frac<1><2>X_2x_3+\frac<25><4>x_3^2 \equiv $$ $$ \equiv -\left(x_1-\frac<1><2>X_2+\frac<5><2>x_3\right)^2+\frac<1><4>\left(X_2-x_3 \right)^2+6\,x_3^2 \ $$ Получили сумму квадратов форм от переменных $ x_1,X_2,x_3 $. Возвращаемся к переменной $ x_ <2>$:

Ответ. $ -(\frac<1><2>x_1-\frac<1><2>x_2+\frac<5><2>x_3)^2+\frac<1><4>(x_1+x_2-x_3)^2+6\,x_3^2 $.

Матричная форма записи квадратичной формы

Задача. Установить правило формирования коэффициентов канонического вида квадратичной формы, получающегося применением метода Лагранжа.

Прежде всего, соберем все переменные в один вектор, а вернее — в два вектора: $$ <>_ <.>\mbox < столбец переменных >X= \left(\begin x_1 \\ \vdots \\ x_n \end \right) \quad \mbox < и строку переменных >X^ <\top>= (x_1,\dots,x_n) \ ; $$ здесь $ <>^ <\top>$ означает транспонирование. Не очень принципиально, что обозначать через $ X_<> $ — столбец или строку; и хотя сокращение $ f(x_1,\dots,x_n)=f(X) $ кажется не вполне корректным с точки зрения только что введенного обозначения, тем не менее не будем навешивать в правую часть дополнительные значки…

Если определить верхнетреугольную матрицу $ \mathbf F $ равенством: $$ <\mathbf F>= \left( \begin f_<11>&f_<12>&\dots &f_ <1n>\\ &f_<22>& \dots & f_ <2n>\\ \mathbb O & &\ddots & \vdots \\ & & & f_ \end \right), $$ то квадратичную форму можно записать в виде произведения трех матриц $$ <>_ <.>\mbox < строка переменных >\times \mbox < матрица >\times \mbox < столбец переменных >$$ $$ f(X)=X^ <\top><\mathbf F>X \ .$$ Более того, можно написать бесконечно много подобных представлений для одной и той же квадратичной формы $ f_<> $, подбирая разные матрицы

Пример. $ f=x_1^2+x_2^2-4\,x_3^2+2\,x_1x_2+6\,x_1x_3+4\,x_2x_3 \equiv $

$$ \equiv (x_1,x_2,x_3) \left( \begin 1 & 2 & 6 \\ 0 & 1 & 4 \\ 0 & 0 & -4 \end \right) \left( \begin x_1 \\ x_2 \\ x_3 \end \right) \equiv (x_1,x_2,x_3) \left( \begin 1 & 0 & 3 \\ 2 & 1 & 4 \\ 3 & 0 & -4 \end \right) \left( \begin x_1 \\ x_2 \\ x_3 \end \right)\equiv $$ $$ \equiv (x_1,x_2,x_3) \left( \begin 1 & 1 & 3 \\ 1 & 1 & 2 \\ 3 & 2 & -4 \end \right) \left( \begin x_1 \\ x_2 \\ x_3 \end \right)\equiv \dots $$

Пример. Для приведенной выше квадратичной формы

$$ f=x_1^2+x_2^2-4\,x_3^2+2\,x_1x_2+6\,x_1x_3+4\,x_2x_3 $$ ее правильной записью будет именно последняя:

$$ f\equiv (x_1,x_2,x_3) \left( \begin 1 & 1 & 3 \\ 1 & 1 & 2 \\ 3 & 2 & -4 \end \right) \left( \begin x_1 \\ x_2 \\ x_3 \end \right) $$ Правило формирования матрицы довольно просты: на диагонали ставятся коэффициенты при квадратах, а внедиагональные элементы получаются располовиниванием коэффициентов при смешанных произведениях переменных.

$ x_ <1>$$ x_ <2>$$ x_ <3>$
$ x_ <1>$$ f_ <11>$$ \frac<1><2>f_ <12>$$ \frac<1><2>f_ <13>$
$ x_ <2>$$ \frac<1><2>f_ <12>$$ f_ <22>$$ \frac<1><2>f_ <23>$
$ x_ <3>$$ \frac<1><2>f_ <13>$$ \frac<1><2>f_ <23>$$ f_ <33>$

Пример. Для

$$ f(x_1,x_2)=a_<11>x_1^2+2\, a_<12>x_1x_2+a_<22>x_2^2 $$ имеем: $$ <\mathbf A>= \left( \begin a_ <11>& a_ <12>\\ a_ <12>& a_ <22>\end \right) \ ; \ <\mathcal D>(f)=a_<11>a_<22>-a_<12>^2 \ ; $$ последнее выражение вполне напоминает дискриминант квадратного трехчлена $ a_<11>x^2+2\, a_<12>x+a_ <22>$ и это обстоятельство оправдывает использование слова дискриминант для нового объекта…

Рассмотрим замены переменных в квадратичной форме, т.е. переход от переменных $ x_<1>,\dots,x_ $ к новым переменным $ y_<1>,\dots,y_ $. Ограничимся только линейными заменами вида $$ \left\< \begin x_1&=&c_<11>y_1+c_<12>y_2+\dots+c_<1n>y_n, \\ x_2&=&c_<21>y_1+c_<22>y_2+\dots+c_<2n>y_n, \\ \dots & & \dots \\ x_n&=&c_y_1+c_y_2+\dots+c_y_n. \end \right. $$ Результатом такой замены переменных будет новая квадратичная форма относительно новых переменных. Установим по какому закону формируются ее коэффициенты. С этой целью введем в рассмотрение матрицу замены переменных $$ C= \left( \begin c_ <11>& c_ <12>& \dots & c_ <1n>\\ c_ <21>& c_ <22>& \dots & c_ <2n>\\ \dots & & & \dots \\ c_ & c_ & \dots & c_ \\ \end \right) ; $$ которая позволяет переписать саму замену переменных в матричном виде $$ \left(\begin x_1 \\ x_2 \\ \vdots \\ x_n \end \right)= \left( \begin c_ <11>& c_ <12>& \dots & c_ <1n>\\ c_ <21>& c_ <22>& \dots & c_ <2n>\\ \dots & & & \dots \\ c_ & c_ & \dots & c_ \\ \end \right) \left(\begin y_1 \\ y_2 \\ \vdots \\ y_n \end \right) \qquad \iff \qquad X=CY \ . $$ Тогда формальная подстановка последнего варианта в правильную запись квадратичной формы приведет к следующей цепочке $$ f(X)=X^<\top><\mathbf A>X= (CY)^<\top> <\mathbf A>(CY)=Y^ <\top>C^<\top><\mathbf A>C Y=\tilde f (Y) \ , $$ (здесь использовались некоторые свойства операции транспонирования ) и, если обозначить матрицу $$ \mathbf B =C^<\top><\mathbf A>C \ , $$ то мы получаем правило формирования матрицы квадратичной формы, получившейся в результате замены переменных, с помощью операции произведения матриц. Обратим внимание на еще один факт — матрица $ \mathbf B $ является симметричной: $$ \mathbf B^ <\top>=(C^<\top><\mathbf A>C)^<\top>= C^<\top><\mathbf A>^<\top>\left(C^ <\top>\right)^ <\top>= C^<\top><\mathbf A>C= \mathbf B \ , $$ т.е. выбор в качестве матричной записи квадратичной формы именно того варианта, что основан на симметричной матрице, позволяет сохранить это свойство при любой линейной замене переменных.

Задача о нахождении канонического вида квадратичной формы $ X^<\top><\mathbf A>X $ может быть также переформулирована в терминах замены переменных: требуется найти такую матрицу $ C_<> $, чтобы матрица $ \mathbf B= C^<\top><\mathbf A>C $ оказалась диагональной: $$ \mathbf B= \left( \begin a_ <1>& & & \\ & a_ <2>& & <\mathbb O>\\ <\mathbb O>& & \ddots & \\ & & & a_ \end \right) \ ; $$ при этом дополнительным условием ставится невырожденность (неособенность) матрицы $ C_<> $: $$ \det C \ne 0 \ . $$

Теорема. Для любой квадратичной формы над $ \mathbb A $ существует невырожденная линейная замена переменных $ X=CY $ такая, что преобразованная квадратичная форма $ \widetilde f(Y) $ имеет канонический вид.

Вернемся к примерам предыдущего пункта, перепишем их на матричном языке.

Пример. Для формы

$$ f(x_1,x_2,x_3,x_4)= $$ $$=4\,x_1^2+2\,x_2^2+x_3^2+x_4^2-4\,x_1x_2-4\,x_1x_3+4\,x_1x_4+4\,x_2x_3-4\,x_3x_4 $$ замена переменных осуществляется формулами

$$ \begin y_1=& x_1 &-\frac<1><2>\, x_2&-\frac<1><2>\,x_3&+ \frac<1><2>\,x_4, \\ y_2=& & x_2&+x_3&+x_4, \\ y_3=& & & x_3 &+ 2\, x_4,\\ y_4=& &&& x_4, \end $$ т.е. матрица замены переменных $$ C= \left( \begin 1 & -\frac<1> <2>& -\frac<1> <2>& \frac<1> <2>\\ 0 & 1 & 1 & 1 \\ 0 & 0 & 1 & 2 \\ 0 & 0 & 0 & 1 \end \right) $$ имеет верхнетреугольный вид. Канонический вид в новых переменных записывается $$ f(x_1,x_2,x_3,x_4) \equiv 4\,y_1^2+y_2^2-y_3^2+3\,y_4^2 \ . $$

Для формы $$ f(x_1,x_2,x_3)=x_1^2+x_2^2-4\,x_3^2+2\,x_1x_2+6\,x_1x_3+4\,x_2x_3 $$ замена переменных уже не имеет треугольного вида: $$ \begin y_1=& x_1 &+ x_2&+3\,x_3 \\ y_2=& & -\frac<1><13>x_2&+x_3 \\ y_3=& & \frac<1><13>x_2 & \end \qquad \iff \qquad C= \left( \begin 1 & 1 & 3 \\ 0 & -\frac<1> <13>& 1 \\ 0 & \frac<1> <13>& 0 \end \right) \ . $$ Для формы $$ f(x_1,x_2,x_3)=x_1x_2-3\,x_1x_3+2\,x_2x_3 $$ получили: $$ \begin y_1=& \frac<1><2>x_1 &-\frac<1><2>x_2&+\frac<5><2>x_3 \\ y_2=& x_1&+x_2&-x_3 \\ y_3=& & & x_3 \end \qquad \iff \qquad C= \left( \begin \frac<1> <2>& -\frac<1> <2>& \frac<5> <2>\\ 1 & 1 & -1 \\ 0 & 1 & 1 \end \right) \ , $$ т.е. замена переменных также не имеет треугольного вида. ♦

Поставленную в начале пункта задачу об установлении структуры канонического вида квадратичной формы попытаемся решить сначала для случая когда замену переменных можно подобрать именно в треугольном виде.

Метод Лагранжа и метод Гаусса

Пример. Рассмотрим матрицу квадратичной формы

из предыдущих пунктов, и, временно выходя из круга поставленных в настоящем разделе задач, попробуем применить к ней метод Гаусса приведения к треугольному виду: $$ \left( \begin 4 & -2 & -2 & 2 \\ -2 & 2 & 2 & 0 \\ -2 & 2 & 1 & -2 \\ 2 & 0 & -2 & 1 \end \right) \ \rightarrow \ \left( \begin 4 & -2 & -2 & 2 \\ 0 & 1 & 1 & 1 \\ 0 & 1 & 0 & -1 \\ 0 & 1 & -1 & 0 \end \right) \ \rightarrow \ $$ $$ \rightarrow \ \left( \begin 4 & -2 & -2 & 2 \\ 0 & 1 & 1 & 1 \\ 0 & 0 & -1 & -2 \\ 0 & 0 & -2 & -1 \end \right) \ \rightarrow \ \left( \begin 4 & -2 & -2 & 2 \\ 0 & 1 & 1 & 1 \\ 0 & 0 & -1 & -2 \\ 0 & 0 & 0 & 3 \end \right) \ . $$ Обратим внимание на два обстоятельства: диагональные элементы последней матрицы совпадают с коэффициентами канонического вида квадратичной формы, а коэффициенты замены переменных, приводящей к этому каноническому виду, совпадают с элементами строк этой матрицы, если их разделить на соответствующие диагональные элементы. Возникает подозрение , что метод Лагранжа является «замаскированной» версией метода Гаусса. ♦

Для того, чтобы выяснить аналитический смысл преобразований по методу Лагранжа найдем правило формирования коэффициентов в первом шаге приведения квадратичной формы к каноническому виду. Пусть исходная квадратичная форма записана в виде $$ f(x_1,\dots,x_ )=\sum_ <1\le j,k \le n>a_x_jx_k= $$ $$ \begin = a_<11>x_1^2&+2a_<12>x_1x_2&+ \dots & +2a_<1n>x_1x_n+ \\ &+a_<22>x_2^2 &+ \dots & +2a_<2n>x_2x_n+ \\ & & +\dots & + \\ & & &+a_x_n^2, \end $$ т.е. коэффициенты при смешанных произведениях переменных записаны с выделением множителя $ 2_<> $. После выделения полного квадрата, содержащего переменные $ x_1,x_2,\dots,x_n $: $$ f(x_1,x_2,\dots,x_n)\equiv a_ <11>\left(x_1+\frac>>x_2+\dots+ \frac>>x_n\ \right)^2 + f_2(x_2,\dots,x_n) $$ в правой части тождества образовалась квадратичная форма $ f_ <2>$, не содержащая $ x_ <1>$. Она равна $$ f_2 =\sum_ <2\le j,k \le n>a_x_jx_k- a_<11>\left(\frac>>x_2+\dots+ \frac>>x_n \right)^2= $$ $$ =\sum_ <2\le j,k \le n>a_x_jx_k-a_<11>\sum_ <2\le j,k \le n>\fraca_<1k>>^2>x_jx_k= \sum_<2\le j,k \le n>\left( a_-\frac>>a_ <1k>\right) x_jx_k \ . $$ Если теперь выписать матрицу этой квадратичной формы (она имеет порядок $ n_<>-1 $), то ее элементы образуются по точно такому же правилу, как и коэффициенты матрицы, получающейся из матрицы $ \mathbf A_<> $ в результате первого шага метода Гаусса.

Теорема. Метод Лагранжа приведения квадратичной формы $ X^<\top><\mathbf A>X $ к каноническому виду эквивалентен методу Гаусса приведения матрицы $ <\mathbf A>$ к треугольному виду.

Доказательство. Действительно, первый шаг прямого хода метода исключения переменных Гаусса преобразует матрицу $ \mathbf A $ следующим образом: $$ \left( \begin a_<11>& a_<12>& a_<13>& \dots & a_ <1n>\\ a_<12>& a_<22>& a_<23>& \dots & a_ <2n>\\ & \dots & & \dots & \\ a_<1n>& a_<2n>& a_<3n>& \dots & a_ \end \right) \rightarrow \left(\begin a_<11>&a_<12>&\dots&a_<1n>\\ 0&a_<22>^<[1]>& \dots &a_<2n>^<[1]>\\ &\dots & & \dots \\ 0&a_^<[1]>&\dots &a_^ <[1]>\end \right) \ ; $$ здесь $$a_^ <[1]>= a_ — \fraca_<1k>>> \ ,$$ и предполагается, что $ a_<11>\ne 0 $. Видим, что формула формирования элементов матрицы $$ \left(\begin a_<22>^<[1]>& \dots&a_<2n>^<[1]>\\ \dots & & \dots & \\ a_^<[1]>&\dots &a_^ <[1]>\end \right)_ <(n-1)\times (n-1)>$$ точно такая же, как и матрицы квадратичной формы $ f_2 $. Более того, поскольку матрица $ <\mathbf A>$ симметрична ($ a_=a_ $), то и только что полученная матрица оказывается симметричной. Если $ a_<22>^ <[1]>\ne 0 $, то к этой новой матрице можно снова применить ту же процедуру, и т.д., и в конце концов придем к матрице первого порядка. Собирая все промежуточные результаты в одну матрицу, получим ее в треугольном виде $$ \left(\begin a_<11>&a_<12>&\dots&a_ <1,n-1>&a_<1n>\\ 0&a_<22>^<[1]>& \dots&a_<2,n-1>^ <[1]>&a_<2n>^<[1]>\\ & & \ddots & & \dots \\ 0 &0 & &a_^<[n-2]>&a_^ <[n-2]>\\ 0 &0 &\dots & 0 &a_^ <[n-1]>\end \right) $$ при условии, что ни одно из чисел на диагонали не обратилось в нуль: $$a_ <11>\ne 0,\ a_<22>^ <[1]>\ne 0, \dots,\ a_^ <[n-2]>\ne 0,\ a_^ <[n-1]>\ne 0 \ .$$ Если теперь обратиться к методу Лагранжа, то увидим, что полученная матрица как раз и определяет замену переменных $$ \left\<\begin y_1=&\displaystyle x_1+&\frac>>x_2+&\dots+&\frac>>x_+& \frac>>x_n \\ y_2=&\displaystyle &x_2+&\dots + &\frac^<[1]>>^<[1]>>x_+& \frac^<[1]>>^<[1]>>x_ \\ \vdots & & & \ddots & \dots & \\ y_=&\displaystyle & & &x_+ &\frac^<[n-2]>>^<[n-2]>>x_n \\ y_n=&&&&&x_n \end \right. \ , $$ приводящую квадратичную форму к каноническому виду: $$ a_<11>y_1^2 + a_<22>^ <[1]>y_2^2 + \dots +a_^ <[n-2]>y_^2 + a_^ <[n-1]>y_n^2 \ . $$ ♦

Формула Якоби

Теорема [Якоби]. Квадратичная форма $ f(X)=X^<\top><\mathbf A>X $ с симметричной матрицей $ <\mathbf A>$, ранг которой равен $ \mathfrak r_<> $, а главные миноры $ \<\det \mathbf A_j \>_^ <\mathfrak r>$ отличны от нуля, приводится к следующему каноническому виду (формула Якоби 3) ):

$$ \frac <1 \cdot \det \mathbf A_1>+\frac <\det \mathbf A_1 \cdot \det \mathbf A_2>+\frac <\det \mathbf A_2 \cdot \det \mathbf A_3>+\dots+\frac^2><\det \mathbf A_<<\mathfrak r>-1> \cdot \det \mathbf A_<\mathfrak r>> $$ Здесь $$ z_1 =\frac<1> <2>\partial f / \partial x_1,\ z_2= \frac<1> <2>\left| \begin a_ <11>& \partial f / \partial x_1 \\ a_ <12>& \partial f / \partial x_2 \end \right|, \ z_3= \frac<1> <2>\left| \begin a_ <11>& a_ <12>& \partial f / \partial x_1 \\ a_ <12>& a_ <22>& \partial f / \partial x_2 \\ a_ <13>& a_ <23>& \partial f / \partial x_3 \end \right|, \ \dots \ , $$ $$ \qquad \qquad z_<\mathfrak r>= \frac<1> <2>\left| \begin a_ <11>& a_ <12>& \dots & a_ <1,\mathfrak r-1>& \partial f / \partial x_1 \\ a_ <12>& a_ <22>& \dots & a_ <2,\mathfrak r-1>& \partial f / \partial x_2 \\ \dots & & & \dots & \dots \\ a_ <1,\mathfrak r >& a_ <2,\mathfrak r >& \dots & a_ <\mathfrak r-1,\mathfrak r >& \partial f / \partial x_ <\mathfrak r>\end \right| $$

Пример. Для квадратичной формы $$ f(x_1,x_2,x_3,x_4)= $$

Легко убедиться, что это — проявление общего правила. Выражение для $$ z_= \frac<1> <2>\left| \begin a_ <11>& a_ <12>& \dots & a_ <1,k-1>& \partial f / \partial x_1 \\ a_ <12>& a_ <22>& \dots & a_ <2,k-1>& \partial f / \partial x_2 \\ \dots & & & \dots & \dots \\ a_ & a_ & \dots & a_ & \partial f / \partial x_ \end \right| $$ при $ k \in \ <1,\dots, \mathfrak r\>$ преобразуем следующим образом: из последнего столбца определителя $$ = \left| \begin a_ <11>& a_ <12>& \dots & a_ <1,k-1>& a_<11>x_1+a_<12>x_2+\dots+ a_ <1,k-1>x_+a_<1k>x_k+\dots+a_<1n>x_n \\ a_ <12>& a_ <22>& \dots & a_ <2,k-1>& a_<21>x_1+a_<22>x_2+\dots+ a_ <2,k-1>x_+a_<2k>x_k+\dots+a_<2n>x_n \\ \dots & & & \dots & \dots \\ a_ & a_ & \dots & a_ & a_x_1+a_x_2+\dots+ a_ x_+a_x_k+\dots+a_x_n \end \right| $$ вычтем первый, домноженный на $ x_1 $, второй, домноженный на $ x_2 $, и т.д., $ (k-1) $-й, домноженный на $ x_ $. В результате получим линейную форму $$ z_k= \left| \begin a_ <11>& a_ <12>& \dots & a_ <1,k-1>& a_ <1k>\\ a_ <12>& a_ <22>& \dots & a_ <2,k-1>& a_ <2k>\\ \dots & & & \dots & \dots \\ a_ & a_ & \dots & a_ & a_ \end \right|x_k + \dots + \left| \begin a_ <11>& a_ <12>& \dots & a_ <1,k-1>& a_ <1n>\\ a_ <12>& a_ <22>& \dots & a_ <2,k-1>& a_ <2n>\\ \dots & & & \dots & \dots \\ a_ & a_ & \dots & a_ & a_ \end \right|x_n \, , $$ не зависящую от $ x_1,\dots, x_ $. Коэффициент же при $ x_k $ равен $ \det \mathbf A_k $ и отличен от нуля по условию теоремы. Если его вынести за пределы формы, то получим еще альтернативный вариант формулы Якоби.

Квадратичная форма $ f(X)=X^<\top><\mathbf A>X $ с симметричной матрицей $ <\mathbf A>$, ранг которой равен $ \mathfrak r_<> $, а главные миноры $ \<\det \mathbf A_j \>_^ <\mathfrak r>$ отличны от нуля, приводится к следующему каноническому виду:

$$ y_1^2 \det \mathbf A_1 + y_2^2\frac<\det \mathbf A_2> < \det \mathbf A_1>+y_3^2\frac<\det \mathbf A_3> <\det \mathbf A_2>+\dots+y_<\mathfrak r>^2 \frac<\det \mathbf A_<\mathfrak r>><\det \mathbf A_<\mathfrak r-1>> \ ; $$ при этом линейные относительно переменных $ x_1,\dots,x_n $ формы $ \_^ <\mathfrak r>$ выражаются по формулам $$ \left\< \begin y_1=&\displaystyle x_1+&\tilde c_<12>x_2& &+\dots+&\tilde c_<1,n-1>x_+&\tilde c_<1n>x_n \\ y_2=&\displaystyle &x_2+& & \dots + &\tilde c_<2,n-1>x_+&\tilde c_<2n>x_ \\ \vdots & & & \ddots & & \dots & \\ y_<\mathfrak r>=&\displaystyle & & &x_<\mathfrak r>+ & \dots + & \tilde c_<\mathfrak r n>x_n \end \right. $$ Здесь $$ \tilde c_<1j>=a_<1j>/a_<11>,\ \tilde c_=\left| \begin a_ <11>& a_ <12>& \dots & a_ <1,k-1>& a_ <1j>\\ a_ <12>& a_ <22>& \dots & a_ <2,k-1>& a_ <2j>\\ \dots & & & \dots & \dots \\ a_ & a_ & \dots & a_ & a_ \end \right| \Bigg/ \det \mathbf A_j \, . $$

При $ \mathfrak r = n $ матрица $ \tilde C_<> $ из предыдущей формулы становится верхнетреугольной: $$ Y=\tilde C X \, ; $$ при этом на главной диагонали будут стоять $ 1 $. Обратная к матрице такого вида имеет ту же структуру — и матрица $ C=\tilde C^ <-1>$ является матрицей, которая встретилась нам в предыдущем ПУНКТЕ.

Теорема. Квадратичная форма $ f(X)=X^<\top><\mathbf A>X $ при симметричной неособенной матрице $ <\mathbf A>$ приводится к каноническому виду заменой переменных, задаваемой верхней унитреугольной матрицей

$$ X=CY \quad npu \ C= \left( \begin 1& c_<12>& \dots & c_ <1n>\\ & 1& \dots & c_ <2n>\\ \mathbb O & & \ddots & \vdots \\ & & & 1 \end \right) $$ тогда и только тогда, когда все главные миноры матрицы $ <\mathbf A>$ отличны от нуля. Этот канонический вид представлен формулой Якоби $$ y_1^2 \det \mathbf A_1 + y_2^2\frac<\det \mathbf A_2> < \det \mathbf A_1>+\dots+y_^2 \frac<\det \mathbf A_><\det \mathbf A_> \ . $$ Доказательство достаточности условия теоремы уже произведено, необходимость доказывается в пункте ☞ LDU-разложение матрицы.

Закон инерции для квадратичных форм

Для заданной квадратичной формы канонические виды, т.е. представления в виде сумм квадратов, можно построить разными способами. Выясним, какие характеристики являются общими (инвариантными) для этих представлений.

Ранг квадратичной формы

Предположим, что с помощью какой-либо невырожденной замены переменных мы привели квадратичную форму к каноническому виду: $$\widetilde f(Y)=\alpha_1y_1^2+\dots+\alpha_n y_n^2 \ .$$ Может так случиться, что часть коэффициентов $ \<\alpha_j \>_^n $ обратится в нуль.

Рангом квадратичной формы называется ранг ее матрицы: $$\operatorname ( f ) = \operatorname ( <\mathbf A>) \ .$$

Теорема. Ранг квадратичной формы не меняется при невырожденных заменах переменных:

$$ \operatorname (f) = \operatorname( C^<\top><\mathbf A>C ) \quad npu \quad \forall C,\ \det C \ne 0 \ .$$

Доказательство основано на следствии к теореме $ 2 $, приведенной ☞ ЗДЕСЬ: ранг матрицы не меняется при домножении ее на произвольную неособенную.

Ранг квадратичной формы равен числу ненулевых коэффициентов в ее каноническом виде.

Закон инерции

Число положительных (или отрицательных) коэффициентов в каноническом виде квадратичной формы $ f_<>(X) $ называется ее положительным (соответственно, отрицательным) индексом инерции. Буду обозначать эти индексы 4) $$n_<+>(f) \quad \mbox < и >\quad n_<->(f) \ . $$ Разность 5) $$\sigma (f) = n_<+>(f)-n_<->(f)$$ называется сигнатурой квадратичной формы (а также сигнатурой соответствующей ей симметричной матрицы).

Теорема [закон инерции]. Индексы инерции не зависят от способа приведения квадратичной формы к каноническому виду.

Доказательство ☞ ЗДЕСЬ.

Пример. Найти ранг и сигнатуру квадратичной формы $ f(x_1,x_2,x_3)=x_1x_2-x_2x_3 $.

Решение. Приводим квадратичную форму к каноническому виду по методу Лагранжа: $$f=\frac<1> <4>\,(x_1+x_2-x_3)^2 — \frac<1> <4>\,(x_1-x_2-x_3)^2 \ .$$

Ответ. $ \operatorname (f) = 2,\, \sigma (f)=0 $.

В предположении, что ранг матрицы $ \mathbf A_<> $ равен $ \mathfrak r_<> $, а ее главные миноры $ \< \det <\mathbf A>_j \>_^ <\mathfrak r>$ отличны от нуля, имеем:

$$ n_<+>(f)=<\mathcal P>(1,\det <\mathbf A>_1,\dots, \det <\mathbf A>_<\mathfrak r>),\ n_<->(f)=<\mathcal V>(1,\det <\mathbf A>_1,\dots, \det <\mathbf A>_<\mathfrak r>)\ . $$ Здесь $ <\mathcal P>_<> $ — число знакопостоянств, а $ <\mathcal V>_<> $ — число число знакоперемен в последовательности. Для сигнатуры квадратичой формы также справедлива и формула $$ \sigma (f)= \sum_^ <\mathfrak r>\operatorname (\det (\mathbf A_) \cdot \det (\mathbf A_) ) \quad npu \quad \det (\mathbf A_<0>)=1 $$ и операции $ \operatorname $ определения знака, введенной ☞ ЗДЕСЬ.

Доказательство следует из формулы Якоби.

Правило вычисления сигнатуры из предыдущей теоремы остается справедливым и в случае, если в последовательности главных миноров $ \< \det <\mathbf A>_j \>_^ <\mathfrak r>$ имеются нулевые, но не подряд идущие, и $ \det <\mathbf A>_ <\mathfrak r>\ne 0 $. Если, например,

$$ \det (\mathbf A_) = 0,\ \det (\mathbf A_) \ne 0,\ \det (\mathbf A_) \ne 0 \quad npu \quad j\in\<1,\dots, <\mathfrak r>-1\> ,$$ то сумма $$ \operatorname (\det (\mathbf A_) \cdot \det (\mathbf A_) )+ \operatorname (\det (\mathbf A_) \cdot \det (\mathbf A_) ) $$ считается равной нулю. (Можно также доказать, что в этом случае главные миноры $ \det (\mathbf A_) $ и $ \det (\mathbf A_) $ имеют противоположные знаки.)

Пример. Найти ранг и сигнатуру квадратичной формы

$$f_ <<\color\alpha >>(x_1,x_2,x_3)=3\,x_1^2 -4\,x_1x_2-2\,x_1x_3 + <\color\alpha > \, x_2^2 +6\, x_2x_3 $$ в зависимости от значений параметра $ <\color\alpha > $.

Решение. Сначала пробуем применить формулу из последнего следствия: $$\det <\mathbf A>_1=3,\ \det <\mathbf A>_2=3\, <\color\alpha > -4,\ \det <\mathbf A>_3= \det <\mathbf A>=- <\color\alpha > -15 \ .$$ При $ <\color\alpha > \not\in \ <4/3,\, -15 \>$ формула применима при $ <\mathfrak r>=3 $: $$n_<+>(f)=\left\< \begin 2 & npu & <\color\alpha > >4/3 ;\\ 2 & npu & -15 -15 & 3 & 1 \end $$

Рассмотренный только что пример относится к общей задаче оценки влияния параметров на характеристики квадратичной формы:

Как меняются ранг и сигнатура при непрерывном изменении параметров?

Пусть квадратичная форма зависит от параметров $ \alpha, \beta, \dots $, причем эта зависимость — полиномиальная. Пусть при некотором наборе вещественных значений параметров все главные миноры матрицы квадратичной формы отличны от нуля. Тогда ранг и сигнатура квадратичной формы могут быть вполне определены знаками этих миноров посредством формулы из следствия к закону инерции. Поскольку элементы миноров полиномиально зависят от параметров, то мы получаем систему неравенств, которую (при необходимости домножением некоторых неравенств на $ (-1) $) можно переписать в виде $$ G_1(\alpha,\beta,\dots) > 0, \dots, G_n(\alpha,\beta,\dots) > 0 \ . $$ Здесь $ G_1,\dots, G_n $ — полиномы от $ \alpha,\beta,\dots $. Если при некотором наборе значений $ \alpha=\alpha_0, \beta=\beta_0, \dots $ эта система удовлетворена, при непрерывной вариации этих параметров $ \alpha_0+\delta_<\alpha>, \beta_0 + \delta_<\beta>,\dots $ какое из неравенств системы нарушится в первую очередь, т.е. раньше остальных? Иными словами: какое из неравенств системы самое важное? — Оказывается, последнее.

Теорема[2]. Пусть $ f_ <<\color\alpha >>(x_1,\dots,x_n) $ — квадратичная форма, зависящая от параметра $ <\color\alpha > $ линейным образом:

Справедливо и более общее утверждение.

Теорема[1,5]. Если при непрерывном изменении коэффициентов формы $ f_<> $ ее ранг $ <\mathfrak r>_<> $ остается неизменным, то не изменяется и ее сигнатура $ \sigma_<>(f) $.

В случае, когда главные миноры матрицы $ \mathbf A $ обращаются в нуль, к анализу канонического вида квадратичной формы приходится привлекать «тяжелую артиллерию» в виде ведущих миноров. Но, по крайней мере, один теоретический результат можно сформулировать немедленно.

Теорема. В произвольной квадратичной форме $ f(X) $ ранга $ \mathfrak r\ge 1 $ можно так перенумеровать переменные, чтобы в матрице получившейся квадратичной формы $ \tilde f(Y) $ в последовательности главных миноров

$$ \det \widetilde<\mathbf A>_1, \dots, \det \widetilde<\mathbf A>_ < \mathfrak r>$$ не было двух подряд идущих нулевых и $ \det \widetilde<\mathbf A>_ < \mathfrak r>\ne 0 $.

Конгруэнтность квадратичных форм

Матрицы $ <\mathbf A>$ и $ <\mathbf B>$, связанные соотношением $ <\mathbf B>=C^<\top><\mathbf A>C $ при некоторой неособенной матрице $ C $, называются конгруэнтными: $ <\mathbf A>\cong <\mathbf B>$. Если, вдобавок, матрицы $ <\mathbf A>$ и $ <\mathbf B>$ симметричны, то конгруэнтными называются и соответствующие им квадратичные формы $ X^<\top><\mathbf A>X $ и $ X^<\top><\mathbf B>X $.

Теорема. Квадратичные формы $ X^<\top><\mathbf A>X $ и $ X^<\top><\mathbf B>X $ конгруэнтны тогда и только тогда, когда совпадают их индексы инерции, или, что то же, равны их ранги и сигнатуры.

Из всего разнообразия канонических видов квадратичной формы выберем самый простой, именно тот, коэффициенты которого равны $ +1 $ или $ (-1) $. Например, если квадратичная форма $ f(X) $ уже приведена к каноническому виду $$\widetilde f(Y)=\alpha_1y_1^2+\dots+\alpha_ <\mathfrak r>y_<\mathfrak r>^2 \ .$$ то преобразование $$y_j=\frac<\sqrt<\alpha_j>>\ npu \ j\in \<1,\dots, <\mathfrak r>\> \ , \ y_j=z_j \ npu \ j\in \<<\mathfrak r>+1,\dots, n \> $$ приводит эту форму к виду $$ z_1^2+\dots + z_(A)>^2 -z_(A)+1>^2 — \dots — z_<<\mathfrak r>>^2 \ , $$ который называется нормальным видом квадратичной формы.

Множество всех квадратичных форм с вещественными коэффициентами можно разбить на классы эквивалентности, в каждом из которых будут находиться только конгруэнтные между собой формы. Каждый из классов полностью описывается каким-то из своих представителей. Таким представителем можно взять нормальный вид.

Какое преобразование квадратичной формы оставляет ее инвариантной?

Теорема [Эрмит]. Квадратичная форма $ X^<\top><\mathbf A>X $ переходит в себя при преобразовании

Знакоопределенность

Квадратичная форма $ f_<>(X) $ называется

а) неотрицательной если $ f(X)\ge 0 $ для любого $ X\in \mathbb R^n $;

б) положительно определенной, если она неотрицательна и $ f(X)= 0 $ только при $ X=\mathbb O_<> $;

в) неопределенной или знакопеременной, если существуют $ \ \subset \mathbb R^n $ такие что числа $ f(X_1) $ и $ f(X_2) $ имеют разные знаки: $ f(X_1)f(X_2) глобальным. В случае положительной определенности точка $ X=\mathbb O $ будет единственной точкой пространства $ \mathbb R^ $, в которой $ f_<>(X) $ достигает своего минимального значения. Однако если свойство положительной определенности будет нарушено: $ f(X_1) =0 $ при $ X_1 \ne \mathbb O $, то вследствие однородности формы $ f_<>(X) $ будет выполнено $$ f(tX_1)=t^2f(X_1)= 0 \quad npu \quad \forall t \in \mathbb R \ . $$ Иными словами, свое минимальное значение $ 0_<> $ неотрицательная, но не положительно определенная, форма $ f_<> (X) $ будет принимать на всей прямой, проходящей через точки $ \mathbb O $ и $ \mathbb X_1 $. Точка $ X=\mathbb O $ перестает быть изолированной точкой минимума: в любой ее окрестности находятся другие точки минимума. С точки зрения здравого смысла, подобная ситуация может считаться исключительным, вырожденным случаем. Интуиция подтверждается аналитикой: как увидим впоследствии вероятность того, что случайным образом выбранная квадратичная форма, обладающая свойством неотрицательности, не будет, вдобавок, положительно определенной, равна $ 0_<> $. Событие теоретически возможно, но практически немыслимо.

Оказывается условие положительной определенности формы $ f $ является необходимым и достаточным для обеспечения подобного свойства в произвольном пространстве $ \mathbb R^n $. И это утверждение верно не только для квадратичной формы, но и для однородного полинома (формы) произвольного порядка.

Задача об условных экстремумах квадратичной формы $ f_<>(X) $ на сфере $ x_1^2+\dots+x_n^2 =1 $ решается ☞ ЗДЕСЬ.

Пример. В произвольном евклидовом пространстве $ \mathbb E $ квадратичная форма с матрицей Грама произвольной системы векторов $ \ \subset \mathbb E $

Задача. Найти условия неотрицательности и положительной определенности квадратичной формы в терминах ее коэффициентов.

Очевидны необходимые условия неотрицательности квадратичной формы $$ f(X)=\displaystyle \sum_ <1\le j \le k \le n>f_x_jx_k \ : $$ все коэффициенты при квадратах переменных должны быть неотрицательными: $$ f_<11>\ge 0, \dots , f_\ge 0 . $$ Также очевидно, что эти условия будут и достаточными, если все остальные коэффициенты $ f_^<> $ при $ j\ne k $ равны нулю. Если же последнее условие не выполняется, то имеет смысл предварительно преобразовать квадратичную форму к сумме квадратов, т.е. исследовать ее канонический вид.

Теорема. Ненулевая квадратичная форма, представленная в правильном виде

$$ f(X)=X^<\top><\mathbf A>X \, , $$ будет неотрицательной тогда и только тогда, когда ее отрицательный индекс инерции равен нулю: $$ n_ <->(<\mathbf A>)=0 \qquad \iff \qquad \qquad \sigma ( <\mathbf A>)=\operatorname <\mathbf A>\ .$$ Если это условие выполнено, то для положительной определенности формы необходимо и достаточно чтобы она была невырождена: $ \det <\mathbf A>\ne 0 $.

Доказательство ☞ ЗДЕСЬ.

К счастью, явное представление канонического вида квадратичной формы уже имеется — как правило, он задается формулой Якоби. Индексы инерции вычисляются через знаки главных миноров матрицы квадратичной формы.

Теорема [Сильвестр]. Квадратичная форма

$$ f(X)=X^<\top><\mathbf A>X $$ будет положительно определенной тогда и только тогда, когда все главные миноры ее матрицы положительны: $$ a_<11>>0, \ \left| \begin a_ <11>& a_ <12>\\ a_ <12>& a_ <22>\end \right| >0, \ \left| \begin a_ <11>& a_ <12>& a_ <13>\\ a_ <12>& a_ <22>& a_ <23>\\ a_ <13>& a_ <23>& a_ <33>\end \right| >0, \dots, \det <\mathbf A>>0 \ . $$

Доказательство ☞ ЗДЕСЬ.

Квадратичная форма будет отрицательно определенной тогда и только тогда, когда знаки главных миноров ее матрицы будут чередоваться следующим образом:

Пример. Найти все значения параметра $ <\color\alpha > $, при которых квадратичная форма

$$2\, x_1^2+2\, x_2^2+x_3^2+ 2\, <\color < \alpha>> \, x_1x_2+6\, x_1x_3 +2\,x_2x_3 $$ будет положительно определенной.

Решение. Значения главных миноров: $$\det <\mathbf A>_1=2,\ \det <\mathbf A>_2=4- <\color\alpha >^2,\ \det <\mathbf A>_3=- <\color\alpha >^2+ 6\, <\color\alpha > -16 \ . $$ Последнее выражение будет отрицательно при любых $ <\color\alpha > \in \mathbb R $.

Ответ. Таких значений нет: $ <\color\alpha > \in \varnothing $.

Можно ли получить условия неотрицательности квадратичной формы: $$ f(X) \ge 0 \ npu \ \forall X \in <\mathbb R>^n $$ превращением всех неравенств из критерия Сильвестра в нестрогие: $ > \ \to <\color < \to>> \ \ge $ ? — Вообще говоря, нет.

Пример. Квадратичная форма

$$f(x_1,x_2,x_3,x_4)=x_1^2+2x_1x_3+2x_2x_4+x_4^2= X^ <\top>\left( \begin 1&0&1 &0 \\ 0&0&0&1 \\ 1&0&0&0 \\ 0&1&0&1 \end \right)X $$ — неопределенная, т.к. $ f(1,0,-1,0)=-1_<> 0 $. Тем не менее, все главные миноры ее матрицы неотрицательны. ♦

Имеются ли конструктивные необходимые и достаточные условия неотрицательности квадратичной формы?

Теорема. Для неотрицательности квадратичной формы $ X^ <\top>\mathbf A X $ необходимо и достаточно, чтобы все ведущие миноры матрицы $ \mathbf A $, т.е. миноры, стоящие на пересечении строк и столбцов матрицы с одинаковыми номерами

$$ A\left( \begin j_1 & \dots & j_k \\ j_1 & \dots & j_k \end \right) \ , j_1 0 $ при всех $ X\in \mathbb V_1, X \ne \mathbb O $.

Теорема. Пусть линейное подпространство задано системой линейных однородных уравнений

$$ \left\< \begin h_<11>x_1 & + \dots & + h_<1n>x_n&=0, \\ \dots & & & \dots \\ h_x_1 & + \dots & + h_x_n&=0, \\ \end \right. \qquad \iff \qquad \underbrace<\left( \begin h_ <11>& \dots & h_ <1n>\\ \dots & & \dots \\ h_ & \dots & h_ \end \right)>_<=H>X=\mathbb O $$ Здесь $ k ☞ ЗДЕСЬ.

Пример. Найти ортогональную замену переменных, приводящую квадратичную форму

$$ X^ <\top>\mathbf A X \quad npu \quad <\mathbf A>=\left(\begin 2 & 2 & -1 \\ 2 & -1 & 2 \\ -1& 2 & 2 \end \right) $$ к каноническому виду.

Решение. Характеристический полином $ \det (\mathbf A- \lambda E)=-(\lambda-3)^2(\lambda+3) $. Простому собственному числу $ \lambda=-3 $ соответствует собственный вектор $ <\mathfrak X>_1=[1,-2,1]^<^<\top>> $, а собственному числу $ \lambda=3 $ второй кратности соответствуют два линейно-независимых собственных вектора $ <\mathfrak X>_2=[2,1,0]^<^<\top>> $ и $ <\mathfrak X>_3=[-1,0,1]^<^<\top>> $. Очевидно, что $ \langle <\mathfrak X>_1, <\mathfrak X>_2\rangle=0 , \langle <\mathfrak X>_1, <\mathfrak X>_3 \rangle =0 $, но $ \langle <\mathfrak X>_2, <\mathfrak X>_3 \rangle \ne 0 $. Ортогонализуем систему векторов $ \left\<<\mathfrak X>_2,<\mathfrak X>_3\right\> $: $$<\mathfrak Y>_2=<\mathfrak X>_2, <\mathfrak Y>_3=<\mathfrak X>_3+ <\color\alpha > <\mathfrak Y>_2 \quad \mbox < и >\ \langle <\mathfrak Y>_2,<\mathfrak Y>_3\rangle =0 \ \Longrightarrow <\color\alpha >=-\frac<\langle <\mathfrak X>_2,<\mathfrak X>_3\rangle> <\langle <\mathfrak X>_2,<\mathfrak X>_2\rangle>=\frac<2> <5>$$ и $ <\mathfrak Y>_3=\left[-1/5, 2/5, 1 \right]^<^<\top>> $. После нормирования, получаем ортогональную матрицу $$ P=\left(\begin 1/\sqrt <6>& 2/\sqrt <5>& -1/\sqrt <30>\\ -2/\sqrt <6>& 1/\sqrt <5>& 2/\sqrt <30>\\ 1/\sqrt <6>& 0 & 5/\sqrt <30>\end \right) \ . $$ Замена переменных $ X=PY $ приводит квадратичную форму $ X^ <\top>\mathbf A X $ к каноническому виду $$ (y_1,y_2,y_3) \left(\begin -3 & 0 & 0 \\ 0 & 3 & 0 \\ 0& 0 & 3 \end \right) \left( \begin y_1 \\ y_2 \\ y_3 \end \right)=-3\,y_1^2+3\,y_2^2+3\,y_3^2 \ . $$

Теорема. Если известны коэффициенты характеристического полинома матрицы квадратичной формы $ f(X)=X^<\top>\mathbf A X $:

$$ \det (\mathbf A- \lambda E) \equiv (-1)^n \left(\lambda^n+a_<1>\lambda^+ \dots + a_n \right) \, ,$$ то $$ \operatorname (f(X))= <\mathfrak r>\iff a_=a_=\dots=a_<<\mathfrak r>+1>=0,a_<<\mathfrak r>>\ne 0 \, . $$ В этом случае будет также выполнено $$ n_ <+>(f(X))=<\mathcal V>(1,a_1,\dots,a_<<\mathfrak r>>),\quad n_ <->(f(X))=<\mathcal P>(1,a_1,\dots,a_<\mathfrak r>) \, , $$ $$ \sigma(f(X))=\sum_^ <\mathfrak r>\operatorname (a_a_j) \quad npu \quad a_0=1 \, . $$

Доказательство основано на правиле знаков Декарта.

Геометрия замен переменных

В предыдущих пунктах мы рассмотрели два подхода к построению канонического вида квадратичной формы. Очевидно, что подход, основанный на ортогональной замене переменных более дорогостоящий в построении по сравнению с методом Лагранжа. В самом деле, он требует нахождения собственных чисел симметричной матрицы, т.е. решения алгебраического уравнения $ \det (\mathbf A — \lambda E)=0 $. В случае матриц порядка $ n> 4 $ корни этого уравнения, как правило, на находятся в виде «хорошей» комбинации коэффициентов, и могут быть определены разве лишь приближенно. Метод же Лагранжа принципиально безошибочен: коэффициенты канонического вида определяются в виде рациональных функций от коэффициентов квадратичной формы.

Пример. Уравнение $ 1/3x_1^2-x_1x_2+x_2^2=1 $ задает на плоскости эллипс:

Преобразование $$ y_1=x_1-3/2x_2, y_2=x_2 $$ приводит уравнение к виду $$ 1/3 y_1^2+1/4 y_2^2=1 ; $$ в новых координатах кривая имеет вид на рисунке слева. С другой стороны, преобразование $$ \begin z_1&= \sqrt<1/2+1/\sqrt<13>>\,x_1+\sqrt<1/2-1/\sqrt<13>>\,x_2,\\ z_2&= \sqrt<-1/2-1/\sqrt<13>>\,x_1+\sqrt<1/2+1/\sqrt<13>>x_2 \end $$ приводит уравнение к виду $$\frac<4-\sqrt<13>><6>z_1^2+\frac<4+\sqrt<13>><6>z_2^2=1 \ . $$ В этих координатах кривая имеет вид на рисунке справа.

Оба преобразования координат не изменяют типа кривой: эллипс остается эллипсом. Но второе преобразование дает нечто большее: оно сохраняет размеры. Фактически, оно сводится к повороту исходного эллипса.

Вывод. Метод Лагранжа «дешевле» метода ортогональных преобразований при решении задачи классификации алгебраических многообразий, заданных уравнением вида $ X^ <\top>\mathbf A X=1 $. Иными словами, он позволяет «дешевле» определить тип поверхности с точностью до ее формы: например, в $ \mathbb R^3 $ является ли эта поверхность эллипсоидом или гиперболоидом (и каким именно — однополостным или двуполостным)? Но если нас интересуют истинные размеры этой поверхности: например, размеры посылочного ящика, в который эллипсоид, заданный уравнением $ X^ <\top>\mathbf A X=1 $, можно было бы поместить — то здесь без собственных векторов и чисел матрицы $ \mathbf A $ не обойтись!

Квадратичные формы

Содержание:

Квадратичные формы и их определение

Определение. Квадратичной формой L (x1, x2, . xn) от n переменных называется сумма, каждый член которой является или квадратом одной из переменных, или произведением двух различных переменных, взятых с некоторым коэффициентом, то есть
(2.44)

Допускаем, что в квадратичной форме (2.44) aij — действительные числа. Распишем квадратичную форму (2.44), разбив слагаемые, содержащие произведения переменных, на две равные части:

Матрица
(2.45)

или A = ij> (i, j = 1, 2, . n) является симметричной, так как aij = aji, называется матрицей квадратичной формы (2.44).

Рангом квадратичной формы называется ранг ее матрицы. Квадратичная форма называется невырожденной, если ее матрица невырожденная.
Если то квадратичную форму можно переписать в матричном виде L (x1, x2, . xn) = X T AX.

Выражение X T AX представляет собой квадратичную форму в матричном виде.

Пример 1. Записать в матричном виде квадратичную форму

Решение. Матрица данной квадратичной формы имеет вид

А =

Значит,

Квадратичная форма называется канонической (или другими словами, имеет канонический вид), если все aij = 0, когда i ≠ j. Тогда квадратичная форма будет иметь вид

Рассмотрим следующую теорему.

ТЕОРЕМА 1. Произвольная квадратичная форма приводится к каноническому виду.

Доказательство. Пусть задана квадратичная форма (2.44) с матрицей (2.45) в базисе . Так как A — симметричная матрица, то существует ортогональная матрица B такая, что.

Матрица B является матрицей перехода от базиса
(2.46)
к некоторому базису
. (2.47)

Примечание. Действительная квадратная матрица называется ортогональной, если сумма квадратов элементов каждого столбца равна единице и сумма произведений соответствующих элементов из двух разных столбцов равна нулю. Необходимое и достаточное условие ортогональности матрицы В является условие В T ⋅ B = Е.

Пусть X и Y являются векторами-столбцами из координат вектора соответственно в базисах (2.46) и (2.47). Тогда X = BY и

или
(2.48)

Примечание. При доказательстве данной теоремы использовали транспонирование произведения матриц по формуле (СY) T = Y T ⋅ C T .

Заметим, что в канонической форме (2.48) λ1, λ2, . λn являются собственными числами матрицы A.

Пример 2. Привести квадратичную форму к каноническому виду с помощью ортогональной матрицы и найти ее.

Решение. Матрица данной квадратичной формы имеет вид . Запишем систему типа (2.39) для нахождения собственных чисел и собственных векторов
(2.49)
Характеристическое уравнение данной системы имеет вид
или (2 – λ) (5 – λ) – 4 = 0.
Решив данное уравнение, находим λ1 = 6, λ2 = 1. Значит канонический вид данной квадратичной формы является .
Найдем ортогональную матрицу.

Столбцами ортогональной матрицы, которая приводит квадратичную форму к каноническому виду, является ортонормированный собственные вектор-столбец матрицы A.

Сначала найдем нормированный собственный вектор-столбец матрицы A с собственным значением λ1 = 6. Для этого из системы (2.49) имеем систему для нахождения координат вектора:

Из данной системы находим x2 = 2x1 или u2 = 2u1. Значит, при произвольном u1, отличном от нуля, столбец является собственным вектором-столбиком матрицы A, а столбец является нормированным собственным вектором-столбиком матрицы A. Здесь использовано, что .
Аналогично находим вектор-столбец матрицы A с собственным значением λ2 = 1, а именно из системы:

Находим x1 = –2x2 или при произвольном s, отличном от нуля, столбец является собственным вектором матрицы A. Столбец является нормированным собственным вектором матрицы A. Значит, искомая матрица имеет вид:

Замечание. Легко проверить, что для данного примера 2.
Рассмотрим на примере еще один метод приведения квадратичной формы к каноническому виду.

Метод Лагранжа приведения квадратичной формы к каноническому виду заключается в последовательном выделении полных квадратов.

Пример 3. Привести к каноническому виду квадратичную форму методом Лагранжа. Сначала выделим полный квадрат при переменной x1, коэффициент при которой отличен от нуля.

Итак, невырожденное линейное преобразование

приводит данную квадратичную форму к каноническому виду

Канонический вид квадратичной формы не является однозначным, так как одна и та же квадратичная форма может быть приведена к каноническому виду многими способами. Однако полученные разными способами квадратичные формы имеют ряд общих свойств.

Сформулируем одно из этих свойств, которое выражает закон инерции квадратичных форм, и заключается в следующем: все канонические формы, к которым приводится данная квадратичная форма, имеют:
1) одно и то же число нулевых коэффициентов;
2) одно и то же число положительных коэффициентов;
3) одно и то же число отрицательных коэффициентов.

Определение 1. Квадратичная форма L (x1, x2, . xn) называется положительно определенной, если для всех действительных значений x1, x2, . xn используется неравенство L (x1, x2, . xn) > 0.

Определение 2. Если L (x1, x2, . xn) является положительно определенной формой, то квадратичная формаL (x1, x2, . xn) T AX была положительно (отрицательно) определенной, необходимо и достаточно, чтобы все собственные значения λi (i = 1, 2, . n) матрицы A были положительными (отрицательными).

Данную теорему приводим без доказательства.

Во многих случаях для установления знакоопределенности квадратичной формы удобно применять критерии Сильвестра.

ТЕОРЕМА 3. Для того чтобы квадратичная форма была положительно определенной, необходимо и достаточно, чтобы все главные миноры матрицы этой формы были положительными, то есть
где
Следует заметить, что для отрицательно определенных квадратичных форм знаки главных миноров чередуются, начиная со знака «минус» для минора первого порядка.

Например, квадратичная форма L в примере 2 является положительно определенной на основании теоремы 2, так как корни характеристического уравнения λ1 = 6 и λ2 = 1 являются положительными.
Второй способ. Так как главные миноры матрицы A
являются положительными, то по критерию Сильвестра данная квадратичная форма является положительно определенной.

Квадратичные формы

Однородный многочлен второй степени относительно переменных

называется квадратичной формой от этих переменных. Если взять то квадратическую форму (1.26) можно записать в виде:

Выражение (1.28), а следует и квадратичная форма (1.26) полностью определяется матрицей которая называется матрицей квадратичной формы (1.26).

Выполняя замену базиса, квадратичную форму (1.26) можно привести к виду:

где — новые переменные, что линейно выражаются через (1.28), — собственные значения матрицы

Выражение (1.29) называется каноническим видом квадратичной формы (1.26).

Рассмотрим квадратичную форму где — матрица коэффициентов

Тогда квадратичную форму можно записать так:

Квадратичная форма называется положительно определенной, если для всех действительных значений выполняется неравенство и отрицательной, если для всех действительных значений выполняется неравенство

Если положительно определена, то квадратичная форма называется отрицательно определенной.

Решение примеров:

Пример 1.99

является отрицательно определенной.

Пример 1.100

Используя теорию квадратичных форм, привести к каноническому виду уравнения линии второго порядка

Решение. Уравнение линии запишем в виде в котором

Сложим характеристическое уравнение матрицы и найдем ее собственные значения.

или

Корни уравнения являются собственными значениями. Следует, уравнение линии преобразуется в вид или Полученная линия — гипербола.

Свойства квадратичной формы (1.30) связаны с собственными числами матрицы

Пример 1.101

Привести к каноническому виду уравнения линии

Решение. Группа старших членов этого уравнения квадратическую форму Ее матрица

Собственными значениями будут числа Следует квадратичная форма преобразуется к виду а данное уравнение — к виду или Это эллипс.

Присылайте задания в любое время дня и ночи в ➔

Официальный сайт Брильёновой Натальи Валерьевны преподавателя кафедры информатики и электроники Екатеринбургского государственного института.

Все авторские права на размещённые материалы сохранены за правообладателями этих материалов. Любое коммерческое и/или иное использование кроме предварительного ознакомления материалов сайта natalibrilenova.ru запрещено. Публикация и распространение размещённых материалов не преследует за собой коммерческой и/или любой другой выгоды.

Сайт предназначен для облегчения образовательного путешествия студентам очникам и заочникам по вопросам обучения . Наталья Брильёнова не предлагает и не оказывает товары и услуги.


источники:

http://vmath.ru/vf5/2form

http://natalibrilenova.ru/kvadratichnyie-formyi/