Привести квадратичную форму к каноническому уравнению

Приведение кривой второго порядка к каноническому виду

Пример . Дано уравнение кривой 3x 2 +10xy+3y 2 -2x-14y-13=0 в системе координат (0,i,j), где i =(1,0) и j =(0,1).
1. Определить тип кривой.
2. Привести уравнение к каноническому виду и построить кривую в исходной системе координат.
3. Найти соответствующие преобразования координат.

Решение. Приводим квадратичную форму B=3x 2 +10xy+3y 2 к главным осям, то есть к каноническому виду. Матрица этой квадратичной формы . Находим собственные числа и собственные векторы этой матрицы:

Характеристическое уравнение:
; λ1=-2, λ2=8. Вид квадратичной формы: .
Исходное уравнение определяет гиперболу.
Заметим, что вид квадратичной формы неоднозначен. Можно записать 8x1 2 -2y1 2 , однако тип кривой остался тот же – гипербола.
Находим главные оси квадратичной формы, то есть собственные векторы матрицы B. .
Собственный вектор, отвечающий числу λ=-2 при x1=1: x 1=(1,-1).
В качестве единичного собственного вектора принимаем вектор , где – длина вектора x 1.
Координаты второго собственного вектора, соответствующего второму собственному числу λ=8, находим из системы
.
x 2=(1,1); .
Итак, имеем новый ортонормированный базис ( i 1, j 1).
По формулам (5) пункта 4.3.3. переходим к новому базису:
или

Задание. Привести к каноническому виду уравнение линии 17x 2 + 12xy + 8y 2 — 20 = 0.
Решение.Пример 2

Задание. Привести к каноническому виду уравнение линии второго порядка, используя теорию квадратичных форм и определить её вид. Уравнение кривой второго порядка путем выделения полного квадрата привести к каноническому виду. Решение

Задание. Привести уравнение к каноническому виду: 16x 2 — 9y 2 -64x — 8y +199 = 0.
Решение.Скачать решение

Задание. Установить, что каждое из следующих уравнений определяет гиперболу, и найти координаты ее центра С, полуоси, эксцентриситет, уравнения асимптот и уравнения директрис. Изобразить гиперболу на чертеже, указав фокусы, асимптоты и директрисы.
Решение:Скачать решение

Задание. Установить, что каждое из следующих уравнений определяет эллипс, и найти координаты его центра С, полуоси, эксцентриситет, уравнения директрис. Изобразить эллипс на чертеже, указав оси симметрии, фокусы и директрисы.
Решение:Скачать решение

76. Приведение квадратичных форм к каноническому виду

Рассмотрим некоторое линейное преобразование А с матрицей .

Это симметрическое преобразование можно записать в виде:

Y1 = a11x1 + a12x2

Y2 = a12x1 + a22x2

Где у1 и у2 – координаты вектора в базисе .

Очевидно, что квадратичная форма может быть записана в виде

Ф(х1, х2) = х1у1 + х2у2.

Как видно, геометрический смысл числового значения квадратичной формы Ф в точке с координатами х1 и х2 – скалярное произведение .

Если взять другой ортонормированный базис на плоскости, то в нем квадратичная форма Ф будет выглядеть иначе, хотя ее числовое значение в каждой геометрической точке и не изменится. Если найти такой базис, в котором квадратичная форма не будет содержать координат в первой степени, а только координаты в квадрате, то квадратичную форму можно будет привести к каноническому виду.

Если в качестве базиса взять совокупность собственных векторов линейного преобразования, то в этом базисе матрица линейного преобразования имеет вид:

.

При переходе к новому базису от переменных х1 и х2 мы переходим к переменным и . Тогда:

Тогда .

Выражение называется Каноническим видом квадратичной формы. Аналогично можно привести к каноническому виду квадратичную форму с большим числом переменных.

Теория квадратичных форм используется для приведения к каноническому виду уравнений кривых и поверхностей второго порядка.

Пример. Привести к каноническому виду квадратичную форму

Ф(х1, х2) = 27.

Коэффициенты: а11 = 27, а12 = 5, а22 = 3.

Составим характеристическое уравнение: ;

(27 — l)(3 — l) – 25 = 0

Пример. Привести к каноническому виду уравнение второго порядка:

17×2 + 12xy + 8y2 – 20 = 0.

Коэффициенты а11 = 17, а12 = 6, а22 = 8. А =

Составим характеристическое уравнение:

(17 — l)(8 — l) — 36 = 0

136 — 8l — 17l + l2 – 36 = 0

L2 — 25l + 100 = 0

Итого: — каноническое уравнение эллипса.

Пример. Используя теорию квадратичных форм, привести к каноническому виду уравнение линии второго порядка. Схематично изобразить график.

Решение: Составим характеристическое уравнение квадратичной формы : при

Решив это уравнение, получим l1 = 2, l2 = 6.

Найдем координаты собственных векторов:

Полагая m1 = 1, получим n1 =

Полагая m2 = 1, получим n2 =

Собственные векторы:

Находим координаты единичных векторов нового базиса.

Имеем следующее уравнение линии в новой системе координат:

Каноническое уравнение линии в новой системе координат будет иметь вид:

Пример. Используя теорию квадратичных форм, привести к каноническому виду уравнение линии второго порядка. Схематично изобразить график.

Решение: Составим характеристическое уравнение квадратичной формы : при

Решив это уравнение, получим l1 = 1, l2 = 11.

Найдем координаты собственных векторов:

Полагая m1 = 1, получим n1 =

Полагая m2 = 1, получим n2 =

Собственные векторы:

Находим координаты единичных векторов нового базиса.

Имеем следующее уравнение линии в новой системе координат:

Каноническое уравнение линии в новой системе координат будет иметь вид:

Пример. Используя теорию квадратичных форм, привести к каноническому виду уравнение линии второго порядка. Схематично изобразить график.

4ху + 3у2 + 16 = 0

Коэффициенты: a11 = 0; a12 = 2; a22 = 3.

Характеристическое уравнение:

Корни: l1 = -1, l2 = 4.

Для l1 = -1 Для l2 = 4

M1 = 1; n1 = -0,5; m2 = 1; n2 = 2;

= (1; -0,5) = (1; 2)

Получаем: — каноническое уравнение гиперболы.

При использовании компьютерной версии “Курса высшей математики” возможно запустить программу, которая решает рассморенные выше примеры для любых начальных условий.

Для запуска программы дважды щелкните на значке:

В открывшемся окне программы введите коэффициенты квадратичной формы и нажмите Enter.

Примечание: Для запуска программы необходимо чтобы на компьютере была установлена программа Maple (Ó Waterloo Maple Inc.) любой версии, начиная с MapleV Release 4.

VMath

Инструменты сайта

Основное

Навигация

Информация

Действия

Содержание

Квадратичная форма

$ \mathbb A_<> $ означает одно из множеств: $ \mathbb Q_<> $ рациональных, или $ \mathbb R_<> $ вещественных, или $ \mathbb C_<> $ комплексных чисел.

Определение

Квадратичной формой над множеством $ \mathbb A_<> $ называют однородный полином второй степени с коэффициентами из $ \mathbb A_<> $; если переменные обозначить $ x_1,\dots,x_ $, то общий вид квадратичной формы от этих переменных: $$ f(x_1,\dots,x_ )= \sum_ <1\le j \le k \le n>f_x_jx_k= $$ $$\begin \displaystyle= f_<11>x_1^2&+f_<12>x_1x_2&+ \dots & +f_<1n>x_1x_n+ \\ &+f_<22>x_2^2 &+ \dots & +f_<2n>x_2x_n+ \\ &+\dots & & +\dots + \\ & & +f_x_jx_k & + \dots+ \\ & & &+f_x_n^2. \end $$

Пример. Функции

$$x_1^2-x_1x_2+x_3^2 \, , \quad \sqrt<3>\, x_2^2 — \pi\, x_3^2 \, , \quad -x_1x_2 \, , \quad \mathbf i \, x_1^2$$ являются квадратичными формами. Функции $$x_1^2-3\, x_1+1 \, , \quad 5\, x_1^2x_2^2 \, , \quad \frac \, , \quad \sqrt $$ не являются квадратичными формами.

Заметим, что в выражении для квадратичной формы присутствуют как квадраты переменных $ x_1^2,\dots,x_n^2 $ так и их смешанные произведения $ x_j x_k $. Говорят, что квадратичная форма $ f(x_1,\dots,x_ ) $ имеет канонический вид если $$f(x_1,\dots,x_ )\equiv f_<11>x_1^2+f_<22>x_2^2+\dots+f_x_n^2 \quad npu \quad \left\\right\>_^n \subset \mathbb A \ , $$ т.е. все коэффициенты при смешанных произведениях переменных равны нулю; в этом случае говорят также, что форма является «суммой квадратов» 1) .

Оказывается, что в любой квадратичной форме можно так сгруппировать входящие в нее одночлены, что в результате получится ее (эквивалентное) представление в виде суммы квадратов.

Пример.

$$ 2\, x_1^2+4\, x_1x_2 +x_2^2 \equiv 2\, (x_1+x_2)^2-x_2^2 \equiv -2\,x_1^2 + (2\,x_1+x_2)^2 \ ; $$ $$ x_1^2+2 \mathbf i x_1x_2 — x_2^2 \equiv (x_1+ \mathbf i x_2)^2 \ ; $$ $$-x_1^2+6\,x_1x_2+6\,x_1x_3+2\,x_2^2+4\,x_2x_3+2\,x_3^2\equiv $$ $$ \equiv (x_1+x_2+x_3)^2-2\,(x_1-x_2-x_3)^2+3\,(x_2+x_3)^2 \equiv $$ $$\equiv -(x_1+3\,x_2+3\,x_3)^2+11\,(x_2+x_3)^2 \ ; $$ $$ x_1x_2 \equiv \frac<1> <4>(x_1+x_2)^2- \frac<1> <4>(x_1-x_2)^2 \ . $$

А в общем случае: $$ f(x_1,\dots,x_ )\equiv $$ $$ \begin \equiv a_1(c_<11>x_1+c_<12>x_2+\dots+c_<1n>x_n)^2 +\\ +a_2(c_<21>x_1+c_<22>x_2+\dots+c_<2n>x_n)^2+ \\ +\dots+ \\ +a_n(c_x_1+c_x_2+\dots+c_x_n)^2 \end $$ при $ \_^n,\\>_^n $ — константах. Такое представление оказывается достаточно удобным для анализа квадратичной формы — например, в случае вещественных форм, при проверке выполнимости неравенства вида $ f(x_1,\dots,x_ ) \ge 0 $. Приведенные выше примеры показывают неоднозначность представления в виде суммы квадратов: вид квадратов и даже их количество для одной и той же формы могут быть различными. С целью обеспечения частичной унификации установим некоторое дополнительное ограничение, а именно, потребуем, чтобы линейные однородные формы $$ c_<11>x_1+c_<12>x_2+\dots+c_<1n>x_n, \ c_<21>x_1+c_<22>x_2+\dots+c_<2n>x_n,\dots, c_x_1+c_x_2+\dots+c_x_n $$ были линейно независимыми. При таком ограничении любое представление квадратичной формы в виде суммы квадратов называется каноническим видом квадратичной формы.

Задача. Для произвольной квадратичной формы $ f(x_1,\dots,x_ ) $ построить (хотя бы один) ее канонический вид.

$$ x^2 -2\,xy+3\,y^2+x-4\,y-15=0 $$ определить к какому типу (эллипс, гипербола, парабола,…) она относится.

Метод Лагранжа приведения квадратичной формы к каноническому виду

Существует универсальный алгоритм, приводящий произвольную квадратичную форму к каноническому виду.

1. Пусть $ f_<11>\ne 0 $. Выделим в $ f(x_1,\dots, x_n)_<> $ все слагаемые, содержащие $ x_ <1>$: $$ f_<11>x_1^2+f_<12>x_1x_2+ \dots +f_<1n>x_1x_n+ \sum_ <2\le j\le k \le n>f_x_jx_k = $$ $$ = f_<11>\left(x_1^2+\frac>>x_1x_2+\dots+ \frac>>x_1x_n \right)+\dots= $$ $$ =f_<11>\left[ \left(x_1+\frac><2f_<11>>x_2+\dots+ \frac><2f_<11>>x_n \right)^2-\left(\frac><2f_<11>>x_2+\dots+ \frac><2f_<11>>x_n \right)^2 \right]+\dots= $$ $$ =f_ <11>\left(x_1+\frac><2f_<11>>x_2+\dots+ \frac><2f_<11>>x_n\ \right)^2 — f_<11>\left(\frac><2f_<11>>x_2+\dots+ \frac><2f_<11>>x_n \right)^2 +\dots $$ В последнем представлении первое слагаемое представляет собой квадрат линейной формы по переменным $ x_<1>,x_2,\dots,x_n $; все оставшиеся слагаемые не зависят от $ x_ <1>$, т.е. составляют квадратичную форму от переменных $ x_<2>,\dots,x_n $. Таким образом, исходная задача для формы $ n_<> $ переменных оказывается сведенной к случаю формы $ (n-1)_<> $-й переменной; последняя преобразуется по аналогичному принципу.

2. Если $ f_<11>=0 $, но $ \exists k:\ f_\ne 0 $, т.е. при хотя бы одном квадрате переменной коэффициент отличен от нуля. Алгоритм модифицируется таким образом, что выделение полного квадрата начинается с переменной $ x_ $ вместо $ x_ <1>$ — первая ничем не лучше (и не хуже) $ k_<> $-й!

3. Совсем исключительный случай: квадраты переменных вообще отсутствуют, т.е. $ f_<11>=\dots=f_=0 $. Выбираем один из ненулевых коэффициентов при смешанных произведениях переменных: пусть $ f_\ne 0 $. Представляем $ x_k=(x_j+x_k)-x_j $ и заменяем все вхождения переменной $ x_ $ на $ X_k-x_j $ при вспомогательной переменной $ X_k=x_j+x_k $. В новой квадратичной форме уже присутствует квадрат переменной $ x_ $ с ненулевым коэффициентом. Тем самым этот случай сводится к предыдущему. После приведения новой формы к сумме квадратов возвращаемся к «старой» переменной $ x_ $.

Пример. Привести форму

$$ f=4\,x_1^2+2\,x_2^2+x_3^2+x_4^2-4\,x_1x_2-4\,x_1x_3+4\,x_1x_4+4\,x_2x_3-4\,x_3x_4 $$ к каноническому виду.

Решение. $$ \begin f&=&4\left(x_1^2-x_1x_2-x_1x_3+x_1x_4\right)+2x_2^2+x_3^2+x_4^2+4x_2x_3-4x_3x_4=\\ &=&4\bigg[ \left(x_1-\frac<1><2>\, x_2-\frac<1><2>\,x_3+ \frac<1><2>\,x_4\, \right)^2- \left(-\frac<1><2>\, x_2-\frac<1><2>\, x_3+\frac<1><2>\, x_4\right)^2 \bigg] + \\ &+&2\,x_2^2+x_3^2+x_4^2+4\,x_2x_3-4\,x_3x_4= \\ &=&4\,\left(x_1-\frac<1><2>\, x_2-\frac<1><2>\,x_3+ \frac<1><2>\,x_4\, \right)^2+\\ & & + \Big[\left(x_2+x_3+x_4\, \right)^2- \left(x_3+x_4 \right)^2\Big]-2\,x_3x_4 = \\ &=&4\,\left(x_1-\frac<1><2>\, x_2-\frac<1><2>\,x_3+ \frac<1><2>\,x_4\, \right)^2+ \left(x_2+x_3+x_4\, \right)^2- \\ &&-x_3^2-4\,x_3x_4-x_4^2= \\ && 4\,\left(x_1-\frac<1><2>\, x_2-\frac<1><2>\,x_3+ \frac<1><2>\,x_4\, \right)^2+ \left(x_2+x_3+x_4\, \right)^2- \\ &&-\Big[ \left(x_3+ 2\, x_4\, \right)^2-4\, x_4^2\Big] -x_4^2 = \\ &=&4\,\left(x_1-\frac<1><2>\, x_2-\frac<1><2>\,x_3+ \frac<1><2>\,x_4\, \right)^2+ \left(x_2+x_3+x_4\, \right)^2-\left(x_3+ 2\, x_4\, \right)^2+3\,x_4^2 \end $$

Ответ. $ f\equiv 4\,\left(x_1-\frac<1><2>\, x_2-\frac<1><2>\,x_3+ \frac<1><2>\,x_4\, \right)^2+ \left(x_2+x_3+x_4\, \right)^2-\left(x_3+ 2\, x_4\, \right)^2+3\,x_4^2 $.

Пример. Привести форму

$$ f=x_1^2+x_2^2-4\,x_3^2+2\,x_1x_2+6\,x_1x_3+4\,x_2x_3 $$ к каноническому виду.

Решение. $$ f\equiv (x_1+x_2+3\,x_3)^2-(x_2+3\,x_3)^2+x_2^2-4\,x_3^2+4\,x_2x_3 \equiv $$ $$ \equiv (x_1+x_2+3\,x_3)^2-2\,x_2x_3 -13\,x_3^2 \equiv $$ В соответствии с алгоритмом, на следующем шаге нужно выделять слагаемые, содержащие переменную $ x_ <2>$, но коэффициент при $ x_2^2 $ в правой части формулы обратился в нуль. Поэтому — в соответствии с пунктом 2 метода — приходится выделять квадрат на основе переменной $ x_ <3>$: $$ (x_1+x_2+3\,x_3)^2-13\, \left(x_3-\frac<1><13>x_2\right)^2+13\cdot \frac<1><13^2>x_2^2 \ . $$

Ответ. $ (x_1+x_2+3\,x_3)^2-13\, \left(x_3-\frac<1><13>x_2\right)^2+ \frac<1><13>x_2^2 $.

Пример. Привести форму

$$ f=x_1x_2-3\,x_1x_3+2\,x_2x_3 $$ к каноническому виду.

Решение. Коэффициенты при квадратах переменных все равны нулю. Действуем в соответствии с пунктом 3 метода Лагранжа. Поскольку коэффициент при $ x_1x_2 $ отличен от нуля, делаем замену переменной $ x_2=X_2-x_1 $ при $ X_2=x_1+x_2 $: $$ f\equiv -x_1^2+x_1X_2-5\,x_1x_3+2\,X_2x_3 \ . $$ Дальнейший ход решения — в соответствии с пунктом 1 метода Лагранжа: $$ -\left(x_1-\frac<1><2>X_2+\frac<5><2>x_3\right)^2+\left(-\frac<1><2>X_2+\frac<5><2>x_3\right)^2+2\,X_2x_3 \equiv $$ $$ \equiv -\left(x_1-\frac<1><2>X_2+\frac<5><2>x_3\right)^2+\frac<1><4>X_2^2-\frac<1><2>X_2x_3+\frac<25><4>x_3^2 \equiv $$ $$ \equiv -\left(x_1-\frac<1><2>X_2+\frac<5><2>x_3\right)^2+\frac<1><4>\left(X_2-x_3 \right)^2+6\,x_3^2 \ $$ Получили сумму квадратов форм от переменных $ x_1,X_2,x_3 $. Возвращаемся к переменной $ x_ <2>$:

Ответ. $ -(\frac<1><2>x_1-\frac<1><2>x_2+\frac<5><2>x_3)^2+\frac<1><4>(x_1+x_2-x_3)^2+6\,x_3^2 $.

Матричная форма записи квадратичной формы

Задача. Установить правило формирования коэффициентов канонического вида квадратичной формы, получающегося применением метода Лагранжа.

Прежде всего, соберем все переменные в один вектор, а вернее — в два вектора: $$ <>_ <.>\mbox < столбец переменных >X= \left(\begin x_1 \\ \vdots \\ x_n \end \right) \quad \mbox < и строку переменных >X^ <\top>= (x_1,\dots,x_n) \ ; $$ здесь $ <>^ <\top>$ означает транспонирование. Не очень принципиально, что обозначать через $ X_<> $ — столбец или строку; и хотя сокращение $ f(x_1,\dots,x_n)=f(X) $ кажется не вполне корректным с точки зрения только что введенного обозначения, тем не менее не будем навешивать в правую часть дополнительные значки…

Если определить верхнетреугольную матрицу $ \mathbf F $ равенством: $$ <\mathbf F>= \left( \begin f_<11>&f_<12>&\dots &f_ <1n>\\ &f_<22>& \dots & f_ <2n>\\ \mathbb O & &\ddots & \vdots \\ & & & f_ \end \right), $$ то квадратичную форму можно записать в виде произведения трех матриц $$ <>_ <.>\mbox < строка переменных >\times \mbox < матрица >\times \mbox < столбец переменных >$$ $$ f(X)=X^ <\top><\mathbf F>X \ .$$ Более того, можно написать бесконечно много подобных представлений для одной и той же квадратичной формы $ f_<> $, подбирая разные матрицы

Пример. $ f=x_1^2+x_2^2-4\,x_3^2+2\,x_1x_2+6\,x_1x_3+4\,x_2x_3 \equiv $

$$ \equiv (x_1,x_2,x_3) \left( \begin 1 & 2 & 6 \\ 0 & 1 & 4 \\ 0 & 0 & -4 \end \right) \left( \begin x_1 \\ x_2 \\ x_3 \end \right) \equiv (x_1,x_2,x_3) \left( \begin 1 & 0 & 3 \\ 2 & 1 & 4 \\ 3 & 0 & -4 \end \right) \left( \begin x_1 \\ x_2 \\ x_3 \end \right)\equiv $$ $$ \equiv (x_1,x_2,x_3) \left( \begin 1 & 1 & 3 \\ 1 & 1 & 2 \\ 3 & 2 & -4 \end \right) \left( \begin x_1 \\ x_2 \\ x_3 \end \right)\equiv \dots $$

Пример. Для приведенной выше квадратичной формы

$$ f=x_1^2+x_2^2-4\,x_3^2+2\,x_1x_2+6\,x_1x_3+4\,x_2x_3 $$ ее правильной записью будет именно последняя:

$$ f\equiv (x_1,x_2,x_3) \left( \begin 1 & 1 & 3 \\ 1 & 1 & 2 \\ 3 & 2 & -4 \end \right) \left( \begin x_1 \\ x_2 \\ x_3 \end \right) $$ Правило формирования матрицы довольно просты: на диагонали ставятся коэффициенты при квадратах, а внедиагональные элементы получаются располовиниванием коэффициентов при смешанных произведениях переменных.

$ x_ <1>$$ x_ <2>$$ x_ <3>$
$ x_ <1>$$ f_ <11>$$ \frac<1><2>f_ <12>$$ \frac<1><2>f_ <13>$
$ x_ <2>$$ \frac<1><2>f_ <12>$$ f_ <22>$$ \frac<1><2>f_ <23>$
$ x_ <3>$$ \frac<1><2>f_ <13>$$ \frac<1><2>f_ <23>$$ f_ <33>$

Пример. Для

$$ f(x_1,x_2)=a_<11>x_1^2+2\, a_<12>x_1x_2+a_<22>x_2^2 $$ имеем: $$ <\mathbf A>= \left( \begin a_ <11>& a_ <12>\\ a_ <12>& a_ <22>\end \right) \ ; \ <\mathcal D>(f)=a_<11>a_<22>-a_<12>^2 \ ; $$ последнее выражение вполне напоминает дискриминант квадратного трехчлена $ a_<11>x^2+2\, a_<12>x+a_ <22>$ и это обстоятельство оправдывает использование слова дискриминант для нового объекта…

Рассмотрим замены переменных в квадратичной форме, т.е. переход от переменных $ x_<1>,\dots,x_ $ к новым переменным $ y_<1>,\dots,y_ $. Ограничимся только линейными заменами вида $$ \left\< \begin x_1&=&c_<11>y_1+c_<12>y_2+\dots+c_<1n>y_n, \\ x_2&=&c_<21>y_1+c_<22>y_2+\dots+c_<2n>y_n, \\ \dots & & \dots \\ x_n&=&c_y_1+c_y_2+\dots+c_y_n. \end \right. $$ Результатом такой замены переменных будет новая квадратичная форма относительно новых переменных. Установим по какому закону формируются ее коэффициенты. С этой целью введем в рассмотрение матрицу замены переменных $$ C= \left( \begin c_ <11>& c_ <12>& \dots & c_ <1n>\\ c_ <21>& c_ <22>& \dots & c_ <2n>\\ \dots & & & \dots \\ c_ & c_ & \dots & c_ \\ \end \right) ; $$ которая позволяет переписать саму замену переменных в матричном виде $$ \left(\begin x_1 \\ x_2 \\ \vdots \\ x_n \end \right)= \left( \begin c_ <11>& c_ <12>& \dots & c_ <1n>\\ c_ <21>& c_ <22>& \dots & c_ <2n>\\ \dots & & & \dots \\ c_ & c_ & \dots & c_ \\ \end \right) \left(\begin y_1 \\ y_2 \\ \vdots \\ y_n \end \right) \qquad \iff \qquad X=CY \ . $$ Тогда формальная подстановка последнего варианта в правильную запись квадратичной формы приведет к следующей цепочке $$ f(X)=X^<\top><\mathbf A>X= (CY)^<\top> <\mathbf A>(CY)=Y^ <\top>C^<\top><\mathbf A>C Y=\tilde f (Y) \ , $$ (здесь использовались некоторые свойства операции транспонирования ) и, если обозначить матрицу $$ \mathbf B =C^<\top><\mathbf A>C \ , $$ то мы получаем правило формирования матрицы квадратичной формы, получившейся в результате замены переменных, с помощью операции произведения матриц. Обратим внимание на еще один факт — матрица $ \mathbf B $ является симметричной: $$ \mathbf B^ <\top>=(C^<\top><\mathbf A>C)^<\top>= C^<\top><\mathbf A>^<\top>\left(C^ <\top>\right)^ <\top>= C^<\top><\mathbf A>C= \mathbf B \ , $$ т.е. выбор в качестве матричной записи квадратичной формы именно того варианта, что основан на симметричной матрице, позволяет сохранить это свойство при любой линейной замене переменных.

Задача о нахождении канонического вида квадратичной формы $ X^<\top><\mathbf A>X $ может быть также переформулирована в терминах замены переменных: требуется найти такую матрицу $ C_<> $, чтобы матрица $ \mathbf B= C^<\top><\mathbf A>C $ оказалась диагональной: $$ \mathbf B= \left( \begin a_ <1>& & & \\ & a_ <2>& & <\mathbb O>\\ <\mathbb O>& & \ddots & \\ & & & a_ \end \right) \ ; $$ при этом дополнительным условием ставится невырожденность (неособенность) матрицы $ C_<> $: $$ \det C \ne 0 \ . $$

Теорема. Для любой квадратичной формы над $ \mathbb A $ существует невырожденная линейная замена переменных $ X=CY $ такая, что преобразованная квадратичная форма $ \widetilde f(Y) $ имеет канонический вид.

Вернемся к примерам предыдущего пункта, перепишем их на матричном языке.

Пример. Для формы

$$ f(x_1,x_2,x_3,x_4)= $$ $$=4\,x_1^2+2\,x_2^2+x_3^2+x_4^2-4\,x_1x_2-4\,x_1x_3+4\,x_1x_4+4\,x_2x_3-4\,x_3x_4 $$ замена переменных осуществляется формулами

$$ \begin y_1=& x_1 &-\frac<1><2>\, x_2&-\frac<1><2>\,x_3&+ \frac<1><2>\,x_4, \\ y_2=& & x_2&+x_3&+x_4, \\ y_3=& & & x_3 &+ 2\, x_4,\\ y_4=& &&& x_4, \end $$ т.е. матрица замены переменных $$ C= \left( \begin 1 & -\frac<1> <2>& -\frac<1> <2>& \frac<1> <2>\\ 0 & 1 & 1 & 1 \\ 0 & 0 & 1 & 2 \\ 0 & 0 & 0 & 1 \end \right) $$ имеет верхнетреугольный вид. Канонический вид в новых переменных записывается $$ f(x_1,x_2,x_3,x_4) \equiv 4\,y_1^2+y_2^2-y_3^2+3\,y_4^2 \ . $$

Для формы $$ f(x_1,x_2,x_3)=x_1^2+x_2^2-4\,x_3^2+2\,x_1x_2+6\,x_1x_3+4\,x_2x_3 $$ замена переменных уже не имеет треугольного вида: $$ \begin y_1=& x_1 &+ x_2&+3\,x_3 \\ y_2=& & -\frac<1><13>x_2&+x_3 \\ y_3=& & \frac<1><13>x_2 & \end \qquad \iff \qquad C= \left( \begin 1 & 1 & 3 \\ 0 & -\frac<1> <13>& 1 \\ 0 & \frac<1> <13>& 0 \end \right) \ . $$ Для формы $$ f(x_1,x_2,x_3)=x_1x_2-3\,x_1x_3+2\,x_2x_3 $$ получили: $$ \begin y_1=& \frac<1><2>x_1 &-\frac<1><2>x_2&+\frac<5><2>x_3 \\ y_2=& x_1&+x_2&-x_3 \\ y_3=& & & x_3 \end \qquad \iff \qquad C= \left( \begin \frac<1> <2>& -\frac<1> <2>& \frac<5> <2>\\ 1 & 1 & -1 \\ 0 & 1 & 1 \end \right) \ , $$ т.е. замена переменных также не имеет треугольного вида. ♦

Поставленную в начале пункта задачу об установлении структуры канонического вида квадратичной формы попытаемся решить сначала для случая когда замену переменных можно подобрать именно в треугольном виде.

Метод Лагранжа и метод Гаусса

Пример. Рассмотрим матрицу квадратичной формы

из предыдущих пунктов, и, временно выходя из круга поставленных в настоящем разделе задач, попробуем применить к ней метод Гаусса приведения к треугольному виду: $$ \left( \begin 4 & -2 & -2 & 2 \\ -2 & 2 & 2 & 0 \\ -2 & 2 & 1 & -2 \\ 2 & 0 & -2 & 1 \end \right) \ \rightarrow \ \left( \begin 4 & -2 & -2 & 2 \\ 0 & 1 & 1 & 1 \\ 0 & 1 & 0 & -1 \\ 0 & 1 & -1 & 0 \end \right) \ \rightarrow \ $$ $$ \rightarrow \ \left( \begin 4 & -2 & -2 & 2 \\ 0 & 1 & 1 & 1 \\ 0 & 0 & -1 & -2 \\ 0 & 0 & -2 & -1 \end \right) \ \rightarrow \ \left( \begin 4 & -2 & -2 & 2 \\ 0 & 1 & 1 & 1 \\ 0 & 0 & -1 & -2 \\ 0 & 0 & 0 & 3 \end \right) \ . $$ Обратим внимание на два обстоятельства: диагональные элементы последней матрицы совпадают с коэффициентами канонического вида квадратичной формы, а коэффициенты замены переменных, приводящей к этому каноническому виду, совпадают с элементами строк этой матрицы, если их разделить на соответствующие диагональные элементы. Возникает подозрение , что метод Лагранжа является «замаскированной» версией метода Гаусса. ♦

Для того, чтобы выяснить аналитический смысл преобразований по методу Лагранжа найдем правило формирования коэффициентов в первом шаге приведения квадратичной формы к каноническому виду. Пусть исходная квадратичная форма записана в виде $$ f(x_1,\dots,x_ )=\sum_ <1\le j,k \le n>a_x_jx_k= $$ $$ \begin = a_<11>x_1^2&+2a_<12>x_1x_2&+ \dots & +2a_<1n>x_1x_n+ \\ &+a_<22>x_2^2 &+ \dots & +2a_<2n>x_2x_n+ \\ & & +\dots & + \\ & & &+a_x_n^2, \end $$ т.е. коэффициенты при смешанных произведениях переменных записаны с выделением множителя $ 2_<> $. После выделения полного квадрата, содержащего переменные $ x_1,x_2,\dots,x_n $: $$ f(x_1,x_2,\dots,x_n)\equiv a_ <11>\left(x_1+\frac>>x_2+\dots+ \frac>>x_n\ \right)^2 + f_2(x_2,\dots,x_n) $$ в правой части тождества образовалась квадратичная форма $ f_ <2>$, не содержащая $ x_ <1>$. Она равна $$ f_2 =\sum_ <2\le j,k \le n>a_x_jx_k- a_<11>\left(\frac>>x_2+\dots+ \frac>>x_n \right)^2= $$ $$ =\sum_ <2\le j,k \le n>a_x_jx_k-a_<11>\sum_ <2\le j,k \le n>\fraca_<1k>>^2>x_jx_k= \sum_<2\le j,k \le n>\left( a_-\frac>>a_ <1k>\right) x_jx_k \ . $$ Если теперь выписать матрицу этой квадратичной формы (она имеет порядок $ n_<>-1 $), то ее элементы образуются по точно такому же правилу, как и коэффициенты матрицы, получающейся из матрицы $ \mathbf A_<> $ в результате первого шага метода Гаусса.

Теорема. Метод Лагранжа приведения квадратичной формы $ X^<\top><\mathbf A>X $ к каноническому виду эквивалентен методу Гаусса приведения матрицы $ <\mathbf A>$ к треугольному виду.

Доказательство. Действительно, первый шаг прямого хода метода исключения переменных Гаусса преобразует матрицу $ \mathbf A $ следующим образом: $$ \left( \begin a_<11>& a_<12>& a_<13>& \dots & a_ <1n>\\ a_<12>& a_<22>& a_<23>& \dots & a_ <2n>\\ & \dots & & \dots & \\ a_<1n>& a_<2n>& a_<3n>& \dots & a_ \end \right) \rightarrow \left(\begin a_<11>&a_<12>&\dots&a_<1n>\\ 0&a_<22>^<[1]>& \dots &a_<2n>^<[1]>\\ &\dots & & \dots \\ 0&a_^<[1]>&\dots &a_^ <[1]>\end \right) \ ; $$ здесь $$a_^ <[1]>= a_ — \fraca_<1k>>> \ ,$$ и предполагается, что $ a_<11>\ne 0 $. Видим, что формула формирования элементов матрицы $$ \left(\begin a_<22>^<[1]>& \dots&a_<2n>^<[1]>\\ \dots & & \dots & \\ a_^<[1]>&\dots &a_^ <[1]>\end \right)_ <(n-1)\times (n-1)>$$ точно такая же, как и матрицы квадратичной формы $ f_2 $. Более того, поскольку матрица $ <\mathbf A>$ симметрична ($ a_=a_ $), то и только что полученная матрица оказывается симметричной. Если $ a_<22>^ <[1]>\ne 0 $, то к этой новой матрице можно снова применить ту же процедуру, и т.д., и в конце концов придем к матрице первого порядка. Собирая все промежуточные результаты в одну матрицу, получим ее в треугольном виде $$ \left(\begin a_<11>&a_<12>&\dots&a_ <1,n-1>&a_<1n>\\ 0&a_<22>^<[1]>& \dots&a_<2,n-1>^ <[1]>&a_<2n>^<[1]>\\ & & \ddots & & \dots \\ 0 &0 & &a_^<[n-2]>&a_^ <[n-2]>\\ 0 &0 &\dots & 0 &a_^ <[n-1]>\end \right) $$ при условии, что ни одно из чисел на диагонали не обратилось в нуль: $$a_ <11>\ne 0,\ a_<22>^ <[1]>\ne 0, \dots,\ a_^ <[n-2]>\ne 0,\ a_^ <[n-1]>\ne 0 \ .$$ Если теперь обратиться к методу Лагранжа, то увидим, что полученная матрица как раз и определяет замену переменных $$ \left\<\begin y_1=&\displaystyle x_1+&\frac>>x_2+&\dots+&\frac>>x_+& \frac>>x_n \\ y_2=&\displaystyle &x_2+&\dots + &\frac^<[1]>>^<[1]>>x_+& \frac^<[1]>>^<[1]>>x_ \\ \vdots & & & \ddots & \dots & \\ y_=&\displaystyle & & &x_+ &\frac^<[n-2]>>^<[n-2]>>x_n \\ y_n=&&&&&x_n \end \right. \ , $$ приводящую квадратичную форму к каноническому виду: $$ a_<11>y_1^2 + a_<22>^ <[1]>y_2^2 + \dots +a_^ <[n-2]>y_^2 + a_^ <[n-1]>y_n^2 \ . $$ ♦

Формула Якоби

Теорема [Якоби]. Квадратичная форма $ f(X)=X^<\top><\mathbf A>X $ с симметричной матрицей $ <\mathbf A>$, ранг которой равен $ \mathfrak r_<> $, а главные миноры $ \<\det \mathbf A_j \>_^ <\mathfrak r>$ отличны от нуля, приводится к следующему каноническому виду (формула Якоби 3) ):

$$ \frac <1 \cdot \det \mathbf A_1>+\frac <\det \mathbf A_1 \cdot \det \mathbf A_2>+\frac <\det \mathbf A_2 \cdot \det \mathbf A_3>+\dots+\frac^2><\det \mathbf A_<<\mathfrak r>-1> \cdot \det \mathbf A_<\mathfrak r>> $$ Здесь $$ z_1 =\frac<1> <2>\partial f / \partial x_1,\ z_2= \frac<1> <2>\left| \begin a_ <11>& \partial f / \partial x_1 \\ a_ <12>& \partial f / \partial x_2 \end \right|, \ z_3= \frac<1> <2>\left| \begin a_ <11>& a_ <12>& \partial f / \partial x_1 \\ a_ <12>& a_ <22>& \partial f / \partial x_2 \\ a_ <13>& a_ <23>& \partial f / \partial x_3 \end \right|, \ \dots \ , $$ $$ \qquad \qquad z_<\mathfrak r>= \frac<1> <2>\left| \begin a_ <11>& a_ <12>& \dots & a_ <1,\mathfrak r-1>& \partial f / \partial x_1 \\ a_ <12>& a_ <22>& \dots & a_ <2,\mathfrak r-1>& \partial f / \partial x_2 \\ \dots & & & \dots & \dots \\ a_ <1,\mathfrak r >& a_ <2,\mathfrak r >& \dots & a_ <\mathfrak r-1,\mathfrak r >& \partial f / \partial x_ <\mathfrak r>\end \right| $$

Пример. Для квадратичной формы $$ f(x_1,x_2,x_3,x_4)= $$

Легко убедиться, что это — проявление общего правила. Выражение для $$ z_= \frac<1> <2>\left| \begin a_ <11>& a_ <12>& \dots & a_ <1,k-1>& \partial f / \partial x_1 \\ a_ <12>& a_ <22>& \dots & a_ <2,k-1>& \partial f / \partial x_2 \\ \dots & & & \dots & \dots \\ a_ & a_ & \dots & a_ & \partial f / \partial x_ \end \right| $$ при $ k \in \ <1,\dots, \mathfrak r\>$ преобразуем следующим образом: из последнего столбца определителя $$ = \left| \begin a_ <11>& a_ <12>& \dots & a_ <1,k-1>& a_<11>x_1+a_<12>x_2+\dots+ a_ <1,k-1>x_+a_<1k>x_k+\dots+a_<1n>x_n \\ a_ <12>& a_ <22>& \dots & a_ <2,k-1>& a_<21>x_1+a_<22>x_2+\dots+ a_ <2,k-1>x_+a_<2k>x_k+\dots+a_<2n>x_n \\ \dots & & & \dots & \dots \\ a_ & a_ & \dots & a_ & a_x_1+a_x_2+\dots+ a_ x_+a_x_k+\dots+a_x_n \end \right| $$ вычтем первый, домноженный на $ x_1 $, второй, домноженный на $ x_2 $, и т.д., $ (k-1) $-й, домноженный на $ x_ $. В результате получим линейную форму $$ z_k= \left| \begin a_ <11>& a_ <12>& \dots & a_ <1,k-1>& a_ <1k>\\ a_ <12>& a_ <22>& \dots & a_ <2,k-1>& a_ <2k>\\ \dots & & & \dots & \dots \\ a_ & a_ & \dots & a_ & a_ \end \right|x_k + \dots + \left| \begin a_ <11>& a_ <12>& \dots & a_ <1,k-1>& a_ <1n>\\ a_ <12>& a_ <22>& \dots & a_ <2,k-1>& a_ <2n>\\ \dots & & & \dots & \dots \\ a_ & a_ & \dots & a_ & a_ \end \right|x_n \, , $$ не зависящую от $ x_1,\dots, x_ $. Коэффициент же при $ x_k $ равен $ \det \mathbf A_k $ и отличен от нуля по условию теоремы. Если его вынести за пределы формы, то получим еще альтернативный вариант формулы Якоби.

Квадратичная форма $ f(X)=X^<\top><\mathbf A>X $ с симметричной матрицей $ <\mathbf A>$, ранг которой равен $ \mathfrak r_<> $, а главные миноры $ \<\det \mathbf A_j \>_^ <\mathfrak r>$ отличны от нуля, приводится к следующему каноническому виду:

$$ y_1^2 \det \mathbf A_1 + y_2^2\frac<\det \mathbf A_2> < \det \mathbf A_1>+y_3^2\frac<\det \mathbf A_3> <\det \mathbf A_2>+\dots+y_<\mathfrak r>^2 \frac<\det \mathbf A_<\mathfrak r>><\det \mathbf A_<\mathfrak r-1>> \ ; $$ при этом линейные относительно переменных $ x_1,\dots,x_n $ формы $ \_^ <\mathfrak r>$ выражаются по формулам $$ \left\< \begin y_1=&\displaystyle x_1+&\tilde c_<12>x_2& &+\dots+&\tilde c_<1,n-1>x_+&\tilde c_<1n>x_n \\ y_2=&\displaystyle &x_2+& & \dots + &\tilde c_<2,n-1>x_+&\tilde c_<2n>x_ \\ \vdots & & & \ddots & & \dots & \\ y_<\mathfrak r>=&\displaystyle & & &x_<\mathfrak r>+ & \dots + & \tilde c_<\mathfrak r n>x_n \end \right. $$ Здесь $$ \tilde c_<1j>=a_<1j>/a_<11>,\ \tilde c_=\left| \begin a_ <11>& a_ <12>& \dots & a_ <1,k-1>& a_ <1j>\\ a_ <12>& a_ <22>& \dots & a_ <2,k-1>& a_ <2j>\\ \dots & & & \dots & \dots \\ a_ & a_ & \dots & a_ & a_ \end \right| \Bigg/ \det \mathbf A_j \, . $$

При $ \mathfrak r = n $ матрица $ \tilde C_<> $ из предыдущей формулы становится верхнетреугольной: $$ Y=\tilde C X \, ; $$ при этом на главной диагонали будут стоять $ 1 $. Обратная к матрице такого вида имеет ту же структуру — и матрица $ C=\tilde C^ <-1>$ является матрицей, которая встретилась нам в предыдущем ПУНКТЕ.

Теорема. Квадратичная форма $ f(X)=X^<\top><\mathbf A>X $ при симметричной неособенной матрице $ <\mathbf A>$ приводится к каноническому виду заменой переменных, задаваемой верхней унитреугольной матрицей

$$ X=CY \quad npu \ C= \left( \begin 1& c_<12>& \dots & c_ <1n>\\ & 1& \dots & c_ <2n>\\ \mathbb O & & \ddots & \vdots \\ & & & 1 \end \right) $$ тогда и только тогда, когда все главные миноры матрицы $ <\mathbf A>$ отличны от нуля. Этот канонический вид представлен формулой Якоби $$ y_1^2 \det \mathbf A_1 + y_2^2\frac<\det \mathbf A_2> < \det \mathbf A_1>+\dots+y_^2 \frac<\det \mathbf A_><\det \mathbf A_> \ . $$ Доказательство достаточности условия теоремы уже произведено, необходимость доказывается в пункте ☞ LDU-разложение матрицы.

Закон инерции для квадратичных форм

Для заданной квадратичной формы канонические виды, т.е. представления в виде сумм квадратов, можно построить разными способами. Выясним, какие характеристики являются общими (инвариантными) для этих представлений.

Ранг квадратичной формы

Предположим, что с помощью какой-либо невырожденной замены переменных мы привели квадратичную форму к каноническому виду: $$\widetilde f(Y)=\alpha_1y_1^2+\dots+\alpha_n y_n^2 \ .$$ Может так случиться, что часть коэффициентов $ \<\alpha_j \>_^n $ обратится в нуль.

Рангом квадратичной формы называется ранг ее матрицы: $$\operatorname ( f ) = \operatorname ( <\mathbf A>) \ .$$

Теорема. Ранг квадратичной формы не меняется при невырожденных заменах переменных:

$$ \operatorname (f) = \operatorname( C^<\top><\mathbf A>C ) \quad npu \quad \forall C,\ \det C \ne 0 \ .$$

Доказательство основано на следствии к теореме $ 2 $, приведенной ☞ ЗДЕСЬ: ранг матрицы не меняется при домножении ее на произвольную неособенную.

Ранг квадратичной формы равен числу ненулевых коэффициентов в ее каноническом виде.

Закон инерции

Число положительных (или отрицательных) коэффициентов в каноническом виде квадратичной формы $ f_<>(X) $ называется ее положительным (соответственно, отрицательным) индексом инерции. Буду обозначать эти индексы 4) $$n_<+>(f) \quad \mbox < и >\quad n_<->(f) \ . $$ Разность 5) $$\sigma (f) = n_<+>(f)-n_<->(f)$$ называется сигнатурой квадратичной формы (а также сигнатурой соответствующей ей симметричной матрицы).

Теорема [закон инерции]. Индексы инерции не зависят от способа приведения квадратичной формы к каноническому виду.

Доказательство ☞ ЗДЕСЬ.

Пример. Найти ранг и сигнатуру квадратичной формы $ f(x_1,x_2,x_3)=x_1x_2-x_2x_3 $.

Решение. Приводим квадратичную форму к каноническому виду по методу Лагранжа: $$f=\frac<1> <4>\,(x_1+x_2-x_3)^2 — \frac<1> <4>\,(x_1-x_2-x_3)^2 \ .$$

Ответ. $ \operatorname (f) = 2,\, \sigma (f)=0 $.

В предположении, что ранг матрицы $ \mathbf A_<> $ равен $ \mathfrak r_<> $, а ее главные миноры $ \< \det <\mathbf A>_j \>_^ <\mathfrak r>$ отличны от нуля, имеем:

$$ n_<+>(f)=<\mathcal P>(1,\det <\mathbf A>_1,\dots, \det <\mathbf A>_<\mathfrak r>),\ n_<->(f)=<\mathcal V>(1,\det <\mathbf A>_1,\dots, \det <\mathbf A>_<\mathfrak r>)\ . $$ Здесь $ <\mathcal P>_<> $ — число знакопостоянств, а $ <\mathcal V>_<> $ — число число знакоперемен в последовательности. Для сигнатуры квадратичой формы также справедлива и формула $$ \sigma (f)= \sum_^ <\mathfrak r>\operatorname (\det (\mathbf A_) \cdot \det (\mathbf A_) ) \quad npu \quad \det (\mathbf A_<0>)=1 $$ и операции $ \operatorname $ определения знака, введенной ☞ ЗДЕСЬ.

Доказательство следует из формулы Якоби.

Правило вычисления сигнатуры из предыдущей теоремы остается справедливым и в случае, если в последовательности главных миноров $ \< \det <\mathbf A>_j \>_^ <\mathfrak r>$ имеются нулевые, но не подряд идущие, и $ \det <\mathbf A>_ <\mathfrak r>\ne 0 $. Если, например,

$$ \det (\mathbf A_) = 0,\ \det (\mathbf A_) \ne 0,\ \det (\mathbf A_) \ne 0 \quad npu \quad j\in\<1,\dots, <\mathfrak r>-1\> ,$$ то сумма $$ \operatorname (\det (\mathbf A_) \cdot \det (\mathbf A_) )+ \operatorname (\det (\mathbf A_) \cdot \det (\mathbf A_) ) $$ считается равной нулю. (Можно также доказать, что в этом случае главные миноры $ \det (\mathbf A_) $ и $ \det (\mathbf A_) $ имеют противоположные знаки.)

Пример. Найти ранг и сигнатуру квадратичной формы

$$f_ <<\color\alpha >>(x_1,x_2,x_3)=3\,x_1^2 -4\,x_1x_2-2\,x_1x_3 + <\color\alpha > \, x_2^2 +6\, x_2x_3 $$ в зависимости от значений параметра $ <\color\alpha > $.

Решение. Сначала пробуем применить формулу из последнего следствия: $$\det <\mathbf A>_1=3,\ \det <\mathbf A>_2=3\, <\color\alpha > -4,\ \det <\mathbf A>_3= \det <\mathbf A>=- <\color\alpha > -15 \ .$$ При $ <\color\alpha > \not\in \ <4/3,\, -15 \>$ формула применима при $ <\mathfrak r>=3 $: $$n_<+>(f)=\left\< \begin 2 & npu & <\color\alpha > >4/3 ;\\ 2 & npu & -15 -15 & 3 & 1 \end $$

Рассмотренный только что пример относится к общей задаче оценки влияния параметров на характеристики квадратичной формы:

Как меняются ранг и сигнатура при непрерывном изменении параметров?

Пусть квадратичная форма зависит от параметров $ \alpha, \beta, \dots $, причем эта зависимость — полиномиальная. Пусть при некотором наборе вещественных значений параметров все главные миноры матрицы квадратичной формы отличны от нуля. Тогда ранг и сигнатура квадратичной формы могут быть вполне определены знаками этих миноров посредством формулы из следствия к закону инерции. Поскольку элементы миноров полиномиально зависят от параметров, то мы получаем систему неравенств, которую (при необходимости домножением некоторых неравенств на $ (-1) $) можно переписать в виде $$ G_1(\alpha,\beta,\dots) > 0, \dots, G_n(\alpha,\beta,\dots) > 0 \ . $$ Здесь $ G_1,\dots, G_n $ — полиномы от $ \alpha,\beta,\dots $. Если при некотором наборе значений $ \alpha=\alpha_0, \beta=\beta_0, \dots $ эта система удовлетворена, при непрерывной вариации этих параметров $ \alpha_0+\delta_<\alpha>, \beta_0 + \delta_<\beta>,\dots $ какое из неравенств системы нарушится в первую очередь, т.е. раньше остальных? Иными словами: какое из неравенств системы самое важное? — Оказывается, последнее.

Теорема[2]. Пусть $ f_ <<\color\alpha >>(x_1,\dots,x_n) $ — квадратичная форма, зависящая от параметра $ <\color\alpha > $ линейным образом:

Справедливо и более общее утверждение.

Теорема[1,5]. Если при непрерывном изменении коэффициентов формы $ f_<> $ ее ранг $ <\mathfrak r>_<> $ остается неизменным, то не изменяется и ее сигнатура $ \sigma_<>(f) $.

В случае, когда главные миноры матрицы $ \mathbf A $ обращаются в нуль, к анализу канонического вида квадратичной формы приходится привлекать «тяжелую артиллерию» в виде ведущих миноров. Но, по крайней мере, один теоретический результат можно сформулировать немедленно.

Теорема. В произвольной квадратичной форме $ f(X) $ ранга $ \mathfrak r\ge 1 $ можно так перенумеровать переменные, чтобы в матрице получившейся квадратичной формы $ \tilde f(Y) $ в последовательности главных миноров

$$ \det \widetilde<\mathbf A>_1, \dots, \det \widetilde<\mathbf A>_ < \mathfrak r>$$ не было двух подряд идущих нулевых и $ \det \widetilde<\mathbf A>_ < \mathfrak r>\ne 0 $.

Конгруэнтность квадратичных форм

Матрицы $ <\mathbf A>$ и $ <\mathbf B>$, связанные соотношением $ <\mathbf B>=C^<\top><\mathbf A>C $ при некоторой неособенной матрице $ C $, называются конгруэнтными: $ <\mathbf A>\cong <\mathbf B>$. Если, вдобавок, матрицы $ <\mathbf A>$ и $ <\mathbf B>$ симметричны, то конгруэнтными называются и соответствующие им квадратичные формы $ X^<\top><\mathbf A>X $ и $ X^<\top><\mathbf B>X $.

Теорема. Квадратичные формы $ X^<\top><\mathbf A>X $ и $ X^<\top><\mathbf B>X $ конгруэнтны тогда и только тогда, когда совпадают их индексы инерции, или, что то же, равны их ранги и сигнатуры.

Из всего разнообразия канонических видов квадратичной формы выберем самый простой, именно тот, коэффициенты которого равны $ +1 $ или $ (-1) $. Например, если квадратичная форма $ f(X) $ уже приведена к каноническому виду $$\widetilde f(Y)=\alpha_1y_1^2+\dots+\alpha_ <\mathfrak r>y_<\mathfrak r>^2 \ .$$ то преобразование $$y_j=\frac<\sqrt<\alpha_j>>\ npu \ j\in \<1,\dots, <\mathfrak r>\> \ , \ y_j=z_j \ npu \ j\in \<<\mathfrak r>+1,\dots, n \> $$ приводит эту форму к виду $$ z_1^2+\dots + z_(A)>^2 -z_(A)+1>^2 — \dots — z_<<\mathfrak r>>^2 \ , $$ который называется нормальным видом квадратичной формы.

Множество всех квадратичных форм с вещественными коэффициентами можно разбить на классы эквивалентности, в каждом из которых будут находиться только конгруэнтные между собой формы. Каждый из классов полностью описывается каким-то из своих представителей. Таким представителем можно взять нормальный вид.

Какое преобразование квадратичной формы оставляет ее инвариантной?

Теорема [Эрмит]. Квадратичная форма $ X^<\top><\mathbf A>X $ переходит в себя при преобразовании

Знакоопределенность

Квадратичная форма $ f_<>(X) $ называется

а) неотрицательной если $ f(X)\ge 0 $ для любого $ X\in \mathbb R^n $;

б) положительно определенной, если она неотрицательна и $ f(X)= 0 $ только при $ X=\mathbb O_<> $;

в) неопределенной или знакопеременной, если существуют $ \ \subset \mathbb R^n $ такие что числа $ f(X_1) $ и $ f(X_2) $ имеют разные знаки: $ f(X_1)f(X_2) глобальным. В случае положительной определенности точка $ X=\mathbb O $ будет единственной точкой пространства $ \mathbb R^ $, в которой $ f_<>(X) $ достигает своего минимального значения. Однако если свойство положительной определенности будет нарушено: $ f(X_1) =0 $ при $ X_1 \ne \mathbb O $, то вследствие однородности формы $ f_<>(X) $ будет выполнено $$ f(tX_1)=t^2f(X_1)= 0 \quad npu \quad \forall t \in \mathbb R \ . $$ Иными словами, свое минимальное значение $ 0_<> $ неотрицательная, но не положительно определенная, форма $ f_<> (X) $ будет принимать на всей прямой, проходящей через точки $ \mathbb O $ и $ \mathbb X_1 $. Точка $ X=\mathbb O $ перестает быть изолированной точкой минимума: в любой ее окрестности находятся другие точки минимума. С точки зрения здравого смысла, подобная ситуация может считаться исключительным, вырожденным случаем. Интуиция подтверждается аналитикой: как увидим впоследствии вероятность того, что случайным образом выбранная квадратичная форма, обладающая свойством неотрицательности, не будет, вдобавок, положительно определенной, равна $ 0_<> $. Событие теоретически возможно, но практически немыслимо.

Оказывается условие положительной определенности формы $ f $ является необходимым и достаточным для обеспечения подобного свойства в произвольном пространстве $ \mathbb R^n $. И это утверждение верно не только для квадратичной формы, но и для однородного полинома (формы) произвольного порядка.

Задача об условных экстремумах квадратичной формы $ f_<>(X) $ на сфере $ x_1^2+\dots+x_n^2 =1 $ решается ☞ ЗДЕСЬ.

Пример. В произвольном евклидовом пространстве $ \mathbb E $ квадратичная форма с матрицей Грама произвольной системы векторов $ \ \subset \mathbb E $

Задача. Найти условия неотрицательности и положительной определенности квадратичной формы в терминах ее коэффициентов.

Очевидны необходимые условия неотрицательности квадратичной формы $$ f(X)=\displaystyle \sum_ <1\le j \le k \le n>f_x_jx_k \ : $$ все коэффициенты при квадратах переменных должны быть неотрицательными: $$ f_<11>\ge 0, \dots , f_\ge 0 . $$ Также очевидно, что эти условия будут и достаточными, если все остальные коэффициенты $ f_^<> $ при $ j\ne k $ равны нулю. Если же последнее условие не выполняется, то имеет смысл предварительно преобразовать квадратичную форму к сумме квадратов, т.е. исследовать ее канонический вид.

Теорема. Ненулевая квадратичная форма, представленная в правильном виде

$$ f(X)=X^<\top><\mathbf A>X \, , $$ будет неотрицательной тогда и только тогда, когда ее отрицательный индекс инерции равен нулю: $$ n_ <->(<\mathbf A>)=0 \qquad \iff \qquad \qquad \sigma ( <\mathbf A>)=\operatorname <\mathbf A>\ .$$ Если это условие выполнено, то для положительной определенности формы необходимо и достаточно чтобы она была невырождена: $ \det <\mathbf A>\ne 0 $.

Доказательство ☞ ЗДЕСЬ.

К счастью, явное представление канонического вида квадратичной формы уже имеется — как правило, он задается формулой Якоби. Индексы инерции вычисляются через знаки главных миноров матрицы квадратичной формы.

Теорема [Сильвестр]. Квадратичная форма

$$ f(X)=X^<\top><\mathbf A>X $$ будет положительно определенной тогда и только тогда, когда все главные миноры ее матрицы положительны: $$ a_<11>>0, \ \left| \begin a_ <11>& a_ <12>\\ a_ <12>& a_ <22>\end \right| >0, \ \left| \begin a_ <11>& a_ <12>& a_ <13>\\ a_ <12>& a_ <22>& a_ <23>\\ a_ <13>& a_ <23>& a_ <33>\end \right| >0, \dots, \det <\mathbf A>>0 \ . $$

Доказательство ☞ ЗДЕСЬ.

Квадратичная форма будет отрицательно определенной тогда и только тогда, когда знаки главных миноров ее матрицы будут чередоваться следующим образом:

Пример. Найти все значения параметра $ <\color\alpha > $, при которых квадратичная форма

$$2\, x_1^2+2\, x_2^2+x_3^2+ 2\, <\color < \alpha>> \, x_1x_2+6\, x_1x_3 +2\,x_2x_3 $$ будет положительно определенной.

Решение. Значения главных миноров: $$\det <\mathbf A>_1=2,\ \det <\mathbf A>_2=4- <\color\alpha >^2,\ \det <\mathbf A>_3=- <\color\alpha >^2+ 6\, <\color\alpha > -16 \ . $$ Последнее выражение будет отрицательно при любых $ <\color\alpha > \in \mathbb R $.

Ответ. Таких значений нет: $ <\color\alpha > \in \varnothing $.

Можно ли получить условия неотрицательности квадратичной формы: $$ f(X) \ge 0 \ npu \ \forall X \in <\mathbb R>^n $$ превращением всех неравенств из критерия Сильвестра в нестрогие: $ > \ \to <\color < \to>> \ \ge $ ? — Вообще говоря, нет.

Пример. Квадратичная форма

$$f(x_1,x_2,x_3,x_4)=x_1^2+2x_1x_3+2x_2x_4+x_4^2= X^ <\top>\left( \begin 1&0&1 &0 \\ 0&0&0&1 \\ 1&0&0&0 \\ 0&1&0&1 \end \right)X $$ — неопределенная, т.к. $ f(1,0,-1,0)=-1_<> 0 $. Тем не менее, все главные миноры ее матрицы неотрицательны. ♦

Имеются ли конструктивные необходимые и достаточные условия неотрицательности квадратичной формы?

Теорема. Для неотрицательности квадратичной формы $ X^ <\top>\mathbf A X $ необходимо и достаточно, чтобы все ведущие миноры матрицы $ \mathbf A $, т.е. миноры, стоящие на пересечении строк и столбцов матрицы с одинаковыми номерами

$$ A\left( \begin j_1 & \dots & j_k \\ j_1 & \dots & j_k \end \right) \ , j_1 0 $ при всех $ X\in \mathbb V_1, X \ne \mathbb O $.

Теорема. Пусть линейное подпространство задано системой линейных однородных уравнений

$$ \left\< \begin h_<11>x_1 & + \dots & + h_<1n>x_n&=0, \\ \dots & & & \dots \\ h_x_1 & + \dots & + h_x_n&=0, \\ \end \right. \qquad \iff \qquad \underbrace<\left( \begin h_ <11>& \dots & h_ <1n>\\ \dots & & \dots \\ h_ & \dots & h_ \end \right)>_<=H>X=\mathbb O $$ Здесь $ k ☞ ЗДЕСЬ.

Пример. Найти ортогональную замену переменных, приводящую квадратичную форму

$$ X^ <\top>\mathbf A X \quad npu \quad <\mathbf A>=\left(\begin 2 & 2 & -1 \\ 2 & -1 & 2 \\ -1& 2 & 2 \end \right) $$ к каноническому виду.

Решение. Характеристический полином $ \det (\mathbf A- \lambda E)=-(\lambda-3)^2(\lambda+3) $. Простому собственному числу $ \lambda=-3 $ соответствует собственный вектор $ <\mathfrak X>_1=[1,-2,1]^<^<\top>> $, а собственному числу $ \lambda=3 $ второй кратности соответствуют два линейно-независимых собственных вектора $ <\mathfrak X>_2=[2,1,0]^<^<\top>> $ и $ <\mathfrak X>_3=[-1,0,1]^<^<\top>> $. Очевидно, что $ \langle <\mathfrak X>_1, <\mathfrak X>_2\rangle=0 , \langle <\mathfrak X>_1, <\mathfrak X>_3 \rangle =0 $, но $ \langle <\mathfrak X>_2, <\mathfrak X>_3 \rangle \ne 0 $. Ортогонализуем систему векторов $ \left\<<\mathfrak X>_2,<\mathfrak X>_3\right\> $: $$<\mathfrak Y>_2=<\mathfrak X>_2, <\mathfrak Y>_3=<\mathfrak X>_3+ <\color\alpha > <\mathfrak Y>_2 \quad \mbox < и >\ \langle <\mathfrak Y>_2,<\mathfrak Y>_3\rangle =0 \ \Longrightarrow <\color\alpha >=-\frac<\langle <\mathfrak X>_2,<\mathfrak X>_3\rangle> <\langle <\mathfrak X>_2,<\mathfrak X>_2\rangle>=\frac<2> <5>$$ и $ <\mathfrak Y>_3=\left[-1/5, 2/5, 1 \right]^<^<\top>> $. После нормирования, получаем ортогональную матрицу $$ P=\left(\begin 1/\sqrt <6>& 2/\sqrt <5>& -1/\sqrt <30>\\ -2/\sqrt <6>& 1/\sqrt <5>& 2/\sqrt <30>\\ 1/\sqrt <6>& 0 & 5/\sqrt <30>\end \right) \ . $$ Замена переменных $ X=PY $ приводит квадратичную форму $ X^ <\top>\mathbf A X $ к каноническому виду $$ (y_1,y_2,y_3) \left(\begin -3 & 0 & 0 \\ 0 & 3 & 0 \\ 0& 0 & 3 \end \right) \left( \begin y_1 \\ y_2 \\ y_3 \end \right)=-3\,y_1^2+3\,y_2^2+3\,y_3^2 \ . $$

Теорема. Если известны коэффициенты характеристического полинома матрицы квадратичной формы $ f(X)=X^<\top>\mathbf A X $:

$$ \det (\mathbf A- \lambda E) \equiv (-1)^n \left(\lambda^n+a_<1>\lambda^+ \dots + a_n \right) \, ,$$ то $$ \operatorname (f(X))= <\mathfrak r>\iff a_=a_=\dots=a_<<\mathfrak r>+1>=0,a_<<\mathfrak r>>\ne 0 \, . $$ В этом случае будет также выполнено $$ n_ <+>(f(X))=<\mathcal V>(1,a_1,\dots,a_<<\mathfrak r>>),\quad n_ <->(f(X))=<\mathcal P>(1,a_1,\dots,a_<\mathfrak r>) \, , $$ $$ \sigma(f(X))=\sum_^ <\mathfrak r>\operatorname (a_a_j) \quad npu \quad a_0=1 \, . $$

Доказательство основано на правиле знаков Декарта.

Геометрия замен переменных

В предыдущих пунктах мы рассмотрели два подхода к построению канонического вида квадратичной формы. Очевидно, что подход, основанный на ортогональной замене переменных более дорогостоящий в построении по сравнению с методом Лагранжа. В самом деле, он требует нахождения собственных чисел симметричной матрицы, т.е. решения алгебраического уравнения $ \det (\mathbf A — \lambda E)=0 $. В случае матриц порядка $ n> 4 $ корни этого уравнения, как правило, на находятся в виде «хорошей» комбинации коэффициентов, и могут быть определены разве лишь приближенно. Метод же Лагранжа принципиально безошибочен: коэффициенты канонического вида определяются в виде рациональных функций от коэффициентов квадратичной формы.

Пример. Уравнение $ 1/3x_1^2-x_1x_2+x_2^2=1 $ задает на плоскости эллипс:

Преобразование $$ y_1=x_1-3/2x_2, y_2=x_2 $$ приводит уравнение к виду $$ 1/3 y_1^2+1/4 y_2^2=1 ; $$ в новых координатах кривая имеет вид на рисунке слева. С другой стороны, преобразование $$ \begin z_1&= \sqrt<1/2+1/\sqrt<13>>\,x_1+\sqrt<1/2-1/\sqrt<13>>\,x_2,\\ z_2&= \sqrt<-1/2-1/\sqrt<13>>\,x_1+\sqrt<1/2+1/\sqrt<13>>x_2 \end $$ приводит уравнение к виду $$\frac<4-\sqrt<13>><6>z_1^2+\frac<4+\sqrt<13>><6>z_2^2=1 \ . $$ В этих координатах кривая имеет вид на рисунке справа.

Оба преобразования координат не изменяют типа кривой: эллипс остается эллипсом. Но второе преобразование дает нечто большее: оно сохраняет размеры. Фактически, оно сводится к повороту исходного эллипса.

Вывод. Метод Лагранжа «дешевле» метода ортогональных преобразований при решении задачи классификации алгебраических многообразий, заданных уравнением вида $ X^ <\top>\mathbf A X=1 $. Иными словами, он позволяет «дешевле» определить тип поверхности с точностью до ее формы: например, в $ \mathbb R^3 $ является ли эта поверхность эллипсоидом или гиперболоидом (и каким именно — однополостным или двуполостным)? Но если нас интересуют истинные размеры этой поверхности: например, размеры посылочного ящика, в который эллипсоид, заданный уравнением $ X^ <\top>\mathbf A X=1 $, можно было бы поместить — то здесь без собственных векторов и чисел матрицы $ \mathbf A $ не обойтись!


источники:

http://matica.org.ua/metodichki-i-knigi-po-matematike/kurs-vysshei-matematiki/76-privedenie-kvadratichnykh-form-k-kanonicheskomu-vidu

http://vmath.ru/vf5/2form