Как привести уравнение поверхности к квадратичной форме

69. Квадратичные формы и их приведение к каноническому виду

При рассмотрении евклидового пространства мы вводили определение квадратичной формы. С помощью некоторой матрицы

Строится многочлен второго порядка вида

Который называется квадратичной формой, порождаемой квадратной матрицей А.

Квадратичные формы тесно связаны с поверхностями второго порядка в n — мерном евклидовом пространстве. Общее уравнение таких поверхностей в нашем трехмерном евклидовом пространстве в декартовой системе координат имеет вид:

Верхняя строка — это не что иное, как квадратичная форма, если положить x1=x, x2=y, x3=z:

— симметричная матрица (aij = aji)

Положим для общности, что многочлен

Есть линейная форма. Тогда общее уравнение поверхности есть сумма квадратичной формы, линейной формы и некоторой постоянной.

Основной задачей теории квадратичных форм является приведение квадратичной формы к максимально простому виду с помощью невырожденного линейного преобразования переменных или, другими словами, замены базиса.

Вспомним, что при изучении поверхностей второго порядка мы приходили к выводу о том, что путем поворота осей координат можно избавиться от слагаемых, содержащих произведение xy, xz, yz или xixj (i¹j). Далее, путем параллельного переноса осей координат можно избавиться от линейных слагаемых и в конечном итоге свести общее уравнение поверхности к виду:

В случае квадратичной формы приведение ее к виду

Называется приведением квадратичной формы к каноническому виду.

Поворот осей координат есть не что иное, как замена одного базиса другим, или, другими словами, линейное преобразование.

Запишем квадратичную форму в матричном виде. Для этого представим ее следующим образом:

L(x, y,z) = x(a11x+a12y+a13z)+

Введем матрицу — столбец

Тогда — где X T =(x, y,z)

— матричная форма записи квадратичной формы. Эта формула, очевидно, справедлива и в общем случае:

Канонический вид квадратичной формы означает, очевидно, что матрица А имеет диагональный вид:

Рассмотрим некоторое линейное преобразование X = SY, где S — квадратная матрица порядка n, а матрицы — столбцы Х и У есть:

Матрица S называется матрицей линейного преобразования. Отметим попутно, что всякой матрице n-ного порядка при заданном базисе соответствует некоторый линейный оператор.

Линейное преобразование X = SY заменяет переменные x1, x2, x3 новыми переменными y1, y2, y3. Тогда:

где B = S T A S

Задача приведения к каноническому виду сводится к отысканию такой матрицы перехода S, чтобы матрица В приобрела диагональный вид:

(*)

Итак, квадратичная форма с матрицей А после линейного преобразования переменных переходит в квадратичную форму от новых переменных с матрицей В.

Обратимся к линейным операторам. Каждой матрице А при заданном базисе соответствует некоторый линейный оператор А. Этот оператор имеет, очевидно, некоторую систему собственных чисел и собственных векторов. Причем, отметим, что в евклидовом пространстве система собственных векторов будет ортогональна. Мы доказывали на предыдущей лекции, что в базисе собственных векторов матрица линейного оператора имеет диагональный вид. Формула (*), как мы помним, это формула преобразования матрицы линейного оператора при смене базиса. Положим, что собственные вектора линейного оператора А с матрицей А — это вектора у1, y2, . yn.

Т. е.

А это означает, что если собственные вектора у1, y2, . yn взять за базис, то матрица линейного оператора в этом базисе будет диагональной

Или В = S-1 А S, где S – матрица перехода от первоначального базиса <E> к базису <Y>. Причем в ортонормированном базисе матрица S будет ортогональной.

Т. о. для приведения квадратичной формы к каноническому виду необходимо найти собственные числа и собственные векторы линейного оператора А, имеющего в первоначальном базисе матрицу А, которая порождает квадратичную форму, перейти к базису собственных векторов и в новой системе координат построить квадратичную форму.

Обратимся к конкретным примерам. Рассмотрим линии второго порядка.

или

С помощью поворота осей координат и последующего параллельного переноса осей это уравнение можно привести к виду ( переменные и коэффициенты переобозначены х1 = х, х2 = у):

1) если линия центральная, l1 ¹ 0, l2 ¹ 0

2) если линия нецентральная, т. е. один из li = 0.

Напомним виды линий второго порядка. Центральные линии:

1) эллипс;

2) гипербола;

3) точка;

4) две пересекающиеся прямые.

5) х2 = а2 две параллельные линии;

6) х2 = 0 две сливающиеся прямые;

7) у2 = 2рх парабола.

Для нас представляют интерес случаи 1), 2), 7).

Рассмотрим конкретный пример.

Привести к каноническому виду уравнение линии и построить ее:

5х2 + 4ху + 8у2 — 32х — 56у + 80 = 0.

Матрица квадратичной формы есть . Характеристическое уравнение:

Его корни:

Найдем собственные векторы:

При l1 = 4: u1 = -2u2; u1 = 2c, u2 = — c или g1 = c1(2IJ).

При l2 = 9: 2u1 = u2; u1 = c, u2 = 2c или g2 = c2(I+2J).

Нормируем эти векторы:

Составим матрицу линейного преобразования или матрицу перехода к базису g1, g2:

— ортогональная матрица!

Формулы преобразования координат имеют вид:

или

Подставим в наше уравнение линии и получим:

Сделаем параллельный перенос осей координат. Для этого выделим полные квадраты по х1 и у1:

Обозначим . Тогда уравнение приобретет вид: 4х22 + 9у22 = 36 или

Это эллипс с полуосями 3 и 2. Определим угол поворота осей координат и их сдвиг для того, чтобы построить эллипс в старой системе.


Построим:

Проверка: при х = 0: 8у2 — 56у + 80 = 0 у2 – 7у + 10 = 0. Отсюда у1,2 = 5; 2

При у =0: 5х2 – 32х + 80 = 0 Здесь нет корней, т. е. нет точек пересечения с осью Х!

VMath

Инструменты сайта

Основное

Навигация

Информация

Действия

Содержание

Квадратичная форма

$ \mathbb A_<> $ означает одно из множеств: $ \mathbb Q_<> $ рациональных, или $ \mathbb R_<> $ вещественных, или $ \mathbb C_<> $ комплексных чисел.

Определение

Квадратичной формой над множеством $ \mathbb A_<> $ называют однородный полином второй степени с коэффициентами из $ \mathbb A_<> $; если переменные обозначить $ x_1,\dots,x_ $, то общий вид квадратичной формы от этих переменных: $$ f(x_1,\dots,x_ )= \sum_ <1\le j \le k \le n>f_x_jx_k= $$ $$\begin \displaystyle= f_<11>x_1^2&+f_<12>x_1x_2&+ \dots & +f_<1n>x_1x_n+ \\ &+f_<22>x_2^2 &+ \dots & +f_<2n>x_2x_n+ \\ &+\dots & & +\dots + \\ & & +f_x_jx_k & + \dots+ \\ & & &+f_x_n^2. \end $$

Пример. Функции

$$x_1^2-x_1x_2+x_3^2 \, , \quad \sqrt<3>\, x_2^2 — \pi\, x_3^2 \, , \quad -x_1x_2 \, , \quad \mathbf i \, x_1^2$$ являются квадратичными формами. Функции $$x_1^2-3\, x_1+1 \, , \quad 5\, x_1^2x_2^2 \, , \quad \frac \, , \quad \sqrt $$ не являются квадратичными формами.

Заметим, что в выражении для квадратичной формы присутствуют как квадраты переменных $ x_1^2,\dots,x_n^2 $ так и их смешанные произведения $ x_j x_k $. Говорят, что квадратичная форма $ f(x_1,\dots,x_ ) $ имеет канонический вид если $$f(x_1,\dots,x_ )\equiv f_<11>x_1^2+f_<22>x_2^2+\dots+f_x_n^2 \quad npu \quad \left\\right\>_^n \subset \mathbb A \ , $$ т.е. все коэффициенты при смешанных произведениях переменных равны нулю; в этом случае говорят также, что форма является «суммой квадратов» 1) .

Оказывается, что в любой квадратичной форме можно так сгруппировать входящие в нее одночлены, что в результате получится ее (эквивалентное) представление в виде суммы квадратов.

Пример.

$$ 2\, x_1^2+4\, x_1x_2 +x_2^2 \equiv 2\, (x_1+x_2)^2-x_2^2 \equiv -2\,x_1^2 + (2\,x_1+x_2)^2 \ ; $$ $$ x_1^2+2 \mathbf i x_1x_2 — x_2^2 \equiv (x_1+ \mathbf i x_2)^2 \ ; $$ $$-x_1^2+6\,x_1x_2+6\,x_1x_3+2\,x_2^2+4\,x_2x_3+2\,x_3^2\equiv $$ $$ \equiv (x_1+x_2+x_3)^2-2\,(x_1-x_2-x_3)^2+3\,(x_2+x_3)^2 \equiv $$ $$\equiv -(x_1+3\,x_2+3\,x_3)^2+11\,(x_2+x_3)^2 \ ; $$ $$ x_1x_2 \equiv \frac<1> <4>(x_1+x_2)^2- \frac<1> <4>(x_1-x_2)^2 \ . $$

А в общем случае: $$ f(x_1,\dots,x_ )\equiv $$ $$ \begin \equiv a_1(c_<11>x_1+c_<12>x_2+\dots+c_<1n>x_n)^2 +\\ +a_2(c_<21>x_1+c_<22>x_2+\dots+c_<2n>x_n)^2+ \\ +\dots+ \\ +a_n(c_x_1+c_x_2+\dots+c_x_n)^2 \end $$ при $ \_^n,\\>_^n $ — константах. Такое представление оказывается достаточно удобным для анализа квадратичной формы — например, в случае вещественных форм, при проверке выполнимости неравенства вида $ f(x_1,\dots,x_ ) \ge 0 $. Приведенные выше примеры показывают неоднозначность представления в виде суммы квадратов: вид квадратов и даже их количество для одной и той же формы могут быть различными. С целью обеспечения частичной унификации установим некоторое дополнительное ограничение, а именно, потребуем, чтобы линейные однородные формы $$ c_<11>x_1+c_<12>x_2+\dots+c_<1n>x_n, \ c_<21>x_1+c_<22>x_2+\dots+c_<2n>x_n,\dots, c_x_1+c_x_2+\dots+c_x_n $$ были линейно независимыми. При таком ограничении любое представление квадратичной формы в виде суммы квадратов называется каноническим видом квадратичной формы.

Задача. Для произвольной квадратичной формы $ f(x_1,\dots,x_ ) $ построить (хотя бы один) ее канонический вид.

$$ x^2 -2\,xy+3\,y^2+x-4\,y-15=0 $$ определить к какому типу (эллипс, гипербола, парабола,…) она относится.

Метод Лагранжа приведения квадратичной формы к каноническому виду

Существует универсальный алгоритм, приводящий произвольную квадратичную форму к каноническому виду.

1. Пусть $ f_<11>\ne 0 $. Выделим в $ f(x_1,\dots, x_n)_<> $ все слагаемые, содержащие $ x_ <1>$: $$ f_<11>x_1^2+f_<12>x_1x_2+ \dots +f_<1n>x_1x_n+ \sum_ <2\le j\le k \le n>f_x_jx_k = $$ $$ = f_<11>\left(x_1^2+\frac>>x_1x_2+\dots+ \frac>>x_1x_n \right)+\dots= $$ $$ =f_<11>\left[ \left(x_1+\frac><2f_<11>>x_2+\dots+ \frac><2f_<11>>x_n \right)^2-\left(\frac><2f_<11>>x_2+\dots+ \frac><2f_<11>>x_n \right)^2 \right]+\dots= $$ $$ =f_ <11>\left(x_1+\frac><2f_<11>>x_2+\dots+ \frac><2f_<11>>x_n\ \right)^2 — f_<11>\left(\frac><2f_<11>>x_2+\dots+ \frac><2f_<11>>x_n \right)^2 +\dots $$ В последнем представлении первое слагаемое представляет собой квадрат линейной формы по переменным $ x_<1>,x_2,\dots,x_n $; все оставшиеся слагаемые не зависят от $ x_ <1>$, т.е. составляют квадратичную форму от переменных $ x_<2>,\dots,x_n $. Таким образом, исходная задача для формы $ n_<> $ переменных оказывается сведенной к случаю формы $ (n-1)_<> $-й переменной; последняя преобразуется по аналогичному принципу.

2. Если $ f_<11>=0 $, но $ \exists k:\ f_\ne 0 $, т.е. при хотя бы одном квадрате переменной коэффициент отличен от нуля. Алгоритм модифицируется таким образом, что выделение полного квадрата начинается с переменной $ x_ $ вместо $ x_ <1>$ — первая ничем не лучше (и не хуже) $ k_<> $-й!

3. Совсем исключительный случай: квадраты переменных вообще отсутствуют, т.е. $ f_<11>=\dots=f_=0 $. Выбираем один из ненулевых коэффициентов при смешанных произведениях переменных: пусть $ f_\ne 0 $. Представляем $ x_k=(x_j+x_k)-x_j $ и заменяем все вхождения переменной $ x_ $ на $ X_k-x_j $ при вспомогательной переменной $ X_k=x_j+x_k $. В новой квадратичной форме уже присутствует квадрат переменной $ x_ $ с ненулевым коэффициентом. Тем самым этот случай сводится к предыдущему. После приведения новой формы к сумме квадратов возвращаемся к «старой» переменной $ x_ $.

Пример. Привести форму

$$ f=4\,x_1^2+2\,x_2^2+x_3^2+x_4^2-4\,x_1x_2-4\,x_1x_3+4\,x_1x_4+4\,x_2x_3-4\,x_3x_4 $$ к каноническому виду.

Решение. $$ \begin f&=&4\left(x_1^2-x_1x_2-x_1x_3+x_1x_4\right)+2x_2^2+x_3^2+x_4^2+4x_2x_3-4x_3x_4=\\ &=&4\bigg[ \left(x_1-\frac<1><2>\, x_2-\frac<1><2>\,x_3+ \frac<1><2>\,x_4\, \right)^2- \left(-\frac<1><2>\, x_2-\frac<1><2>\, x_3+\frac<1><2>\, x_4\right)^2 \bigg] + \\ &+&2\,x_2^2+x_3^2+x_4^2+4\,x_2x_3-4\,x_3x_4= \\ &=&4\,\left(x_1-\frac<1><2>\, x_2-\frac<1><2>\,x_3+ \frac<1><2>\,x_4\, \right)^2+\\ & & + \Big[\left(x_2+x_3+x_4\, \right)^2- \left(x_3+x_4 \right)^2\Big]-2\,x_3x_4 = \\ &=&4\,\left(x_1-\frac<1><2>\, x_2-\frac<1><2>\,x_3+ \frac<1><2>\,x_4\, \right)^2+ \left(x_2+x_3+x_4\, \right)^2- \\ &&-x_3^2-4\,x_3x_4-x_4^2= \\ && 4\,\left(x_1-\frac<1><2>\, x_2-\frac<1><2>\,x_3+ \frac<1><2>\,x_4\, \right)^2+ \left(x_2+x_3+x_4\, \right)^2- \\ &&-\Big[ \left(x_3+ 2\, x_4\, \right)^2-4\, x_4^2\Big] -x_4^2 = \\ &=&4\,\left(x_1-\frac<1><2>\, x_2-\frac<1><2>\,x_3+ \frac<1><2>\,x_4\, \right)^2+ \left(x_2+x_3+x_4\, \right)^2-\left(x_3+ 2\, x_4\, \right)^2+3\,x_4^2 \end $$

Ответ. $ f\equiv 4\,\left(x_1-\frac<1><2>\, x_2-\frac<1><2>\,x_3+ \frac<1><2>\,x_4\, \right)^2+ \left(x_2+x_3+x_4\, \right)^2-\left(x_3+ 2\, x_4\, \right)^2+3\,x_4^2 $.

Пример. Привести форму

$$ f=x_1^2+x_2^2-4\,x_3^2+2\,x_1x_2+6\,x_1x_3+4\,x_2x_3 $$ к каноническому виду.

Решение. $$ f\equiv (x_1+x_2+3\,x_3)^2-(x_2+3\,x_3)^2+x_2^2-4\,x_3^2+4\,x_2x_3 \equiv $$ $$ \equiv (x_1+x_2+3\,x_3)^2-2\,x_2x_3 -13\,x_3^2 \equiv $$ В соответствии с алгоритмом, на следующем шаге нужно выделять слагаемые, содержащие переменную $ x_ <2>$, но коэффициент при $ x_2^2 $ в правой части формулы обратился в нуль. Поэтому — в соответствии с пунктом 2 метода — приходится выделять квадрат на основе переменной $ x_ <3>$: $$ (x_1+x_2+3\,x_3)^2-13\, \left(x_3-\frac<1><13>x_2\right)^2+13\cdot \frac<1><13^2>x_2^2 \ . $$

Ответ. $ (x_1+x_2+3\,x_3)^2-13\, \left(x_3-\frac<1><13>x_2\right)^2+ \frac<1><13>x_2^2 $.

Пример. Привести форму

$$ f=x_1x_2-3\,x_1x_3+2\,x_2x_3 $$ к каноническому виду.

Решение. Коэффициенты при квадратах переменных все равны нулю. Действуем в соответствии с пунктом 3 метода Лагранжа. Поскольку коэффициент при $ x_1x_2 $ отличен от нуля, делаем замену переменной $ x_2=X_2-x_1 $ при $ X_2=x_1+x_2 $: $$ f\equiv -x_1^2+x_1X_2-5\,x_1x_3+2\,X_2x_3 \ . $$ Дальнейший ход решения — в соответствии с пунктом 1 метода Лагранжа: $$ -\left(x_1-\frac<1><2>X_2+\frac<5><2>x_3\right)^2+\left(-\frac<1><2>X_2+\frac<5><2>x_3\right)^2+2\,X_2x_3 \equiv $$ $$ \equiv -\left(x_1-\frac<1><2>X_2+\frac<5><2>x_3\right)^2+\frac<1><4>X_2^2-\frac<1><2>X_2x_3+\frac<25><4>x_3^2 \equiv $$ $$ \equiv -\left(x_1-\frac<1><2>X_2+\frac<5><2>x_3\right)^2+\frac<1><4>\left(X_2-x_3 \right)^2+6\,x_3^2 \ $$ Получили сумму квадратов форм от переменных $ x_1,X_2,x_3 $. Возвращаемся к переменной $ x_ <2>$:

Ответ. $ -(\frac<1><2>x_1-\frac<1><2>x_2+\frac<5><2>x_3)^2+\frac<1><4>(x_1+x_2-x_3)^2+6\,x_3^2 $.

Матричная форма записи квадратичной формы

Задача. Установить правило формирования коэффициентов канонического вида квадратичной формы, получающегося применением метода Лагранжа.

Прежде всего, соберем все переменные в один вектор, а вернее — в два вектора: $$ <>_ <.>\mbox < столбец переменных >X= \left(\begin x_1 \\ \vdots \\ x_n \end \right) \quad \mbox < и строку переменных >X^ <\top>= (x_1,\dots,x_n) \ ; $$ здесь $ <>^ <\top>$ означает транспонирование. Не очень принципиально, что обозначать через $ X_<> $ — столбец или строку; и хотя сокращение $ f(x_1,\dots,x_n)=f(X) $ кажется не вполне корректным с точки зрения только что введенного обозначения, тем не менее не будем навешивать в правую часть дополнительные значки…

Если определить верхнетреугольную матрицу $ \mathbf F $ равенством: $$ <\mathbf F>= \left( \begin f_<11>&f_<12>&\dots &f_ <1n>\\ &f_<22>& \dots & f_ <2n>\\ \mathbb O & &\ddots & \vdots \\ & & & f_ \end \right), $$ то квадратичную форму можно записать в виде произведения трех матриц $$ <>_ <.>\mbox < строка переменных >\times \mbox < матрица >\times \mbox < столбец переменных >$$ $$ f(X)=X^ <\top><\mathbf F>X \ .$$ Более того, можно написать бесконечно много подобных представлений для одной и той же квадратичной формы $ f_<> $, подбирая разные матрицы

Пример. $ f=x_1^2+x_2^2-4\,x_3^2+2\,x_1x_2+6\,x_1x_3+4\,x_2x_3 \equiv $

$$ \equiv (x_1,x_2,x_3) \left( \begin 1 & 2 & 6 \\ 0 & 1 & 4 \\ 0 & 0 & -4 \end \right) \left( \begin x_1 \\ x_2 \\ x_3 \end \right) \equiv (x_1,x_2,x_3) \left( \begin 1 & 0 & 3 \\ 2 & 1 & 4 \\ 3 & 0 & -4 \end \right) \left( \begin x_1 \\ x_2 \\ x_3 \end \right)\equiv $$ $$ \equiv (x_1,x_2,x_3) \left( \begin 1 & 1 & 3 \\ 1 & 1 & 2 \\ 3 & 2 & -4 \end \right) \left( \begin x_1 \\ x_2 \\ x_3 \end \right)\equiv \dots $$

Пример. Для приведенной выше квадратичной формы

$$ f=x_1^2+x_2^2-4\,x_3^2+2\,x_1x_2+6\,x_1x_3+4\,x_2x_3 $$ ее правильной записью будет именно последняя:

$$ f\equiv (x_1,x_2,x_3) \left( \begin 1 & 1 & 3 \\ 1 & 1 & 2 \\ 3 & 2 & -4 \end \right) \left( \begin x_1 \\ x_2 \\ x_3 \end \right) $$ Правило формирования матрицы довольно просты: на диагонали ставятся коэффициенты при квадратах, а внедиагональные элементы получаются располовиниванием коэффициентов при смешанных произведениях переменных.

$ x_ <1>$$ x_ <2>$$ x_ <3>$
$ x_ <1>$$ f_ <11>$$ \frac<1><2>f_ <12>$$ \frac<1><2>f_ <13>$
$ x_ <2>$$ \frac<1><2>f_ <12>$$ f_ <22>$$ \frac<1><2>f_ <23>$
$ x_ <3>$$ \frac<1><2>f_ <13>$$ \frac<1><2>f_ <23>$$ f_ <33>$

Пример. Для

$$ f(x_1,x_2)=a_<11>x_1^2+2\, a_<12>x_1x_2+a_<22>x_2^2 $$ имеем: $$ <\mathbf A>= \left( \begin a_ <11>& a_ <12>\\ a_ <12>& a_ <22>\end \right) \ ; \ <\mathcal D>(f)=a_<11>a_<22>-a_<12>^2 \ ; $$ последнее выражение вполне напоминает дискриминант квадратного трехчлена $ a_<11>x^2+2\, a_<12>x+a_ <22>$ и это обстоятельство оправдывает использование слова дискриминант для нового объекта…

Рассмотрим замены переменных в квадратичной форме, т.е. переход от переменных $ x_<1>,\dots,x_ $ к новым переменным $ y_<1>,\dots,y_ $. Ограничимся только линейными заменами вида $$ \left\< \begin x_1&=&c_<11>y_1+c_<12>y_2+\dots+c_<1n>y_n, \\ x_2&=&c_<21>y_1+c_<22>y_2+\dots+c_<2n>y_n, \\ \dots & & \dots \\ x_n&=&c_y_1+c_y_2+\dots+c_y_n. \end \right. $$ Результатом такой замены переменных будет новая квадратичная форма относительно новых переменных. Установим по какому закону формируются ее коэффициенты. С этой целью введем в рассмотрение матрицу замены переменных $$ C= \left( \begin c_ <11>& c_ <12>& \dots & c_ <1n>\\ c_ <21>& c_ <22>& \dots & c_ <2n>\\ \dots & & & \dots \\ c_ & c_ & \dots & c_ \\ \end \right) ; $$ которая позволяет переписать саму замену переменных в матричном виде $$ \left(\begin x_1 \\ x_2 \\ \vdots \\ x_n \end \right)= \left( \begin c_ <11>& c_ <12>& \dots & c_ <1n>\\ c_ <21>& c_ <22>& \dots & c_ <2n>\\ \dots & & & \dots \\ c_ & c_ & \dots & c_ \\ \end \right) \left(\begin y_1 \\ y_2 \\ \vdots \\ y_n \end \right) \qquad \iff \qquad X=CY \ . $$ Тогда формальная подстановка последнего варианта в правильную запись квадратичной формы приведет к следующей цепочке $$ f(X)=X^<\top><\mathbf A>X= (CY)^<\top> <\mathbf A>(CY)=Y^ <\top>C^<\top><\mathbf A>C Y=\tilde f (Y) \ , $$ (здесь использовались некоторые свойства операции транспонирования ) и, если обозначить матрицу $$ \mathbf B =C^<\top><\mathbf A>C \ , $$ то мы получаем правило формирования матрицы квадратичной формы, получившейся в результате замены переменных, с помощью операции произведения матриц. Обратим внимание на еще один факт — матрица $ \mathbf B $ является симметричной: $$ \mathbf B^ <\top>=(C^<\top><\mathbf A>C)^<\top>= C^<\top><\mathbf A>^<\top>\left(C^ <\top>\right)^ <\top>= C^<\top><\mathbf A>C= \mathbf B \ , $$ т.е. выбор в качестве матричной записи квадратичной формы именно того варианта, что основан на симметричной матрице, позволяет сохранить это свойство при любой линейной замене переменных.

Задача о нахождении канонического вида квадратичной формы $ X^<\top><\mathbf A>X $ может быть также переформулирована в терминах замены переменных: требуется найти такую матрицу $ C_<> $, чтобы матрица $ \mathbf B= C^<\top><\mathbf A>C $ оказалась диагональной: $$ \mathbf B= \left( \begin a_ <1>& & & \\ & a_ <2>& & <\mathbb O>\\ <\mathbb O>& & \ddots & \\ & & & a_ \end \right) \ ; $$ при этом дополнительным условием ставится невырожденность (неособенность) матрицы $ C_<> $: $$ \det C \ne 0 \ . $$

Теорема. Для любой квадратичной формы над $ \mathbb A $ существует невырожденная линейная замена переменных $ X=CY $ такая, что преобразованная квадратичная форма $ \widetilde f(Y) $ имеет канонический вид.

Вернемся к примерам предыдущего пункта, перепишем их на матричном языке.

Пример. Для формы

$$ f(x_1,x_2,x_3,x_4)= $$ $$=4\,x_1^2+2\,x_2^2+x_3^2+x_4^2-4\,x_1x_2-4\,x_1x_3+4\,x_1x_4+4\,x_2x_3-4\,x_3x_4 $$ замена переменных осуществляется формулами

$$ \begin y_1=& x_1 &-\frac<1><2>\, x_2&-\frac<1><2>\,x_3&+ \frac<1><2>\,x_4, \\ y_2=& & x_2&+x_3&+x_4, \\ y_3=& & & x_3 &+ 2\, x_4,\\ y_4=& &&& x_4, \end $$ т.е. матрица замены переменных $$ C= \left( \begin 1 & -\frac<1> <2>& -\frac<1> <2>& \frac<1> <2>\\ 0 & 1 & 1 & 1 \\ 0 & 0 & 1 & 2 \\ 0 & 0 & 0 & 1 \end \right) $$ имеет верхнетреугольный вид. Канонический вид в новых переменных записывается $$ f(x_1,x_2,x_3,x_4) \equiv 4\,y_1^2+y_2^2-y_3^2+3\,y_4^2 \ . $$

Для формы $$ f(x_1,x_2,x_3)=x_1^2+x_2^2-4\,x_3^2+2\,x_1x_2+6\,x_1x_3+4\,x_2x_3 $$ замена переменных уже не имеет треугольного вида: $$ \begin y_1=& x_1 &+ x_2&+3\,x_3 \\ y_2=& & -\frac<1><13>x_2&+x_3 \\ y_3=& & \frac<1><13>x_2 & \end \qquad \iff \qquad C= \left( \begin 1 & 1 & 3 \\ 0 & -\frac<1> <13>& 1 \\ 0 & \frac<1> <13>& 0 \end \right) \ . $$ Для формы $$ f(x_1,x_2,x_3)=x_1x_2-3\,x_1x_3+2\,x_2x_3 $$ получили: $$ \begin y_1=& \frac<1><2>x_1 &-\frac<1><2>x_2&+\frac<5><2>x_3 \\ y_2=& x_1&+x_2&-x_3 \\ y_3=& & & x_3 \end \qquad \iff \qquad C= \left( \begin \frac<1> <2>& -\frac<1> <2>& \frac<5> <2>\\ 1 & 1 & -1 \\ 0 & 1 & 1 \end \right) \ , $$ т.е. замена переменных также не имеет треугольного вида. ♦

Поставленную в начале пункта задачу об установлении структуры канонического вида квадратичной формы попытаемся решить сначала для случая когда замену переменных можно подобрать именно в треугольном виде.

Метод Лагранжа и метод Гаусса

Пример. Рассмотрим матрицу квадратичной формы

из предыдущих пунктов, и, временно выходя из круга поставленных в настоящем разделе задач, попробуем применить к ней метод Гаусса приведения к треугольному виду: $$ \left( \begin 4 & -2 & -2 & 2 \\ -2 & 2 & 2 & 0 \\ -2 & 2 & 1 & -2 \\ 2 & 0 & -2 & 1 \end \right) \ \rightarrow \ \left( \begin 4 & -2 & -2 & 2 \\ 0 & 1 & 1 & 1 \\ 0 & 1 & 0 & -1 \\ 0 & 1 & -1 & 0 \end \right) \ \rightarrow \ $$ $$ \rightarrow \ \left( \begin 4 & -2 & -2 & 2 \\ 0 & 1 & 1 & 1 \\ 0 & 0 & -1 & -2 \\ 0 & 0 & -2 & -1 \end \right) \ \rightarrow \ \left( \begin 4 & -2 & -2 & 2 \\ 0 & 1 & 1 & 1 \\ 0 & 0 & -1 & -2 \\ 0 & 0 & 0 & 3 \end \right) \ . $$ Обратим внимание на два обстоятельства: диагональные элементы последней матрицы совпадают с коэффициентами канонического вида квадратичной формы, а коэффициенты замены переменных, приводящей к этому каноническому виду, совпадают с элементами строк этой матрицы, если их разделить на соответствующие диагональные элементы. Возникает подозрение , что метод Лагранжа является «замаскированной» версией метода Гаусса. ♦

Для того, чтобы выяснить аналитический смысл преобразований по методу Лагранжа найдем правило формирования коэффициентов в первом шаге приведения квадратичной формы к каноническому виду. Пусть исходная квадратичная форма записана в виде $$ f(x_1,\dots,x_ )=\sum_ <1\le j,k \le n>a_x_jx_k= $$ $$ \begin = a_<11>x_1^2&+2a_<12>x_1x_2&+ \dots & +2a_<1n>x_1x_n+ \\ &+a_<22>x_2^2 &+ \dots & +2a_<2n>x_2x_n+ \\ & & +\dots & + \\ & & &+a_x_n^2, \end $$ т.е. коэффициенты при смешанных произведениях переменных записаны с выделением множителя $ 2_<> $. После выделения полного квадрата, содержащего переменные $ x_1,x_2,\dots,x_n $: $$ f(x_1,x_2,\dots,x_n)\equiv a_ <11>\left(x_1+\frac>>x_2+\dots+ \frac>>x_n\ \right)^2 + f_2(x_2,\dots,x_n) $$ в правой части тождества образовалась квадратичная форма $ f_ <2>$, не содержащая $ x_ <1>$. Она равна $$ f_2 =\sum_ <2\le j,k \le n>a_x_jx_k- a_<11>\left(\frac>>x_2+\dots+ \frac>>x_n \right)^2= $$ $$ =\sum_ <2\le j,k \le n>a_x_jx_k-a_<11>\sum_ <2\le j,k \le n>\fraca_<1k>>^2>x_jx_k= \sum_<2\le j,k \le n>\left( a_-\frac>>a_ <1k>\right) x_jx_k \ . $$ Если теперь выписать матрицу этой квадратичной формы (она имеет порядок $ n_<>-1 $), то ее элементы образуются по точно такому же правилу, как и коэффициенты матрицы, получающейся из матрицы $ \mathbf A_<> $ в результате первого шага метода Гаусса.

Теорема. Метод Лагранжа приведения квадратичной формы $ X^<\top><\mathbf A>X $ к каноническому виду эквивалентен методу Гаусса приведения матрицы $ <\mathbf A>$ к треугольному виду.

Доказательство. Действительно, первый шаг прямого хода метода исключения переменных Гаусса преобразует матрицу $ \mathbf A $ следующим образом: $$ \left( \begin a_<11>& a_<12>& a_<13>& \dots & a_ <1n>\\ a_<12>& a_<22>& a_<23>& \dots & a_ <2n>\\ & \dots & & \dots & \\ a_<1n>& a_<2n>& a_<3n>& \dots & a_ \end \right) \rightarrow \left(\begin a_<11>&a_<12>&\dots&a_<1n>\\ 0&a_<22>^<[1]>& \dots &a_<2n>^<[1]>\\ &\dots & & \dots \\ 0&a_^<[1]>&\dots &a_^ <[1]>\end \right) \ ; $$ здесь $$a_^ <[1]>= a_ — \fraca_<1k>>> \ ,$$ и предполагается, что $ a_<11>\ne 0 $. Видим, что формула формирования элементов матрицы $$ \left(\begin a_<22>^<[1]>& \dots&a_<2n>^<[1]>\\ \dots & & \dots & \\ a_^<[1]>&\dots &a_^ <[1]>\end \right)_ <(n-1)\times (n-1)>$$ точно такая же, как и матрицы квадратичной формы $ f_2 $. Более того, поскольку матрица $ <\mathbf A>$ симметрична ($ a_=a_ $), то и только что полученная матрица оказывается симметричной. Если $ a_<22>^ <[1]>\ne 0 $, то к этой новой матрице можно снова применить ту же процедуру, и т.д., и в конце концов придем к матрице первого порядка. Собирая все промежуточные результаты в одну матрицу, получим ее в треугольном виде $$ \left(\begin a_<11>&a_<12>&\dots&a_ <1,n-1>&a_<1n>\\ 0&a_<22>^<[1]>& \dots&a_<2,n-1>^ <[1]>&a_<2n>^<[1]>\\ & & \ddots & & \dots \\ 0 &0 & &a_^<[n-2]>&a_^ <[n-2]>\\ 0 &0 &\dots & 0 &a_^ <[n-1]>\end \right) $$ при условии, что ни одно из чисел на диагонали не обратилось в нуль: $$a_ <11>\ne 0,\ a_<22>^ <[1]>\ne 0, \dots,\ a_^ <[n-2]>\ne 0,\ a_^ <[n-1]>\ne 0 \ .$$ Если теперь обратиться к методу Лагранжа, то увидим, что полученная матрица как раз и определяет замену переменных $$ \left\<\begin y_1=&\displaystyle x_1+&\frac>>x_2+&\dots+&\frac>>x_+& \frac>>x_n \\ y_2=&\displaystyle &x_2+&\dots + &\frac^<[1]>>^<[1]>>x_+& \frac^<[1]>>^<[1]>>x_ \\ \vdots & & & \ddots & \dots & \\ y_=&\displaystyle & & &x_+ &\frac^<[n-2]>>^<[n-2]>>x_n \\ y_n=&&&&&x_n \end \right. \ , $$ приводящую квадратичную форму к каноническому виду: $$ a_<11>y_1^2 + a_<22>^ <[1]>y_2^2 + \dots +a_^ <[n-2]>y_^2 + a_^ <[n-1]>y_n^2 \ . $$ ♦

Формула Якоби

Теорема [Якоби]. Квадратичная форма $ f(X)=X^<\top><\mathbf A>X $ с симметричной матрицей $ <\mathbf A>$, ранг которой равен $ \mathfrak r_<> $, а главные миноры $ \<\det \mathbf A_j \>_^ <\mathfrak r>$ отличны от нуля, приводится к следующему каноническому виду (формула Якоби 3) ):

$$ \frac <1 \cdot \det \mathbf A_1>+\frac <\det \mathbf A_1 \cdot \det \mathbf A_2>+\frac <\det \mathbf A_2 \cdot \det \mathbf A_3>+\dots+\frac^2><\det \mathbf A_<<\mathfrak r>-1> \cdot \det \mathbf A_<\mathfrak r>> $$ Здесь $$ z_1 =\frac<1> <2>\partial f / \partial x_1,\ z_2= \frac<1> <2>\left| \begin a_ <11>& \partial f / \partial x_1 \\ a_ <12>& \partial f / \partial x_2 \end \right|, \ z_3= \frac<1> <2>\left| \begin a_ <11>& a_ <12>& \partial f / \partial x_1 \\ a_ <12>& a_ <22>& \partial f / \partial x_2 \\ a_ <13>& a_ <23>& \partial f / \partial x_3 \end \right|, \ \dots \ , $$ $$ \qquad \qquad z_<\mathfrak r>= \frac<1> <2>\left| \begin a_ <11>& a_ <12>& \dots & a_ <1,\mathfrak r-1>& \partial f / \partial x_1 \\ a_ <12>& a_ <22>& \dots & a_ <2,\mathfrak r-1>& \partial f / \partial x_2 \\ \dots & & & \dots & \dots \\ a_ <1,\mathfrak r >& a_ <2,\mathfrak r >& \dots & a_ <\mathfrak r-1,\mathfrak r >& \partial f / \partial x_ <\mathfrak r>\end \right| $$

Пример. Для квадратичной формы $$ f(x_1,x_2,x_3,x_4)= $$

Легко убедиться, что это — проявление общего правила. Выражение для $$ z_= \frac<1> <2>\left| \begin a_ <11>& a_ <12>& \dots & a_ <1,k-1>& \partial f / \partial x_1 \\ a_ <12>& a_ <22>& \dots & a_ <2,k-1>& \partial f / \partial x_2 \\ \dots & & & \dots & \dots \\ a_ & a_ & \dots & a_ & \partial f / \partial x_ \end \right| $$ при $ k \in \ <1,\dots, \mathfrak r\>$ преобразуем следующим образом: из последнего столбца определителя $$ = \left| \begin a_ <11>& a_ <12>& \dots & a_ <1,k-1>& a_<11>x_1+a_<12>x_2+\dots+ a_ <1,k-1>x_+a_<1k>x_k+\dots+a_<1n>x_n \\ a_ <12>& a_ <22>& \dots & a_ <2,k-1>& a_<21>x_1+a_<22>x_2+\dots+ a_ <2,k-1>x_+a_<2k>x_k+\dots+a_<2n>x_n \\ \dots & & & \dots & \dots \\ a_ & a_ & \dots & a_ & a_x_1+a_x_2+\dots+ a_ x_+a_x_k+\dots+a_x_n \end \right| $$ вычтем первый, домноженный на $ x_1 $, второй, домноженный на $ x_2 $, и т.д., $ (k-1) $-й, домноженный на $ x_ $. В результате получим линейную форму $$ z_k= \left| \begin a_ <11>& a_ <12>& \dots & a_ <1,k-1>& a_ <1k>\\ a_ <12>& a_ <22>& \dots & a_ <2,k-1>& a_ <2k>\\ \dots & & & \dots & \dots \\ a_ & a_ & \dots & a_ & a_ \end \right|x_k + \dots + \left| \begin a_ <11>& a_ <12>& \dots & a_ <1,k-1>& a_ <1n>\\ a_ <12>& a_ <22>& \dots & a_ <2,k-1>& a_ <2n>\\ \dots & & & \dots & \dots \\ a_ & a_ & \dots & a_ & a_ \end \right|x_n \, , $$ не зависящую от $ x_1,\dots, x_ $. Коэффициент же при $ x_k $ равен $ \det \mathbf A_k $ и отличен от нуля по условию теоремы. Если его вынести за пределы формы, то получим еще альтернативный вариант формулы Якоби.

Квадратичная форма $ f(X)=X^<\top><\mathbf A>X $ с симметричной матрицей $ <\mathbf A>$, ранг которой равен $ \mathfrak r_<> $, а главные миноры $ \<\det \mathbf A_j \>_^ <\mathfrak r>$ отличны от нуля, приводится к следующему каноническому виду:

$$ y_1^2 \det \mathbf A_1 + y_2^2\frac<\det \mathbf A_2> < \det \mathbf A_1>+y_3^2\frac<\det \mathbf A_3> <\det \mathbf A_2>+\dots+y_<\mathfrak r>^2 \frac<\det \mathbf A_<\mathfrak r>><\det \mathbf A_<\mathfrak r-1>> \ ; $$ при этом линейные относительно переменных $ x_1,\dots,x_n $ формы $ \_^ <\mathfrak r>$ выражаются по формулам $$ \left\< \begin y_1=&\displaystyle x_1+&\tilde c_<12>x_2& &+\dots+&\tilde c_<1,n-1>x_+&\tilde c_<1n>x_n \\ y_2=&\displaystyle &x_2+& & \dots + &\tilde c_<2,n-1>x_+&\tilde c_<2n>x_ \\ \vdots & & & \ddots & & \dots & \\ y_<\mathfrak r>=&\displaystyle & & &x_<\mathfrak r>+ & \dots + & \tilde c_<\mathfrak r n>x_n \end \right. $$ Здесь $$ \tilde c_<1j>=a_<1j>/a_<11>,\ \tilde c_=\left| \begin a_ <11>& a_ <12>& \dots & a_ <1,k-1>& a_ <1j>\\ a_ <12>& a_ <22>& \dots & a_ <2,k-1>& a_ <2j>\\ \dots & & & \dots & \dots \\ a_ & a_ & \dots & a_ & a_ \end \right| \Bigg/ \det \mathbf A_j \, . $$

При $ \mathfrak r = n $ матрица $ \tilde C_<> $ из предыдущей формулы становится верхнетреугольной: $$ Y=\tilde C X \, ; $$ при этом на главной диагонали будут стоять $ 1 $. Обратная к матрице такого вида имеет ту же структуру — и матрица $ C=\tilde C^ <-1>$ является матрицей, которая встретилась нам в предыдущем ПУНКТЕ.

Теорема. Квадратичная форма $ f(X)=X^<\top><\mathbf A>X $ при симметричной неособенной матрице $ <\mathbf A>$ приводится к каноническому виду заменой переменных, задаваемой верхней унитреугольной матрицей

$$ X=CY \quad npu \ C= \left( \begin 1& c_<12>& \dots & c_ <1n>\\ & 1& \dots & c_ <2n>\\ \mathbb O & & \ddots & \vdots \\ & & & 1 \end \right) $$ тогда и только тогда, когда все главные миноры матрицы $ <\mathbf A>$ отличны от нуля. Этот канонический вид представлен формулой Якоби $$ y_1^2 \det \mathbf A_1 + y_2^2\frac<\det \mathbf A_2> < \det \mathbf A_1>+\dots+y_^2 \frac<\det \mathbf A_><\det \mathbf A_> \ . $$ Доказательство достаточности условия теоремы уже произведено, необходимость доказывается в пункте ☞ LDU-разложение матрицы.

Закон инерции для квадратичных форм

Для заданной квадратичной формы канонические виды, т.е. представления в виде сумм квадратов, можно построить разными способами. Выясним, какие характеристики являются общими (инвариантными) для этих представлений.

Ранг квадратичной формы

Предположим, что с помощью какой-либо невырожденной замены переменных мы привели квадратичную форму к каноническому виду: $$\widetilde f(Y)=\alpha_1y_1^2+\dots+\alpha_n y_n^2 \ .$$ Может так случиться, что часть коэффициентов $ \<\alpha_j \>_^n $ обратится в нуль.

Рангом квадратичной формы называется ранг ее матрицы: $$\operatorname ( f ) = \operatorname ( <\mathbf A>) \ .$$

Теорема. Ранг квадратичной формы не меняется при невырожденных заменах переменных:

$$ \operatorname (f) = \operatorname( C^<\top><\mathbf A>C ) \quad npu \quad \forall C,\ \det C \ne 0 \ .$$

Доказательство основано на следствии к теореме $ 2 $, приведенной ☞ ЗДЕСЬ: ранг матрицы не меняется при домножении ее на произвольную неособенную.

Ранг квадратичной формы равен числу ненулевых коэффициентов в ее каноническом виде.

Закон инерции

Число положительных (или отрицательных) коэффициентов в каноническом виде квадратичной формы $ f_<>(X) $ называется ее положительным (соответственно, отрицательным) индексом инерции. Буду обозначать эти индексы 4) $$n_<+>(f) \quad \mbox < и >\quad n_<->(f) \ . $$ Разность 5) $$\sigma (f) = n_<+>(f)-n_<->(f)$$ называется сигнатурой квадратичной формы (а также сигнатурой соответствующей ей симметричной матрицы).

Теорема [закон инерции]. Индексы инерции не зависят от способа приведения квадратичной формы к каноническому виду.

Доказательство ☞ ЗДЕСЬ.

Пример. Найти ранг и сигнатуру квадратичной формы $ f(x_1,x_2,x_3)=x_1x_2-x_2x_3 $.

Решение. Приводим квадратичную форму к каноническому виду по методу Лагранжа: $$f=\frac<1> <4>\,(x_1+x_2-x_3)^2 — \frac<1> <4>\,(x_1-x_2-x_3)^2 \ .$$

Ответ. $ \operatorname (f) = 2,\, \sigma (f)=0 $.

В предположении, что ранг матрицы $ \mathbf A_<> $ равен $ \mathfrak r_<> $, а ее главные миноры $ \< \det <\mathbf A>_j \>_^ <\mathfrak r>$ отличны от нуля, имеем:

$$ n_<+>(f)=<\mathcal P>(1,\det <\mathbf A>_1,\dots, \det <\mathbf A>_<\mathfrak r>),\ n_<->(f)=<\mathcal V>(1,\det <\mathbf A>_1,\dots, \det <\mathbf A>_<\mathfrak r>)\ . $$ Здесь $ <\mathcal P>_<> $ — число знакопостоянств, а $ <\mathcal V>_<> $ — число число знакоперемен в последовательности. Для сигнатуры квадратичой формы также справедлива и формула $$ \sigma (f)= \sum_^ <\mathfrak r>\operatorname (\det (\mathbf A_) \cdot \det (\mathbf A_) ) \quad npu \quad \det (\mathbf A_<0>)=1 $$ и операции $ \operatorname $ определения знака, введенной ☞ ЗДЕСЬ.

Доказательство следует из формулы Якоби.

Правило вычисления сигнатуры из предыдущей теоремы остается справедливым и в случае, если в последовательности главных миноров $ \< \det <\mathbf A>_j \>_^ <\mathfrak r>$ имеются нулевые, но не подряд идущие, и $ \det <\mathbf A>_ <\mathfrak r>\ne 0 $. Если, например,

$$ \det (\mathbf A_) = 0,\ \det (\mathbf A_) \ne 0,\ \det (\mathbf A_) \ne 0 \quad npu \quad j\in\<1,\dots, <\mathfrak r>-1\> ,$$ то сумма $$ \operatorname (\det (\mathbf A_) \cdot \det (\mathbf A_) )+ \operatorname (\det (\mathbf A_) \cdot \det (\mathbf A_) ) $$ считается равной нулю. (Можно также доказать, что в этом случае главные миноры $ \det (\mathbf A_) $ и $ \det (\mathbf A_) $ имеют противоположные знаки.)

Пример. Найти ранг и сигнатуру квадратичной формы

$$f_ <<\color\alpha >>(x_1,x_2,x_3)=3\,x_1^2 -4\,x_1x_2-2\,x_1x_3 + <\color\alpha > \, x_2^2 +6\, x_2x_3 $$ в зависимости от значений параметра $ <\color\alpha > $.

Решение. Сначала пробуем применить формулу из последнего следствия: $$\det <\mathbf A>_1=3,\ \det <\mathbf A>_2=3\, <\color\alpha > -4,\ \det <\mathbf A>_3= \det <\mathbf A>=- <\color\alpha > -15 \ .$$ При $ <\color\alpha > \not\in \ <4/3,\, -15 \>$ формула применима при $ <\mathfrak r>=3 $: $$n_<+>(f)=\left\< \begin 2 & npu & <\color\alpha > >4/3 ;\\ 2 & npu & -15 -15 & 3 & 1 \end $$

Рассмотренный только что пример относится к общей задаче оценки влияния параметров на характеристики квадратичной формы:

Как меняются ранг и сигнатура при непрерывном изменении параметров?

Пусть квадратичная форма зависит от параметров $ \alpha, \beta, \dots $, причем эта зависимость — полиномиальная. Пусть при некотором наборе вещественных значений параметров все главные миноры матрицы квадратичной формы отличны от нуля. Тогда ранг и сигнатура квадратичной формы могут быть вполне определены знаками этих миноров посредством формулы из следствия к закону инерции. Поскольку элементы миноров полиномиально зависят от параметров, то мы получаем систему неравенств, которую (при необходимости домножением некоторых неравенств на $ (-1) $) можно переписать в виде $$ G_1(\alpha,\beta,\dots) > 0, \dots, G_n(\alpha,\beta,\dots) > 0 \ . $$ Здесь $ G_1,\dots, G_n $ — полиномы от $ \alpha,\beta,\dots $. Если при некотором наборе значений $ \alpha=\alpha_0, \beta=\beta_0, \dots $ эта система удовлетворена, при непрерывной вариации этих параметров $ \alpha_0+\delta_<\alpha>, \beta_0 + \delta_<\beta>,\dots $ какое из неравенств системы нарушится в первую очередь, т.е. раньше остальных? Иными словами: какое из неравенств системы самое важное? — Оказывается, последнее.

Теорема[2]. Пусть $ f_ <<\color\alpha >>(x_1,\dots,x_n) $ — квадратичная форма, зависящая от параметра $ <\color\alpha > $ линейным образом:

Справедливо и более общее утверждение.

Теорема[1,5]. Если при непрерывном изменении коэффициентов формы $ f_<> $ ее ранг $ <\mathfrak r>_<> $ остается неизменным, то не изменяется и ее сигнатура $ \sigma_<>(f) $.

В случае, когда главные миноры матрицы $ \mathbf A $ обращаются в нуль, к анализу канонического вида квадратичной формы приходится привлекать «тяжелую артиллерию» в виде ведущих миноров. Но, по крайней мере, один теоретический результат можно сформулировать немедленно.

Теорема. В произвольной квадратичной форме $ f(X) $ ранга $ \mathfrak r\ge 1 $ можно так перенумеровать переменные, чтобы в матрице получившейся квадратичной формы $ \tilde f(Y) $ в последовательности главных миноров

$$ \det \widetilde<\mathbf A>_1, \dots, \det \widetilde<\mathbf A>_ < \mathfrak r>$$ не было двух подряд идущих нулевых и $ \det \widetilde<\mathbf A>_ < \mathfrak r>\ne 0 $.

Конгруэнтность квадратичных форм

Матрицы $ <\mathbf A>$ и $ <\mathbf B>$, связанные соотношением $ <\mathbf B>=C^<\top><\mathbf A>C $ при некоторой неособенной матрице $ C $, называются конгруэнтными: $ <\mathbf A>\cong <\mathbf B>$. Если, вдобавок, матрицы $ <\mathbf A>$ и $ <\mathbf B>$ симметричны, то конгруэнтными называются и соответствующие им квадратичные формы $ X^<\top><\mathbf A>X $ и $ X^<\top><\mathbf B>X $.

Теорема. Квадратичные формы $ X^<\top><\mathbf A>X $ и $ X^<\top><\mathbf B>X $ конгруэнтны тогда и только тогда, когда совпадают их индексы инерции, или, что то же, равны их ранги и сигнатуры.

Из всего разнообразия канонических видов квадратичной формы выберем самый простой, именно тот, коэффициенты которого равны $ +1 $ или $ (-1) $. Например, если квадратичная форма $ f(X) $ уже приведена к каноническому виду $$\widetilde f(Y)=\alpha_1y_1^2+\dots+\alpha_ <\mathfrak r>y_<\mathfrak r>^2 \ .$$ то преобразование $$y_j=\frac<\sqrt<\alpha_j>>\ npu \ j\in \<1,\dots, <\mathfrak r>\> \ , \ y_j=z_j \ npu \ j\in \<<\mathfrak r>+1,\dots, n \> $$ приводит эту форму к виду $$ z_1^2+\dots + z_(A)>^2 -z_(A)+1>^2 — \dots — z_<<\mathfrak r>>^2 \ , $$ который называется нормальным видом квадратичной формы.

Множество всех квадратичных форм с вещественными коэффициентами можно разбить на классы эквивалентности, в каждом из которых будут находиться только конгруэнтные между собой формы. Каждый из классов полностью описывается каким-то из своих представителей. Таким представителем можно взять нормальный вид.

Какое преобразование квадратичной формы оставляет ее инвариантной?

Теорема [Эрмит]. Квадратичная форма $ X^<\top><\mathbf A>X $ переходит в себя при преобразовании

Знакоопределенность

Квадратичная форма $ f_<>(X) $ называется

а) неотрицательной если $ f(X)\ge 0 $ для любого $ X\in \mathbb R^n $;

б) положительно определенной, если она неотрицательна и $ f(X)= 0 $ только при $ X=\mathbb O_<> $;

в) неопределенной или знакопеременной, если существуют $ \ \subset \mathbb R^n $ такие что числа $ f(X_1) $ и $ f(X_2) $ имеют разные знаки: $ f(X_1)f(X_2) глобальным. В случае положительной определенности точка $ X=\mathbb O $ будет единственной точкой пространства $ \mathbb R^ $, в которой $ f_<>(X) $ достигает своего минимального значения. Однако если свойство положительной определенности будет нарушено: $ f(X_1) =0 $ при $ X_1 \ne \mathbb O $, то вследствие однородности формы $ f_<>(X) $ будет выполнено $$ f(tX_1)=t^2f(X_1)= 0 \quad npu \quad \forall t \in \mathbb R \ . $$ Иными словами, свое минимальное значение $ 0_<> $ неотрицательная, но не положительно определенная, форма $ f_<> (X) $ будет принимать на всей прямой, проходящей через точки $ \mathbb O $ и $ \mathbb X_1 $. Точка $ X=\mathbb O $ перестает быть изолированной точкой минимума: в любой ее окрестности находятся другие точки минимума. С точки зрения здравого смысла, подобная ситуация может считаться исключительным, вырожденным случаем. Интуиция подтверждается аналитикой: как увидим впоследствии вероятность того, что случайным образом выбранная квадратичная форма, обладающая свойством неотрицательности, не будет, вдобавок, положительно определенной, равна $ 0_<> $. Событие теоретически возможно, но практически немыслимо.

Оказывается условие положительной определенности формы $ f $ является необходимым и достаточным для обеспечения подобного свойства в произвольном пространстве $ \mathbb R^n $. И это утверждение верно не только для квадратичной формы, но и для однородного полинома (формы) произвольного порядка.

Задача об условных экстремумах квадратичной формы $ f_<>(X) $ на сфере $ x_1^2+\dots+x_n^2 =1 $ решается ☞ ЗДЕСЬ.

Пример. В произвольном евклидовом пространстве $ \mathbb E $ квадратичная форма с матрицей Грама произвольной системы векторов $ \ \subset \mathbb E $

Задача. Найти условия неотрицательности и положительной определенности квадратичной формы в терминах ее коэффициентов.

Очевидны необходимые условия неотрицательности квадратичной формы $$ f(X)=\displaystyle \sum_ <1\le j \le k \le n>f_x_jx_k \ : $$ все коэффициенты при квадратах переменных должны быть неотрицательными: $$ f_<11>\ge 0, \dots , f_\ge 0 . $$ Также очевидно, что эти условия будут и достаточными, если все остальные коэффициенты $ f_^<> $ при $ j\ne k $ равны нулю. Если же последнее условие не выполняется, то имеет смысл предварительно преобразовать квадратичную форму к сумме квадратов, т.е. исследовать ее канонический вид.

Теорема. Ненулевая квадратичная форма, представленная в правильном виде

$$ f(X)=X^<\top><\mathbf A>X \, , $$ будет неотрицательной тогда и только тогда, когда ее отрицательный индекс инерции равен нулю: $$ n_ <->(<\mathbf A>)=0 \qquad \iff \qquad \qquad \sigma ( <\mathbf A>)=\operatorname <\mathbf A>\ .$$ Если это условие выполнено, то для положительной определенности формы необходимо и достаточно чтобы она была невырождена: $ \det <\mathbf A>\ne 0 $.

Доказательство ☞ ЗДЕСЬ.

К счастью, явное представление канонического вида квадратичной формы уже имеется — как правило, он задается формулой Якоби. Индексы инерции вычисляются через знаки главных миноров матрицы квадратичной формы.

Теорема [Сильвестр]. Квадратичная форма

$$ f(X)=X^<\top><\mathbf A>X $$ будет положительно определенной тогда и только тогда, когда все главные миноры ее матрицы положительны: $$ a_<11>>0, \ \left| \begin a_ <11>& a_ <12>\\ a_ <12>& a_ <22>\end \right| >0, \ \left| \begin a_ <11>& a_ <12>& a_ <13>\\ a_ <12>& a_ <22>& a_ <23>\\ a_ <13>& a_ <23>& a_ <33>\end \right| >0, \dots, \det <\mathbf A>>0 \ . $$

Доказательство ☞ ЗДЕСЬ.

Квадратичная форма будет отрицательно определенной тогда и только тогда, когда знаки главных миноров ее матрицы будут чередоваться следующим образом:

Пример. Найти все значения параметра $ <\color\alpha > $, при которых квадратичная форма

$$2\, x_1^2+2\, x_2^2+x_3^2+ 2\, <\color < \alpha>> \, x_1x_2+6\, x_1x_3 +2\,x_2x_3 $$ будет положительно определенной.

Решение. Значения главных миноров: $$\det <\mathbf A>_1=2,\ \det <\mathbf A>_2=4- <\color\alpha >^2,\ \det <\mathbf A>_3=- <\color\alpha >^2+ 6\, <\color\alpha > -16 \ . $$ Последнее выражение будет отрицательно при любых $ <\color\alpha > \in \mathbb R $.

Ответ. Таких значений нет: $ <\color\alpha > \in \varnothing $.

Можно ли получить условия неотрицательности квадратичной формы: $$ f(X) \ge 0 \ npu \ \forall X \in <\mathbb R>^n $$ превращением всех неравенств из критерия Сильвестра в нестрогие: $ > \ \to <\color < \to>> \ \ge $ ? — Вообще говоря, нет.

Пример. Квадратичная форма

$$f(x_1,x_2,x_3,x_4)=x_1^2+2x_1x_3+2x_2x_4+x_4^2= X^ <\top>\left( \begin 1&0&1 &0 \\ 0&0&0&1 \\ 1&0&0&0 \\ 0&1&0&1 \end \right)X $$ — неопределенная, т.к. $ f(1,0,-1,0)=-1_<> 0 $. Тем не менее, все главные миноры ее матрицы неотрицательны. ♦

Имеются ли конструктивные необходимые и достаточные условия неотрицательности квадратичной формы?

Теорема. Для неотрицательности квадратичной формы $ X^ <\top>\mathbf A X $ необходимо и достаточно, чтобы все ведущие миноры матрицы $ \mathbf A $, т.е. миноры, стоящие на пересечении строк и столбцов матрицы с одинаковыми номерами

$$ A\left( \begin j_1 & \dots & j_k \\ j_1 & \dots & j_k \end \right) \ , j_1 0 $ при всех $ X\in \mathbb V_1, X \ne \mathbb O $.

Теорема. Пусть линейное подпространство задано системой линейных однородных уравнений

$$ \left\< \begin h_<11>x_1 & + \dots & + h_<1n>x_n&=0, \\ \dots & & & \dots \\ h_x_1 & + \dots & + h_x_n&=0, \\ \end \right. \qquad \iff \qquad \underbrace<\left( \begin h_ <11>& \dots & h_ <1n>\\ \dots & & \dots \\ h_ & \dots & h_ \end \right)>_<=H>X=\mathbb O $$ Здесь $ k ☞ ЗДЕСЬ.

Пример. Найти ортогональную замену переменных, приводящую квадратичную форму

$$ X^ <\top>\mathbf A X \quad npu \quad <\mathbf A>=\left(\begin 2 & 2 & -1 \\ 2 & -1 & 2 \\ -1& 2 & 2 \end \right) $$ к каноническому виду.

Решение. Характеристический полином $ \det (\mathbf A- \lambda E)=-(\lambda-3)^2(\lambda+3) $. Простому собственному числу $ \lambda=-3 $ соответствует собственный вектор $ <\mathfrak X>_1=[1,-2,1]^<^<\top>> $, а собственному числу $ \lambda=3 $ второй кратности соответствуют два линейно-независимых собственных вектора $ <\mathfrak X>_2=[2,1,0]^<^<\top>> $ и $ <\mathfrak X>_3=[-1,0,1]^<^<\top>> $. Очевидно, что $ \langle <\mathfrak X>_1, <\mathfrak X>_2\rangle=0 , \langle <\mathfrak X>_1, <\mathfrak X>_3 \rangle =0 $, но $ \langle <\mathfrak X>_2, <\mathfrak X>_3 \rangle \ne 0 $. Ортогонализуем систему векторов $ \left\<<\mathfrak X>_2,<\mathfrak X>_3\right\> $: $$<\mathfrak Y>_2=<\mathfrak X>_2, <\mathfrak Y>_3=<\mathfrak X>_3+ <\color\alpha > <\mathfrak Y>_2 \quad \mbox < и >\ \langle <\mathfrak Y>_2,<\mathfrak Y>_3\rangle =0 \ \Longrightarrow <\color\alpha >=-\frac<\langle <\mathfrak X>_2,<\mathfrak X>_3\rangle> <\langle <\mathfrak X>_2,<\mathfrak X>_2\rangle>=\frac<2> <5>$$ и $ <\mathfrak Y>_3=\left[-1/5, 2/5, 1 \right]^<^<\top>> $. После нормирования, получаем ортогональную матрицу $$ P=\left(\begin 1/\sqrt <6>& 2/\sqrt <5>& -1/\sqrt <30>\\ -2/\sqrt <6>& 1/\sqrt <5>& 2/\sqrt <30>\\ 1/\sqrt <6>& 0 & 5/\sqrt <30>\end \right) \ . $$ Замена переменных $ X=PY $ приводит квадратичную форму $ X^ <\top>\mathbf A X $ к каноническому виду $$ (y_1,y_2,y_3) \left(\begin -3 & 0 & 0 \\ 0 & 3 & 0 \\ 0& 0 & 3 \end \right) \left( \begin y_1 \\ y_2 \\ y_3 \end \right)=-3\,y_1^2+3\,y_2^2+3\,y_3^2 \ . $$

Теорема. Если известны коэффициенты характеристического полинома матрицы квадратичной формы $ f(X)=X^<\top>\mathbf A X $:

$$ \det (\mathbf A- \lambda E) \equiv (-1)^n \left(\lambda^n+a_<1>\lambda^+ \dots + a_n \right) \, ,$$ то $$ \operatorname (f(X))= <\mathfrak r>\iff a_=a_=\dots=a_<<\mathfrak r>+1>=0,a_<<\mathfrak r>>\ne 0 \, . $$ В этом случае будет также выполнено $$ n_ <+>(f(X))=<\mathcal V>(1,a_1,\dots,a_<<\mathfrak r>>),\quad n_ <->(f(X))=<\mathcal P>(1,a_1,\dots,a_<\mathfrak r>) \, , $$ $$ \sigma(f(X))=\sum_^ <\mathfrak r>\operatorname (a_a_j) \quad npu \quad a_0=1 \, . $$

Доказательство основано на правиле знаков Декарта.

Геометрия замен переменных

В предыдущих пунктах мы рассмотрели два подхода к построению канонического вида квадратичной формы. Очевидно, что подход, основанный на ортогональной замене переменных более дорогостоящий в построении по сравнению с методом Лагранжа. В самом деле, он требует нахождения собственных чисел симметричной матрицы, т.е. решения алгебраического уравнения $ \det (\mathbf A — \lambda E)=0 $. В случае матриц порядка $ n> 4 $ корни этого уравнения, как правило, на находятся в виде «хорошей» комбинации коэффициентов, и могут быть определены разве лишь приближенно. Метод же Лагранжа принципиально безошибочен: коэффициенты канонического вида определяются в виде рациональных функций от коэффициентов квадратичной формы.

Пример. Уравнение $ 1/3x_1^2-x_1x_2+x_2^2=1 $ задает на плоскости эллипс:

Преобразование $$ y_1=x_1-3/2x_2, y_2=x_2 $$ приводит уравнение к виду $$ 1/3 y_1^2+1/4 y_2^2=1 ; $$ в новых координатах кривая имеет вид на рисунке слева. С другой стороны, преобразование $$ \begin z_1&= \sqrt<1/2+1/\sqrt<13>>\,x_1+\sqrt<1/2-1/\sqrt<13>>\,x_2,\\ z_2&= \sqrt<-1/2-1/\sqrt<13>>\,x_1+\sqrt<1/2+1/\sqrt<13>>x_2 \end $$ приводит уравнение к виду $$\frac<4-\sqrt<13>><6>z_1^2+\frac<4+\sqrt<13>><6>z_2^2=1 \ . $$ В этих координатах кривая имеет вид на рисунке справа.

Оба преобразования координат не изменяют типа кривой: эллипс остается эллипсом. Но второе преобразование дает нечто большее: оно сохраняет размеры. Фактически, оно сводится к повороту исходного эллипса.

Вывод. Метод Лагранжа «дешевле» метода ортогональных преобразований при решении задачи классификации алгебраических многообразий, заданных уравнением вида $ X^ <\top>\mathbf A X=1 $. Иными словами, он позволяет «дешевле» определить тип поверхности с точностью до ее формы: например, в $ \mathbb R^3 $ является ли эта поверхность эллипсоидом или гиперболоидом (и каким именно — однополостным или двуполостным)? Но если нас интересуют истинные размеры этой поверхности: например, размеры посылочного ящика, в который эллипсоид, заданный уравнением $ X^ <\top>\mathbf A X=1 $, можно было бы поместить — то здесь без собственных векторов и чисел матрицы $ \mathbf A $ не обойтись!

Квадратичные формы — определение и понятие с примерами решения

Содержание:

Первоначально теория квадратичных форм использовалась для исследования кривых и поверхностей, задаваемых уравнением второго порядка, содержащими две или три переменные, Позднее эта теория нашла и другие приложения. В частности, при математическом моделировании экономических процессов целевые функции могут содержать квадратичные слагаемые. Многочисленные приложения квадратичных форм потребовали построения общей теории, когда число переменных равно любому п, а коэффициенты квадратичной формы не всегда являются вещественными числами.

Понятие квадратичной формы

Квадратичной формой

Пример:

Сумма является квадратичной формой от трех неизвестных .

Каждую квадратичную форму можно записать в стандартном виде. Для этого сначала приводятся подобные в квадратичной форме, затем коэффициенты при обозначаются через а коэффициенты при через причем „ Член записывается в виде После этих преобразований квадратичную форму можно записать в виде:

Матрица: называется матрицей квадратичной формы F. Так как то А — симметричная матрица.

С учетом правила умножения матриц можно вывести матричную форму записи квадратичной формы.

где А — матрица квадратичной формы, X — матрица-столбец неизвестных:

Приведенные выкладки показывают, в частности, что если А -симметрическая матрица, то выражение является квадратичной формой от неизвестных ,т.е. квадратичная форма является

результатом скалярного произведения матриц X и АХ. Матричная форма записи квадратичной формы имеет вид . Если — произвольный n— мерный вектор, то после подстановки в квадратичную форму вместо X получится число , которое называется значением квадратичной формы F(X) на векторе .

Канонический базис квадратичной формы

Принято считать, что квадратичная форма F(X) имеет канонический вид, если все коэффициенты при произведениях различных переменных равны нулю, т.е. при . При этом квадратичная форма представляет собой сумму квадратов переменных с соответствующими коэффициентами ,т.е.:

В этом случае матрица квадратичной формы имеет диагональный вид:

Очевидно, что изучение свойств квадратичной формы, записанной в каноническом виде, значительно упрощается. В связи с этим возникает задача приведения произвольной квадратичной формы к каноническому виду. В основе многих известных методов приведения квадратичной формы к каноническому виду лежит следующая теорема.

Теорема. Всякая квадратичная форма с помощью невырожденного линейного преобразования может быть приведена к каноническому виду.

Метод ортогональной матрицы использует особенности собственных значений и собственных векторов симметрической матрицы.

Пусть дана квадратичная форма , Поскольку А -симметрическая матрица, для нее существует диагонализирующая ортогональная матрица S, такая что:

где -собственные значения матрицы А.

Применим к квадратичной форме линейное преобразование — матрица-столбец новых переменных — матрица, обратная к S.

Таким образом, квадратичную форму всегда можно представить в каноническом виде с коэффициентами, равными собственным значениям матрицы квадратичной формы.

Канонический вид квадратичной формы определяется неоднозначно. В то же время можно доказать, что все канонические формы, к которым приводится данная квадратичная форма, содержат одинаковое число отрицательных, положительных и нулевых коэффициентов при квадратах новых переменных.

Наиболее удобным для исследования является канонический вид, в котором коэффициенты при новых переменных равны +1 или -1, т.е. квадратичная форма имеет вид:

Такую запись называют нормальным видом квадратичной формы. В нем общее число квадратов равно рангу r квадратичной формы.

Квадратичная форма может быть приведена к нормальному виду многими различными преобразованиями. При этом справедлива следующая теорема.

Теорема, Число положительных и число отрицательных квадратов в нормальном виде, к которому приводится данная вещественная квадратичная форма вещественным невырожденным линейным преобразованием, не зависит от выбора этого преобразования.

Эту теорему называют законом инерции квадратичных форм.

Базис пространства R» называется каноническим базисом квадратичной формы , если в этом базисе квадратичная форма имеет канонический вид, т.е. при

Если канонический базис F(X), то выражение: называется каноническим видом F(X) в базисе где — новый набор неизвестных.

Теорема. Если — разложение вектора а по каноническому базису квадратичной формы то значение F(X) на векторе а вычисляется по формуле

Доказательство:

Эта теорема утверждает, что если известны канонический базис квадратичной формы F(X) и ее канонический вид в этом базисе, то для вычисления значения F(a) квадратичной формы F(X) на векторе а достаточно:

  1. разложить вектор а по каноническому базису :
  2. коэффициенты разложения подставить вместо неизвестных в канонический вид квадратичной формы:

Квадратичная форма имеет много разных канонических базисов. Процесс построения канонического базиса называется приведением квадратичной формы к сумме квадратов.

Наиболее часто используются: канонический базис из собственных векторов матрицы А и канонический базис Якоби.

Канонический базис из собственных векторов матрицы квадратичной формы

Теорема. Ортонормированный базис пространства Rсостоящий из собственных векторов симметрической матрицы , является каноническим базисом квадратичной формы , а выражение — ее каноническим видом в базисе ,

Доказательство:

  • , если так как -ортогональная система векторов =>,- канонический базис квадратичной формы F(X).
  • = так как векторы системы нормированы, то .

Канонический базис Якоби квадратичной формы . Будем говорить, что матрица удовлетворяет условию Якоби, если определители:

называемые угловыми минорами матрицы А, не равны нулю. Очевидно, что

Обозначим через матрицу:

Вычислим определитель этой матрицы, разлагая ее по последнему столбцу, затем также по последнему столбцу разложим полученный определитель и т.д. Из условия следует, что и, значит, каждая система уравнений , где вектор диагональной системы, имеет единственное решение . Система векторов называется системой векторов Якоби матрицы А, которая удовлетворяет условию Якоби.

Теорема. матрица А квадратичной формы удовлетворяет условию Якоби, система векторов Якоби матрицы А является каноническим базисом квадратичной формы , а выражение:

ее каноническим видом в базисе .

Положительно и отрицательно определенные квадратичные формы

При копировании любых материалов с сайта evkova.org обязательна активная ссылка на сайт www.evkova.org

Сайт создан коллективом преподавателей на некоммерческой основе для дополнительного образования молодежи

Сайт пишется, поддерживается и управляется коллективом преподавателей

Whatsapp и логотип whatsapp являются товарными знаками корпорации WhatsApp LLC.

Cайт носит информационный характер и ни при каких условиях не является публичной офертой, которая определяется положениями статьи 437 Гражданского кодекса РФ. Анна Евкова не оказывает никаких услуг.


источники:

http://vmath.ru/vf5/2form

http://www.evkova.org/kvadratichnyie-formyi