Матрица якоби в дифференциальном уравнении

VMath

Инструменты сайта

Основное

Информация

Действия

Содержание

Вспомогательная страница к разделам ОПРЕДЕЛИТЕЛЬ и ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ

Матрица Якоби и якобиан

Определение и основные свойства

Матрицей Якоби системы из $ m_<> $ функций $ \,\dots,x_n)\> $ по переменным $ x_<1>,\dots,x_n $ называется матрица, составленная из всевозможных частных производных: $$ \mathbf J = \left[ \frac<\partial f_j> <\partial x_k>\right]_ = \left( \begin <\partial f_1>/ <\partial x_1>& <\partial f_1>/ <\partial x_2>& \dots & <\partial f_1>/ <\partial x_n>\\ <\partial f_2>/ <\partial x_1>& <\partial f_2>/ <\partial x_2>& \dots & <\partial f_2>/ <\partial x_n>\\ \dots & && \dots \\ <\partial f_m>/ <\partial x_1>& <\partial f_m>/ <\partial x_2>& \dots & <\partial f_m>/ <\partial x_n>\end \right) \, . $$ В частном случае $ m_<>=1 $ матрица Якоби состоит из одной строки: этот вектор в $ \mathbb R_<>^ $ или $ \mathbb C^ $ называется градиентом функции $ f_<> $ (в точке $ (x_1,\dots,x_) $): $$ \operatorname (f) = \left( \frac<\partial f><\partial x_1>,\dots, \frac<\partial f> <\partial x_n>\right) \ . $$

Можно сказать, что в общем случае системы функций их матрица Якоби состоит из строк, являющихся градиентами этих функций.

Пример. Для системы линейных функций

$$f_1=a_<11>x_1+\dots+a_<1n>x_n — b_1,\dots, f_m=a_x_1+\dots+a_x_n — b_m $$ матрица Якоби будет матрицей коэффициентов при переменных: $$ \mathbf J = \left(\begin a_ <11>& a_ <12>& \dots & a_ <1n>\\ \dots & && \dots \\ a_ & a_ & \dots & a_ \end \right) . $$

В частном случае $ m=n_<> $ матрица Якоби становится квадратной и тогда ее определитель называется якобианом или определителем Якоби или функциональным определителем системы из $ n_<> $ функций $ \(x_1,\dots,x_n)\> $ по переменным $ x_<1>,\dots,x_n $: $$ <\mathfrak J>(x_1,\dots,x_n)=\frac= $$ $$ =\left| \begin <\partial f_1>/ <\partial x_1>& <\partial f_1>/ <\partial x_2>& \dots & <\partial f_1>/ <\partial x_n>\\ <\partial f_2>/ <\partial x_1>& <\partial f_2>/ <\partial x_2>& \dots & <\partial f_2>/ <\partial x_n>\\ \dots & && \dots \\ <\partial f_n>/ <\partial x_1>& <\partial f_n>/ <\partial x_2>& \dots & <\partial f_n>/ <\partial x_n>\end \right|= \det \left[ \frac<\partial f_j> <\partial x_k>\right]_^n \ . $$ В этом же случае след матрицы Якоби называется дивергенцией вектора $ (f_1,f_2,\dots,f_n) $: $$ \operatorname

(f_1,f_2,\dots,f_n)= <\partial f_1>/<\partial x_1>+ <\partial f_2>/<\partial x_2>+\dots+ <\partial f_n>/ <\partial x_n>\ . $$

Пример. Якобиан системы двух функций $ \ $ равен

Теорема [Якоби]. Если $ A_,\dots,A_ $ — алгебраические дополнения элементов $ j_<> $-й строки якобиана, то

Функциональная зависимость

Следующая теорема и ее следствия являются прямыми обобщениями соответствующих результатов из линейной алгебры.

Теорема. Якобиан системы функций $ \< f_<1>,f_2,\dots,f_n \> $ тождественно равен нулю в некоторой области $ \mathbb~~_<> $:~~

$$ \frac \equiv 0 \mbox < >\ \mbox <при>\mbox < >X \in \mathbb $$ тогда и только тогда, когда между этими функциями имеется функциональная зависимость в $ \mathbb $, т.е. существует функция $ G(y_1,y_2,\dots,y_n) \not\equiv 0 $ такая, что $$ G(f_1(X),f_2(X),\dots,f_n(X))\equiv 0 \mbox < >\mbox <при>\mbox < >X \in \mathbb ~~\ . $$~~

Приведем соображения, показывающие необходимость обращения якобиана в нуль для существования функциональной зависимости в системе функций $ \ < f_j \>$. Дополнительно предположим, что у функции $ G $ существуют частные производные по ее аргументам. Продифференцируем тождество $ G(f_1(X),f_2(X),\dots,f_n(X))\equiv 0 $ по $ x_1,\dots,x_n $. Получим систему тождеств $$ \left\<\begin \frac<\partial G> <\partial y_1>\frac<\partial f_1><\partial x_1>+ & \frac<\partial G> <\partial y_2>\frac<\partial f_2><\partial x_1>+ &\dots + \frac<\partial G> <\partial y_n>\frac<\partial f_n> <\partial x_1>& \equiv 0, \\ \dots & & & \dots \\ \frac<\partial G> <\partial y_1>\frac<\partial f_1><\partial x_n>+ & \frac<\partial G> <\partial y_2>\frac<\partial f_2><\partial x_n>+ &\dots + \frac<\partial G> <\partial y_n>\frac<\partial f_n> <\partial x_n>& \equiv 0; \end \right. $$ здесь после вычисления производных $ \ <\partial G / \partial y_j \>$ следует произвести подстановку $ y_1=f_1(X),\dots,y_n=f_n(X) $. Получившуюся систему можно рассматривать как линейную однородную относительно этих последних выражений. Хотя бы одна из них не должна быть тождественно нулевой (в противном случае функция $ G $ не содержала бы ни одной функции $ f_j $). Но тогда для совместности системы необходимо, чтобы ее определитель был равен нулю. Этот определитель, с точностью до транспонирования, совпадает с якобианом.

Пример. Являются ли полиномы

~~$$ f_1=x_1+x_2+x_3-1,\quad f_2=x_1x_2+x_1x_3+x_2x_3-2,\quad f_3=x_1^2+x_2^2+x_3^2+3 $$ функционально зависимыми?~~

Решение. $$ \frac= $$ $$ = \left| \begin 1 & 1 & 1 \\ x_2+x_3 & x_1+x_3 & x_1+x_2 \\ 2x_1 & 2x_2 & 2x_3 \end \right| = 2 \left| \begin 1 & 1 & 1 \\ x_2+x_3 & x_1+x_3 & x_1+x_2 \\ x_1 & x_2 & x_3 \end \right|= $$ $$ = \left| \begin 1 & 1 & 1 \\ x_1+x_2+x_3 & x_1+x_2+x_3 & x_1+x_2+x_3 \\ x_1 & x_2 & x_3 \end \right|\equiv 0 $$ (мы воспользовались здесь свойствами 4 и 5 определителя, выписанными ☞ ЗДЕСЬ ). Ответ оказывается положительным: рассматриваемые полиномы являются функционально зависимыми. В данном примере эта зависимость сравнительно просто «отлавливается» наметанным взглядом: $$(f_1+1)^2-2(f_2+2)-(f_3-3) \equiv 0 \ . $$ ♦

~~Если какие-то $ \mathfrak r $ функций системы $ \< f_<1>, \dots, f_n \> $ связаны в $ \mathbb ~~$ функциональным соотношением~~~~

$$ H(f_, \dots, f_>) \equiv 0 \ , $$ то любой минор порядка $ \mathfrak r $ якобиана, выбранный из соответствующих строк, будет тождественно равен нулю в $ \mathbb~~_<> $.~~

Пусть $ \mathfrak r_<> $ обозначает ранг матрицы Якоби системы функций $ \ \> $ по переменным $ x_<1>,\dots,x_n $. Если минор этой матрицы

$$ \frac)> $$ отличен от нуля в $ \mathbb_<> $, то функции $ f_1,\dots,f_ <\mathfrak r>$ функционально независимы в $ \mathbb $, а все оставшиеся функции системы (при условии $ \mathfrak r непрерывная функция $ \varphi (y) $ такая, что $$ f(\varphi(y)) \equiv y,\ \varphi(y_0)=x_0 \, . $$ В этой окрестности функция $ \varphi $ является непрерывно дифференцируемой и выполняется равенство $$ \varphi^ <\prime>(y) = \frac<1> (x)> $$ для значений $ x $ и $ y $, связанных равенством $ y=f(x) $.

Конструктивных аналитических способов нахождения функции, обратной к заданной $ y=f(x) $ можно сказать, что и нет. Задача сводится к разрешению этого уравнения относительно $ x $. Однако уже для полиномиальных $ f(x) $ решение такого уравнения в «хороших» функциях, т.е. в радикалах, возможно, в общем случае, только для $ \deg f ♦

В альтернативу интерполяции, можно поставить задачу об аппроксимации обратной функции с помощью степенных рядов. Составим формальный ряд $$ \varphi(y)=B_0+B_1(y-y_0) + B_2(y-y_0)^2+ \dots + B_k(y-y_0)^k+ \dots $$ Для значения $ y_0 $ из теоремы получаем два коэффициента этого ряда $$ B_0=x_0, B_1= 1/f^ <\prime>(x_0) \, . $$ Как получить следующий коэффициент $ B_2 $? Заметим, что если бы у обратной функции существовала бы вторая производная, то $ B_2 $ был бы следующим коэффициентом ряда Тейлора: $$ B_2 = \varphi^<\prime \prime>(y_0)/2 \, . $$ Для получения выражения $ \varphi^<\prime \prime>(y_0) $ продифференцируем по $ y $ тождество $ f(\varphi(y)) \equiv y $. Тождество останется справедливым $$ f^<\prime>_x(\varphi(y)) \varphi^<\prime>_y(y)\equiv 1 \, . $$ При подстановке сюда $ y=y_0 $ получаем уже известное нам равенство $ f^<\prime>_x(x_0)\varphi^<\prime>_y(y_0)=1 $. Но если продифференцировать еще раз, то получим $$ f^<\prime \prime>_(\varphi(y)) \left(\varphi^<\prime>_y(y)\right)^2+f^<\prime>_x(\varphi(y)) \varphi^<\prime \prime>_(y)\equiv 0 \, . $$ При подстановке сюда $ y=y_0 $ получаем $$ \varphi^<\prime \prime>_(y_0)=- \frac_(x_0)><[f^<\prime>_x(x_0)]^3> $$ в дополнительном предположении, что вторая производная от $ f(x) $ существует. Вычисление остальных старших производных $ \varphi(y) $ в точке $ y_0 $ производится аналогичным приемом — лишь бы только существовали эти производные для функции $ f(x) $. $$ \varphi^<\prime \prime \prime>_(y_0)= \frac<3\,[f^<\prime \prime>_(x_0)]^2- f^<\prime>_x(x_0)f^<\prime \prime \prime>_(x_0) ><[f^<\prime>_x(x_0)]^5> \ , $$ $$ \varphi^<[4]>_(y_0)= $$ А для выведения общей формулы $ \varphi^<[k]>_(y_0) $ используется формула Фаа-ди-Бруно. При полиномиальной $ f(x) $ ряд Тейлора для обратной функции всегда может быть построен.

Пример. Для функции $ y=-x^3+3\,x-1 $ приведенного выше примера первые $ 8 $ членов разложение обратной функции в ряд Тейлора в точке $ y_0=-1 $ имеют вид

$$ \widehat<\varphi>(y)= \frac<1><3>(y+1)+\frac<1><81>(y+1)^3+\frac<1><729>(y+1)^5 +\frac<4><19683>(y+1)^7 \, . $$ На графике внизу кривая $ y = \widehat<\varphi>(x)$ изображена цветом охры.

~~И только близко к точке $ x=1 $ заметно расхождение с $ y= \varphi(x) $. ♦~~

Теорема утверждает, что обратная функция будет определена в окрестности точки $ y_0 $, удовлетворяющей условию. Насколько большой можно сделать эту окрестность? Ограничимся случаем полиномиальных $ f(x) $. При движении от точки $ y_0 $ вправо или влево по числовой оси значения $ \varphi^<\prime>(y) $ меняются непрерывным образом и стремятся к бесконечности только когда соответствующие значения $ x $ стремятся к корням полинома $ f^<\prime>(x) $. Если этот полином имеет вещественные корни, и $ \mu_1 непрерывные функции $ \varphi(u,v) $ и $ \psi(u,v) $ такие, что $$ f(\varphi(u,v),\psi(u,v)) \equiv u, \ g(\varphi(u,v),\psi(u,v)) \equiv v, \ \varphi(u_0,v_0)=x_0, \psi(u_0,v_0)=x_0 \, . $$ Функции $ \varphi $ и $ \psi $ непрерывно дифференцируемы в этой окрестности, и для их матрицы Якоби выполняется равенство $$ \left(\begin \partial \varphi/ \partial u & \partial \varphi/ \partial v \\ \partial \psi/ \partial u & \partial \psi/ \partial v \end \right)= \left(\begin \partial f/ \partial x & \partial f/ \partial y \\ \partial g/ \partial x & \partial g/ \partial y \end \right)^ <-1>\, . $$ Левая часть этого матричного равенства вычисляется в точках $ (u,v) $, соответствующих точкам $(x,y) $, в которых вычисляется правая часть (т.е. эти пары подчиняются равенствам $ u=f(x,y),v=g(x,y) $).

Отображение окрестности точки $ (u_0,v_0) $ в окрестность точки $ (x_0,y_0) $, заданное векторной функцией $ (\varphi(u,v), \psi(u,v)) $ из теоремы, называется обратным отображением к отображению $ (f(x,y),g(x,y)) $.

~~При выполнении условий теоремы, в соответствующих друг другу точках $ (u,v) $ и $ (x,y) $ выполняется равенство~~

Пример. Отображение

$$ (e^x \cos y, e^x \sin y \> $$ отображает $ (x,y) $-плоскость $ \mathbb R^2 $ во множество $ \mathbb R^2 \setminus (0,0) $ на плоскости $ (u,v) $. Якобиан $$ \frac \equiv e^ <2x>$$ отличен от нуля во всей плоскости $ (x,y) $. Можно было бы ожидать, что обратное отображение однозначно определено во всей области $ \mathbb R^2 \setminus (0,0) $. Но очевидно, что это не так: бесконечное множество $$ \ <(x,y)=(0,2\pi k ) \mid k \in \mathbb Z \>$$ отображается в точку $ (u,v)=(1,0) $. Обратное отображение бесконечнозначно. Результат теоремы справедлив если мы рассмотрим отображение любой полосы шириной $ 2 \pi $ плоскости $(x,y) $, параллельной оси $ O x $. Например, полосы $ 0\le y ♦

Мы в дальнейшем ограничимся случаем полиномиальных функций. Для этого случая хотя бы можно ожидать, что якобиан будет из того же класса, что и сами функции, т.е. полиномом. Ну и можно что-то конструктивное сказать о представлении обратных отображений — хотя они уже, как правило, не будут полиномиальными, но задачу их представления можно свести к одномерному случаю.

Пример. Найти обратное отображение к отображению

Решение. Якобиан $$ \frac=\left| \begin -4\,x+5\,y-2 & 5\,x-6\,y+1 \\ 2\,x-2\,y-1 & -2\,x+2\,y+1 \end \right|=-2\,x^2+4\,xy-2\,y^2+3\,x -3\,y-1\equiv $$ $$ \equiv (-2x+2y+1)(x-y-1) \, . $$ отличен от нуля во всех точках плоскости, за исключением лежащих на прямых $ y=x-1 $ и $ y=x-1/2 $. Согласно теореме, обратное отображение должно существовать, например, в окрестности точки $ (u,v)=(-5,7)=(f(-1,1),g(-1,1)) $.

Для разрешения системы алгебраических уравнений $ u=f(x,y), v=g(x,y) $ относительно $ x $ и $ y $ применим теорию исключения. Результант системы по переменной $ y $ $$ \mathcal X(x)=(1-v)x^2+(u+11\,v-9)x+u^2-6\,u-34\,v+9\,v^2+6\,uv+21 $$ оказывается квадратным полиномом 1) по $ x $. Корни уравнения $ \mathcal X(x) =0$ следующие: $$ \frac> <2(v-1)>\, . $$ Из них только соответствующий знаку минус в числителе, т.е. $$ \varphi(u,v):=\frac> <2(v-1)>$$ удовлетворяет условию $ \varphi(-5,7)=-1 $. Аналогично находим выражение для $ y $: $$ \psi(u,v):=\frac> <2(v-1)>\, . $$ Области определения обеих функций одинаковы: $$ \ <(u,v) \in \mathbb R^2 \mid v\ge 3/4, v\ne 1 \>\, . $$ Теперь проверим справедливость формулы, связывающей якобианы. Имеем (в окрестности точки $ (-5,7) $) $$ \frac= \frac<1><2(1-v)\sqrt<4v-3>>\left[\sqrt<4v-3>-1 \right] \, . $$ Подстановка сюда $ u=f(x,y), v= g(x,y) $ дает (в окрестности точки $ (1,-1) $) $$ \frac<2(y-x)> <2(2y-2x+1)(y-x)(x-y-1)>\equiv \left( \frac \right)^ <-1>\, . $$ ♦

~~Сформулируем обобщение предыдущего результата в $ \mathbb R^n $.~~

~~Теорема. Если якобиан системы полиномов~~

$$ \ < f_1(X), \dots , f_n(X) \>\subset \mathbb R[X] $$ отличен от нуля в некоторой точке $ X_0 \in \mathbb R^n $, то существует окрестность этой точки, в которой система уравнений $$ y_1=f_1(x_1,\dots,x_n),\dots,y_n=f_n(x_1,\dots,x_n) \ , $$ рассматриваемая относительно переменных $ x_<1>,\dots,x_n $, имеет единственное решение, лежащее в окрестности точки $$ Y_0=(f_1(X_0), \dots , f_n(X_0)) \, . $$ Иными словами: существует и однохначно определяется система непрерывных в окрестности точки $ Y_0 $ функций $$ \ < \varphi_1(Y),\dots, \varphi_n(Y)\>, $$ таких, что $$ f_1(\varphi_1(Y),\dots, \varphi_n(Y))\equiv y_1,\dots, f_n(\varphi_1(Y),\dots, \varphi_n(Y))\equiv y_n $$ и $$ (\varphi_1(Y_0),\dots, \varphi_n(Y_0))=X_0 \, .$$ Функции $ \<\varphi_j(Y) \>_^n $ непрерывно дифференцируемы в указанной окрестности. Матрицы Якоби систем функций $ \< f_j(X) \>_^n$ и $ \< \varphi_j (Y)\>_^n$ связаны равенством: $$ \left( \begin <\partial \varphi_1>/ <\partial y_1>& <\partial \varphi_1>/ <\partial y_2>& \dots & <\partial \varphi_1>/ <\partial y_n>\\ \dots & && \dots \\ <\partial \varphi_n>/ <\partial y_1>& <\partial \varphi_n>/ <\partial y_2>& \dots & <\partial \varphi_n>/ <\partial y_n>\end \right)= \left( \begin <\partial f_1>/ <\partial x_1>& <\partial f_1>/ <\partial x_2>& \dots & <\partial f_1>/ <\partial x_n>\\ \dots & && \dots \\ <\partial f_n>/ <\partial x_1>& <\partial f_n>/ <\partial x_2>& \dots & <\partial f_n>/ <\partial x_n>\end \right)^ <-1>\, . $$ Здесь производные в левых и правых частях равенства вычислены в соответствующих точках.

~~При выполнении условий теоремы, в соответствующих друг другу точках $ Y $ и $ X $ выполняется равенство~~

Якобиан как коэффициент растяжения

~~Еще одну важную сущность якобиана сформулируем в решении следующего примера.~~

Пример. Отображение

$$ \left\< \begin u=f(x,y):=&-1/2\,x^2-3/4\,xy-y^2-x-1/2\,y+2,\\ v=g(x,y):=& 1/4\,x^2-1/2\,xy-1/2\,y^2-x+1/2\,y+1 \end \right. $$ отображает окрестность точки $ (x_0,y_0)=(0,1) $ в окрестность точки $ (u_0,v_0)=(1/2,1) $. Квадрат $ 0 \le x \le 1, 0 \le y \le 1$ отображается в область плоскости $ (u,v) $, органиченную параметрически заданными кривыми $$ \, \ , $$ $$ \, \ . $$ Как соотносятся между собой площади двух областей: исходного квадрата и его образа?

Решение. Для ответа на вопрос надо обладать возможностью вычислить точную площадь области, закрашенной оранжевым на рисунке. Я не уверен, что это можно сделать сведением к случаю «табличных» интегралов, но, по крайней мере, численными методами можно найти приближение этой площади. Попробуем получить такое приближение, заменив границу области — криволинейную — на параллелограмм. С этой целью проведем в точке $ (u_0,v_0) $ касательные к ограничивающую область кривым: $$ \< (u,v)= (u_0+ f^<\prime>_x(x_0,y_0) t, v_0+ g^<\prime>_x(x_0,y_0) t) \mid t \in \mathbb R \> \ \mbox < и >\ \< (u,v)=(u_0+ f^<\prime>_y(x_0,y_0) \tau, v_0+ g^<\prime>_y(x_0,y_0) \tau )\mid \tau \in \mathbb R \> \, . $$ и возьмем на них, помимо $ (u_0,v_0) $, точки, соответствующие значениям параметров $ t=1, \tau=1 $.

Эта аппроксимация, в нашем конкретном случае, очевидно неудачная. Как следствие, площадь получишегося параллелограмма визуально отличается от искомой площади. Однако если уменьшить размеры отображаемого квадрата на плоскости $ (x,y) $ до $ 0 \le x \le 1/2, 1/2\le y \le 1 $, то его образ становится более похожим на параллелограмм построенный по приведенному выше образцу. В общем случае отображения квадрата размера $ \delta \times \delta $ получаем приближение его образа в виде параллелограмма с вершинами $$ (u_0,v_0),\ (u_0+f^<\prime>_x \delta,v_0 +g^<\prime>_x \delta),\ (u_0+f^<\prime>_y \delta,v_0 +g^<\prime>_y \delta) \, , $$ $$ (u_0+f^<\prime>_x \delta++f^<\prime>_y \delta,v_0 +g^<\prime>_x \delta+g^<\prime>_y \delta) \, . $$ Здесь все производные вычислены в точке $ (x_0,y_0) $. Воспользовавшись формулой вычисления площади параллелограмма, получаем выражение в виде абсолютной величины (модуля) выражения $$ \left|\begin f^<\prime>_x & g^<\prime>_x \\ f^<\prime>_y & g^<\prime>_y \end \right| \delta^2 \, . $$ Чем меньше $ \delta $ тем меньше отклонение этого приближения от образа квадрата при отображении. Если изображать образы точек под воздействием отображения на той же исходной плоскости, то можно сказать, что абсолютная величина якобиана представляет собой коэффициент сжатия (или растяжения) бесконечно малой области вокруг точки, в которой он вычисляется. В настоящем примере $$ \frac \Bigg|_<(0,1)>= — \frac<23> <8>\ , $$ т.е. малая окрестность точки $ (0,1) $ «резиновой» плоскости сдвинется к точке $ (1,-1) $ и растянется примерно в четыре раза. ♦

Неявная функция

Обобщением рассмотренного в предыдущем пункте случая, т.е. выражения вектора $ X=(x_1,\dots,x_n) $ через вектор $ Y=(y_1,\dots,y_n) $ при задании многомерного отображения формулами $$ Y= (f_1(X),\dots,f_n(X)) $$ является случай неявной функции.

В линейном случае, эта задача встречается при записи общего решения системы линейных уравнений. Если эта система представлена в виде $$ \left\< \begin a_<11>y_1 &+a_<12>y_2&+ \ldots&+a_<1n>y_n &+a_<1,n+1>x_<1>&+\ldots & +a_<1,n+m>x_ -b_1=0,\\ a_<21>y_1 &+a_<22>y_2&+ \ldots&+a_<2n>y_n &+a_<2,n+1>x_<1>&+\ldots & +a_<2,n+m>x_ -b_2=0,\\ \dots & & & & \dots & \dots & & \dots \\ a_y_1 &+a_y_2&+ \ldots&+a_y_n &+a_x_<1>&+\ldots & +a_x_ -b_n=0 \end \right. $$ при $ m\ge 1 $, то при условии $$ \left| \begin a_ <11>& a_ <12>& \dots & a_ <1n>\\ a_ <21>& a_ <22>& \dots & a_ <2n>\\ \dots &&& \dots \\ a_ & a_ & \dots & a_ \end \right| \ne 0 $$ ее можно разрешить относительно переменных $ y_1,\dots,y_n $ — например, по формулам Крамера или посредством обратной матрицы: $$ \left( \begin y_ <1>\\ y_ <2>\\ \vdots \\ y_ \end \right) = — \left( \begin a_ <11>& a_ <12>& \dots & a_ <1n>\\ a_ <21>& a_ <22>& \dots & a_ <2n>\\ \dots &&& \dots \\ a_ & a_ & \dots & a_ \end \right)^ <-1>\left( \begin a_ <1,n+1>& \dots & a_ <1,n+m>\\ a_ <2,n+1>& \dots & a_ <2,n+m>\\ \dots && \dots \\ a_ & \dots & a_ \end \right) \left( \begin x_ <1>\\ \\ \vdots \\ x_ \end \right)+\left( \begin a_ <11>& a_ <12>& \dots & a_ <1n>\\ a_ <21>& a_ <22>& \dots & a_ <2n>\\ \dots &&& \dots \\ a_ & a_ & \dots & a_ \end \right)^ <-1>\left( \begin b_ <1>\\ \\ \vdots \\ b_ \end \right) \, . $$

~~В случае нелинейного уравнения $$ f(x,y)=0 \, $$ критерий существования неявной функции дается следующей теоремой~~

Теорема 1 [о неявной функции]. Пусть функция $ f $ — непрерывно дифференцируема в окрестности точки $ (x_0,y_0) $ и

$$ f(x_0,y_0)=0 ,\ \partial f /\partial y \mid_<(x_0,y_0)>\ne 0 \, .$$ Тогда существует окрестность точки $ x_0 $, в которой уравнение $ f(x,y)=0 $ имеет единственное вещественное решение относительно $ y $, лежащее в окрестности $ y_0 $. Иными словами: существует вещественная непрерывная функция $ \varphi(x) $, такая, что $$ \varphi(x_0)=y_0, \ f(x,\varphi(x)) \equiv 0 $$ (последнее тождество выполняется в заявленной окрестности $ x_0 $). При этом $ \varphi(x) $ является непрерывно дифференцируемой функцией в той же окрестности и выполняется тождество $$ \varphi^<\prime>(x)\equiv-\frac<\partial f /\partial x> <\partial f /\partial y>\Bigg|_<_<(x,\varphi(x))>> \, . $$

Нахождение явного выражения для $ y=\varphi(x) $ является задачей еще более сложной, чем задача предыдущего пункта о нахождении обратной функции. Усложнение проявляется уже в проблеме поиска хотя бы одной точки $ (x_0,y_0) \in \mathbb R^2 $, удовлетворяющей уравнению $ f(x,y)=0 $. Проблема существования вещественного решения этого уравнения даже для случая полиномиальной функции $ f $ нетривиальна: см. пункт ☞ АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ. Если вещественное решение удастся обнаружить, то нахождение неявной функции можно осуществить построением ряда Тейлора (или, в общем случае, при нарушении условия теоремы, в виде ряда Пюизё), сходящегося в некоторой окрестности точки $ x_0 $.

Результат теоремы $ 1 $ очевидным образом обобщается на случай неявной функции нескольких переменных: уравнение $$ f(x_1,\dots,x_n, y) = 0 \quad \mbox < при >n \ge 2 $$ пытаются разрешить относительно $ y $.

Более общую задачу решения системы уравнений относительно нескольких переменных мы рассмотрим в частном случае уравнений алгебраических.

~~Теорема 2. Пусть имеется система полиномов~~

$$ \ < f_1(X,Y), \dots , f_m(X,Y) \>\subset \mathbb R[X,Y],\ m \ge 2 $$ от векторов переменных $ X=(x_1,\dots,x_n) $ и $ Y=(y_1,\dots,y_m) $. Пусть выполнены следующие условия:

~~$$ f_1(X_0,Y_0)=0, \dots , f_m(X_0,Y_0)=0 \, . $$~~

Рассмотрим сначала самый простой случай: $$ f(x,y,z)=0, g(x,y,z)=0 \, . $$ Будем предполагать, что каждое из уравнений задает некоторую поверхность в $ \mathbb R^3 $. Две неявно заданные алгебраические поверхности в $ \mathbb R^3 $ могут не иметь вещественных точек пересечения. Как установить существование точек пересечения, т.е. наличие вещественных решений системы уравнений? Для полиномимальных $ f $ и $ g $ этот факт можно установить алгебраическими методами, которые проиллюстрирую на примере.

Пример. Пусть заданы две квадрики

$$ f(x,y,z):=\frac9+\frac<16>-\frac<25>-1=0, $$ $$ g(x,y,z):= 111376\, x^2-14656\, xy+72128\, xz+45184\, y^2-45184\, yz+76096\, z^2+ $$ $$ +92136\, x-118608\, y+205104\, z-1913751=0 $$ Первая является однополостным гиперболоидом, а вторая — эллипсоидом. Эти поверхности пересекаются по двум замкнутым кривым $ \mathbf K_1 $ и $ \mathbf K_2 $. На одной из них выбираем произвольную точку, например $$ (x_0,y_o,z_0) \approx (1.959148, 3.864766, 3) \, . $$

Отложив на несколько последующих абзацев ответ на вопрос, как эти координаты найдены, займемся задачей нахождения касательной к кривой $ \mathbf K_1 $ в указанной точке.

Докажем, что в окрестности точки кривую $ \mathbf K_1 $ можно представить параметрически $$ x=\varphi_1 (z),\ y= \varphi_2 (z), z= z \, . $$ Действительно, матрица Якоби $$ \mathbf J=\left(\begin 2/9 x & 1/6 y \\ 222752\, x-14656\, y+72128\, z + 92136 & -14656\, x+90368\, y-45184\, z-118608 \end \right) $$ имеет ненулевой определитель в точке $ (x_0,y_o,z_0) $. В соответствии с теоремой 2, параметрическое представление кривой существует в некоторой окрестности точки $ z_0 $. Явное выражение для функций $ \varphi_1, \varphi_2 $ — отдельная нетривиальная проблема, но для поставленной конкретной задачи поиска касательной решение этой проблемы не требуется. Действительно, теорема 2 дает представление $$ (\varphi_1^<\prime>(z_0), \varphi_2^<\prime>(z_0),1) \approx (-1.052314,1.445142,1) $$ для направляющего вектора касательной в виде явного выражения через значения функций $ f $ и $ g $ (и их производных) в точке $ (x_0,y_0,z_0) $.

А теперь проверим полученный результат альтернативным алгоритмом, задействовав технологию исключения переменных (которую мы уже использовали в предыдущем ПУНКТЕ). Cоставив результант полиномов $ f $ и $ g $ по переменной $ y $, придем к уравнению $$ F(x,z)=0 $$ при $$ F(x,z):=\mathcal R_y(f,g)= $$ $$ =\frac<425850289><81>x^4+\frac<240241528><9>x^3z+\frac<4457694952><75>x^2z^2+\frac<1396604256><25>\,xz^3+\frac<23733568656><625>z^4+ $$ $$ +\frac<139478087> <3>x^3+\frac<528311126> <3>x^2 z+\frac<4561868172> <25>x z^2+\frac<3536887608> <25>z^3- $$ $$ -\frac<12342564733><72>x^2-\frac<1212320819><2>xz-\frac<9754043781><10>z^2-\frac<17191161915><16>x-\frac<20624138805><8>z+\frac<1192935588625> <256>\, . $$ Имеем: $ \deg_x F=4 $, т.е. уравнение $ F(x,z)=0 $ разрешимо в радикалах относительно $ x $. По крайней мере, теоретически, функцию $ \varphi_1(z) $ можно представить в виде конечной комбинации элементарных функций и корней второй и третьей степеней от коэффициентов полинома. Реальное же представление для $ \varphi_1(z) $ крайне громоздко и, с точки зрения практического использования, неконструктивно.

Уравнение четвертой степени может иметь от нуля до четырех вещественных корней в зависимости от значений $ z $. При подстановке конкретного значения $z =z_0 \in \mathbb R $ получаем полином $ F(x,z_0) $ от одной переменной $ x $. Мы можем однозначно и чисто алгебраическим алгоритмом установить число его вещественных корней. Так, $$ F(x,3)\equiv \frac<425850289><81>x^4+126573205 x^3+\frac<1605258018107><1800>x^2+\frac<20614103217><80>x-\frac<793132431560159> <160000>$$ имеет два вещественных корня $ \approx -3.309237 $ и $ \approx 1.959148 $. Второй из них мы и взяли выше в качестве $ x_0 $. Таким образом, для $ \varphi_1(z) $ мы получили представление в виде неявной функции $ F(x,z)=0 $ при заданном значении $ \varphi_1(z_0)=x_0 $. Но тогда для этой функции должна работать теорема 1, которая дает представление $$ \varphi_1^<\prime>(z_0)= -\frac<\partial F /\partial z> <\partial F /\partial x>\Bigg|_<_<(x_0,z_0)>> \, . $$ Результат совпадает с полученным выше.

Понятно, что для получения $ \varphi_2(z) $ мы должны произвести процедуру исключения переменной $ x $ из системы $ f=0,g=0 $, т.е. вычислить результант $ G(y,z):=\mathcal R_x(f,g) $. Далее найти корень полинома $ G(y,z_0) $ (выбрав тот из них, что соответствует уже найденном у значению $ x_0 $) и т.д. Убеждаемся, что $$ \varphi_2^<\prime>(z_0)= -\frac<\partial G /\partial z> <\partial G /\partial y>\Bigg|_<_<(y_0,z_0)>> \, . $$

Вопроc: какая же связь между матрицей Якоби и результантами $ \mathcal R_x(f,g), \mathcal R_y(f,g) $ приводит — в результате применения двух различных алгоритмов — к совершенно разным представлениям для $ \varphi_1^<\prime>(z_0), \varphi_2^<\prime>(z_0) $, имеющим, тем не менее, одинаковые значения? ♦

~~Если система полиномов~~

$$\ $$ удовлетворяет условиям теоремы в некоторой точке $ (X_0,Y_0) \in \mathbb R^ <2n>$, то существует окрестность точки $ X_0 $, в которой справедливо равенство $$ \frac=(-1)^n \frac \bigg/ \frac \, . $$ Здесь производные вычислены в соответствующих точках.

Геометрические приложения

~~Теорема. Пусть на плоскости заданы две кривые уравнениями~~

$$ f(x,y)=0 \quad u \quad g(x,y)=0 \ $$ и они пересекаются в точке $ (x_<0>,y_0) $. Тогда величина угла $ \gamma $, под которым происходит это пересечение вычисляется по формуле $$ \operatorname (\gamma) = \pm \frac<\frac<\partial f> <\partial x>\frac <\partial g> <\partial y>— \frac<\partial f> <\partial y>\frac<\partial g><\partial x>><\frac<\partial f> <\partial x>\frac<\partial g> <\partial x>+ \frac<\partial f><\partial y>\frac<\partial g><\partial y>> $$ где все производные в правой части вычислены в точке $ (x_<0>,y_0) $.

Утверждение следует из свойства градиента: вычисленный в точке кривой, он определяет направляющий вектор нормали к этой кривой.

~~Если $ (x_<0>,y_0) $ — точка пересечения кривых $ f(x,y)=0 $ и $ g(x,y)=0 $, то~~

~~Показать, что если функции $ u_<>(x,y) $ и $ v_<>(x,y) $ связаны соотношениями Коши-Римана (Даламбера-Эйлера):~~

$$ \frac<\partial u> < \partial x>\equiv \frac<\partial v> < \partial y>, \frac<\partial u> < \partial y>\equiv — \frac<\partial v> < \partial x>$$ в некоторой области $ \mathbb_<> $, то в этой области их линии уровня, то есть кривые $ u(x,y) = c_1 $ и $ v(x,y) = c_2 $ при $ \ \subset \mathbb R $, могут пересекаться только под прямым углом.

Решение системы нелинейных уравнений

Рассмотрим систему двух вещественных алгебраических уравнений $$ f(x,y)=0, \ g(x,y)=0 \, . $$ По аналогии с методом Ньютона решения уравнения от одной неизвестной, попробуем найти вещественное решение этой системы, сгенерировав итерационную последовательность в $ \mathbb R^2 $, сходящуюся к этому решению. Допустим, что из каких-то соображений нам удалось установить, что вещественное решение системы существует, и что некоторая точка $ (x_0, y_0) $ достаточно близка к этому решению. Раскладываем полиномы по формуле Тейлора по степеням $ x-x_0, y-y_0 $ и оставляем в этих разложениях только первые слагаемые: $$ f(x,y)\equiv f(x_0,y_0)+ \frac<\partial f><\partial x>\Bigg|_<(x_0,y_0)>(x-x_0)+\frac<\partial f><\partial y>\Bigg|_<(x_0,y_0)>(y-y_0) + \dots \, , $$ $$ g(x,y)\equiv g(x_0,y_0)+ \frac<\partial g><\partial x>\Bigg|_<(x_0,y_0)>(x-x_0)+\frac<\partial g><\partial y>\Bigg|_<(x_0,y_0)>(y-y_0) + \dots \, . $$ Теперь вместо системы нелинейных уравнений рассматриваем систему $$ \left\< \begin f(x_0,y_0)&+ \frac<\partial f><\partial x>\Bigg|_<(x_0,y_0)>(x-x_0)+\frac<\partial f><\partial y>\Bigg|_<(x_0,y_0)>(y-y_0) &= 0,\\ g(x_0,y_0)&+ \frac<\partial g><\partial x>\Bigg|_<(x_0,y_0)>(x-x_0)+\frac<\partial g><\partial y>\Bigg|_<(x_0,y_0)>(y-y_0) &= 0 \end \right. $$ линейных уравнений. Она гарантировано имеет решение если матрица $$ \mathbf J= \left( \begin \partial f /\partial x & \partial f /\partial y \\ \partial g /\partial x & \partial g /\partial y \end \right) $$ будет неособенной при $ x=x_0,y=y_0 $. При этом предположении решение системы единственно и может быть выражено в виде $$ \left( \begin x_1 \\ y_1 \end \right)= \left( \begin x_0 \\ y_0 \end \right) — \mathbf J^ <-1>\left( \begin f(x_0,y_0) \\ g(x_0,y_0) \end \right) \, . $$ Получаем полную аналогию с одномерным методом Ньютона; роль производной теперь выполняет матрица Якоби. Можно ожидать, что точка $ (x_1,y_1) $ будет лежать ближе к неизвестному нам решению исходной системы, нежели стартовая точка $ (x_0, y_0 ) $. Если это предположение выполняется, то можно попытаться организовать вычисление итерационной последовательности $$ \left\< \left( \begin x_j \\ y_j \end \right)= \left( \begin x_ \\ y_ \end \right) — \mathbf J^ <-1>\Bigg|_<_<(x_,y_)>> \left( \begin f(x_,y_) \\ g(x_,y_) \end \right) \right\>_^ <\infty>$$ и потестировать ее на сходимость к решению. Одно ограничение для этого умозаключения довольно очевидно: матрица Якоби должна быть невырожденной на всех итерациях (а, желательно, и не очень близкой к вырожденным матрицам).

~~Подробнее о методе Ньютона решения систем нелинейных уравнений ☞ ЗДЕСЬ.~~

13.3 Матрица Якоби

Рассмотрим отображение $f : E \longmapsto R^m,$ где $E \subset R^n.$ Оно состоит из $m$ функций: $f = \left(f_1 \left(x_1,\ldots,x_n \right),f_2 \left(x_1,\ldots,x_n \right),\ldots,f_m \left(x_1,\ldots,x_n \right) \right),$ которые осуществляют отображение множества $E$ из $R^n$ в пространство $R^m.$

Предположим, что функции $f_k \left(x_1,\ldots,x_n \right),$ где $k = \overline<1,m>,$ дифференцируемы, то есть имеют частные производные по аргументам $(x_1,\ldots,x_n):$

~~Составим матрицу из этих частных производных по переменным $x_1,\ldots,x_n$~~

~~Такая матрица называется матрицей Якоби.~~

Если $m = n,$ то получаем квадратную матрицу, определитель которой называется определителем Якоби или якобианом $Jf(x)$ и обозначается

Замечание. Если все частные производные непрерывны, то и сам оределитель Якоби является непрерывной функцией.

~~Теорема. Якобиан тождественно равен нулю в некоторой области $\mathbb$:~~

тогда и только тогда, когда между функциями $f_1,f_2,\ldots,f_n$ имеется функциональная зависимость в $\mathbb~~,$ то есть существует функция $G \left(y_1,y_2,\ldots,y_n \right) \not \equiv 0$ такая, что~~

~~$G \left(f_1(x),f_2(x),\ldots,f_n(x) \right) \equiv 0$ при всех $x = (x_1, \ldots, x_n) \in \mathbb.$~~

~~Пример 1. Являются ли функции функционально зависимыми?~~

~~\begin f_1 = x_1 + x_2 + x_3 -1; \\ f_2 = x_1x_2 + x_1x_3 + x_2x_3 -2; \\ f_3 = x^2_1 + x^2_2 + x^2_3 + 3. \end~~

~~$\frac = \begin \\ 1 & 1 & 1 \\ x_2 + x_3 & x_1 + x_3 & x_1 + x_2 \\ 2x_1 & 2x_2 & 2x_3 \end = $~~

~~$=\begin \\ 1 & 1 & 1 \\ x_1 + x_2 + x_3 & x_1 + x_2 + x_3 & x_1 + x_2 + x_3 \\ 2x_1 & 2x_2 & 2x_3 \end \equiv 0$~~

~~Так как якобиан равен нулю, то эти функции функционально зависимы. Несложно найти эту зависимость:~~

~~$\left(f_1 + 1 \right)^2 -2\left(f_2 + 2 \right) -\left(f_3 -3\right) = 0.$~~

Пример 2. Для линейных функций $f_1 = a_ <11>x_1 + \ldots + a_ <1n>x_n -b_1, \ldots , f_m = a_ x_1 + a_ x_n -b_m$ матрица Якоби будет матрицей коэффициентов при переменных:

~~\begin a_ <11>& a_ <12>& \ldots & a_ <1n>\\ \ldots & \ldots & \ldots & \ldots \\ a_ & a_ & \ldots & a_ \end~~

Если мы хотим разрешить систему $f_1 = 0,f_2 = 0, \ldots, f_n = 0$ относительно $x_1, \ldots, x_n,$ то для случая $m = n$ определитель Якоби

~~\begin a_ <11>& \ldots & a_ <1n>\\ \ldots & \ldots & \ldots \\ a_ & \ldots & a_\end~~

~~есть определитель системы и для её разрешимости он должен быть отличен от нуля.~~

Пример 3. Переход элементарной площади $dS = dx\,dy$ от декартовых координат $ \left( x,y \right)$ к полярным координатам $ \left( r,\phi \right)$:

~~Матрица Якоби имеет вид:~~

$$J(r,\phi) = \begin \frac<\partial x> <\partial r>& \frac<\partial x> <\partial \phi>\\ \frac<\partial y> <\partial r>& \frac<\partial y> <\partial \phi>\end = \begin \cos(\phi) & -r\,\sin(\phi) \\ \sin(\phi) & r\,\cos(\phi) \end.$$
Якобиан перехода от декартовых координат к полярным есть определитель матрицы Якоби:

~~$J(r,\phi) = \det I(r,\phi) = \det\begin \cos(\phi) & -r\,\sin(\phi) \\ \sin(\phi) & r\,\cos(\phi) \end.$~~

Таким образом, элемент площади при переходе от декартовых к полярным координатам будет выглядеть следующим образом:

~~$dS = dx\,dy = J\left(r,\phi \right) dr\,d\phi = r\,dr\,d\phi.$~~

Пример 4. Переход элементарного объёма $dV$=$dx$ $dy$ $dz$ от декартовых координат $\left(x,y,z \right)$ к сферическим координатам $\left(r,\theta,\phi \right)$ :

~~$\beginx = r\,\sin(\theta)\,\cos(\phi); \\ y = r\,\sin(\theta)\,\sin(\phi); \\ z = r\,\cos(\theta).\end$~~

$= \begin \sin(\theta) \cos(\phi) & r\,\cos(\theta) \cos(\phi) & -r\,\sin(\theta)\,\sin(\phi) \\ \sin(\theta)\,\sin(\phi) & r\,\cos(\theta)\,\sin(\phi) & r\,\sin(\theta)\,\cos(\phi) \\ \cos(\theta) & -r\,\sin(\theta) & 0 \end.$

~~А якобиан перехода от декартовых координат к сферическим – есть определитель матрицы Якоби:~~

~~$J\left(r,\theta,\phi \right) = \det I\left(r,\theta,\phi \right)$ =~~

= $\begin \sin(\theta)\,\cos(\phi) & r\,\cos(\theta)\,\cos(\phi) & -r\,\sin(\theta)\,\sin(\phi) \\ \sin(\theta)\,\sin(\phi) & r\,\cos(\theta)\,\sin(\phi) & r\,\sin(\theta)\, \cos(\phi) \\ \cos(\theta) & -r\,\sin(\theta) & 0 \end = r^2\sin(\theta).$

Таким образом, элемент объёма при переходе от декартовых к сферическим координатам будет выглядеть следующим образом:

~~$dV = dx\,dy\,dz = J\left(r,\theta,\phi \right) dr\,d\theta\,d\phi = r^2\,\sin(\theta)\,dr\,d\theta \,d\phi.$~~

Магия тензорной алгебры: Часть 3 — Криволинейные координаты

Введение

Читая отзывы к своим статьям, понял, что я излишне перегрузил читателя теоретическими вводными. Прошу за это прощения, признаться честно, я сам далек от формальной математики.

Однако, тензорное исчисление пестрит понятиями, многие из которых требуется вводить формально. Поэтому третья статься цикла тоже будет посвящена сухой теории. Тем не менее, я обещаю, что в следующей работе приступлю к тому, к чему сам давно хотел — к описанию практической ценности тензорного подхода. На примете имеется интересная задача, большая часть которой в моей голове уже разобрана. Тензорное исчисление для меня не праздный интерес, а способ обработать некоторые из своих теоретических и практических соображений в области механики. Так что практика по полной программе ещё предстоит.

~~А пока что рассмотрим некоторые теоретические основы. Добро пожаловать под кат.~~

1. Матрица Якоби и локальная метрика. «Жонглирование» индексами

Те системы координат, что мы рассматривали до сих пор были косоугольными. Но их оси были прямыми линиями. Однако, крайне часто приходится работать в пространстве, координатные линии которого — кривые. Такая система координат называется криволинейной.

Простейший жизненный пример криволинейной системы координат — географические координаты — широта, долгота и высота над уровнем моря, по которой определяется положение объектов вблизи поверхности Земли. Криволинейные координаты широко применяются в астрономии. В механике примером таких координат могут служить обобщенные координаты механической системы, однозначно определяющие её положение в пространстве с учетом геометрии наложенных на систему связей. На этом и строится аналитическая механика.

~~Рис. 1. Криволинейные координаты в трехмерном пространстве~~

Рассмотрим криволинейные координаты, заданные в трехмерном евклидовом пространстве (рисунок 1). Пусть положение точки задается в этих координатах вектором

~~и декартовы координаты точки связаны с (1) соотношением~~

~~или, в компонентной форме~~

Рассмотрим частную производную . Результат такого дифференцирования — это вектор, направленный по касательной к координатной линии . Дифференцируя (2) по всем криволинейным координатам получим тройку векторов

Эти векторы задают базис так называемого касательного пространства. И в отличие от базиса в косоугольной системе координат, модуль и направление этих векторов будут изменятся при переходе от одной точки к другой. Мы получаем переменный базис, зависящий от положения в пространстве, заданного вектором (1). Такой базис называется локальным

~~Векторы (4) собирают в матрицу~~

которая называется матрицей Якоби, и по сути определяется как производная от одного вектора по другому вектору. В нашем случае

Легко догадаться, что если функция (2) линейна относительно компонент вектора , то её можно выразить матричным соотношением

то мы рассматриваем косоугольную систему координат, и матрица Якоби будет равна матрице преобразования от косоугольных координат к декартовым

Теперь, любой вектор, заданный в пространстве (тензор ранга (1, 0)) можно представить через его контравариантные компоненты в криволинейной системе координат

Однако, компоненты вектора, из-за переменного базиса, будут зависеть от положения в пространстве точки приложения вектора. Кроме того, для того чтобы представление (6) существовало, надо чтобы векторы, составляющие базис были не компланарны. Из курса векторной алгебры нам известно, что векторы некомпланарны, если их смешанное произведение отлично от нуля. Отсюда возникает условие, которому должен удовлетворять определитель матрицы Якоби

~~Данный определитель как раз определяет смешанное произведение векторов базиса.~~

Теперь вычислим ковариантные компоненты вектора . Для этого, в самой первой статье цикла, мы умножали вектор скалярно на соответствующий вектор базиса

В той же, первой статье, мы определили, что ковариантные компоненты вектора связаны с контравариантными через метрический тензор

Сравнивая два последних выражения мы получаем определение метрического тензора в криволинейных координатах

~~которое можно представить в матричной форме~~

Эту связь можно представить и в тензорной форме, но для этого придется ввести явно метрику для декартовых координат

~~Тогда, преобразование декартовой метрики в криволинейную будет выглядеть так~~

Выражение (8) вводит метрический тензор для криволинейных координат. Этот тензор зависит от положения точки в пространстве, поэтому говорят что он задан локально или определяет локальную метрику

Определившись с метрикой, мы можем записать правила преобразования контравариантных координат в ковариантные

~~и ковариантных координат в контравариантные~~

~~В тензорном исчислении операции опускания (9) и поднятия (10) индексов называют «жонглированием» индексами.~~

Выписав соотношения (9) и (10) мы подразумевали, что матрицы и взаимно обратимы. Это возможно лишь в том случае, если

Данное условие выполняется для криволинейных координат, если матрица Якоби не вырождена, и это непосредственно следует из (8), так как

то есть условие (7) выполняемое для всех точек пространства — достаточное условие невырожденности локальной метрики.

Рассмотрение вырожденнных метрик, это отдельный и сложный вопрос, поэтому мы ограничимся метриками, в которых матрица метрического тензора обратима, то есть выполняется условие

2. Взаимный базис

~~Введем векторы , получаемые из векторов исходного базиса путем поднятия индекса~~

~~Теперь возьмем и умножим (11) скалярно на вектор~~

~~но, мы знаем, что — метрический тензор, поэтому, приходим к уравнению~~

Если мы возьмем, например, вектор , то в силу (12) он перпендикулярен векторам и (его скалярное произведение с ними равно нулю), а скалярное произведение этого вектора на — равно единице

~~Дальше возьмем и умножим (11) скалярно на~~

~~и в силу (12) это дает контравариантный метрический тензор~~

~~Система векторов тоже образует базис, который называют взаимным или сопряженным с базисом .~~

~~Снова рассмотрим вектор . Из соотношений (10) и (11) следует цепочка преобразований~~

~~Умножим (13) скалярно на~~

приходим к заключению, что любой вектор может быть разложен как по базису — тогда его компоненты будут контравариантные, так и по базису — компоненты будут ковариантными

При этом, ковариантные компоненты — это скалярные произведение вектора на векторы базиса , а контравариантные компоненты — скалярные произведения вектора на векторы базиса

~~что ещё раз иллюстрирует взаимность этих базисов.~~

Тут надо отметить, что векторы базиса получаются естественным путем — они касательны соответствующим координатным линиям и им можно приписать геометрический смысл. Что касается базиса , то его векторы не направлены по касательной координатным линиям, а перпендикулярны парам векторов касательного базиса. Такой базис иногда принято называть неголономным

3. Преобразование криволинейных координат. Формальное определение ковариантных и контравариантных компонент

Допустим, что мы работаем в криволинейной система координат, определенной вектором . Перейдем к другой системе координат, положение точек которой определяется вектором , таким, что преобразование от старой системы координат к новой определяется уравнениями

~~Будем считать преобразование (16) обратимым, то есть допустим существование функции~~

~~Для этого требуется, чтобы определитель матрицы Якоби~~

~~был отличен от нуля~~

~~Тогда существует матрица , обратная матрице (18), такая, что~~

~~Матрица является матрицей Якоби для преобразования (17). Тогда можно вычислить векторы нового базиса~~

~~Получаем связь между старым базисом и новым~~

~~Разложим вектор в новом базисе~~

~~и используя соотношение (19), напишем~~

~~С учетом того, что векторы базиса линейно независимы, приравниваем коэффициенты при них в (21)~~

~~Теперь умножим обе части (21) на~~

~~То есть, получаем формулу обратного преобразования контравариантных компонент~~

~~Контравариантные компоненты вектора преобразуются оператором, обратным оператору преобразования базиса~~

Действительно, чтобы получить векторы нового базиса, мы использовали матрицу по формуле (19). Чтобы получить контравариантные компоненты заданного в новом базисе вектора мы используем матрицу

~~А теперь посмотрим, как преобразуется вектор, заданный своими ковариантными компонентами~~

Ковариантные компоненты вектора преобразуются тем же оператором, которым осуществляется преобразование базиса

Тензор ранга (1,0) преобразуется оператором обратным, используемому при преобразовании базиса, а тензор ранга (0,1) преобразуется тем же самым оператором, что используется при преобразовании базиса.

4. Ковариантная производная. Символы Кристоффеля 2-го рода

Предположим, что мы хотим продифференцировать вектор, заданный произвольными координатам по какой-то из координат. Что мы должны сделать? Давайте попробуем выполнить эту операцию

На каком основании мы выписали производную от базисного вектора? А на том основании, что базис в криволинейных координатах зависит от них, а значит его производная от координаты отлична от нуля. Ну и ладно, эта производная тоже будет вектором, а значит её можно разложить по локальному базису, например вот так

Найдем коэффициенты разложения в (25). Для этого, возьмем ковариантный метрический тензор и продифференцируем его по указанной координате

~~Подставим (25) в (26)~~

~~Здесь очевидно присутствие компонент метрического тензора, поэтому выполняем замену~~

Прежде чем начать работать с (27), скажем, что искомые коэффициенты разложения симметричны относительно нижних индексов, так как проведя прямое дифференцирования базисного вектора приходим к выражению

~~откуда, в силу непрерывности рассматриваемых функций, заключаем, что~~

~~Теперь, в (27) переставим индексы i и k~~

~~А теперь, переставим в (27) индексы j и k~~

~~Теперь сложим (29) и (30) учтя при этом симметричность (28)~~

~~Вычитаем (27) из (31), снова учитывая (28)~~

~~Умножаем (32) на , и получаем окончательно~~

~~Выражение (33) определяет так называемый символ Кристоффеля 2-го рода. Тогда~~

~~Выражение, стоящее в скобках в (34) называется ковариантной производной контравариантных компонент вектора~~

Исходя из (35) мы должны понимать, что пытаясь дифференцировать по криволинейной координате, мы обязаны учитывать зависимость базиса от координат. Если метрика не зависит от положения точки приложения вектора в пространстве, то (35) превращается в частную частную производную, ибо все символы Кристоффеля равны будут нулю, из-за того что метрический тензор не зависит от координат. В любой косоугольной системе координат, и в их частном случае — декартовых координатах, символы Кристоффеля, согласно (33) равны нулю. А значит, согласно (35) ковариантрая производная от вектора по координате будет совпадать с его частной производной по этой координате, к чему мы приучены вобщем-то давно. Но если бы (33) был тензором, то он, будучи равен нулю, остался бы нулевым в любой другой системе координат. Но в криволинейных координатах (33) нулю не равны. А значит символы Кристоффеля не являются тензором. При преобразовании системы координат меняются компоненты, но не сущность тензора. Нулевой тензор должен быть таковым в любой системе координат.

Заключение

Первичные теоретические основы разобраны. Со следующей статьи мы уйдем в практику использования тензорного исчисления для решения конкретных задач. Спасибо Вам за оказанное мне внимание и доверие.

~~источники:~~

~~http://ib.mazurok.com/2019/06/14/jacobian-matrix-and-determinant/~~

~~http://habr.com/ru/post/261717/~~