VMath
Инструменты сайта
Основное
Навигация
Информация
Действия
Содержание
Вспомогательная страница к разделам ОПРЕДЕЛИТЕЛЬ и ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ
Матрица Якоби и якобиан
Определение и основные свойства
Матрицей Якоби системы из $ m_<> $ функций $ \
Можно сказать, что в общем случае системы функций их матрица Якоби состоит из строк, являющихся градиентами этих функций.
Пример. Для системы линейных функций
$$f_1=a_<11>x_1+\dots+a_<1n>x_n — b_1,\dots, f_m=a_
В частном случае $ m=n_<> $ матрица Якоби становится квадратной и тогда ее определитель называется якобианом или определителем Якоби или функциональным определителем системы из $ n_<> $ функций $ \
Пример. Якобиан системы двух функций $ \
Теорема [Якоби]. Если $ A_
Функциональная зависимость
Следующая теорема и ее следствия являются прямыми обобщениями соответствующих результатов из линейной алгебры.
Теорема. Якобиан системы функций $ \< f_<1>,f_2,\dots,f_n \> $ тождественно равен нулю в некоторой области $ \mathbb_<> $:
$$ \frac$$ тогда и только тогда, когда между этими функциями имеется функциональная зависимость в $ \mathbb $, т.е. существует функция $ G(y_1,y_2,\dots,y_n) \not\equiv 0 $ такая, что $$ G(f_1(X),f_2(X),\dots,f_n(X))\equiv 0 \mbox < >\mbox <при>\mbox < >X \in \mathbb \ . $$
Приведем соображения, показывающие необходимость обращения якобиана в нуль для существования функциональной зависимости в системе функций $ \ < f_j \>$. Дополнительно предположим, что у функции $ G $ существуют частные производные по ее аргументам. Продифференцируем тождество $ G(f_1(X),f_2(X),\dots,f_n(X))\equiv 0 $ по $ x_1,\dots,x_n $. Получим систему тождеств $$ \left\<\begin
Пример. Являются ли полиномы
$$ f_1=x_1+x_2+x_3-1,\quad f_2=x_1x_2+x_1x_3+x_2x_3-2,\quad f_3=x_1^2+x_2^2+x_3^2+3 $$ функционально зависимыми?
Решение. $$ \frac
Если какие-то $ \mathfrak r $ функций системы $ \< f_<1>, \dots, f_n \> $ связаны в $ \mathbb $ функциональным соотношением
$$ H(f__<> $.
Пусть $ \mathfrak r_<> $ обозначает ранг матрицы Якоби системы функций $ \
$$ \frac_<> $, то функции $ f_1,\dots,f_ <\mathfrak r>$ функционально независимы в $ \mathbb $, а все оставшиеся функции системы (при условии $ \mathfrak r непрерывная функция $ \varphi (y) $ такая, что $$ f(\varphi(y)) \equiv y,\ \varphi(y_0)=x_0 \, . $$ В этой окрестности функция $ \varphi $ является непрерывно дифференцируемой и выполняется равенство $$ \varphi^ <\prime>(y) = \frac<1>
Конструктивных аналитических способов нахождения функции, обратной к заданной $ y=f(x) $ можно сказать, что и нет. Задача сводится к разрешению этого уравнения относительно $ x $. Однако уже для полиномиальных $ f(x) $ решение такого уравнения в «хороших» функциях, т.е. в радикалах, возможно, в общем случае, только для $ \deg f ♦
В альтернативу интерполяции, можно поставить задачу об аппроксимации обратной функции с помощью степенных рядов. Составим формальный ряд $$ \varphi(y)=B_0+B_1(y-y_0) + B_2(y-y_0)^2+ \dots + B_k(y-y_0)^k+ \dots $$ Для значения $ y_0 $ из теоремы получаем два коэффициента этого ряда $$ B_0=x_0, B_1= 1/f^ <\prime>(x_0) \, . $$ Как получить следующий коэффициент $ B_2 $? Заметим, что если бы у обратной функции существовала бы вторая производная, то $ B_2 $ был бы следующим коэффициентом ряда Тейлора: $$ B_2 = \varphi^<\prime \prime>(y_0)/2 \, . $$ Для получения выражения $ \varphi^<\prime \prime>(y_0) $ продифференцируем по $ y $ тождество $ f(\varphi(y)) \equiv y $. Тождество останется справедливым $$ f^<\prime>_x(\varphi(y)) \varphi^<\prime>_y(y)\equiv 1 \, . $$ При подстановке сюда $ y=y_0 $ получаем уже известное нам равенство $ f^<\prime>_x(x_0)\varphi^<\prime>_y(y_0)=1 $. Но если продифференцировать еще раз, то получим $$ f^<\prime \prime>_
Пример. Для функции $ y=-x^3+3\,x-1 $ приведенного выше примера первые $ 8 $ членов разложение обратной функции в ряд Тейлора в точке $ y_0=-1 $ имеют вид
$$ \widehat<\varphi>(y)= \frac<1><3>(y+1)+\frac<1><81>(y+1)^3+\frac<1><729>(y+1)^5 +\frac<4><19683>(y+1)^7 \, . $$ На графике внизу кривая $ y = \widehat<\varphi>(x)$ изображена цветом охры.
И только близко к точке $ x=1 $ заметно расхождение с $ y= \varphi(x) $. ♦
Теорема утверждает, что обратная функция будет определена в окрестности точки $ y_0 $, удовлетворяющей условию. Насколько большой можно сделать эту окрестность? Ограничимся случаем полиномиальных $ f(x) $. При движении от точки $ y_0 $ вправо или влево по числовой оси значения $ \varphi^<\prime>(y) $ меняются непрерывным образом и стремятся к бесконечности только когда соответствующие значения $ x $ стремятся к корням полинома $ f^<\prime>(x) $. Если этот полином имеет вещественные корни, и $ \mu_1 непрерывные функции $ \varphi(u,v) $ и $ \psi(u,v) $ такие, что $$ f(\varphi(u,v),\psi(u,v)) \equiv u, \ g(\varphi(u,v),\psi(u,v)) \equiv v, \ \varphi(u_0,v_0)=x_0, \psi(u_0,v_0)=x_0 \, . $$ Функции $ \varphi $ и $ \psi $ непрерывно дифференцируемы в этой окрестности, и для их матрицы Якоби выполняется равенство $$ \left(\begin
Отображение окрестности точки $ (u_0,v_0) $ в окрестность точки $ (x_0,y_0) $, заданное векторной функцией $ (\varphi(u,v), \psi(u,v)) $ из теоремы, называется обратным отображением к отображению $ (f(x,y),g(x,y)) $.
При выполнении условий теоремы, в соответствующих друг другу точках $ (u,v) $ и $ (x,y) $ выполняется равенство
Пример. Отображение
$$ (e^x \cos y, e^x \sin y \> $$ отображает $ (x,y) $-плоскость $ \mathbb R^2 $ во множество $ \mathbb R^2 \setminus (0,0) $ на плоскости $ (u,v) $. Якобиан $$ \frac
Мы в дальнейшем ограничимся случаем полиномиальных функций. Для этого случая хотя бы можно ожидать, что якобиан будет из того же класса, что и сами функции, т.е. полиномом. Ну и можно что-то конструктивное сказать о представлении обратных отображений — хотя они уже, как правило, не будут полиномиальными, но задачу их представления можно свести к одномерному случаю.
Пример. Найти обратное отображение к отображению
Решение. Якобиан $$ \frac
Для разрешения системы алгебраических уравнений $ u=f(x,y), v=g(x,y) $ относительно $ x $ и $ y $ применим теорию исключения. Результант системы по переменной $ y $ $$ \mathcal X(x)=(1-v)x^2+(u+11\,v-9)x+u^2-6\,u-34\,v+9\,v^2+6\,uv+21 $$ оказывается квадратным полиномом 1) по $ x $. Корни уравнения $ \mathcal X(x) =0$ следующие: $$ \frac> <2(v-1)>\, . $$ Из них только соответствующий знаку минус в числителе, т.е. $$ \varphi(u,v):=\frac> <2(v-1)>$$ удовлетворяет условию $ \varphi(-5,7)=-1 $. Аналогично находим выражение для $ y $: $$ \psi(u,v):=\frac> <2(v-1)>\, . $$ Области определения обеих функций одинаковы: $$ \ <(u,v) \in \mathbb R^2 \mid v\ge 3/4, v\ne 1 \>\, . $$ Теперь проверим справедливость формулы, связывающей якобианы. Имеем (в окрестности точки $ (-5,7) $) $$ \frac
Сформулируем обобщение предыдущего результата в $ \mathbb R^n $.
Теорема. Если якобиан системы полиномов
$$ \ < f_1(X), \dots , f_n(X) \>\subset \mathbb R[X] $$ отличен от нуля в некоторой точке $ X_0 \in \mathbb R^n $, то существует окрестность этой точки, в которой система уравнений $$ y_1=f_1(x_1,\dots,x_n),\dots,y_n=f_n(x_1,\dots,x_n) \ , $$ рассматриваемая относительно переменных $ x_<1>,\dots,x_n $, имеет единственное решение, лежащее в окрестности точки $$ Y_0=(f_1(X_0), \dots , f_n(X_0)) \, . $$ Иными словами: существует и однохначно определяется система непрерывных в окрестности точки $ Y_0 $ функций $$ \ < \varphi_1(Y),\dots, \varphi_n(Y)\>, $$ таких, что $$ f_1(\varphi_1(Y),\dots, \varphi_n(Y))\equiv y_1,\dots, f_n(\varphi_1(Y),\dots, \varphi_n(Y))\equiv y_n $$ и $$ (\varphi_1(Y_0),\dots, \varphi_n(Y_0))=X_0 \, .$$ Функции $ \<\varphi_j(Y) \>_
При выполнении условий теоремы, в соответствующих друг другу точках $ Y $ и $ X $ выполняется равенство
Якобиан как коэффициент растяжения
Еще одну важную сущность якобиана сформулируем в решении следующего примера.
Пример. Отображение
$$ \left\< \begin
Решение. Для ответа на вопрос надо обладать возможностью вычислить точную площадь области, закрашенной оранжевым на рисунке. Я не уверен, что это можно сделать сведением к случаю «табличных» интегралов, но, по крайней мере, численными методами можно найти приближение этой площади. Попробуем получить такое приближение, заменив границу области — криволинейную — на параллелограмм. С этой целью проведем в точке $ (u_0,v_0) $ касательные к ограничивающую область кривым: $$ \< (u,v)= (u_0+ f^<\prime>_x(x_0,y_0) t, v_0+ g^<\prime>_x(x_0,y_0) t) \mid t \in \mathbb R \> \ \mbox < и >\ \< (u,v)=(u_0+ f^<\prime>_y(x_0,y_0) \tau, v_0+ g^<\prime>_y(x_0,y_0) \tau )\mid \tau \in \mathbb R \> \, . $$ и возьмем на них, помимо $ (u_0,v_0) $, точки, соответствующие значениям параметров $ t=1, \tau=1 $.
Эта аппроксимация, в нашем конкретном случае, очевидно неудачная. Как следствие, площадь получишегося параллелограмма визуально отличается от искомой площади. Однако если уменьшить размеры отображаемого квадрата на плоскости $ (x,y) $ до $ 0 \le x \le 1/2, 1/2\le y \le 1 $, то его образ становится более похожим на параллелограмм построенный по приведенному выше образцу. В общем случае отображения квадрата размера $ \delta \times \delta $ получаем приближение его образа в виде параллелограмма с вершинами $$ (u_0,v_0),\ (u_0+f^<\prime>_x \delta,v_0 +g^<\prime>_x \delta),\ (u_0+f^<\prime>_y \delta,v_0 +g^<\prime>_y \delta) \, , $$ $$ (u_0+f^<\prime>_x \delta++f^<\prime>_y \delta,v_0 +g^<\prime>_x \delta+g^<\prime>_y \delta) \, . $$ Здесь все производные вычислены в точке $ (x_0,y_0) $. Воспользовавшись формулой вычисления площади параллелограмма, получаем выражение в виде абсолютной величины (модуля) выражения $$ \left|\begin
Неявная функция
Обобщением рассмотренного в предыдущем пункте случая, т.е. выражения вектора $ X=(x_1,\dots,x_n) $ через вектор $ Y=(y_1,\dots,y_n) $ при задании многомерного отображения формулами $$ Y= (f_1(X),\dots,f_n(X)) $$ является случай неявной функции.
В линейном случае, эта задача встречается при записи общего решения системы линейных уравнений. Если эта система представлена в виде $$ \left\< \begin
В случае нелинейного уравнения $$ f(x,y)=0 \, $$ критерий существования неявной функции дается следующей теоремой
Теорема 1 [о неявной функции]. Пусть функция $ f $ — непрерывно дифференцируема в окрестности точки $ (x_0,y_0) $ и
$$ f(x_0,y_0)=0 ,\ \partial f /\partial y \mid_<(x_0,y_0)>\ne 0 \, .$$ Тогда существует окрестность точки $ x_0 $, в которой уравнение $ f(x,y)=0 $ имеет единственное вещественное решение относительно $ y $, лежащее в окрестности $ y_0 $. Иными словами: существует вещественная непрерывная функция $ \varphi(x) $, такая, что $$ \varphi(x_0)=y_0, \ f(x,\varphi(x)) \equiv 0 $$ (последнее тождество выполняется в заявленной окрестности $ x_0 $). При этом $ \varphi(x) $ является непрерывно дифференцируемой функцией в той же окрестности и выполняется тождество $$ \varphi^<\prime>(x)\equiv-\frac<\partial f /\partial x> <\partial f /\partial y>\Bigg|_<_<(x,\varphi(x))>> \, . $$
Нахождение явного выражения для $ y=\varphi(x) $ является задачей еще более сложной, чем задача предыдущего пункта о нахождении обратной функции. Усложнение проявляется уже в проблеме поиска хотя бы одной точки $ (x_0,y_0) \in \mathbb R^2 $, удовлетворяющей уравнению $ f(x,y)=0 $. Проблема существования вещественного решения этого уравнения даже для случая полиномиальной функции $ f $ нетривиальна: см. пункт ☞ АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ. Если вещественное решение удастся обнаружить, то нахождение неявной функции можно осуществить построением ряда Тейлора (или, в общем случае, при нарушении условия теоремы, в виде ряда Пюизё), сходящегося в некоторой окрестности точки $ x_0 $.
Результат теоремы $ 1 $ очевидным образом обобщается на случай неявной функции нескольких переменных: уравнение $$ f(x_1,\dots,x_n, y) = 0 \quad \mbox < при >n \ge 2 $$ пытаются разрешить относительно $ y $.
Более общую задачу решения системы уравнений относительно нескольких переменных мы рассмотрим в частном случае уравнений алгебраических.
Теорема 2. Пусть имеется система полиномов
$$ \ < f_1(X,Y), \dots , f_m(X,Y) \>\subset \mathbb R[X,Y],\ m \ge 2 $$ от векторов переменных $ X=(x_1,\dots,x_n) $ и $ Y=(y_1,\dots,y_m) $. Пусть выполнены следующие условия:
$$ f_1(X_0,Y_0)=0, \dots , f_m(X_0,Y_0)=0 \, . $$
Рассмотрим сначала самый простой случай: $$ f(x,y,z)=0, g(x,y,z)=0 \, . $$ Будем предполагать, что каждое из уравнений задает некоторую поверхность в $ \mathbb R^3 $. Две неявно заданные алгебраические поверхности в $ \mathbb R^3 $ могут не иметь вещественных точек пересечения. Как установить существование точек пересечения, т.е. наличие вещественных решений системы уравнений? Для полиномимальных $ f $ и $ g $ этот факт можно установить алгебраическими методами, которые проиллюстрирую на примере.
Пример. Пусть заданы две квадрики
$$ f(x,y,z):=\frac
Отложив на несколько последующих абзацев ответ на вопрос, как эти координаты найдены, займемся задачей нахождения касательной к кривой $ \mathbf K_1 $ в указанной точке.
Докажем, что в окрестности точки кривую $ \mathbf K_1 $ можно представить параметрически $$ x=\varphi_1 (z),\ y= \varphi_2 (z), z= z \, . $$ Действительно, матрица Якоби $$ \mathbf J=\left(\begin
А теперь проверим полученный результат альтернативным алгоритмом, задействовав технологию исключения переменных (которую мы уже использовали в предыдущем ПУНКТЕ). Cоставив результант полиномов $ f $ и $ g $ по переменной $ y $, придем к уравнению $$ F(x,z)=0 $$ при $$ F(x,z):=\mathcal R_y(f,g)= $$ $$ =\frac<425850289><81>x^4+\frac<240241528><9>x^3z+\frac<4457694952><75>x^2z^2+\frac<1396604256><25>\,xz^3+\frac<23733568656><625>z^4+ $$ $$ +\frac<139478087> <3>x^3+\frac<528311126> <3>x^2 z+\frac<4561868172> <25>x z^2+\frac<3536887608> <25>z^3- $$ $$ -\frac<12342564733><72>x^2-\frac<1212320819><2>xz-\frac<9754043781><10>z^2-\frac<17191161915><16>x-\frac<20624138805><8>z+\frac<1192935588625> <256>\, . $$ Имеем: $ \deg_x F=4 $, т.е. уравнение $ F(x,z)=0 $ разрешимо в радикалах относительно $ x $. По крайней мере, теоретически, функцию $ \varphi_1(z) $ можно представить в виде конечной комбинации элементарных функций и корней второй и третьей степеней от коэффициентов полинома. Реальное же представление для $ \varphi_1(z) $ крайне громоздко и, с точки зрения практического использования, неконструктивно.
Уравнение четвертой степени может иметь от нуля до четырех вещественных корней в зависимости от значений $ z $. При подстановке конкретного значения $z =z_0 \in \mathbb R $ получаем полином $ F(x,z_0) $ от одной переменной $ x $. Мы можем однозначно и чисто алгебраическим алгоритмом установить число его вещественных корней. Так, $$ F(x,3)\equiv \frac<425850289><81>x^4+126573205 x^3+\frac<1605258018107><1800>x^2+\frac<20614103217><80>x-\frac<793132431560159> <160000>$$ имеет два вещественных корня $ \approx -3.309237 $ и $ \approx 1.959148 $. Второй из них мы и взяли выше в качестве $ x_0 $. Таким образом, для $ \varphi_1(z) $ мы получили представление в виде неявной функции $ F(x,z)=0 $ при заданном значении $ \varphi_1(z_0)=x_0 $. Но тогда для этой функции должна работать теорема 1, которая дает представление $$ \varphi_1^<\prime>(z_0)= -\frac<\partial F /\partial z> <\partial F /\partial x>\Bigg|_<_<(x_0,z_0)>> \, . $$ Результат совпадает с полученным выше.
Понятно, что для получения $ \varphi_2(z) $ мы должны произвести процедуру исключения переменной $ x $ из системы $ f=0,g=0 $, т.е. вычислить результант $ G(y,z):=\mathcal R_x(f,g) $. Далее найти корень полинома $ G(y,z_0) $ (выбрав тот из них, что соответствует уже найденном у значению $ x_0 $) и т.д. Убеждаемся, что $$ \varphi_2^<\prime>(z_0)= -\frac<\partial G /\partial z> <\partial G /\partial y>\Bigg|_<_<(y_0,z_0)>> \, . $$
Вопроc: какая же связь между матрицей Якоби и результантами $ \mathcal R_x(f,g), \mathcal R_y(f,g) $ приводит — в результате применения двух различных алгоритмов — к совершенно разным представлениям для $ \varphi_1^<\prime>(z_0), \varphi_2^<\prime>(z_0) $, имеющим, тем не менее, одинаковые значения? ♦
Если система полиномов
$$\
Геометрические приложения
Теорема. Пусть на плоскости заданы две кривые уравнениями
$$ f(x,y)=0 \quad u \quad g(x,y)=0 \ $$ и они пересекаются в точке $ (x_<0>,y_0) $. Тогда величина угла $ \gamma $, под которым происходит это пересечение вычисляется по формуле $$ \operatorname
Утверждение следует из свойства градиента: вычисленный в точке кривой, он определяет направляющий вектор нормали к этой кривой.
Если $ (x_<0>,y_0) $ — точка пересечения кривых $ f(x,y)=0 $ и $ g(x,y)=0 $, то
Показать, что если функции $ u_<>(x,y) $ и $ v_<>(x,y) $ связаны соотношениями Коши-Римана (Даламбера-Эйлера):
$$ \frac<\partial u> < \partial x>\equiv \frac<\partial v> < \partial y>, \frac<\partial u> < \partial y>\equiv — \frac<\partial v> < \partial x>$$ в некоторой области $ \mathbb_<> $, то в этой области их линии уровня, то есть кривые $ u(x,y) = c_1 $ и $ v(x,y) = c_2 $ при $ \
Решение системы нелинейных уравнений
Рассмотрим систему двух вещественных алгебраических уравнений $$ f(x,y)=0, \ g(x,y)=0 \, . $$ По аналогии с методом Ньютона решения уравнения от одной неизвестной, попробуем найти вещественное решение этой системы, сгенерировав итерационную последовательность в $ \mathbb R^2 $, сходящуюся к этому решению. Допустим, что из каких-то соображений нам удалось установить, что вещественное решение системы существует, и что некоторая точка $ (x_0, y_0) $ достаточно близка к этому решению. Раскладываем полиномы по формуле Тейлора по степеням $ x-x_0, y-y_0 $ и оставляем в этих разложениях только первые слагаемые: $$ f(x,y)\equiv f(x_0,y_0)+ \frac<\partial f><\partial x>\Bigg|_<(x_0,y_0)>(x-x_0)+\frac<\partial f><\partial y>\Bigg|_<(x_0,y_0)>(y-y_0) + \dots \, , $$ $$ g(x,y)\equiv g(x_0,y_0)+ \frac<\partial g><\partial x>\Bigg|_<(x_0,y_0)>(x-x_0)+\frac<\partial g><\partial y>\Bigg|_<(x_0,y_0)>(y-y_0) + \dots \, . $$ Теперь вместо системы нелинейных уравнений рассматриваем систему $$ \left\< \begin
Подробнее о методе Ньютона решения систем нелинейных уравнений ☞ ЗДЕСЬ.
13.3 Матрица Якоби
Рассмотрим отображение $f : E \longmapsto R^m,$ где $E \subset R^n.$ Оно состоит из $m$ функций: $f = \left(f_1 \left(x_1,\ldots,x_n \right),f_2 \left(x_1,\ldots,x_n \right),\ldots,f_m \left(x_1,\ldots,x_n \right) \right),$ которые осуществляют отображение множества $E$ из $R^n$ в пространство $R^m.$
Предположим, что функции $f_k \left(x_1,\ldots,x_n \right),$ где $k = \overline<1,m>,$ дифференцируемы, то есть имеют частные производные по аргументам $(x_1,\ldots,x_n):$
Составим матрицу из этих частных производных по переменным $x_1,\ldots,x_n$
Такая матрица называется матрицей Якоби.
Если $m = n,$ то получаем квадратную матрицу, определитель которой называется определителем Якоби или якобианом $Jf(x)$ и обозначается
Замечание. Если все частные производные непрерывны, то и сам оределитель Якоби является непрерывной функцией.
Теорема. Якобиан тождественно равен нулю в некоторой области $\mathbb$:
тогда и только тогда, когда между функциями $f_1,f_2,\ldots,f_n$ имеется функциональная зависимость в $\mathbb,$ то есть существует функция $G \left(y_1,y_2,\ldots,y_n \right) \not \equiv 0$ такая, что
$G \left(f_1(x),f_2(x),\ldots,f_n(x) \right) \equiv 0$ при всех $x = (x_1, \ldots, x_n) \in \mathbb.$
Пример 1. Являются ли функции функционально зависимыми?
\begin
$\frac
$=\begin
Так как якобиан равен нулю, то эти функции функционально зависимы. Несложно найти эту зависимость:
$\left(f_1 + 1 \right)^2 -2\left(f_2 + 2 \right) -\left(f_3 -3\right) = 0.$
Пример 2. Для линейных функций $f_1 = a_ <11>x_1 + \ldots + a_ <1n>x_n -b_1, \ldots , f_m = a_
\begin
Если мы хотим разрешить систему $f_1 = 0,f_2 = 0, \ldots, f_n = 0$ относительно $x_1, \ldots, x_n,$ то для случая $m = n$ определитель Якоби
\begin
есть определитель системы и для её разрешимости он должен быть отличен от нуля.
Пример 3. Переход элементарной площади $dS = dx\,dy$ от декартовых координат $ \left( x,y \right)$ к полярным координатам $ \left( r,\phi \right)$:
Матрица Якоби имеет вид:
$$J(r,\phi) = \begin
Якобиан перехода от декартовых координат к полярным есть определитель матрицы Якоби:
$J(r,\phi) = \det I(r,\phi) = \det\begin
Таким образом, элемент площади при переходе от декартовых к полярным координатам будет выглядеть следующим образом:
$dS = dx\,dy = J\left(r,\phi \right) dr\,d\phi = r\,dr\,d\phi.$
Пример 4. Переход элементарного объёма $dV$=$dx$ $dy$ $dz$ от декартовых координат $\left(x,y,z \right)$ к сферическим координатам $\left(r,\theta,\phi \right)$ :
$\begin
$= \begin
А якобиан перехода от декартовых координат к сферическим – есть определитель матрицы Якоби:
$J\left(r,\theta,\phi \right) = \det I\left(r,\theta,\phi \right)$ =
= $\begin
Таким образом, элемент объёма при переходе от декартовых к сферическим координатам будет выглядеть следующим образом:
$dV = dx\,dy\,dz = J\left(r,\theta,\phi \right) dr\,d\theta\,d\phi = r^2\,\sin(\theta)\,dr\,d\theta \,d\phi.$
Магия тензорной алгебры: Часть 3 — Криволинейные координаты
Введение
Читая отзывы к своим статьям, понял, что я излишне перегрузил читателя теоретическими вводными. Прошу за это прощения, признаться честно, я сам далек от формальной математики.
Однако, тензорное исчисление пестрит понятиями, многие из которых требуется вводить формально. Поэтому третья статься цикла тоже будет посвящена сухой теории. Тем не менее, я обещаю, что в следующей работе приступлю к тому, к чему сам давно хотел — к описанию практической ценности тензорного подхода. На примете имеется интересная задача, большая часть которой в моей голове уже разобрана. Тензорное исчисление для меня не праздный интерес, а способ обработать некоторые из своих теоретических и практических соображений в области механики. Так что практика по полной программе ещё предстоит.
А пока что рассмотрим некоторые теоретические основы. Добро пожаловать под кат.
1. Матрица Якоби и локальная метрика. «Жонглирование» индексами
Те системы координат, что мы рассматривали до сих пор были косоугольными. Но их оси были прямыми линиями. Однако, крайне часто приходится работать в пространстве, координатные линии которого — кривые. Такая система координат называется криволинейной.
Простейший жизненный пример криволинейной системы координат — географические координаты — широта, долгота и высота над уровнем моря, по которой определяется положение объектов вблизи поверхности Земли. Криволинейные координаты широко применяются в астрономии. В механике примером таких координат могут служить обобщенные координаты механической системы, однозначно определяющие её положение в пространстве с учетом геометрии наложенных на систему связей. На этом и строится аналитическая механика.
Рис. 1. Криволинейные координаты в трехмерном пространстве
Рассмотрим криволинейные координаты, заданные в трехмерном евклидовом пространстве (рисунок 1). Пусть положение точки задается в этих координатах вектором
и декартовы координаты точки связаны с (1) соотношением
или, в компонентной форме
Рассмотрим частную производную . Результат такого дифференцирования — это вектор, направленный по касательной к координатной линии . Дифференцируя (2) по всем криволинейным координатам получим тройку векторов
Эти векторы задают базис так называемого касательного пространства. И в отличие от базиса в косоугольной системе координат, модуль и направление этих векторов будут изменятся при переходе от одной точки к другой. Мы получаем переменный базис, зависящий от положения в пространстве, заданного вектором (1). Такой базис называется локальным
Векторы (4) собирают в матрицу
которая называется матрицей Якоби, и по сути определяется как производная от одного вектора по другому вектору. В нашем случае
Легко догадаться, что если функция (2) линейна относительно компонент вектора , то её можно выразить матричным соотношением
то мы рассматриваем косоугольную систему координат, и матрица Якоби будет равна матрице преобразования от косоугольных координат к декартовым
Теперь, любой вектор, заданный в пространстве (тензор ранга (1, 0)) можно представить через его контравариантные компоненты в криволинейной системе координат
Однако, компоненты вектора, из-за переменного базиса, будут зависеть от положения в пространстве точки приложения вектора. Кроме того, для того чтобы представление (6) существовало, надо чтобы векторы, составляющие базис были не компланарны. Из курса векторной алгебры нам известно, что векторы некомпланарны, если их смешанное произведение отлично от нуля. Отсюда возникает условие, которому должен удовлетворять определитель матрицы Якоби
Данный определитель как раз определяет смешанное произведение векторов базиса.
Теперь вычислим ковариантные компоненты вектора . Для этого, в самой первой статье цикла, мы умножали вектор скалярно на соответствующий вектор базиса
В той же, первой статье, мы определили, что ковариантные компоненты вектора связаны с контравариантными через метрический тензор
Сравнивая два последних выражения мы получаем определение метрического тензора в криволинейных координатах
которое можно представить в матричной форме
Эту связь можно представить и в тензорной форме, но для этого придется ввести явно метрику для декартовых координат
Тогда, преобразование декартовой метрики в криволинейную будет выглядеть так
Выражение (8) вводит метрический тензор для криволинейных координат. Этот тензор зависит от положения точки в пространстве, поэтому говорят что он задан локально или определяет локальную метрику
Определившись с метрикой, мы можем записать правила преобразования контравариантных координат в ковариантные
и ковариантных координат в контравариантные
В тензорном исчислении операции опускания (9) и поднятия (10) индексов называют «жонглированием» индексами.
Выписав соотношения (9) и (10) мы подразумевали, что матрицы и взаимно обратимы. Это возможно лишь в том случае, если
Данное условие выполняется для криволинейных координат, если матрица Якоби не вырождена, и это непосредственно следует из (8), так как
то есть условие (7) выполняемое для всех точек пространства — достаточное условие невырожденности локальной метрики.
Рассмотрение вырожденнных метрик, это отдельный и сложный вопрос, поэтому мы ограничимся метриками, в которых матрица метрического тензора обратима, то есть выполняется условие
2. Взаимный базис
Введем векторы , получаемые из векторов исходного базиса путем поднятия индекса
Теперь возьмем и умножим (11) скалярно на вектор
но, мы знаем, что — метрический тензор, поэтому, приходим к уравнению
Если мы возьмем, например, вектор , то в силу (12) он перпендикулярен векторам и (его скалярное произведение с ними равно нулю), а скалярное произведение этого вектора на — равно единице
Дальше возьмем и умножим (11) скалярно на
и в силу (12) это дает контравариантный метрический тензор
Система векторов тоже образует базис, который называют взаимным или сопряженным с базисом .
Снова рассмотрим вектор . Из соотношений (10) и (11) следует цепочка преобразований
Умножим (13) скалярно на
приходим к заключению, что любой вектор может быть разложен как по базису — тогда его компоненты будут контравариантные, так и по базису — компоненты будут ковариантными
При этом, ковариантные компоненты — это скалярные произведение вектора на векторы базиса , а контравариантные компоненты — скалярные произведения вектора на векторы базиса
что ещё раз иллюстрирует взаимность этих базисов.
Тут надо отметить, что векторы базиса получаются естественным путем — они касательны соответствующим координатным линиям и им можно приписать геометрический смысл. Что касается базиса , то его векторы не направлены по касательной координатным линиям, а перпендикулярны парам векторов касательного базиса. Такой базис иногда принято называть неголономным
3. Преобразование криволинейных координат. Формальное определение ковариантных и контравариантных компонент
Допустим, что мы работаем в криволинейной система координат, определенной вектором . Перейдем к другой системе координат, положение точек которой определяется вектором , таким, что преобразование от старой системы координат к новой определяется уравнениями
Будем считать преобразование (16) обратимым, то есть допустим существование функции
Для этого требуется, чтобы определитель матрицы Якоби
был отличен от нуля
Тогда существует матрица , обратная матрице (18), такая, что
Матрица является матрицей Якоби для преобразования (17). Тогда можно вычислить векторы нового базиса
Получаем связь между старым базисом и новым
Разложим вектор в новом базисе
и используя соотношение (19), напишем
С учетом того, что векторы базиса линейно независимы, приравниваем коэффициенты при них в (21)
Теперь умножим обе части (21) на
То есть, получаем формулу обратного преобразования контравариантных компонент
Контравариантные компоненты вектора преобразуются оператором, обратным оператору преобразования базиса
Действительно, чтобы получить векторы нового базиса, мы использовали матрицу по формуле (19). Чтобы получить контравариантные компоненты заданного в новом базисе вектора мы используем матрицу
А теперь посмотрим, как преобразуется вектор, заданный своими ковариантными компонентами
Ковариантные компоненты вектора преобразуются тем же оператором, которым осуществляется преобразование базиса
Тензор ранга (1,0) преобразуется оператором обратным, используемому при преобразовании базиса, а тензор ранга (0,1) преобразуется тем же самым оператором, что используется при преобразовании базиса.
4. Ковариантная производная. Символы Кристоффеля 2-го рода
Предположим, что мы хотим продифференцировать вектор, заданный произвольными координатам по какой-то из координат. Что мы должны сделать? Давайте попробуем выполнить эту операцию
На каком основании мы выписали производную от базисного вектора? А на том основании, что базис в криволинейных координатах зависит от них, а значит его производная от координаты отлична от нуля. Ну и ладно, эта производная тоже будет вектором, а значит её можно разложить по локальному базису, например вот так
Найдем коэффициенты разложения в (25). Для этого, возьмем ковариантный метрический тензор и продифференцируем его по указанной координате
Подставим (25) в (26)
Здесь очевидно присутствие компонент метрического тензора, поэтому выполняем замену
Прежде чем начать работать с (27), скажем, что искомые коэффициенты разложения симметричны относительно нижних индексов, так как проведя прямое дифференцирования базисного вектора приходим к выражению
откуда, в силу непрерывности рассматриваемых функций, заключаем, что
Теперь, в (27) переставим индексы i и k
А теперь, переставим в (27) индексы j и k
Теперь сложим (29) и (30) учтя при этом симметричность (28)
Вычитаем (27) из (31), снова учитывая (28)
Умножаем (32) на , и получаем окончательно
Выражение (33) определяет так называемый символ Кристоффеля 2-го рода. Тогда
Выражение, стоящее в скобках в (34) называется ковариантной производной контравариантных компонент вектора
Исходя из (35) мы должны понимать, что пытаясь дифференцировать по криволинейной координате, мы обязаны учитывать зависимость базиса от координат. Если метрика не зависит от положения точки приложения вектора в пространстве, то (35) превращается в частную частную производную, ибо все символы Кристоффеля равны будут нулю, из-за того что метрический тензор не зависит от координат. В любой косоугольной системе координат, и в их частном случае — декартовых координатах, символы Кристоффеля, согласно (33) равны нулю. А значит, согласно (35) ковариантрая производная от вектора по координате будет совпадать с его частной производной по этой координате, к чему мы приучены вобщем-то давно. Но если бы (33) был тензором, то он, будучи равен нулю, остался бы нулевым в любой другой системе координат. Но в криволинейных координатах (33) нулю не равны. А значит символы Кристоффеля не являются тензором. При преобразовании системы координат меняются компоненты, но не сущность тензора. Нулевой тензор должен быть таковым в любой системе координат.
Заключение
Первичные теоретические основы разобраны. Со следующей статьи мы уйдем в практику использования тензорного исчисления для решения конкретных задач. Спасибо Вам за оказанное мне внимание и доверие.
http://ib.mazurok.com/2019/06/14/jacobian-matrix-and-determinant/
http://habr.com/ru/post/261717/