Неявные функции
Неявные функции, определяемые одним уравнением.
Пусть функция \(F(x,y)\) определена в \(R^2\). Рассмотрим уравнение
$$
F(x,y)=0.\label
$$
Множество \(G_F\) точек плоскости, координаты которых удовлетворяют уравнению \eqref
Так, график уравнения \(x^2 + y^2 — 1 = 0\) есть окружность, график уравнения \((x-1)(x+y-1)=0\) есть пара прямых \(x = 1\) и \(x+y-1=0\) (рис. 28.1).
Рис. 28.1
Если график \(G_F\) уравнения \eqref
Но, как правило, график уравнения \eqref
Меняя местами переменные \(x\) и \(y\), можно говорить о том, что уравнение \eqref
Докажем теорему, дающую достаточные условия существования, непрерывности и дифференцируемости неявной функции, определяемой уравнением \eqref
- функция \(F(x,y)\) имеет в окрестности точки \((x_0,y_0)\) непрерывные частные производные \(F_x(x,y)\) и \(F_y(x,y)\);
- \(F(x_0,y_0)=0\);
- \(F_y(x_0,y_0)\neq 0\).
Тогда существует прямоугольник
$$
K = \<(x,y): \; x_0-a\leq x\leq x_0+a, \; y_0-b\leq y\leq y_0+b\>,\nonumber
$$
в котором уравнение \(F(x,y) = 0\) определяет \(y\) как неявную функцию \(x\). Функция \(y=f(x)\) непрерывно дифференцируема на интервале \((x_0-a,x_0+a)\) и
$$
f'(x)=-\frac
$$
\(\circ\) Разобьем доказательство на два пункта.
Доказательство существования неявной функции. Из условия \(F_y(x_0,y_0)\neq 0\) следует, что либо \(F_y(x_0,y_0) > 0\), либо \(F_y(x_0,y_0) 0.\label
$$
Если \(F_y(x_0,y_0) 0\).
Так как функция \(F_y(x,y)\) в точке \((x_0,y_0)\) непрерывна и в силу условия \eqref
$$
K_1=\<(x,y): \; |x-x_0|\leq a_1, \; |y-y_0|\leq b\>,\nonumber
$$
в котором функция \(F_y(x,y) > 0\).
Рис. 28.3
Рассмотрим функцию одной переменной
$$
\psi (y)=F(x_0,y),\quad y_0-b\leq y\leq y_0+b.\nonumber
$$
Функция \(\psi (y)\) строго возрастает на отрезке \([y_0-b,y_0+b]\), так как
$$
\psi'(y)=F_y(x_0,y) > 0.\nonumber
$$
Кроме того, в силу условия \(F(x_0,y_0)=0\)
$$
\psi (y_0) = F(x_0,y_0) = 0.\nonumber
$$
Поэтому
$$
\psi (y_0-b)= F(x_0,y_0-b) 0.\label
$$
Неравенства \eqref
$$
F(x,y_0-b) 0.\label
$$
Покажем, что в прямоугольнике
$$
K=\<(x,y): \; |x-x_0|\leq a, \; |y-y_0|\leq b\>,\nonumber
$$
уравнение \(F(x,y) = 0\) определяет \(y\) как неявную функцию \(x\).
Возьмем любую точку \(x^*\in [x_0-a,x_0+a]\) и рассмотрим непрерывную на отрезке \([y_0-b,y_0+b]\) функцию одной переменной \(\varphi (y)=F(x^*,y)\). В силу условия \eqref
$$
\varphi(y_0-b)= F(x^*,y_0-b) 0.\nonumber
$$
По теореме Коши о промежуточных значениях найдется такая точка \(y^*\in [y_0-b,y_0+b]\), что
$$
\varphi(y^*) = F(x^*,y^*)=0.\nonumber
$$
Так как \(\varphi'(y) = F_y(x^*,y) > 0\), то функция \(\varphi(y)\) строго возрастает на отрезке \([y_0-b,y_0+b]\) и не может обратиться на этом отрезке в нуль более одного раза.
Таким образом, для любого \(x\in [x_0-a,x_0+a]\) найдется единственный \(y\in [y_0-b,y_0+b]\) такой, что \(F(x,y) = 0\). Это означает, что в прямоугольнике \(K\) уравнение \(F(x,y) = 0\) определяет \(y\) как неявную функцию \(x\).
Доказательство непрерывной дифференцируемости неявной функции. Непрерывная на замкнутом прямоугольнике \(K\) функция \(F_y(x,y)\) по теореме Вейерштрасса принимает на этом прямоугольнике свое наименьшее значение \(\alpha\). Так как \(F_y(x,y) > 0\) на \(K\), то
$$
F_y(x,y)\geq a > 0,\qquad (x,y)\in K.\label
$$
Непрерывная на \(K\) функция \(F_x(x,y)\) ограничена на \(K\). Поэтому
$$
|F_x(x,y)| Замечание 1.
Если известно, что уравнение \(F(x,y)=0\) определяет в прямоугольнике \(a\leq x\leq b, \; c\leq y\leq d\) переменную \(y\) как неявную функцию \(x\), то связь между \(dy\) и \(dx\) можно установить, формально дифференцируя тождество \(F(x,y(x)) = 0\). Воспользовавшись инвариантностью формы дифференциала, получаем
$$
F_x(x,y)dx + F_y(x,y)dy = 0.\nonumber
$$
Дифференцируя последнее тождество еще раз, можем найти второй дифференциал \(d^2y\)
$$
F_
$$
Неявные функции, определяемые системой уравнений.
Рассмотрим систему \(m\) уравнений с \(n+m\) неизвестными
$$
\left\<\begin
$$
При формулировке общей теоремы о неявных функциях удобно пользоваться понятием декартова произведения множеств. Если \(A\) и \(B\) — произвольные множества, то их декартово произведение \(A\times B\) есть множество пар \((x,y)\), где \(x\in A\), \(y\in B\). Так, декартово произведение \([a,b]\times [c,d]\) есть множество пар вещественных чисел таких, что \(a\leq x\leq b,\) и \(c\leq y\leq d\), то есть прямоугольник в \(R^2\).
Клеточной окрестностью точки \(x^0 =(x_1^0,\ldots,x_n^0)\) будем называть следующее множество:
$$
K(x^0)=\
$$
где \(\varepsilon_i, \; i =\overline<1,n>\) — положительные числа, \(x = (x_1,…,x_n)\).
Легко видеть, что в том случае, когда \(K_1(x^0)\subset R^n\) и \(K_2(y^0)\subset R^m\) — клеточные окрестности, их декартово произведение \(K_1(x^0)\times K_2(y^0)\) есть клеточная окрестность точки \((x^0,y^0)=(x_1^0,…,x_n^0,y_1^0,…,y_m^0\) в пространстве \(R^
Для дальнейшего удобно преобразовать переменные, полагая \(x=(x_1,…,x_n), \; y=(y_1,…,y_m)\), где \(y_1=x_
Тогда систему уравнений \eqref
$$
F_i(x,y) = 0, \; i=\overline<1,m>.\label
$$
Функции \(F_i(x,y) = 0\) будем считать определенными в некоторой клеточной окрестности точки \((x^0,y^0)\).
Пусть \(K(x^0)\subset R^n\) и \(Q(y_0)\subset R^m\) есть клеточные окрестности. Будем говорить, что система уравнений \(F_i(x,y)=0, \; i=\overline<1,m>\), определяет в \(K(x^0)\times Q(y_0)\) переменные \(y_1,…,y_m\) как неявные функции переменных \(x_1,…,x_n\), если для любого \(x\in K(x^0)\) найдется единственный \(y\in Q(y^0)\) такой, что \(F_i(x,y) = 0, \; i=\overline<1,m>\).
Пусть выполнены следующие условия:
Тогда найдутся клеточные окрестности \(K(x^0) \subset R^n\) и \(Q(y^0) \subset R^m\) такие, что в \(K(x^0)\times Q(y^0)\) система уравнений \eqref
\(\circ\) Воспользуемся методом индукции по числу уравнений \(m\). При \(m=1\) доказательство теоремы 2 не отличается от доказательства теоремы 1 (в дальнейшем будем ссылаться на этот частный случай теоремы 2 как на теорему 1).
Предположим, что утверждение теоремы верно в том случае, когда система \eqref
Так как определитель \eqref
$$
<\begin
$$
(Здесь и в дальнейшем символ \(0\) означает, что значение соответствующей функции берется для аргументов с верхним индексом \(0\)).
Тогда в силу индукции найдутся такие клеточные окрестности
$$
\begin
Существует несколько способов доказательства теоремы о неявных функциях. Предложенный способ является, по-видимому, наиболее простым, но обладает двумя недостатками: не дает алгоритма для вычисления неявной функции и не обобщается на бесконечномерный случай.
Локальная обратимость регулярного отображения.
Пусть на множестве \(E\subset R^n\) заданы \(n\) функций
$$
f_1(x),…,f_n(x).\nonumber
$$
Они задают отображение \(f: \; E\rightarrow R^n\), которое каждой точке \(x\in E\) ставит в соответствие точку \(y=f(x)\), где
$$
y_1=f_1(x),\quad,…,\quad y_n=f_n(x).\nonumber
$$
Точка \(y=f(x)\) называется образом точки \(x\) при отображении \(f\). Точка \(x\) называется прообразом точки \(y\).
Если \(\Omega\subset E\), то множество
$$
f(\Omega)=\
$$
называется образом множества \(\Omega\) при отображении \(f\). Если \(\omega\subset f(E)\), то множество
$$
f^<-1>(\omega)=\
$$
называется прообразом множества \(\omega\).
Пусть \(G \subset R^n\) есть открытое множество. Отображение \(f: \; G\rightarrow R^n\) называется непрерывным в точке \(x^0\), если \(\forall \varepsilon > 0 \; \exists\delta > 0\) такое, что \(\forall x\) таких, что \(\rho(x,x^0) Лемма 1.
Если \(G\) есть открытое множество, а \(f: \; G\rightarrow R^n\) — непрерывное отображение, то прообраз каждого открытого множества \(\omega\in f(G)\) есть открытое множество.
\(\circ\) Пусть \(\Omega= f^<-1>(\omega)\). Возьмем любую точку \(x^0\in\Omega\). Тогда \(f(x^0)=y^0\in \omega\). Так как множество \(\omega\) открыто, то найдется окрестность \(S_<\varepsilon>(y^0)\in \omega\). В силу непрерывности отображения \(f\) в точке \(x^0\) найдется шаровая окрестность \(S_<\delta>(x^0)\), для которой выполнено условие \eqref
Следовательно,
$$
S_<\delta>(x^0)\subset f^<-1>(\omega)\subset\Omega,\nonumber
$$
и \(\Omega\) — открытое множество. \(\bullet\)
Как обычно, под окрестностью \(A(x^0)\) точки \(x^0\) будем понимать любое множество \(A\), для которого точка \(x^0\) внутренняя.
Пусть \(G \subset R^n\) — открытое множество. Отображение \(f: \; G\rightarrow R^n\) будем называть непрерывно дифференцируемым, если функции \(f_1(x),…,f_n(x)\), задающие это отображение, непрерывно дифференцируемы в \(G\). Непрерывно дифференцируемое отображение \(f: \; G\rightarrow R^n\) будем называть регулярным, если в области \(G\) якобиан отображения \(j_f(x)\neq 0\). Якобианом отображения \(j_f(x)\) называется следующий функциональный определитель:
$$
j_f(x)=\begin
$$
Пусть \(G\) — открытое множество в \(R^n\), а отображение \(f: \; G\rightarrow R^n\) регулярно. Тогда в каждой точке \(x^0\in G\) оно локально регулярно обратимо, то есть \(\forall x^0\in G\) найдутся такие окрестности \(A(x^0) \subset G\) и \(B(y^0)\subset f(G)\), где \(y^0= f(x^0)\), что отображение \(f: \; A(x^0)\rightarrow B(y^0)\) будет взаимно однозначным, причем обратное отображение \(f^<-1>: \; B(y^0)\rightarrow A(x^0)\) регулярно.
\(\circ\) Рассмотрим в \(G\times R^n\) систему уравнений
$$
F_i(x,y)\equiv y_i-f_i(x)=0,\quad i=\overline<1,n>.\label
$$
Пусть \(x^0\) — произвольная точка множества G и \(y^0=f(x^0)\). Тогда функции \(F_i(x,y)\) непрерывно дифференцируемы в \(G\times R^n\) и \(y_i^0= f_i(x^0), \; i=\overline<1,n>\). Так как отображение \(f\) регулярно, то Если \(f: \; G\rightarrow R^n\) есть регулярное отображение, то образ любого открытого множества \(\Omega\subset G\) есть открытое множество. \(\circ\) Пусть \(\omega=f(\Omega)\). Возьмем произвольную точку \(y^0\in\omega\) и пусть \(x^0\) есть какой-то ее прообраз. Тогда, вследствие теоремы 3, найдутся такие окрестности \(A(x^0) \subset \Omega\) и \(B(y^0) \subset \omega\); что отображение \(f: \; A(x^0)\rightarrow B(y^0)\) регулярно обратимо. Поэтому каждая точка \(y^0\in\omega\) принадлежит \(\omega\) вместе с некоторой окрестностью \(B(y^0)\). Множество \(\omega=f(\Omega)\) открыто. \(\bullet\) Пусть функция задана неявным образом с помощью уравнения Для доказательства рассмотрим функцию как сложную функцию от переменной : Перепишем уравнение (4), используя другие обозначения: Поскольку производная правой части уравнения (4) равна нулю, то Дифференцируя, аналогичным образом, уравнение (5), мы получим уравнение, содержащее производную третьего порядка : Продолжая дифференцирование, можно найти производную любого порядка. Найдите производную первого порядка от функции, заданной неявно уравнением: Находим производную по формуле (2): Перенесем все переменные в левую часть, чтобы уравнение приняло вид . Находим производную по , считая постоянной. Находим производную по переменной , считая переменную постоянной. По формуле (2) находим: Мы можем упростить результат если заметим, что согласно исходному уравнению (П.1), . Подставим : Решим этот пример вторым способом. Для этого найдем производную по переменной левой и правой частей исходного уравнения (П1). Подставим (из уравнения (П1)): Найти производную второго порядка от функции , заданной неявно с помощью уравнения: Дифференцируем исходное уравнение, по переменной , считая что является функцией от : Дифференцируем исходное уравнение (П2.1): Чтобы найти производную второго порядка, дифференцируем уравнение (П2.2). ; Найти производную третьего порядка при от функции , заданной неявно с помощью уравнения: Дифференцируем исходное уравнение по переменной считая, что является функцией от . Дифференцируем уравнение (П3.2) по переменной . Из уравнений (П3.2), (П3.3) и (П3.4) находим значения производных при . Автор: Олег Одинцов . Опубликовано: 16-02-2017 Методы численного решения ОДУ, с которыми мы познакомились в первом разделе этого курса (метод Эйлера, метод средней точки и т. п.), называются «явными» методами. Однако иногда система ОДУ может стать «жесткой», а решать такие системы явными методами неудобно. В этом случае желательно изменить формулировку задачи так, что не пришлось иметь дело с жесткой системой. Но это не всегда возможно, поэтому вы должны уметь решать жесткие ОДУ. Для этого, как правило, используют методы решения, которые называются «неявными». Во-первых, в чем смысл и причина появления жестких уравнений? Давайте рассмотрим пример, который часто возникает в динамике. Предположим, что у нас есть частица, с координатами \((x(t),y(t))\) , и предположим, что мы хотим, чтобы ее \(y\) -координата всегда оставалась равной нулю. Один из способов добиться этого — добавить слагаемое \(-ky(t)\) , к производной \(\dot (Кроме того, мы предполагаем, что частица не запускается из \(y_0=0\) ). В результате частица будет сильно притягиваться к прямой \(y = 0\) , и менее сильно — к \(x = 0\) . Если решать ОДУ на достаточно продолжительном интервале времени, то частица рано или поздно попадет в точку \((0, 0)\) и останется в ней. Теперь предположим, что для решения уравнения мы используем метод Эйлера. Если сделать шаг размера \(h\) , то получим Если мы посмотрим на \(у\) -компоненту этого уравнения, то увидим, что при \(|1-hk|>1\) , вычисленное нами \(y_ Теперь, если \(k\) – большое число, мы вынуждены делать очень маленькие шаги. Это означает, что частица будет двигаться к \((0,0)\) мучительно медленно. Даже если взять \(y_0\) очень близким к нулю, то придется делать настолько маленькие шаги, что изменение \(x\) -координаты будет практически незаметно. Вот так выглядит жесткое ОДУ. В данном случае жесткость возникает из-за слишком большого \(k\) , призванного удержать частицу возле прямой \(у = 0\) . Позже, когда мы будем рассматривать частицы, соединенные пружинами, мы увидим то же самое явление: от жесткости пружины и происходит термин «жесткое» ОДУ. Даже если мы используем более совершенный численный метод, такой как метод Рунге-Кутта 4-го порядка, это лишь слегка улучшит ситуацию с выбором величины шага, но мы все равно будем иметь серьезные вычислительные проблемы. Теперь, как мы уже говорили выше, нужно попытаться переформулировать свою задачу так, чтобы избежать появления жесткого ОДУ. Если же это не получится, то нужно использовать неявный метод решения ОДУ. Метод, который мы покажем ниже, является самым простым из неявных методов. Он основан на том, что шаг обычного метода Эйлера выполняется «наоборот». Пусть дано дифференциальное уравнение Формула явного метода Эйлера продвигает систему вперед на шаг \(h\) во времени. Для жестких систем, однако, удобнее заменить эту формулу на следующую То есть, нам нужно вычислить \(f\) в точке, в которую мы стремимся попасть ( \(\textbf Чтобы справиться с этим, заменим \(f (\textbf Теперь заменим \(f(\textbf (Заметим, что поскольку \(f(\textbf Разделим обе части последнего соотношения на \(h\) и перепишем результат в виде где \(I\) — единичная матрица. Разрешая это соотношение относительно \(\Delta\textbf Вычисление \(\textbf Применим теперь неявный метод для решения уравнения \eqref Дифференцирование по \(\textbf Тогда матрица \((1/h)\textbf — f^<\prime>(\textbf Обращая эту матрицу и умножая на \(f(\textbf Какова же предельная длина шага в этом случае? Ответ: нет предела! Если позволить \(h\) расти до бесконечности, мы получаем следующее Это означает, что мы достигнем \(\textbf Большинство задач динамики записывается в виде ДУ 2-го порядка Это уравнение легко преобразуется систему ДУ 1-го порядка, добавлением новых переменных. Если мы определим \(\textbf что представляет собой систему ДУ 1-го порядка. Однако, применяя обратный (неявный) метод Эйлера к уравнению \eqref Система \(n \times n\) , которая должна быть решена, получается следующим образом. Введем для краткости следующие обозначения \(\textbf Применяя к \(f\) разложение в ряд Тейлора, которое в данном контексте является функцией и \(\textbf В этом уравнении, производная \(\partial f / \partial\textbf Подставив во вторую строку последнего равенства соотношение \(\Delta\textbf Вводя единичную матрицу \(I\) и перегруппировав члены, получим соотношение из которого находим \(\Delta\textbf Выше, мы предполагали, что функция \(f\) не зависит явно от времени. Если же \(f\) зависит от времени явно (например, если \(f\) описывает изменяющиеся во времени внешние силы), то в уравнение \eqref Дмитрий Храмов http://1cov-edu.ru/mat_analiz/proizvodnaya/nayti/neyavnoy-funktsii/ http://dkhramov.dp.ua/Comp.PMBWImplicitMethodsforDifferentialEquations
$$
<\begin
$$
Для системы уравнений \eqref
$$
\begin
$$
что в \(K(x^0)\times Q(y^0)\) система уравнений \eqref
$$
\begin
$$
Пусть \(B(y^0)\) есть внутренность \(Q(y^0)\):
$$
B(y^0) = \left\Производная функции, заданной неявно
Производная первого порядка
(1) .
И пусть это уравнение, при некотором значении , имеет единственное решение . Пусть функция является дифференцируемой функцией в точке , причем
.
Тогда, при этом значении , существует производная , которая определяется по формуле:
(2) .Доказательство
.
Применим правило дифференцирования сложной функции и найдем производную по переменной от левой и правой частей уравнения
(3) :
.
Поскольку производная от постоянной равна нулю и , то
(4) ;
.Производные высших порядков
(4) .
При этом и являются сложными функциями от переменной :
;
.
Зависимость определяет уравнение (1):
(1) .
(5) .
Подставив сюда производную , получим значение производной второго порядка в неявном виде.
.
Подставив сюда найденные значения производных первого и второго порядков, найдем значение производной третьего порядка.Примеры
Пример 1
(П1) .Решение по формуле 2
(2) .
.
Отсюда .
;
;
;
.
;
;
;
.
.
.
Умножим числитель и знаменатель на :
.Решение вторым способом
.
Умножим на :
.Пример 2
(П2.1) .
;
.
Применяем формулу производной сложной функции.
.
;
.
Из исходного уравнения (П2.1) следует, что . Подставим :
.
Раскрываем скобки и группируем члены:
;
(П2.2) .
Находим производную первого порядка:
(П2.3) .
;
;
;
.
Подставим выражение производной первого порядка (П2.3):
.
Умножим на :
.
Отсюда находим производную второго порядка.Пример 3
(П3.1) .
;
;
;
;
;
;
(П3.2) ;
;
;
;
;
;
(П3.3) .
;
;
. Неявные методы решения дифференциальных уравнений
1. Неявные методы
2. Пример жесткого ОДУ
3. Решение жесткого ОДУ
4. Решение уравнений второго порядка
Ссылки
Читайте также
Комментарии
Компьютерное моделирование и все, что с ним связано: сбор данных, их анализ, разработка математических моделей, софт для моделирования, визуализации и оформления публикаций. Ну и за жизнь немного.