Для решения систем нелинейных уравнений используют

Численные методы решения систем нелинейных уравнений

Введение

Многие прикладные задачи приводят к необходимости нахождения общего решения системы нелинейных уравнений. Общего аналитического решения системы нелинейных уравнений не найдено. Существуют лишь численные методы.

Следует отметить интересный факт о том, что любая система уравнений над действительными числами может быть представлена одним равносильным уравнением, если взять все уравнения в форме , возвести их в квадрат и сложить.

Для численного решения применяются итерационные методы последовательных приближений (простой итерации) и метод Ньютона в различных модификациях. Итерационные процессы естественным образом обобщаются на случай системы нелинейных уравнений вида:

(1)

Обозначим через вектор неизвестных и определим вектор-функцию Тогда система (1) записывается в виде уравнения:

(2)

Теперь вернёмся к всеми любимому Python и отметим его первенство среди языков программирования, которые хотят изучать [1].

Этот факт является дополнительным стимулом рассмотрения числительных методов именно на Python. Однако, среди любителей Python бытует мнение, что специальные библиотечные функции, такие как scipy.optimize.root, spsolve_trianular, newton_krylov, являются самым лучшим выбором для решения задач численными методами.

С этим трудно не согласится хотя бы потому, что в том числе и разнообразие модулей подняло Python на вершину популярности. Однако, существуют случаи, когда даже при поверхностном рассмотрении использование прямых известных методов без применения специальных функций библиотеки SciPy тоже дают неплохие результаты. Иными словами, новое- это хорошо забытое старое.

Так, в публикации [2], на основании проведенных вычислительных экспериментов, доказано, что библиотечная функция newton_krylov, предназначенная для решения больших систем нелинейных уравнений, имеет в два раза меньшее быстродействие, чем алгоритм TSLS+WD
(two-step least squares), реализованный средствами библиотеки NumPy.

Целью настоящей публикации является сравнение по числу итераций, быстродействию, а главное, по результату решения модельной задачи в виде системы из ста нелинейных алгебраических уравнений при помощи библиотечной функции scipy.optimize.root и методом Ньютона, реализованного средствами библиотеки NumPy.

Возможности решателя scipy.optimize.root для численного решения систем алгебраических нелинейных уравнений

Библиотечная функция scipy.optimize.root выбрана в качестве базы сравнения, потому что имеет обширную библиотеку методов, пригодных для сравнительного анализа.

scipy.optimize.root(fun, x0, args=(), method=’hybr’, jac=None, tol=None,callback=None, ptions=None)
fun — Векторная функция для поиска корня.
x0 –Начальные условия поиска корней

method:
hybr -используется модификация Пауэлл гибридный метод;
lm – решает системы нелинейных уравнений методом наименьших квадратов.
Как следует из документации [3] методы broyden1, broyden2, anderson, linearmixing, diagbroyden, excitingmixing, krylov являются точными методами Ньютона. Остальные параметры являются «не обязательными» и с ними можно ознакомится в документации.

Методы решения систем нелинейных уравнений

Приведенный далее материал действительно можно прочитать в литературе, например в [4], но я уважаю своего читателя и для его удобства приведу вывод метода по возможности в сокращенном виде. Те, кто не любит формулы, этот раздел пропускают.

В методе Ньютона новое приближение для решения системы уравнений (2) определяется из решения системы линейных уравнений:

(3)

Определим матрицу Якоби:

(4)

Запишем(3) в виде:

(5)

Многие одношаговые методы для приближенного решения (2) по аналогии с двухслойными итерационными методами для решения систем линейных алгебраических уравнений можно записать в виде:

(6)

где — итерационные параметры, a — квадратная матрица n х n, имеющая обратную.

При использовании записи (6) метод Ньютона (5) соответствует выбору:

Система линейных уравнений (5) для нахождения нового приближения может решаться итерационно. В этом случае мы имеем двухступенчатый итерационный процесс с внешними и внутренними итерациями. Например, внешний итерационный процесс может осуществляться по методу Ньютона, а внутренние итерации — на основе итерационного метода Зейделя

При решении систем нелинейных уравнений можно использовать прямые аналоги стандартных итерационных методов, которые применяются для решения систем линейных уравнений. Нелинейный метод Зейделя применительно к решению (2) дает:

(7)

В этом случае каждую компоненту нового приближения из решения нелинейного уравнения, можно получить на основе метода простой итерации и метода Ньютона в различных модификациях. Тем самым снова приходим к двухступенчатому итерационному методу, в котором внешние итерации проводятся в соответствии с методом Зейделя, а внутренние — с методом Ньютона.

Основные вычислительные сложности применения метода Ньютона для приближенного решения систем нелинейных уравнений связаны с необходимостью решения линейной системы уравнений с матрицей Якоби на каждой итерации, причем от итерации к итерации эта матрица меняется. В модифицированном методе Ньютона матрица Якоби обращается только один раз:

(8)

Выбор модельной функции

Такой выбор не является простой задачей, поскольку при увеличении числа уравнений в системе в соответствии с ростом числа переменных результат решения не должен меняться, поскольку в противном случае невозможно отследить правильность решения системы уравнений при сравнении двух методов. Привожу следующее решение для модельной функции:

Функция f создаёт систему из n нелинейных уравнений, решение которой не зависит от числа уравнений и для каждой из n переменных равно единице.

Программа для тестирования на модельной функции c результатами решения системы алгебраических нелинейных уравнений с помощью библиотечной функции optimize.root для разных методов отыскания корней

Только один из методов, приведенных в документации [3] прошёл тестирование по результату решения модельной функции, это метод ‘krylov’.

Решение для n=100:

Вывод: С увеличением числа уравнений вдвое заметно появление ошибок в решении. При дальнейшем увеличении n решение становится не приемлемым, что возможно из-за автоматической адаптации к шагу, эта же причина резкого падения быстродействия. Но это только моё предположение.

Программа для тестирования на модельной функции c результатами решения системы алгебраических нелинейных уравнений с помощью программы написанной на Python 3 с учётом соотношений (1)-(8) для отыскания корней по модифицированному методу Ньютона

Решение для n=100:

Решение для n=200:

Solution:
[1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1. 1. 1. 1. 1.]
Newton iteration = 14
Newton method time 1.869 seconds

Чтобы убедиться в том, что программа действительно решает систему, перепишем модельную функцию для ухода от корня со значением 1 в виде:

Получим:
Solution:
[ 0.96472166 0.87777036 0.48175823 -0.26190496 -0.63693762 0.49232062
-1.31649896 0.6865098 0.89609091 0.98509235]
Newton iteration = 16
Newton method time 0.046 seconds

Вывод: Программа работает и при изменении модельной функции.

Теперь вернёмся к начальной модельной функции и проверим более широкий диапазон для n, например в 2 и 500.
n=2
Solution:
[1. 1.]
Newton iteration = 6
Newton method time 0.048 seconds
n=500

Нелинейные системы и уравнения

В более общем случае мы имеем не одно уравнение (1), а систему нелинейных уравнений $$ \begin \tag <2>f_i(x_1, x_2, \ldots, x_n) = 0, \quad i = 1, 2, \ldots n. \end $$ Обозначим через $ \mathbf = (x_1, x_2, \ldots, x_n) $ вектор неизвестных и определим вектор-функцию $ \mathbf(\mathbf) = (f_1(\mathbf), f_2(\mathbf), \ldots, f_n(\mathbf)) $. Тогда система (2) записывается в виде $$ \begin \tag <3>\mathbf(\mathbf) = 0. \end $$ Частным случаем (3) является уравнение (1) ($ n = 1 $). Второй пример (3) — система линейных алгебраических уравнений, когда $ \mathbf (\mathbf) = A \mathbf — \mathbf $.

Метод Ньютона

Решение нелинейных уравнений

При итерационном решении уравнений (1), (3) задается некоторое начальное приближение, достаточно близкое к искомому решению $ x^* $. В одношаговых итерационных методах новое приближение $ x_ $ определяется по предыдущему приближению $ x_k $. Говорят, что итерационный метод сходится с линейной скоростью, если $ x_ — x^* = O(x_k — x^*) $ и итерационный метод имеет квадратичную сходимость, если $ x_ — x^* = O(x_k — x^*)^2 $.

В итерационном методе Ньютона (методе касательных) для нового приближения имеем $$ \begin \tag <4>x_ = x_k + \frac, \quad k = 0, 1, \ldots, \end $$

Вычисления по (4) проводятся до тех пор, пока $ f(x_k) $ не станет близким к нулю. Более точно, до тех пор, пока $ |f_(x_k)| > \varepsilon $, где $ \varepsilon $ — малая величина.

Простейшая реализация метода Ньютона может выглядеть следующим образом:

Чтобы найти корень уравнения $ x^2 = 9 $ необходимо реализовать функции

Данная функция хорошо работает для приведенного примера. Однако, в общем случае могут возникать некоторые ошибки, которые нужно отлавливать. Например: пусть нужно решить уравнение $ \tanh(x) = 0 $, точное решение которого $ x = 0 $. Если $ |x_0| \leq 1.08 $, то метод сходится за шесть итераций.

Теперь зададим $ x_0 $ близким к $ 1.09 $. Возникнет переполнение

Возникнет деление на ноль, так как для $ x_7 = -126055892892.66042 $ значение $ \tanh(x_7) $ при машинном округлении равно $ 1.0 $ и поэтому $ f^\prime(x_7) = 1 — \tanh(x_7)^2 $ становится равной нулю в знаменателе.

Проблема заключается в том, что при таком начальном приближении метод Ньютона расходится.

Еще один недостаток функции naive_Newton заключается в том, что функция f(x) вызывается в два раза больше, чем необходимо.

Учитывая выше сказанное реализуем функцию с учетом следующего:

обрабатывать деление на ноль
задавать максимальное число итераций в случае расходимости метода
убрать лишний вызов функции f(x)

Метод Ньютона сходится быстро, если начальное приближение близко к решению. Выбор начального приближение влияет не только на скорость сходимости, но и на сходимость вообще. Т.е. при неправильном выборе начального приближения метод Ньютона может расходиться. Неплохой стратегией в случае, когда начальное приближение далеко от точного решения, может быть использование нескольких итераций по методу бисекций, а затем использовать метод Ньютона.

При реализации метода Ньютона нужно знать аналитическое выражение для производной $ f^\prime(x) $. Python содержит пакет SymPy, который можно использовать для создания функции dfdx . Для нашей задачи это можно реализовать следующим образом:

Решение нелинейных систем

Идея метода Ньютона для приближенного решения системы (2) заключается в следующем: имея некоторое приближение $ \pmb^ <(k)>$, мы находим следующее приближение $ \pmb^ <(k+1)>$, аппроксимируя $ \pmb(\pmb^<(k+1)>) $ линейным оператором и решая систему линейных алгебраических уравнений. Аппроксимируем нелинейную задачу $ \pmb(\pmb^<(k+1)>) = 0 $ линейной $$ \begin \tag <5>\pmb(\pmb^<(k)>) + \pmb(\pmb^<(k)>)(\pmb^ <(k+1)>— \pmb^<(k)>) = 0, \end $$ где $ \pmb(\pmb^<(k)>) $ — матрица Якоби (якобиан): $$ \pmb<\nabla F>(\pmb^<(k)>) = \begin \frac<\partial f_1(\pmb^<(k)>)> <\partial x_1>& \frac<\partial f_1(\pmb^<(k)>)> <\partial x_2>& \ldots & \frac<\partial f_1(\pmb^<(k)>)> <\partial x_n>\\ \frac<\partial f_2(\pmb^<(k)>)> <\partial x_1>& \frac<\partial f_2(\pmb^<(k)>)> <\partial x_2>& \ldots & \frac<\partial f_2(\pmb^<(k)>)> <\partial x_n>\\ \vdots & \vdots & \ldots & \vdots \\ \frac<\partial f_n(\pmb^<(k)>)> <\partial x_1>& \frac<\partial f_n(\pmb^<(k)>)> <\partial x_2>& \ldots & \frac<\partial f_n(\pmb^<(k)>)> <\partial x_n>\\ \end $$ Уравнение (5) является линейной системой с матрицей коэффициентов $ \pmb $ и вектором правой части $ -\pmb(\pmb^<(k)>) $. Систему можно переписать в виде $$ \pmb(\pmb^<(k)>)\pmb <\delta>= — \pmb(\pmb^<(k)>), $$ где $ \pmb <\delta>= \pmb^ <(k+1)>— \pmb^ <(k)>$.

Таким образом, $ k $-я итерация метода Ньютона состоит из двух стадий:

1. Решается система линейных уравнений (СЛАУ) $ \pmb(\pmb^<(k)>)\pmb <\delta>= -\pmb(\pmb^<(k)>) $ относительно $ \pmb <\delta>$.

2. Находится значение вектора на следующей итерации $ \pmb^ <(k+1)>= \pmb^ <(k)>+ \pmb <\delta>$.

Для решения СЛАУ можно использовать приближенные методы. Можно также использовать метод Гаусса. Пакет numpy содержит модуль linalg , основанный на известной библиотеке LAPACK, в которой реализованы методы линейной алгебры. Инструкция x = numpy.linalg.solve(A, b) решает систему $ Ax = b $ методом Гаусса, реализованным в библиотеке LAPACK.

Когда система нелинейных уравнений возникает при решении задач для нелинейных уравнений в частных производных, матрица Якоби часто бывает разреженной. В этом случае целесообразно использовать специальные методы для разреженных матриц или итерационные методы.

Можно также воспользоваться методами, реализованными для систем линейных уравнений.

Системы с нелинейными уравнениями

Нелинейные уравнения с двумя неизвестными

Системы из двух уравнений, одно из которых линейное

Однородные уравнения второй степени с двумя неизвестными

Системы из двух уравнений, одно из которых однородное

Системы из двух уравнений, сводящиеся к системам, в которых одно из уравнений однородное

Примеры решения систем уравнений других видов

Нелинейные уравнения с двумя неизвестными

Определение 1 . Пусть A – некоторое множество пар чисел (x ; y) . Говорят, что на множестве A задана числовая функция z от двух переменных x и y , если указано правило, с помощью которого каждой паре чисел из множества A ставится в соответствие некоторое число.

Задание числовой функции z от двух переменных x и y часто обозначают так:

z = f (x , y) ,

(1)

причем в записи (1) числа x и y называют аргументами функции , а число z – значением функции , соответствующим паре аргументов (x ; y) .

Определение 2 . Нелинейным уравнением с двумя неизвестными x и y называют уравнение вида

f (x , y) = 0 ,

(2)

где f (x , y) – любая функция, отличная от функции

где a , b , c – заданные числа.

Определение 3 . Решением уравнения (2) называют пару чисел (x ; y) , для которых формула (2) является верным равенством.

Пример 1 . Решить уравнение

x 2 – 4xy + 6y 2 –
– 12 y +18 = 0 .

(3)

Решение . Преобразуем левую часть уравнения (3):

Таким образом, уравнение (3) можно переписать в виде

(x – 2y) 2 + 2(y – 3) 2 = 0 .

(4)

Поскольку квадрат любого числа неотрицателен, то из формулы (4) вытекает, что неизвестные x и y удовлетворяют системе уравнений

решением которой служит пара чисел (6 ; 3) .

Пример 2 . Решить уравнение

sin (xy) = 2 .

(5)

вытекает, что уравнение (5) решений не имеет.

Ответ : Решений нет.

Пример 3 . Решить уравнение

ln (x – y) = 0 .

(6)

Следовательно, решением уравнения (6) является бесконечное множество пар чисел вида

где y – любое число.

Системы из двух уравнений, одно из которых линейное

Определение 4 . Решением системы уравнений

называют пару чисел (x ; y) , при подстановке которых в каждое из уравнений этой системы получается верное равенство.

Системы из двух уравнений, одно из которых линейное, имеют вид

где a , b , c – заданные числа, а g(x , y) – функция двух переменных x и y .

Пример 4 . Решить систему уравнений

(7)

Решение . Выразим из первого уравнения системы (7) неизвестное y через неизвестное x и подставим полученное выражение во второе уравнение системы:

Таким образом, решениями системы (7) являются две пары чисел

Ответ : (– 1 ; 9) , (9 ; – 1)

Однородные уравнения второй степени с двумя неизвестными

Определение 5 . Однородным уравнением второй степени с двумя неизвестными x и y называют уравнение вида

где a , b , c – заданные числа.

Пример 5 . Решить уравнение

3x 2 – 8xy + 5y 2 = 0 .

(8)

Решение . Для каждого значения y рассмотрим уравнение (8) как квадратное уравнение относительно неизвестного x . Тогда дискриминант D квадратного уравнения (8) будет выражаться по формуле

откуда с помощью формулы для корней квадратного уравнения найдем корни уравнения (8):

Ответ . Решениями уравнения (8) являются все пары чисел вида

( y ; y) или

где y – любое число.

Следствие . Левую часть уравнения (8) можно разложить на множители

Системы из двух уравнений, одно из которых однородное

Системы из двух уравнений, одно из которых однородное, имеют вид

где a , b , c – заданные числа, а g(x , y) – функция двух переменных x и y .

Пример 6 . Решить систему уравнений

(9)

рассматривая его как квадратное уравнение относительно неизвестного x :

В случае, когда x = – y , из второго уравнения системы (9) получаем уравнение

корнями которого служат числа y₁ = 2 , y₂ = – 2 . Находя для каждого из этих значений y соответствующее ему значение x , получаем два решения системы: (– 2 ; 2) , (2 ; – 2) .

из второго уравнения системы (9) получаем уравнение

которое корней не имеет.

Ответ : (– 2 ; 2) , (2 ; – 2)

Системы из двух уравнений, сводящиеся к системам, в которых одно из уравнений однородное

Пример 7 . Решить систему уравнений

(10)

Решение . Совершим над системой (10) следующие преобразования:

второе уравнение системы оставим без изменений;
к первому уравнению, умноженному на 5 , прибавим второе уравнение, умноженное на 3 , и запишем полученный результат вместо первого уравнения системы (10).

В результате система (10) преобразуется в равносильную ей систему (11), в которой первое уравнение является однородным уравнением:

(11)

рассматривая его как квадратное уравнение относительно неизвестного x :

В случае, когда x = – 5y , из второго уравнения системы (11) получаем уравнение

которое корней не имеет.

из второго уравнения системы (11) получаем уравнение

корнями которого служат числа y₁ = 3 , y₂ = – 3 . Находя для каждого из этих значений y соответствующее ему значение x , получаем два решения системы: (– 2 ; 3) , (2 ; – 3) .

Ответ : (– 2 ; 3) , (2 ; – 3)

Примеры решения систем уравнений других видов

Пример 8 . Решить систему уравнений (МФТИ)

Решение . Введем новые неизвестные u и v , которые выражаются через x и y по формулам:

(13)

Для того, чтобы переписать систему (12) через новые неизвестные, выразим сначала неизвестные x и y через u и v . Из системы (13) следует, что

(14)

Решим линейную систему (14), исключив из второго уравнения этой системы переменную x . С этой целью совершим над системой (14) следующие преобразования:

первое уравнение системы оставим без изменений;
из второго уравнения вычтем первое уравнение и заменим второе уравнение системы на полученную разность.

В результате система (14) преобразуется в равносильную ей систему

из которой находим

(15)

Воспользовавшись формулами (13) и (15), перепишем исходную систему (12) в виде

(16)

У системы (16) первое уравнение – линейное, поэтому мы можем выразить из него неизвестное u через неизвестное v и подставить это выражение во второе уравнение системы:

Следовательно, решениями системы (16) являются две пары чисел

Из формул (13) вытекает, что , поэтому первое решение должно быть отброшено. В случае u₂ = 5, v₂ = 2 из формул (15) находим значения x и y :

Определение 6 . Решением системы из двух уравнений с тремя неизвестными называют тройку чисел (x ; y ; z) , при подстановке которых в каждое уравнение системы получается верное равенство.

Пример 9 . Решить систему из двух уравнений с тремя неизвестными

(17)

Решение . У системы (17) первое уравнение – линейное, поэтому мы можем выразить из него неизвестное z через неизвестные x и y и подставить это выражение во второе уравнение системы:

(18)

Перепишем второе уравнение системы (18) в другом виде:

Поскольку квадрат любого числа неотрицателен, то выполнение последнего равенства возможно лишь в случае x = 4, y = 4 .

Ответ : (4 ; 4 ; – 4)

Замечание . Рекомендуем посетителю нашего сайта, интересующемуся методами решения систем уравнений, ознакомиться также c разделом справочника «Системы линейных уравнений» и нашим учебным пособием «Системы уравнений».

источники:

http://slemeshevsky.github.io/num-mmf/snes/html/._snes-FlatUI001.html

http://www.resolventa.ru/spr/algebra/system1.htm