Нелинейное уравнение регрессии по мнк

Метод наименьших квадратов для нелинейных регрессионных моделей

Метод наименьших квадратов можно применять к нелинейным регрессионным моделям только в том случае, если возможна их линеаризация, т.е. они нелинейны по факторным переменным или нелинейны по параметрам, но внутренне линейны.

Рассмотрим применение МНК для определения неизвестных параметров уравнения параболической зависимости следующего вида:

Данный полином второго порядка (или второй степени) является нелинейным по факторным переменным xi . Для нахождения неизвестных параметров уравнения регрессии β0 , β1 , β2 необходимо минимизировать с помощью МНК функцию Q:

Процесс минимизации функции сводится к вычислению частных производных этой функции по каждому из оцениваемых параметров. Составим систему уравнений для данной функции Q, не пользуясь при этом методом замен:

дQ = —(yi — β0 — β1xi — β2x 2 i ) = 0

дβ0

дQ = —(yi — β0 — β1xi — β2x 2 i ) xi = 0

дβ2

После элементарных преобразований данной системы уравнений получим

0 + β1 Σ xi + β2 Σ x 2 i = Σ yi

Данная система является системой нормальных уравнений относительно параметров β0, β1 , β2 для параболической зависимости yi = β0 + β1xi + β2x 2 i + εi . Эта система является квадратной, т.е. количество уравнений равняется количеству неизвестных переменных. Коэффициенты β0 , β1 , β2 можно найти с помощью метода Гаусса, если свести систему нормальных уравнений к линейному виду с помощью метода замен.

В общем случае полинома п-й степени

Для нахождения неизвестных коэффициентов уравнения регрессии с помощью МНКнеобходимо минимизировать функцию Q следующего вида:

Тогда систему нормальных уравнений можно записать таким образом:

Решением данной системы будут являться оценки коэффициентов регрессионной зависимости, выраженной полиномом п-го порядка.

Метод Гаусса применяется в большинстве случаев для решения систем линейных уравнений, когда число неизвестных параметров не совпадает с количеством уравнений. Однако его используют и для решения квадратных систем линейных уравнений.

Основная идея решения системы линейных уравнений методом Гаусса заключается в том, что исходную систему из т линейных уравнений с п неизвестными переменными необходимо преобразовать к треугольному виду. Для этого в одном из уравнений системы оставляют все неизвестные переменные. В другом сокращают одну из неизвестных переменных для того, чтобы их число стало (п — 1). В следующем уравнении убирают две неизвестные переменные, чтобы их число уже было (п — 2). В конце данного процесса система примет треугольный вид: первое уравнение содержит все, а последнее — только (пт) неизвестных, которые называются базисными. Остальные переменные называются свободными. Дальнейшее решение сводится к выражению свободных неизвестных переменных через базисные и получению общего решения системы линейных уравнений. Для осуществления базисного решения системы линейных уравнений свободные переменные приравнивают к нулю.

Дата добавления: 2015-10-05 ; просмотров: 2619 ; ЗАКАЗАТЬ НАПИСАНИЕ РАБОТЫ

Метод наименьших квадратов регрессия

Метод наименьших квадратов (МНК) заключается в том, что сумма квадратов отклонений значений y от полученного уравнения регрессии — минимальное. Уравнение линейной регрессии имеет вид

y=ax+b

a, b – коэффициенты линейного уравнения регрессии;

x – независимая переменная;

y – зависимая переменная.

Нахождения коэффициентов уравнения линейной регрессии через метод наименьших квадратов:

частные производные функции приравниваем к нулю

отсюда получаем систему линейных уравнений

Формулы определения коэффициентов уравнения линейной регрессии:

Также запишем уравнение регрессии для квадратной нелинейной функции:

Система линейных уравнений регрессии полинома n-ого порядка:

Формула коэффициента детерминации R 2 :

Формула средней ошибки аппроксимации для уравнения линейной регрессии (оценка качества модели):

Чем меньше ε, тем лучше. Рекомендованный показатель ε
Формула среднеквадратической погрешности:

Для примера, проведём расчет для получения линейного уравнения регрессии аппроксимации функции, заданной в табличном виде:

xy
34
47
611
716
918
1122
1324
1527
1630
1933

Решение

Расчеты значений суммы, произведения x и у приведены в таблицы.

Расчет коэффициентов линейной регрессии:

при этом средняя ошибка аппроксимации равна:

ε=11,168%

Получаем уравнение линейной регрессии с помощью метода наименьших квадратов:

y=1,7871x+0,79

График функции линейной зависимости y=1,7871x+0,79 и табличные значения, в виде точек

Коэффициент корреляции равен 0,988
Коэффициента детерминации равен 0,976

Уравнение нелинейной регрессии

Вместе с этим калькулятором также используют следующие:
Уравнение множественной регрессии

Виды нелинейной регрессии

ВидКласс нелинейных моделей
  1. Полиномальное уравнение регрессии:
    y = a + bx + cx 2 (см. метод выравнивания)
  2. Гиперболическое уравнение регрессии:
  3. Квадратичное уравнение регрессии:
Нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам
  1. Показательное уравнение регрессии:
  2. Экспоненциальное уравнение регрессии:
  3. Степенное уравнение регрессии:
  4. Полулогарифмическое уравнение регрессии: y = a + b lg(x)
Нелинейные по оцениваемым параметрам

Здесь ε — случайная ошибка (отклонение, возмущение), отражающая влияние всех неучтенных факторов.

Уравнению регрессии первого порядка — это уравнение парной линейной регрессии.

Уравнение регрессии второго порядка это полиномальное уравнение регрессии второго порядка: y = a + bx + cx 2 .

Уравнение регрессии третьего порядка соответственно полиномальное уравнение регрессии третьего порядка: y = a + bx + cx 2 + dx 3 .

Чтобы привести нелинейные зависимости к линейной используют методы линеаризации (см. метод выравнивания):

  1. Замена переменных.
  2. Логарифмирование обеих частей уравнения.
  3. Комбинированный.
y = f(x)ПреобразованиеМетод линеаризации
y = b x aY = ln(y); X = ln(x)Логарифмирование
y = b e axY = ln(y); X = xКомбинированный
y = 1/(ax+b)Y = 1/y; X = xЗамена переменных
y = x/(ax+b)Y = x/y; X = xЗамена переменных. Пример
y = aln(x)+bY = y; X = ln(x)Комбинированный
y = a + bx + cx 2x1 = x; x2 = x 2Замена переменных
y = a + bx + cx 2 + dx 3x1 = x; x2 = x 2 ; x3 = x 3Замена переменных
y = a + b/xx1 = 1/xЗамена переменных
y = a + sqrt(x)bx1 = sqrt(x)Замена переменных

Пример . По данным, взятым из соответствующей таблицы, выполнить следующие действия:

  1. Построить поле корреляции и сформулировать гипотезу о форме связи.
  2. Рассчитать параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной, гиперболической парной регрессии.
  3. Оценить тесноту связи с помощью показателей корреляции и детерминации.
  4. Дать с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
  5. Оценить с помощью средней ошибки аппроксимации качество уравнений.
  6. Оценить с помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования. По значениям характеристик, рассчитанных в пп. 4, 5 и данном пункте, выбрать лучшее уравнение регрессии и дать его обоснование.
  7. Рассчитать прогнозное значение результата, если прогнозное значение фактора увеличится на 15% от его среднего уровня. Определить доверительный интервал прогноза для уровня значимости α=0,05 .
  8. Оценить полученные результаты, выводы оформить в аналитической записке.
ГодФактическое конечное потребление домашних хозяйств (в текущих ценах), млрд. руб. (1995 г. — трлн. руб.), yСреднедушевые денежные доходы населения (в месяц), руб. (1995 г. — тыс. руб.), х
1995872515,9
200038132281,1
200150143062
200264003947,2
200377085170,4
200498486410,3
2005124558111,9
20061528410196
20071892812602,7
20082369514940,6
20092515116856,9

Решение. В калькуляторе последовательно выбираем виды нелинейной регрессии. Получим таблицу следующего вида.
Экспоненциальное уравнение регрессии имеет вид y = a e bx
После линеаризации получим: ln(y) = ln(a) + bx
Получаем эмпирические коэффициенты регрессии: b = 0.000162, a = 7.8132
Уравнение регрессии: y = e 7.81321500 e 0.000162x = 2473.06858e 0.000162x

Степенное уравнение регрессии имеет вид y = a x b
После линеаризации получим: ln(y) = ln(a) + b ln(x)
Эмпирические коэффициенты регрессии: b = 0.9626, a = 0.7714
Уравнение регрессии: y = e 0.77143204 x 0.9626 = 2.16286x 0.9626

Гиперболическое уравнение регрессии имеет вид y = b/x + a + ε
После линеаризации получим: y=bx + a
Эмпирические коэффициенты регрессии: b = 21089190.1984, a = 4585.5706
Эмпирическое уравнение регрессии: y = 21089190.1984 / x + 4585.5706

Логарифмическое уравнение регрессии имеет вид y = b ln(x) + a + ε
Эмпирические коэффициенты регрессии: b = 7142.4505, a = -49694.9535
Уравнение регрессии: y = 7142.4505 ln(x) — 49694.9535


источники:

http://www.matematicus.ru/matematicheskaya-statistika/metod-naimenshih-kvadratov-regressiya

http://math.semestr.ru/corel/noncorel.php