Уравнения регрессии для нелинейной корреляции

Уравнение нелинейной регрессии

Вместе с этим калькулятором также используют следующие:
Уравнение множественной регрессии

Виды нелинейной регрессии

ВидКласс нелинейных моделей
  1. Полиномальное уравнение регрессии:
    y = a + bx + cx 2 (см. метод выравнивания)
  2. Гиперболическое уравнение регрессии:
  3. Квадратичное уравнение регрессии:
Нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам
  1. Показательное уравнение регрессии:
  2. Экспоненциальное уравнение регрессии:
  3. Степенное уравнение регрессии:
  4. Полулогарифмическое уравнение регрессии: y = a + b lg(x)
Нелинейные по оцениваемым параметрам

Здесь ε — случайная ошибка (отклонение, возмущение), отражающая влияние всех неучтенных факторов.

Уравнению регрессии первого порядка — это уравнение парной линейной регрессии.

Уравнение регрессии второго порядка это полиномальное уравнение регрессии второго порядка: y = a + bx + cx 2 .

Уравнение регрессии третьего порядка соответственно полиномальное уравнение регрессии третьего порядка: y = a + bx + cx 2 + dx 3 .

Чтобы привести нелинейные зависимости к линейной используют методы линеаризации (см. метод выравнивания):

  1. Замена переменных.
  2. Логарифмирование обеих частей уравнения.
  3. Комбинированный.
y = f(x)ПреобразованиеМетод линеаризации
y = b x aY = ln(y); X = ln(x)Логарифмирование
y = b e axY = ln(y); X = xКомбинированный
y = 1/(ax+b)Y = 1/y; X = xЗамена переменных
y = x/(ax+b)Y = x/y; X = xЗамена переменных. Пример
y = aln(x)+bY = y; X = ln(x)Комбинированный
y = a + bx + cx 2x1 = x; x2 = x 2Замена переменных
y = a + bx + cx 2 + dx 3x1 = x; x2 = x 2 ; x3 = x 3Замена переменных
y = a + b/xx1 = 1/xЗамена переменных
y = a + sqrt(x)bx1 = sqrt(x)Замена переменных

Пример . По данным, взятым из соответствующей таблицы, выполнить следующие действия:

  1. Построить поле корреляции и сформулировать гипотезу о форме связи.
  2. Рассчитать параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной, гиперболической парной регрессии.
  3. Оценить тесноту связи с помощью показателей корреляции и детерминации.
  4. Дать с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
  5. Оценить с помощью средней ошибки аппроксимации качество уравнений.
  6. Оценить с помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования. По значениям характеристик, рассчитанных в пп. 4, 5 и данном пункте, выбрать лучшее уравнение регрессии и дать его обоснование.
  7. Рассчитать прогнозное значение результата, если прогнозное значение фактора увеличится на 15% от его среднего уровня. Определить доверительный интервал прогноза для уровня значимости α=0,05 .
  8. Оценить полученные результаты, выводы оформить в аналитической записке.
ГодФактическое конечное потребление домашних хозяйств (в текущих ценах), млрд. руб. (1995 г. — трлн. руб.), yСреднедушевые денежные доходы населения (в месяц), руб. (1995 г. — тыс. руб.), х
1995872515,9
200038132281,1
200150143062
200264003947,2
200377085170,4
200498486410,3
2005124558111,9
20061528410196
20071892812602,7
20082369514940,6
20092515116856,9

Решение. В калькуляторе последовательно выбираем виды нелинейной регрессии. Получим таблицу следующего вида.
Экспоненциальное уравнение регрессии имеет вид y = a e bx
После линеаризации получим: ln(y) = ln(a) + bx
Получаем эмпирические коэффициенты регрессии: b = 0.000162, a = 7.8132
Уравнение регрессии: y = e 7.81321500 e 0.000162x = 2473.06858e 0.000162x

Степенное уравнение регрессии имеет вид y = a x b
После линеаризации получим: ln(y) = ln(a) + b ln(x)
Эмпирические коэффициенты регрессии: b = 0.9626, a = 0.7714
Уравнение регрессии: y = e 0.77143204 x 0.9626 = 2.16286x 0.9626

Гиперболическое уравнение регрессии имеет вид y = b/x + a + ε
После линеаризации получим: y=bx + a
Эмпирические коэффициенты регрессии: b = 21089190.1984, a = 4585.5706
Эмпирическое уравнение регрессии: y = 21089190.1984 / x + 4585.5706

Логарифмическое уравнение регрессии имеет вид y = b ln(x) + a + ε
Эмпирические коэффициенты регрессии: b = 7142.4505, a = -49694.9535
Уравнение регрессии: y = 7142.4505 ln(x) — 49694.9535

Корреляция для нелинейной регрессии.

Уравнение нелинейной регрессии, так же как и в линейной зависимости, дополняется показателем тесноты связи, а именно – индексом корреляции R

(4.18)

где -общая дисперсия результативного признака;

— остаточная дисперсия.

Учитывая связь дисперсии с объемом вариации, можно легко доказать, что индекс корреляции через объемы вариации определяется следующим образом:

(4.19)

Нам уже известно, что величина данного показателя находится в пределах от нуля до единицы. Чем он ближе к единице, тем теснее связь рассматриваемых признаков, тем более надежно найденное уравнение регрессии.

Парабола второй степени, как и полином более высокого порядка, при линеаризации принимает вид уравнения множественной регрессии. Если же нелинейное относительно объясняющей переменной уравнение регрессии при линеаризации принимает форму линейного уравнения парной регрессии, то для оценки тесноты связи может быть использован линейный коэффициент корреляции, величина которого совпадет с индексом корреляции. (Доказательство дано в учебнике Елисеевой И.И. «Эконометрика»)

Обратимся к равносторонней гиперболе . Заменив на z, имеем регрессию вида , для которой может быть определен линейный коэффициент корреляции . По своей величине он будет равен коэффициенту корреляции между у и х , то есть ryч.

Иначе обстоит дело, когда преобразование уравнения в линейную форму связаны с зависимой переменной. В этом случае линейный коэффициент корреляции по преобразованным значениям признаков дает лишь приближенную оценку тесноты связи и численно не совпадает с индексом корреляции. Так, для степенной функции после перехода к логарифмически линейному уравнению loqy=loqa+bloqx может быть найден линейный коэффициент корреляции не для фактических значений переменных у и х, а для их логарифмов (то есть rloqy.loqx). Квадрат линейного коэффициента корреляции будет характеризовать отношение факторной суммы квадратов отклонений к общей, но не для у, а для его логарифмов. Между тем при расчете индекса корреляции используются суммы квадратов отклонений именно у, а не их логарифмов.

Квадрат индекса корреляции (i 2 ) называют индекс детерминации, он имеет тот же смысл, что и линейный коэффициент детерминации, то есть представляет собой отношение факторной и общей суммы квадратов отклонений.

Индекс детерминации используется для проверки существенности уравнения нелинейной регрессии в целом по F-критерию Фишера

F = (4.20)

где п – число наблюдений;

т – число параметров при переменных х.

Величина m характеризует число степеней свободы для факторной дисперсии, а (n – m – 1) – число степеней свободы для остаточной суммы квадратов. Для степенной функции т=1 и формула F-критерия примет тот же вид, что и при линейной парной зависимости

(4.21)

Для параболы второй степени m=2 и

(4.22)

Расчет критерия Фишера можно вести и в таблице дисперсионного анализа результатов регрессии, как это было показано для линейной функции (лекция 3).

Индекс детерминации можно сравнивать с коэффициентом детерминации для обоснования возможности применения линейной функции. Чем больше кривизна линии регрессии, тем меньше значение линейного коэффициента детерминации по сравнению с индексом детерминации. Близость этих показателей означает, что нет необходимости усложнять форму уравнения регрессии и можно использовать линейную функцию. Практически если величина i 2 -r 2 ≤0.1 , то предположение о линейной форме связи считается оправданным. Иными словами, если нет уверенности в правильности выбора нелинейной функции, то в целях лучшей интерпретации связи она может быть заменена уравнением прямой.

Вопросы для повторения

1. Какие есть способы выбора вида математической функции в случае парной связи переменных?

2. В чем сущность экспериментального метода выбора вида уравнения?

3. Назовите виды функций, нелинейных относительно объясняющих переменных.

4. Параметризацию каких видов нелинейных регрессий можно выполнить методом наименьших квадратов?

5. С какой целью проводится линеаризация переменных в уравнениях регрессии?

6. Назовите область применения равносторонней гиперболы в эконометрических исследованиях.

7. В чем особенность параболической регрессионной зависимости?

8. Раскройте содержание «кривых Энгеля».

9. Какова интерпретация показателя степени в степенной функции?

10. Назовите показатели корреляции, используемые при нелинейных соотношениях изучаемых признаков.

Корреляция для нелинейной регрессии. Коэффициенты эластичности

Качество нелинейной регрессионной модели можно определить с помощью нелинейного показателя корреляции, который называется индексом корреляции для нелинейных форм связи R.

R можно вычислить на основе теоремы о разложении сумм квадратов. Сумма квадратов разностей между значениями результативной переменной и ее средним значением по выборке может быть представлена следующим образом:

,

где — общая сумма квадратов (TSS – Total Sum Square); — сумма квадратов объясненной регрессии (RSS – Regression Sum Square); — сумма квадратов остатков (ESS – Error Sum Square).

На основании данной теоремы

Индекс корреляции для нелинейных форм связи изменяется в пределах [0; 1] . Чем ближе его значение к единице, тем сильнее взаимосвязь между изучаемыми переменными.

Если возвести индекс корреляции в квадрат, то полученная величина будет называться индексом детерминации для нелинейных форм связи:

Индекс детерминации для нелинейных форм связи по характеристикам аналогичен обычному множественному коэффициенту детерминации. Индекс R 2 показывает, на сколько процентов построенная модель регрессии объясняет разброс значений зависимой переменной относительно среднего значения, т.е. какая доля общей дисперсии результативного признака объясняется вариацией факторных модельных признаков. Индекс детерминации можно назвать количественной характеристикой объясненной построенным уравнением регрессии дисперсии результативного признака. Чем больше значение данного показателя, тем лучше уравнение регрессии описывает выявленную взаимосвязь.

Кроме рассмотренных показателей, для изучения зависимости между результативной переменной и факторными признаками используются различные коэффициенты эластичности, которые позволяют оценить тесноту связи между переменными х и у.

Общий коэффициент эластичности показывает, на сколько процентов изменится результативный показатель у при изменении величины факторного признака на 1%. Формула расчета общего коэффициента эластичности имеет вид

где первая производная результативной переменной по факторному признаку.

Средний коэффициент эластичности вычисляется для среднего значения факторного признака по приведенной выше формуле:

где — значение функции при среднем значении факторного признака.

Средний коэффициент эластичности характеризует процентное изменение результативного признака у относительно своего среднего значения при изменении факторного признака на 1% относительного . Такие коэффициенты рассчитываются по индивидуальным формулам для каждой разновидности функции.

Например, для показательной функции вида средний коэффициент эластичности определяется как:

Основное достоинство степенной функции вида заключается в том, что средний коэффициент эластичности равен коэффициенту регрессии:

Помимо средних коэффициентов эластичности могут быть также рассчитаны точечные коэффициенты эластичности. Общая формула их расчета

т.е. эластичность зависит от конкретного заданного значения факторного признака х1.

Точечный коэффициент эластичности характеризует процентное изменение результативной переменной у относительно уровня функции у(х1) при изменении факторного признака на 1% относительно заданного уровня х1.

Например, для параболической функции точечный коэффициент эластичности находится следующим образом:

Знаменателем данного показателя является значение параболической функции в точке x1.


источники:

http://helpiks.org/5-98044.html

http://mydocx.ru/8-46835.html