Уравнение гиперболы имеет вид эконометрика

Уравнение нелинейной регрессии

Вместе с этим калькулятором также используют следующие:
Уравнение множественной регрессии

Виды нелинейной регрессии

ВидКласс нелинейных моделей
  1. Полиномальное уравнение регрессии:
    y = a + bx + cx 2 (см. метод выравнивания)
  2. Гиперболическое уравнение регрессии:
  3. Квадратичное уравнение регрессии:
Нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам
  1. Показательное уравнение регрессии:
  2. Экспоненциальное уравнение регрессии:
  3. Степенное уравнение регрессии:
  4. Полулогарифмическое уравнение регрессии: y = a + b lg(x)
Нелинейные по оцениваемым параметрам

Здесь ε — случайная ошибка (отклонение, возмущение), отражающая влияние всех неучтенных факторов.

Уравнению регрессии первого порядка — это уравнение парной линейной регрессии.

Уравнение регрессии второго порядка это полиномальное уравнение регрессии второго порядка: y = a + bx + cx 2 .

Уравнение регрессии третьего порядка соответственно полиномальное уравнение регрессии третьего порядка: y = a + bx + cx 2 + dx 3 .

Чтобы привести нелинейные зависимости к линейной используют методы линеаризации (см. метод выравнивания):

  1. Замена переменных.
  2. Логарифмирование обеих частей уравнения.
  3. Комбинированный.
y = f(x)ПреобразованиеМетод линеаризации
y = b x aY = ln(y); X = ln(x)Логарифмирование
y = b e axY = ln(y); X = xКомбинированный
y = 1/(ax+b)Y = 1/y; X = xЗамена переменных
y = x/(ax+b)Y = x/y; X = xЗамена переменных. Пример
y = aln(x)+bY = y; X = ln(x)Комбинированный
y = a + bx + cx 2x1 = x; x2 = x 2Замена переменных
y = a + bx + cx 2 + dx 3x1 = x; x2 = x 2 ; x3 = x 3Замена переменных
y = a + b/xx1 = 1/xЗамена переменных
y = a + sqrt(x)bx1 = sqrt(x)Замена переменных

Пример . По данным, взятым из соответствующей таблицы, выполнить следующие действия:

  1. Построить поле корреляции и сформулировать гипотезу о форме связи.
  2. Рассчитать параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной, гиперболической парной регрессии.
  3. Оценить тесноту связи с помощью показателей корреляции и детерминации.
  4. Дать с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
  5. Оценить с помощью средней ошибки аппроксимации качество уравнений.
  6. Оценить с помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования. По значениям характеристик, рассчитанных в пп. 4, 5 и данном пункте, выбрать лучшее уравнение регрессии и дать его обоснование.
  7. Рассчитать прогнозное значение результата, если прогнозное значение фактора увеличится на 15% от его среднего уровня. Определить доверительный интервал прогноза для уровня значимости α=0,05 .
  8. Оценить полученные результаты, выводы оформить в аналитической записке.
ГодФактическое конечное потребление домашних хозяйств (в текущих ценах), млрд. руб. (1995 г. — трлн. руб.), yСреднедушевые денежные доходы населения (в месяц), руб. (1995 г. — тыс. руб.), х
1995872515,9
200038132281,1
200150143062
200264003947,2
200377085170,4
200498486410,3
2005124558111,9
20061528410196
20071892812602,7
20082369514940,6
20092515116856,9

Решение. В калькуляторе последовательно выбираем виды нелинейной регрессии. Получим таблицу следующего вида.
Экспоненциальное уравнение регрессии имеет вид y = a e bx
После линеаризации получим: ln(y) = ln(a) + bx
Получаем эмпирические коэффициенты регрессии: b = 0.000162, a = 7.8132
Уравнение регрессии: y = e 7.81321500 e 0.000162x = 2473.06858e 0.000162x

Степенное уравнение регрессии имеет вид y = a x b
После линеаризации получим: ln(y) = ln(a) + b ln(x)
Эмпирические коэффициенты регрессии: b = 0.9626, a = 0.7714
Уравнение регрессии: y = e 0.77143204 x 0.9626 = 2.16286x 0.9626

Гиперболическое уравнение регрессии имеет вид y = b/x + a + ε
После линеаризации получим: y=bx + a
Эмпирические коэффициенты регрессии: b = 21089190.1984, a = 4585.5706
Эмпирическое уравнение регрессии: y = 21089190.1984 / x + 4585.5706

Логарифмическое уравнение регрессии имеет вид y = b ln(x) + a + ε
Эмпирические коэффициенты регрессии: b = 7142.4505, a = -49694.9535
Уравнение регрессии: y = 7142.4505 ln(x) — 49694.9535

Равносторонняя гипербола.

Среди класса нелинейных функций, параметры которой без особых затруднений оцениваются МНК, следует назвать хорошо известную в эконометрике равностороннюю гиперболу. Для нее, заменив 1/х на z, получим линейное уравнение регрессии

Гипербола может быть использована не только для характеристики удельных затрат с объемами производства, как уже указывалось ранее. Примером ее использования может служить также взаимосвязь доли расходов на определенные группы товаров (продовольственные, непродовольственные, товары длительного пользования) с общей суммой доходов. Подобного рода взаимосвязи получили название кривых Энгеля. В 1857 году немецкий статистик Энгель сформулировал закономерность – с ростом дохода доля затрат на продовольствие уменьшается. Соответственно, возрастает доля расходов на непродовольственные товары.

Допустим, вы исследуете соотношение между ежегодным потреблением бананов и годовым доходом, и наблюдения приведены в табл.4. 1, где собраны наблюдения для 10 семей (слайд).

СемьяБананы (в фунтах) (у)Доход (в 1000 долл.) (х)( z )
1,931,000
7,130,500
8,780,333
9,690,250
10,090,200
10,420,167
10,620,143
10,710,125
10,790,111
11,130,100

На слайде (рис.4.2). представлено облако точек, соответствующих наблюдениям, а также график уравнения регрессии между у и х

= 5,09 + 0,73 х ; R 2 = 0,64. (4.7.)

Стандартные ошибки (1,23) (0,20)

Из рисунка видно, что график уравнения регрессии не вполне соответствует точкам наблюдений, несмотря на то, что коэффициент при х существенно отличается от нуля при однопроцентном уровне значимости. Очевидно, что точки наблюдений лежат на кривой, тогда как уравнение регрессии характеризуется прямой. В данном случае нетрудно заметить, что функциональная зависимость между у и х определена неправильно.

В том случае, если вы не можете представить зависимость в графическом виде ( например, если вы используете множественный регрессионный анализ), понять, что где то допущена ошибка, можно с помощью анализа остатков. В данном случае значения остатков приведены в таблице 4.2.

Семьяуе
1234
1,935,82— 3,90
7,136,560,57
8,787,291,49
9,698,031,67
10,098,761,33

Продолжение табл. 4.2.

1234
10,429,500,93
10,6210,230,39
10,7110,97— 0,26
10,7911,70— 0,91
11,1312,43— 1,31

Положительные или отрицательные, большие или малые остатки должны чередоваться случайным образом. Здесь же, как видно из таблицы, сначала остатки отрицательны, затем они становятся положительными, достигают максимума, а потом снова уменьшаются и становятся отрицательными: это представляется сомнительным.

В данном примере соотношение имеет вид:

у = 12 — (4.8.)

где х принимает целые значения от 1 до 10. Если мы знаем это и определим z = 1/ х, то уравнение примет линейный вид (4.7.) . Значение z для каждой семьи уже подсчитано в таблице 4.1. Оценив регрессию между y и z , получим

= 12, 08 — 10, 08 z ; R 2 = 0, 9989

Стандартные ошибки (0, 04) (0,12 ) (4.9.) Подставив z = 1 / x , имеем

(4.10.)

С учетом высокого качества оцененного уравнения (4.9.) неудивительно, что соотношение (4.10) близко к истинному уравнению (4.8 ) На слайде (рис. 4.3 и рис. 4.4) показаны регрессионная зависимость и точки наблюдений для у, х и z.

Улучшение качества уравнения, измеряемого с помощью коэффициента R 2 , отражено в более полном соответствии графиков. Сравните графики на рис.4.2. и 4.4.

Степенная функция.

Рассмотрим далее функции вида

которые являются нелинейными как по параметрам, так и по переменным. Данное соотношение может быть преобразовано в линейное уравнение путем использования логарифмов, знакомых вам из курса математики. Ниже приведем основные свойства логарифмов, которые помогут вам в преобразованиях нелинейных уравнений.

Основные правила гласят :

1. Если у = х z , то log y = log x + log z .

2. Если y = x / z , то log y = log xlog z.

3. Если y = x n , то log y = n log x.

Эти правила могут применяться вместе для преобразования более сложных выражений. Например, если у = a х b , то по правилу 1 :

log y = log a + log x b и по правилу 3

Если обозначить у 1 = log (y) , z = log x и a 1 = log a , то уравнение (4.11) можно переписать в следующем виде:

у 1 = a 1 + b z (4.12)

Процедура оценивания регрессии теперь будет следующей. Сначала вычислим у 1 и z для каждого наблюдения путем взятия логарифмов от исходных значений. Вы можете сделать это на компьютере с помощью имеющейся статистической программы. Затем оценим регрессионную зависимость у 1 от z. Коэффициент при z будет представлять собой непосредственную оценку b. Постоянный член является оценкой a 1 , то есть log a. Для получения оценки a необходимо взять антилогарифм, то есть выполнить обратное действие.

Дата добавления: 2015-11-06 ; просмотров: 1598 ; ЗАКАЗАТЬ НАПИСАНИЕ РАБОТЫ

Равносторонняя гипербола.

Линейная модель.

Уравнение однофакторной (парной) линейной регрессии имеет вид:

Для нашего примера:

Y – Валовый доход растениеводства, приходящийся на 100 га пашни, тыс. руб. (результативный признак);

Х – Доля трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, % (факторный признак).

Для нахождения параметров a и b линейной регрессии можно решить систему нормальных уравнений относительно a и b.

Для расчета параметров уравнения регрессии можно также воспользоваться готовыми формулами, полученными путем преобразования уравнений системы:

Уравнение принимает вид:

Рис. 2. Влияние доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, на валовый доход растениеводства, приходящийся на 100 га пашни.

Коэффициент -0,7113 стоящий перед Х, называется коэффициентом регрессии. По знаку этого коэффициента судят о направлении связи. Если знак «+» – связь прямая; «-» – связь обратная. Величина коэффициента регрессии показывает, на сколько в среднем изменится величина результативного признака Y при изменении факторного признака Х на единицу. В данном случае с увеличением доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, на 1 % валовый доход растениеводства, приходящийся на 100 га пашни, уменьшается в среднем на 0,7113 тыс. руб.

Коэффициент регрессии применяется для расчета среднего коэффициента эластичности, который показывает: на сколько процентов в среднем по совокупности изменится результат Y от своей средней величины при изменении фактора X на 1% от своего среднего значения.

Коэффициент эластичности рассчитывается по формуле:

В нашем случае

И формула коэффициента эластичности парной линейной регрессии принимает вид:

С увеличением доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, на 1 % валовый доход растениеводства, приходящийся на 100 га пашни, уменьшается в среднем на 0,26749%.

При линейной корреляции между Х и Y исчисляют парный линейный коэффициент корреляции r. Он принимает значения в интервале –1 £ r £ 1. Знак коэффициента корреляции показывает направление связи: «+» – связь прямая, «–» – связь обратная. Абсолютная величина характеризует степень тесноты связи.

Коэффициент парной линейной корреляции рассчитаем по формуле:

Линейный коэффициент парной корреляции показывает, что связь между долей трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, и валовым доходом растениеводства, приходящийся на 100 га пашни, обратная и слабая.

Изменение результативного признака Y обусловлено вариацией факторного признака X. Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака характеризует коэффициент детерминации D.

Коэффициент детерминации рассчитывается по формуле:

Следовательно, вариация валового дохода растениеводства, приходящийся на 100 га пашни, на 6,4% объясняется вариацией доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, а остальные 93,6% вариации валового дохода растениеводства, приходящийся на 100 га пашни, обусловлены изменением других, не учтенных в модели факторов.

Для практического использования корреляционно-регрессионных моделей большое значение имеет их адекватность, т.е. соответствие фактическим статистическим данным. Корреляционно-регрессионный анализ проводится обычно по ограниченному объему статистической совокупности. Поэтому показатели регрессии и корреляции – параметры уравнения регрессии, коэффициенты корреляции и детерминации могут быть искажены действием случайных факторов. Чтобы проверить насколько эти показатели характерны для генеральной совокупности, являются ли они результатом действия случайных величин, необходимо проверить адекватность построенных статистических моделей.

Оценим модель через среднюю ошибку аппроксимации.

Средняя ошибка аппроксимации – среднее отклонение расчетных значений от фактических:

Допустимый предел значений — не более 8 – 10%.

Выполним вспомогательные расчеты (табл.6).

Таблица 6. Исходные данные, необходимые для определения показателей аппроксимации.

№ хозяйстваДоля трактористов-машинистов в общей численности работников, занятых в сельскохозяйственном производстве, %Валовый доход растениеводства, приходящийся на 100 га пашни, тыс.руб.Расчетные величины
34,042648,216253,3288883-5,1126883210,603673326,1395818121,975157
24,193546,356860,3337919-13,976991930,1508989195,3563021,42835093
28,248647,470357,4497127-9,9794126821,022434499,588677527,5649819
18,985040,513664,0381953-23,524595358,0659219553,40658616,1070877
27,1845100,735658,206524842,5290752442,21851581808,7222417,5237377
11,926659,460369,0582897-9,5979897116,141845492,1214064122,58395
19,565261,400463,6255439-2,225143943,623989314,9512655311,7866126
18,120849,759663,90085828,87194175512,191288278,711350514,5944143
15,822899,187064,652834-14,89323429,9303733221,80841923,790627
19,178172,772866,287223832,8997762133,16944381082,3952751,4887135
35,714347,149252,1399373-4,9907373210,584988324,907459161,695038
252,9819673,0219673,0218267,7033734188,10856570,53867
сред. знач.22,998461,183861,183824,3366702

Средняя ошибка аппроксимации равна 24,3%. т.е. в среднем расчетные значения валового дохода растениеводства, приходящийся на 100 га пашни, отличаются от фактических на 24,3367%, что не входит в допустимый предел.

Оценим модель через F-критерий Фишера. F-критерий Фишера необходим для проверки нулевой гипотезы о статистической незначимости уравнения регрессии и показателя тесноты связи (r).

Выдвинем H0 о статистической незначимости полученного уравнения регрессии и показателя тесноты связи.

Сравним фактическое значение F-критерия с табличным. Для этого выпишем из таблицы «Значения F-Фишера при уровне значимости α=0,05» табличное значение.

k1 – число факторных признаков в модели

n – число единиц совокупности

В нашем примере k1 =1, k2 = 11-1-1 = 9

Так как Fфакт 2.1051

lgY = 10 2.1051 *(-0.25295)lgX

Рис. 4. Влияние доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, на валовый доход растениеводства, приходящийся на 100 га пашни.

Коэффициент эластичности рассчитывается по формуле:

В нашем случае

И формула коэффициента эластичности парной линейной регрессии принимает вид:

С увеличением доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, на 1 % валовый доход растениеводства, приходящийся на 100 га пашни, уменьшается в среднем на 0,2617%.

Для нелинейной парной корреляции рассчитывается индекс корреляции:

Для расчета индекса корреляции выполним вспомогательные расчеты (таблица 10).

Таблица 10. Расчетные величины, необходимые для расчета индекса корреляции и определения показателей аппроксимации

№ хозяйстваДоля тракторис-тов-машинистов в общей численности работников, занятых в сельскохозяйственном производстве, %Валовый доход растениеводства, приходящийся на 100 га пашни, тыс.руб.Расчетные величины
34,042648,216252,19089615,79820936168,15864988,2434869081,7175950,00120,036853
24,193546,356856,900057111,1602591219,83992922,743710891,7551130,00790,001905
28,248647,470354,7129252,45554041188,060082315,25716021,738090,00380,012309
18,985040,513660,498539399,3977771427,25716849,328963011,7817450,03030,0038
27,1845100,735655,2468992069,2218771564,34488345,156529121,7423080,06810,008887
11,926659,460368,04764873,742547652,9704522514,442154031,8328130,00340,06945
19,565261,400460,0396221,851716690,046915562,2162363311,7784380,00010,002359
18,120849,759660,343875154,4781809134,30492117,07908061,7806330,00660,003277
15,822899,187061,215697131,2421549130,512345623,022887731,7868630,00810,006703
19,178172,772863,3519221284,1527951444,2432136,12880491,801760,03790,019816
35,714347,149251,56185919,47156064196,96999729,3589268421,7123290,00150,04528
252,9819673,0219644,10994312,972624476,708554242,9779419,42770,16890,21064
сред. знач.22,998461,183822,0889

Индекс корреляции показывает, что между долей трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, и валовым доходом растениеводства, приходящийся на 100 га пашни, слабая.

Коэффициент детерминации для нелинейных функций рассчитывается по формуле:

Следовательно, вариация валового дохода растениеводства, приходящийся на 100 га пашни, на 3,6575% объясняется вариацией доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, а остальные 96,3425% вариации валового дохода растениеводства, приходящийся на 100 га пашни, обусловлены изменением других, не учтенных в модели факторов.

Оценим модель через среднюю ошибку аппроксимации:

Средняя ошибка аппроксимации равна 22,1%, т.е. в среднем расчетные значения валового дохода растениеводства, приходящийся на 100 га пашни, отличаются от фактических на 22,0889%, что не входит в допустимый предел. Данная модель имеет наименьшую ошибку аппроксимации.

Оценим модель через F-критерий Фишера. F-критерий Фишера необходим для проверки нулевой гипотезы о статистической незначимости уравнения регрессии и показателя тесноты связи.

Выдвинем H0 о статистической незначимости полученного уравнения регрессии и показателя тесноты связи.

Сравним фактическое значение F-критерия с табличным. Для этого выпишем из таблицы «Значения F-Фишера при уровне значимости α=0,05» табличное значение.

Так как Fфакт 2 ) для нее максимальное

№ п/пМодельСредняя ошибка аппроксимацииR 2 (ρ 2 )
24,330,064
25,1040,045
Y=127.3836*X -0.2529522,08890,037

По условию задачи прогнозное значение фактора составляет 125% от его среднего уровня =22,9984:

=1,25∙22,9984=28,7479

и прогнозное значение среднедушевого прожиточного минимума в день при этом составит:

= 77,5426-0,7113*28,7479= 57,0942

Если доля машинистов-трактористов составит 125% от среднего уровня =22,9984, то валовой доход растениеводства, приходящийся на 100 га пашни составит 57,0942 тыс. руб.

Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал

Найдем ошибку прогноза:

=

= тыс.руб.

Далее строится доверительный интервал прогноза при уровне значимости g=0,05:

;

предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:

=2,2622∙25,7934=58,35

Доверительный интервал прогноза

Нижняя граница интервала:

Верхняя граница интервала:

Выполненный прогноз валового дохода растениеводства, приходящийся на 100 га пашни является неточным, так как в доверительный интервал входит 0.


источники:

http://helpiks.org/5-98042.html

http://poisk-ru.ru/s15375t23.html