Уравнение показательной регрессии имеет вид

Показательное уравнение регрессии

В случае b = e (примерное значение экспоненты e ≈ 2.718281828 ), показательное уравнение регрессии называется экспоненциальным и записывается как y=a·e x .

Здесь b — темп изменения в разах или константа тренда, которая показывает тенденцию ускоренного и все более ускоряющегося возрастания уровней.

Пример . Необходимо изучить зависимость потребительским расходами на моторное масло (у) и располагаемым личным доходом (х).

Составляем систему нормальных уравнений с помощью онлайн-калькулятора Нелинейная регрессия .
a•n + b∑x = ∑y
a∑x + b∑x 2 = ∑y•x

Для наших данных система уравнений имеет вид
21a + 20439.4 b = 32.32
20439.4 a + 20761197.38 b = 31007.03
Из первого уравнения выражаем а и подставим во второе уравнение:
Получаем эмпирические коэффициенты регрессии: b = -0.000515, a = 2.04
Уравнение регрессии (эмпирическое уравнение регрессии):
y = e 2.04 *e -0.000515x = 7.69529*0.99948 x
Эмпирические коэффициенты регрессии a и b являются лишь оценками теоретических коэффициентов βi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных.
Для расчета параметров регрессии построим расчетную таблицу (табл. 1)

log(y) 2x·log(y)
622.91.59388004.412.53989.93
6581.654329642.721084.82
700.41.7490560.162.911194.01
740.61.72548488.362.971275.88
774.41.72599695.362.971334.11
816.21.67666182.442.781361.18
853.51.61728462.252.591373.66
876.81.55768778.242.391356.9
9001.538100002.331373.45
951.41.61905161.962.591531.22
1007.91.691015862.412.841699.72
1004.81.441009623.042.061441.97
1010.81.441021716.642.061450.58
1056.21.531115558.442.331611.82
1105.41.481221909.162.21637.77
1162.31.551350941.292.391798.73
1200.71.551441680.492.391858.16
1209.51.361462890.251.851646.1
1248.61.281559001.961.641599.37
1254.41.281573519.361.641606.8
1284.61.391650197.161.921780.83
20439.432.3220761197.3850.131007.03

1. Параметры уравнения регрессии.
Выборочные средние.



Выборочные дисперсии:


Среднеквадратическое отклонение

Показательная парная регрессия.

1.4 Гиперболическая парная регрессия рассчитывается по формуле:

Для определения параметров a и b необходимо линеаризировать предыдущую формулу. Для этого сделаем замену:

Тогда

Для определения параметров a и b используем следующие формулы:

В таблице рассчитываем средние значения величин x, x*, y, x*y, x* 2 .

nухx*=1/xx*x*x*y
11,9218,260,05480,0029990,652793
8,3421,900,04570,0020850,380822
7,0812,120,08250,0068080,584158
10,5217,520,05710,0032580,600457
18,6826,280,03810,0014480,710807
8,2411,860,08430,0071090,694772
10,5015,080,06630,0043970,696286
7,3410,560,09470,0089680,695076
7,2810,400,09620,0092460,7
6,7210,780,09280,0086050,623377
8,1810,800,09260,0085730,757407
9,0413,640,07330,0053750,662757
7,3410,740,09310,0086690,683426
6,5611,780,08490,0072060,556876
9,2012,520,07990,006380,734824
7,6010,420,09600,009210,729367
8,7812,520,07990,006380,701278
6,8810,420,09600,009210,660269
8,0213,160,07600,0057740,609422
10,2814,920,06700,0044920,689008
среднее8,925013,78400,07750,00630,6562

Вычислим значение коэффициента регрессии b:

Вычислим значение коэффициента регрессии a:

Тогда показательное уравнение регрессии будет выглядеть следующим образом:

Гиперболическая парная регрессия.

  1. Оцените тесноту связи с помощью показателей корреляции и детерминации.

Оценка тесноты связи с помощью показателей корреляции.

2.1.1 Показатель корреляции для линейной регрессии:

, где .

nухxxxyyy
11,9218,26333,4276217,6592142,0864
8,3421,9479,6100182,646069,5556
7,0812,12146,894485,809650,1264
10,5217,52306,9504184,3104110,6704
18,6826,28690,6384490,9104348,9424
8,2411,86140,659697,726467,8976
10,515,08227,4064158,3400110,2500
7,3410,56111,513677,510453,8756
7,2810,4108,160075,712052,9984
6,7210,78116,208472,441645,1584
8,1810,8116,640088,344066,9124
9,0413,64186,0496123,305681,7216
7,3410,74115,347678,831653,8756
6,5611,78138,768477,276843,0336
9,212,52156,7504115,184084,6400
7,610,42108,576479,192057,7600
8,7812,52156,7504109,925677,0884
6,8810,42108,576471,689647,3344
8,0213,16173,1856105,543264,3204
10,2814,92222,6064153,3776105,6784
среднее8,92513,784207,236132,286886,6963

Определим среднеквадратические отклонения:

Определим показатель корреляции: .

2.1.2 Показатель корреляции для степенной регрессии:

,где

.

nухx*=lg(x)y*=lg(y)y*y*ŷ*e=y*-ŷ*ee
11,9218,261,26151,07631,15841,04350,03280,0011
8,3421,901,34040,92120,84851,1048-0,18360,0337
7,0812,121,08350,85000,72260,9053-0,05530,0031
10,5217,521,24351,02201,04451,0296-0,00750,0001
18,6826,281,41961,27141,61641,16630,10510,0111
8,2411,861,07410,91590,83890,89800,01790,0003
10,5015,081,17841,02121,04280,97900,04220,0018
7,3410,561,02370,86570,74940,85890,00680,0000
7,2810,401,01700,86210,74330,85370,00840,0001
6,7210,781,03260,82740,68450,8658-0,03850,0015
8,1810,801,03340,91280,83310,86640,04630,0021
9,0413,641,13480,95620,91430,94520,01100,0001
7,3410,741,03100,86570,74940,86460,00110,0000
6,5611,781,07110,81690,66730,8957-0,07880,0062
9,2012,521,09760,96380,92890,91630,04750,0023
7,6010,421,01790,88080,77580,85440,02640,0007
8,7812,521,09760,94350,89020,91630,02720,0007
6,8810,421,01790,83760,70160,8544-0,01680,0003
8,0213,161,11930,90420,81750,9331-0,02890,0008
10,2814,921,17381,01201,02410,97540,03660,0013
среднее8,925013,78401,12340,93630,88760,9363250,0000030,003364

Определим индекс корреляции:

; ;

.

2.1.3 Показатель корреляции для показательной регрессии:

,где

nухy*=lg(y)y*y*ŷ*e=y*-ŷ*ee
11,9218,261,07631,15841,03030,04600,0021
8,3421,900,92120,84851,1067-0,18550,0344
7,0812,120,85000,72260,9013-0,05130,0026
10,5217,521,02201,04451,01470,00730,0001
18,6826,281,27141,61641,19870,07270,0053
8,2411,860,91590,83890,89590,02010,0004
10,5015,081,02121,04280,96350,05770,0033
7,3410,560,86570,74940,8686-0,00290,0000
7,2810,400,86210,74330,8652-0,00310,0000
6,7210,780,82740,68450,8732-0,04580,0021
8,1810,800,91280,83310,87360,03920,0015
9,0413,640,95620,91430,93320,02290,0005
7,3410,740,86570,74940,8723-0,00660,0000
6,5611,780,81690,66730,8942-0,07730,0060
9,2012,520,96380,92890,90970,05410,0029
7,6010,420,88080,77580,86560,01520,0002
8,7812,520,94350,89020,90970,03380,0011
6,8810,420,83760,70160,8656-0,02800,0008
8,0213,160,90420,81750,9232-0,01900,0004
10,2814,921,01201,02410,96010,05190,0027
среднее8,925013,78400,93630,88760,93630,00010,0033

Определим индекс корреляции:

; ;

.

2.1.4 Показатель корреляции для гиперболической регрессии:

,где

nухx*=1/xy*yŷe=y-ŷee
11,9218,260,0548142,086411,67170,24830,0617
8,3421,900,045769,555612,7713-4,431319,6367
7,0812,120,082550,12648,3200-1,24001,5376
10,5217,520,0571110,670411,3922-0,87220,7608
18,6826,280,0381348,942413,69074,989324,8929
8,2411,860,084367,89768,10150,13850,0192
10,5015,080,0663110,250010,27650,22350,0499
7,3410,560,094753,87566,84750,49250,2426
7,2810,400,096252,99846,67150,60850,3703
6,7210,780,092845,15847,0810-0,36100,1303
8,1810,800,092666,91247,10171,07831,1627
9,0413,640,073381,72169,4308-0,39080,1527
7,3410,740,093153,87567,03920,30080,0905
6,5611,780,084943,03368,0323-1,47232,1677
9,2012,520,079984,64008,63850,56150,3153
7,6010,420,096057,76006,69380,90620,8212
8,7812,520,079977,08848,63850,14150,0200
6,8810,420,096047,33446,69380,18620,0347
8,0213,160,076064,32049,1077-1,08771,1831
10,2814,920,0670105,678410,19060,08940,0080
среднее8,925013,78400,077586,69638,91950,00552,6829

Определим индекс корреляции:

; ;

.

Вывод:

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1

Парная регрессия и корреляция

1. Парная регрессия и корреляция

1.1. Понятие регрессии

Парной регрессией называется уравнение связи двух переменных у и х

где у – зависимая переменная (результативный признак); х – независимая, объясняющая переменная (признак-фактор).

Различают линейные и нелинейные регрессии.

Линейная регрессия описывается уравнением: y = a + b × x +e .

Нелинейные регрессии делятся на два класса: регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам, и регрессии, нелинейные по оцениваемым параметрам.

Примеры регрессий, нелинейных по объясняющим переменным, но ли-

нейных по оцениваемым параметрам:

· полиномы разных степеней

· равносторонняя гипербола:

Примеры регрессий, нелинейных по оцениваемым параметрам:

· степенная

· показательная

· экспоненциальная

Наиболее часто применяются следующие модели регрессий:

– прямой

– гиперболы

– параболы

– показательной функции

– степенная функция

1.2. Построение уравнения регрессии

Постановка задачи. По имеющимся данным n наблюдений за совместным

изменением двух параметров x и y <(xi,yi), i=1,2. n> необходимо определить

аналитическую зависимость ŷ=f(x), наилучшим образом описывающую данные наблюдений.

Построение уравнения регрессии осуществляется в два этапа (предполагает решение двух задач):

– спецификация модели (определение вида аналитической зависимости

– оценка параметров выбранной модели.

1.2.1. Спецификация модели

Парная регрессия применяется, если имеется доминирующий фактор, который и используется в качестве объясняющей переменной.

Применяется три основных метода выбора вида аналитической зависимости:

– графический (на основе анализа поля корреляций);

– аналитический, т. е. исходя из теории изучаемой взаимосвязи;

– экспериментальный, т. е. путем сравнения величины остаточной дисперсии Dост или средней ошибки аппроксимации , рассчитанных для различных

моделей регрессии (метод перебора).

1.2.2. Оценка параметров модели

Для оценки параметров регрессий, линейных по этим параметрам, используется метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака у от теоретических значений ŷx при тех же значениях фактора x минимальна, т. е.

В случае линейной регрессии параметры а и b находятся из следующей

системы нормальных уравнений метода МНК:

(1.1)

Можно воспользоваться готовыми формулами, которые вытекают из этой

(1.2)

Для нелинейных уравнений регрессии, приводимых к линейным с помощью преобразования (x, y) → (x’, y’), система нормальных уравнений имеет

вид (1.1) в преобразованных переменных x’, y’.

Коэффициент b при факторной переменной x имеет следующую интерпретацию: он показывает, на сколько изменится в среднем величина y при изменении фактора x на 1 единицу измерения.

Линеаризующее преобразование: x’ = 1/x; y’ = y.

Уравнения (1.1) и формулы (1.2) принимают вид

Линеаризующее преобразование: x’ = x; y’ = lny.

Модифицированная экспонента: , (0 K и со знаком «–» в противном случае.

Степенная функция:

Линеаризующее преобразование: x’ = ln x; y’ = ln y.

Показательная функция:

Линеаризующее преобразование: x’ = x; y’ = lny.

Логарифмическая функция:

Линеаризующее преобразование: x’ = ln x; y’ = y.

Парабола второго порядка:

Парабола второго порядка имеет 3 параметра a0, a1, a2, которые определяются из системы трех уравнений

1.3. Оценка тесноты связи

Тесноту связи изучаемых явлений оценивает линейный коэффициент

парной корреляции rxy для линейной регрессии (–1 ≤ r xy ≤ 1)

и индекс корреляции ρxy для нелинейной регрессии

Имеет место соотношение

Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака у характеризует коэффициент детерминации r2xy (для линейной регрессии) или индекс детерминации (для нелинейной регрессии).

Коэффициент детерминации – квадрат коэффициента или индекса корреляции.

Для оценки качества построенной модели регрессии можно использовать

показатель (коэффициент, индекс) детерминации R2 либо среднюю ошибку аппроксимации.

Чем выше показатель детерминации или чем ниже средняя ошибка аппроксимации, тем лучше модель описывает исходные данные.

Средняя ошибка аппроксимации – среднее относительное отклонение

расчетных значений от фактических

Построенное уравнение регрессии считается удовлетворительным, если

значение не превышает 10–12 %.

1.4. Оценка значимости уравнения регрессии, его коэффициентов,

Оценка значимости всего уравнения регрессии в целом осуществляется с

помощью F-критерия Фишера.

F-критерий Фишера заключается в проверке гипотезы Но о статистической незначимости уравнения регрессии. Для этого выполняется сравнение

фактического Fфакт и критического (табличного) Fтабл значений F-критерия

Fфакт определяется из соотношения значений факторной и остаточной

дисперсий, рассчитанных на одну степень свободы

где n – число единиц совокупности; m – число параметров при переменных.

Для линейной регрессии m = 1 .

Для нелинейной регрессии вместо r 2 xy используется R2.

Fтабл – максимально возможное значение критерия под влиянием случайных факторов при степенях свободы k1 = m, k2 = n – m – 1 (для линейной регрессии m = 1) и уровне значимости α.

Уровень значимости α вероятность отвергнуть правильную гипотезу

при условии, что она верна. Обычно величина α принимается равной 0,05 или

Если Fтабл Fфакт, то гипотеза Но не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.

Для оценки статистической значимости коэффициентов линейной регрессии и линейного коэффициента парной корреляции применяется

t-критерий Стьюдента и рассчитываются доверительные интервалы каждого

Согласно t-критерию выдвигается гипотеза Н0 о случайной природе показателей, т. е. о незначимом их отличии от нуля. Далее рассчитываются фактические значения критерия tфакт для оцениваемых коэффициентов регрессии и коэффициента корреляции путем сопоставления их значений с величиной стандартной ошибки

Стандартные ошибки параметров линейной регрессии и коэффициента

корреляции определяются по формулам

Сравнивая фактическое и критическое (табличное) значения t-статистики

tтабл и tфакт принимают или отвергают гипотезу Но.

tтабл – максимально возможное значение критерия под влиянием случайных факторов при данной степени свободы k = n–2 и уровне значимости α.

Связь между F-критерием Фишера (при k1 = 1; m =1) и t-критерием Стьюдента выражается равенством

Если tтабл tфакт, то гипотеза Но не отклоняется и признается случайная природа формирования а, b или .

Значимость коэффициента детерминации R2 (индекса корреляции) определяется с помощью F-критерия Фишера. Фактическое значение критерия Fфакт определяется по формуле

Fтабл определяется из таблицы при степенях свободы k1 = 1, k2 = n–2 и при

заданном уровне значимости α. Если Fтабл


источники:

http://zdamsam.ru/b52151.html

http://pandia.ru/text/78/146/82802.php