Оценка параметров линейного регрессионного уравнения
Для оценки параметров регрессионного уравнения наиболее часто используют метод наименьших квадратов (МНК), в основе которого лежит предположение о независимости наблюдений исследуемой совокупности. Сущность данного метода заключается в нахождении параметров модели (α, β), при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:
В итоге получаем систему нормальных уравнений:
Эту систему можно записать в виде:
Решая данную систему линейных уравнений с двумя неизвестными получаем оценки наименьших квадратов:
В уравнениях регрессии параметр α показывает усредненное влияние на результативный признак неучтенных факторов, а параметр β – коэффициент регрессии показывает, насколько изменяется в среднем значение результативного признака при увеличении факторного на единицу.
Между линейным коэффициентом корреляции и коэффициентом регрессии существует определенная зависимость, выражаемая формулой:
где – коэффициент регрессии в уравнении связи;
– среднее квадратическое отклонение соответствующего статистически существенного факторного признака.
Имеются следующие данные о размере страховой суммы и страховых возмещений на автотранспортные средства одной из страховых компаний.
Зависимость между размером страховых возмещений и страховой суммой на автотранспорт
Объем страхового возмещения (тыс.долл.), Yi
Стоимость застрахованного автомобиля (тыс.долл.), X i
Линейные уравнения с параметром
Рассмотрим линейные уравнения с параметром вида: $$p(a)x-q(a)=0,$$ где \(p(a)\) и \(q(a)\)- выражения, которые зависят от параметра. Для того, чтобы решить такое уравнение, нужно найти все \(x\) при всех значениях параметра \(a\). Приведем наше уравнение к виду: $$p(a)x=q(a),$$ Отсюда единственное решение: \(x=\frac \) при \(p(a)≠0.\) Если же \(p(a)=0\) и \(q(a)=0\), то решением данного уравнения является любое число. И последний случай, когда \(p(a)=0\),а \(q(a)≠0\), то уравнение не имеет решений. Замечу, что по некоторым уравнениям сразу невозможно определить, являются ли они линейными. Выполнив некоторые преобразования, вдруг обнаружим, что в уравнении отсутствуют члены с \(x\) в степени большей, чем 1. Если изначально у нас и были старшие степени, то теперь они сократились. Мы провели анализ линейного уравнения в общем виде, теперь разберем несколько примеров: Решить уравнение \(ax-5a=7x-3\) при всех возможных \(a\). Перенесем все одночлены с \(x\) влево, а оставшиеся члены – вправо. И вынесем \(x\) за скобку, как общий множитель: $$x(a-7)=5a-3;$$ Первый случай, когда \((a-7)≠0\). Тогда мы можем поделить все уравнение на \(a-7\) и выразить: $$x=\frac<5a-3> Найдите все \(a\), при которых корнем уравнения $$ax+5a-2(3x+2)=-5x+a^2$$ будет любое число. Раскроем скобки и перенесем все члены, содержащие \(x\), влево, а остальные – вправо. $$ax-6x+5x=-5a+4+a^2$$ Приведем подобные: $$ax-x=a^2-5a+4$$ И вынесем за скобку \(x\) и разложим квадратный многочлен на множители: $$x(a-1)=a^2-5a+4$$ $$x(a-1)=(a-1)(a-4)$$ Первый случай: \((a-1)=0\),т.е. \(a=1\) $$x*0=(a-1)(a-4)$$ $$x*0=0.$$ Решением уравнения будет любое число. Из ОДЗ видно, что \(5a+x≠0\) и \(x-5a≠0,\) таким образом, \(x≠±5a.\) Приведем уравнение к общему знаменателю \(x^2-25a^2\) и умножим на него все уравнение: $$x^2-5ax-x^2-10ax-25a^2=-100a^2$$ $$-15ax=-75a^2$$ $$ax=5a^2.$$ После преобразований получили линейное уравнение. Первый случай: \(a=0.\) Получаем уравнение \(0*x=0.\) Решениями этого уравнения будет любое число, кроме \(x=0\) (ОДЗ \(x≠±5a\)). Ответ: При \(a=0\) решениями уравнения будут все действительные числа, кроме \(x=0.\) Если \(a≠0,\) то решений нет. Имеются следующие данные разных стран об индексе розничных цен на продукты питания (х) и об индексе промышленного производства (у). 1. Для характеристики зависимости у от х рассчитать параметры следующих функций: В) равносторонней гиперболы. 2. Для каждой модели рассчитать показатели: тесноты связи и среднюю ошибку аппроксимации. 3. Оценить статистическую значимость параметров регрессии и корреляции. 4. Выполнить прогноз значения индекса промышленного производства у при прогнозном значении индекса розничных цен на продукты питания х=138. 1. Для расчёта параметров линейной регрессии Решаем систему нормальных уравнений относительно a и b: Построим таблицу расчётных данных, как показано в таблице 1. Таблица 1 Расчетные данные для оценки линейной регрессии Среднее значение определим по формуле: Cреднее квадратическое отклонение рассчитаем по формуле: и занесём полученный результат в таблицу 1. Возведя в квадрат полученное значение получим дисперсию: Параметры уравнения можно определить также и по формулам: Таким образом, уравнение регрессии: Следовательно, с увеличением индекса розничных цен на продукты питания на 1, индекс промышленного производства увеличивается в среднем на 1,13. Рассчитаем линейный коэффициент парной корреляции: Связь прямая, достаточно тесная. Определим коэффициент детерминации: Вариация результата на 74,59% объясняется вариацией фактора х. Подставляя в уравнение регрессии фактические значения х, определим теоретические (расчётные) значения . , следовательно, параметры уравнения определены правильно. Рассчитаем среднюю ошибку аппроксимации – среднее отклонение расчётных значений от фактических: В среднем расчётные значения отклоняются от фактических на 5,01%. Оценку качества уравнения регрессии проведём с помощью F-теста. F-тест состоит в проверке гипотезы Н0 о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического Fфакт и критического (табличного) Fтабл значений F-критерия Фишера. Fфакт определяется по формуле: где n – число единиц совокупности; m – число параметров при переменных х. Таким образом, Н0 – гипотеза о случайной природе оцениваемых характеристик отклоняется и признаётся их статистическая значимость и надёжность. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение индекса розничных цен на продукты питания х = 138, тогда прогнозное значение индекса промышленного производства составит: 2. Степенная регрессия имеет вид: Для определения параметров производят логарифмирование степенной функции: Для определения параметров логарифмической функции строят систему нормальных уравнений по способу наименьших квадратов: Построим таблицу расчётных данных, как показано в таблице 2. Таблица 2 Расчетные данные для оценки степенной регрессии Продолжение таблицы 2 Расчетные данные для оценки степенной регрессии Решая систему нормальных уравнений, определяем параметры логарифмической функции. Получим линейное уравнение: Выполнив его потенцирование, получим: Подставляя в данное уравнение фактические значения х, получаем теоретические значения результата . По ним рассчитаем показатели: тесноты связи – индекс корреляции и среднюю ошибку аппроксимации. Связь достаточно тесная. В среднем расчётные значения отклоняются от фактических на 5,02%. Таким образом, Н0 – гипотеза о случайной природе оцениваемых характеристик отклоняется и признаётся их статистическая значимость и надёжность. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение индекса розничных цен на продукты питания х = 138, тогда прогнозное значение индекса промышленного производства составит: 3. Уравнение равносторонней гиперболы Для определения параметров этого уравнения используется система нормальных уравнений: Произведем замену переменных и получим следующую систему нормальных уравнений: Решая систему нормальных уравнений, определяем параметры гиперболы. Составим таблицу расчётных данных, как показано в таблице 3. Таблица 3 Расчетные данные для оценки гиперболической зависимости Продолжение таблицы 3 Расчетные данные для оценки гиперболической зависимости Значения параметров регрессии a и b составили: Связь достаточно тесная. В среднем расчётные значения отклоняются от фактических на 4,76%. Таким образом, Н0 – гипотеза о случайной природе оцениваемых характеристик отклоняется и признаётся их статистическая значимость и надёжность. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение индекса розничных цен на продукты питания х = 138, тогда прогнозное значение индекса промышленного производства составит: По уравнению равносторонней гиперболы получена наибольшая оценка тесноты связи по сравнению с линейной и степенной регрессиями. Средняя ошибка аппроксимации остаётся на допустимом уровне. http://sigma-center.ru/linear_equation_with_parametr http://ecson.ru/economics/econometrics/zadacha-1.postroenie-regressii-raschyot-korrelyatsii-oshibki-approximatsii-otsenka-znachimosti-i-prognoz.html
Ответ: При \(a=7\) \(x∈∅;\)
при \(a≠7\) \(x=\frac<5a-3>
Второй случай: \((a-1)≠0\), т.е. \(a≠1\) $$x=\frac<(a-1)(a-4)>
Ответ: \(a=1.\)Задача №1 Построение уравнения регрессии
Индекс розничных цен на продукты питания (х) Индекс промышленного производства (у) 1 100 70 2 105 79 3 108 85 4 113 84 5 118 85 6 118 85 7 110 96 8 115 99 9 119 100 10 118 98 11 120 99 12 124 102 13 129 105 14 132 112 Требуется:
Решение:
№ п/п х у ху x 2 y 2 1 100 70 7000 10000 4900 74,26340 0,060906 2 105 79 8295 11025 6241 79,92527 0,011712 3 108 85 9180 11664 7225 83,32238 0,019737 4 113 84 9492 12769 7056 88,98425 0,059336 5 118 85 10030 13924 7225 94,64611 0,113484 6 118 85 10030 13924 7225 94,64611 0,113484 7 110 96 10560 12100 9216 85,58713 0,108467 8 115 99 11385 13225 9801 91,24900 0,078293 9 119 100 11900 14161 10000 95,77849 0,042215 10 118 98 11564 13924 9604 94,64611 0,034223 11 120 99 11880 14400 9801 96,91086 0,021102 12 124 102 12648 15376 10404 101,4404 0,005487 13 129 105 13545 16641 11025 107,1022 0,020021 14 132 112 14784 17424 12544 110,4993 0,013399 Итого: 1629 1299 152293 190557 122267 1299,001 0,701866 Среднее значение: 116,3571 92,78571 10878,07 13611,21 8733,357 х х 8,4988 11,1431 х х х х х 72,23 124,17 х х х х х №п/п х у lg x lg y lg x*lg y (lg x) 2 (lg y) 2 1 100 70 2,000000 1,845098 3,690196 4,000000 3,404387 2 105 79 2,021189 1,897627 3,835464 4,085206 3,600989 3 108 85 2,033424 1,929419 3,923326 4,134812 3,722657 4 113 84 2,053078 1,924279 3,950696 4,215131 3,702851 5 118 85 2,071882 1,929419 3,997528 4,292695 3,722657 6 118 85 2,071882 1,929419 3,997528 4,292695 3,722657 7 110 96 2,041393 1,982271 4,046594 4,167284 3,929399 8 115 99 2,060698 1,995635 4,112401 4,246476 3,982560 9 119 100 2,075547 2,000000 4,151094 4,307895 4,000000 10 118 98 2,071882 1,991226 4,125585 4,292695 3,964981 11 120 99 2,079181 1,995635 4,149287 4,322995 3,982560 12 124 102 2,093422 2,008600 4,204847 4,382414 4,034475 13 129 105 2,110590 2,021189 4,265901 4,454589 4,085206 14 132 112 2,120574 2,049218 4,345518 4,496834 4,199295 Итого 1629 1299 28,90474 27,49904 56,79597 59,69172 54,05467 Среднее значение 116,3571 92,78571 2,064624 1,964217 4,056855 4,263694 3,861048 8,4988 11,1431 0,031945 0,053853 х х х 72,23 124,17 0,001021 0,0029 х х х №п/п х у 1 100 70 74,16448 17,34292 0,059493 519,1886 2 105 79 79,62057 0,385112 0,007855 190,0458 3 108 85 82,95180 4,195133 0,024096 60,61728 4 113 84 88,59768 21,13866 0,054734 77,1887 5 118 85 94,35840 87,57961 0,110099 60,61728 6 118 85 94,35840 87,57961 0,110099 60,61728 7 110 96 85,19619 116,7223 0,11254 10,33166 8 115 99 90,88834 65,79901 0,081936 38,6174 9 119 100 95,52408 20,03384 0,044759 52,04598 10 118 98 94,35840 13,26127 0,037159 27,18882 11 120 99 96,69423 5,316563 0,023291 38,6174 12 124 102 101,4191 0,337467 0,005695 84,90314 13 129 105 107,4232 5,872099 0,023078 149,1889 14 132 112 111,0772 0,85163 0,00824 369,1889 Итого 1629 1299 1296,632 446,4152 0,703074 1738,357 Среднее значение 116,3571 92,78571 х х х х 8,4988 11,1431 х х х х 72,23 124,17 х х х х №п/п х у z yz 1 100 70 0,010000000 0,700000 0,0001000 4900 2 105 79 0,009523810 0,752381 0,0000907 6241 3 108 85 0,009259259 0,787037 0,0000857 7225 4 113 84 0,008849558 0,743363 0,0000783 7056 5 118 85 0,008474576 0,720339 0,0000718 7225 6 118 85 0,008474576 0,720339 0,0000718 7225 7 110 96 0,009090909 0,872727 0,0000826 9216 8 115 99 0,008695652 0,860870 0,0000756 9801 9 119 100 0,008403361 0,840336 0,0000706 10000 10 118 98 0,008474576 0,830508 0,0000718 9604 11 120 99 0,008333333 0,825000 0,0000694 9801 12 124 102 0,008064516 0,822581 0,0000650 10404 13 129 105 0,007751938 0,813953 0,0000601 11025 14 132 112 0,007575758 0,848485 0,0000574 12544 Итого: 1629 1299 0,120971823 11,13792 0,0010510 122267 Среднее значение: 116,3571 92,78571 0,008640844 0,795566 0,0000751 8733,357 8,4988 11,1431 0,000640820 х х х 72,23 124,17 0,000000411 х х х №п/п х у 1 100 70 72,3262 0,033231 5,411206 519,1886 2 105 79 79,49405 0,006254 0,244083 190,0458 3 108 85 83,47619 0,017927 2,322012 60,61728 4 113 84 89,64321 0,067181 31,84585 77,1887 5 118 85 95,28761 0,121031 105,8349 60,61728 6 118 85 95,28761 0,121031 105,8349 60,61728 7 110 96 86,01027 0,10406 99,79465 10,33166 8 115 99 91,95987 0,071112 49,56344 38,6174 9 119 100 96,35957 0,036404 13,25272 52,04598 10 118 98 95,28761 0,027677 7,357059 27,18882 11 120 99 97,41367 0,016024 2,516453 38,6174 12 124 102 101,46 0,005294 0,291565 84,90314 13 129 105 106,1651 0,011096 1,357478 149,1889 14 132 112 108,8171 0,028419 10,1311 369,1889 Итого: 1629 1299 1298,988 0,666742 435,7575 1738,357 Среднее значение: 116,3571 92,78571 х х х х 8,4988 11,1431 х х х х 72,23 124,17 х х х х