Расчет линейной регрессии онлайн
Быстрая навигация по странице:
Общая характеристика линейной регрессии
Под линейной регрессией понимается функция вида Y = a0 + a1X1 + a2X2 + … anXn, объясняющая изменение величины зависимой (или эндогенной) переменной Y от изменения величин объясняющих (независимых) переменных X1, X2, … Xn. В том случае, когда в построенной функции объясняющая переменная (или фактор) X только одна, то тогда такую регрессию называют парной, если же в модели используется несколько факторных переменных X – то множественной регрессией. Особенностью линейной регрессии является то, что изменение (приращение) зависимой переменной Y пропорционально изменению объясняющих факторов X, а графиком такой регрессии является прямая линия. Расчет параметров линейной регрессии выполняется, как правило, при помощи метода наименьших квадратов (МНК). Качество построенной модели во многом зависит от количества значений наблюдений, используемых для построения уравнения линейной регрессии.
Размещено на www.rnz.ru
Формулы уравнения и коэффициентов линейной регрессии
Общая формула парной линейной регрессии следующая:
Y^ = a + b*x + ε
где: Y^ — теоретические (расчетные) значения зависимого показателя (зависимой переменной), получаемые по построенному уравнению;
a — свободный член уравнения регрессии;
b — коэффициент уравнения регрессии
Для нахождения параметров (коэффициентов) линейной регрессии существует множество формул. Приведем некоторые из них:
— формулы для нахождения свободного члена уравнения регрессии a:
— формулы для нахождения коэффициента регрессии b:
Для расчета параметров уравнения регрессии также можно решить следующую систему уравнений:
Пример расчета уравнения регрессии
Приведем пример расчета параметров уравнения регрессии для значений, приведенных в следующей таблице (пример условный):
По семи территориям Уральского региона известны значения двух признаков за 201_ год:
Район | Расходы на покупку продовольственных товаров в общих расходах, %, y | Среднедневная заработная плата одного работающего, руб., х |
---|---|---|
Удмуртская республика | 66.3 | 41.5 |
Свердловская область | 59.9 | 57.7 |
Республика Башкортостан | 57.3 | 55.8 |
Челябинская область | 53.1 | 59.4 |
Пермский край | 51.7 | 56.7 |
Курганская область | 50.7 | 44.6 |
Оренбургская область | 48 | 52.7 |
1. Для характеристики зависимости y от x рассчитать параметры уравнения парной линейной регрессии;
2. Рассчитать линейный коэффициент парной корреляции и дать его интерпретацию;
3. Рассчитать коэффициент детерминации и дать его интерпретацию;
4. Рассчитать коэффициент эластичности для линейной парной регрессии и дать его интерпретацию.
Для построения уравнения парной линейной регрессии составим таблицу вспомогательных расчетов, где будут произведены необходимые промежуточные вычисления:
№ района | Расходы на покупку продовольственных товаров в общих расходах, %, y | Среднедневная заработная плата одного работающего, руб., х | yx |
---|---|---|---|
1 | 66.3 | 41.5 | 2751.45 |
2 | 59.9 | 57.7 | 3456.23 |
3 | 57.3 | 55.8 | 3197.34 |
4 | 53.1 | 59.4 | 3154.14 |
5 | 51.7 | 56.7 | 2931.39 |
6 | 50.7 | 44.6 | 2261.22 |
7 | 48 | 52.7 | 2529.6 |
Итого | 387 | 368.4 | 20281.37 |
Среднее значение | 55.29 | 52.63 | 2897.34 |
σ | 5.84 | 6.4 | — |
σ 2 | 34.06 | 40.93 | — |
Далее рассчитаем коэффициенты уравнения парной линейной регрессии.
Коэффициент b вычислим по формуле:
Формула расчета коэффициента b уравнения парной линейной регрессии
Пример расчета коэффициента b уравнения парной линейной регрессии: b = (2897.34-55.29*52.63)/40.93 = -0.31
Коэффициент a вычислим по формуле:
Формула расчета коэффициента a уравнения парной линейной регрессии
Пример расчета коэффициента a уравнения парной линейной регрессии: a = 55.29 — -0.31*52.63 = 71.61
Получим следующее уравнение парной линейной регрессии:
Линейный коэффициент парной корреляции рассчитаем по формуле:
Формула расчета линейного коэффициента парной корреляции
Пример расчета линейного коэффициента парной корреляции:
ryx = -0.31*6.4 / 5.84 = -0.3397
Далее вычислим коэффициент детерминации по формуле:
Формула расчета коэффициента детерминации
Пример расчета значения коэффициента детерминации:
r 2 yx = -0.3397*-0.3397 = 0.1154 или 11.54%
Интерпретация значения коэффициента детерминации: согласно полученному значению коэффициента детерминации вариация расходов на покупку продовольственных товаров в общих расходах только на 11.54% определяется вариацией среднедневной заработной платой одного работающего, что является низким показателем.
Далее рассчитаем коэффициент эластичности для линейной регресии по формуле:
Формула расчета коэффициента эластичности для линейной регрессии
Пример расчета величины коэффициента эластичности для линейной регрессии:
Интерпретация значения коэффициента эластичности для линейной регрессии: полученное значение коэффициента эластичности показывает, что с изменением среднедневной заработной платы одного работающего на 1% от своего среднего значения величина расходов на покупку продовольственных товаров изменится на -0.295% в среднем по совокупности.
Далее рассчитаем значение F-критерия Фишера для построенного уравнения парной линейной регрессии. Расчет F-критерия Фишера выполним по формуле:
Формула расчета F-критерия Фишера
Пример расчета F-критерия Фишера: F = 0.1154 / 0.8846*5 = 0.65.
Интерпретация значения F-критерия Фишера. Так как полученное значение F-критерия Фишера меньше табличного критерия, то полученное уравнение парной линейной регрессии является статистически незначимым и не пригодным для описания зависимости доли расходов на покупку продовольственных товаров в общих расходах только от величины среднедневной заработной платой одного работающего. Показатель тесноты связи также признается статистически незначимым.
Онлайн калькулятор расчета уравнения регрессии
В заключении приводим небольшой онлайн калькулятор расчета параметров уравнения линейной регрессии, используя который, Вы можете самостоятельно определить значения соответствующих коэффициентов и построить линейную регрессии онлайн. При заполнении приведенной формы калькулятора внимательно соблюдайте размерность полей, что позволит выполнить построить уравнение регрессии онлайн быстро и точно. В приведенной форме онлайн калькулятора уже содержатся данные условного примера, чтобы пользователь мог посмотреть, как это работает. Для определения значений соответствующих показателей по своим данным просто внесите их в соответствующие поля формы онлайн калькулятора и нажмите кнопку «Выполнить вычисления». При заполнении формы соблюдайте размерность показателей! Дробные числа записываются с точной, а не запятой!
Приведенная форма рассчитана на ввод максимум 10 значений. Если у вас их меньше, то обязательно оставьте «лишние» поля формы пустыми!
Онлайн-калькулятор расчета коэффициента корреляции:
Заказать решение задач на построение уравнения регрессии
Мы можем помочь Вам выполнить построение различных уравнений регрессии, как линейных, так и нелинейных:
Линейная регрессия
Линейная регрессия это способ описания зависимости между двумя или более исходными данными. При использовании линейная регрессии в математическом анализе можно узнать:
Зависимость одной переменной (y) от переменной(x), или нескольких других переменных.
На сколько значение (y) может изменяться в зависимости от значения (x).
На сколько значение (y) зависит от значения (x).
Появляется возможность предсказать значение (y) от значения (x).
Калькулятор расчета регрессии
Важно! В качестве разделителя для чисел используйте пробел
Предсказать значение Y при помощи линейной регрессии
Формулы
- Уравнение регрессии Y = a + bx
- Наклон b = (NΣXY — (ΣX)(ΣY)) / (NΣX 2 — (ΣX) 2 )
- Перехват a = (ΣY — b(ΣX)) / N
- a = Точка пересечения линии регрессии и оси y
- b = Наклон линии регрессии
- X и Y-переменные
- N = Количество значений или элементов
Как пользоваться калькулятором линейной регрессии
Самый простой способ понять что такое линейная регрессия, это объяснить все на конкретном примере.
За исходными данными обратимся к официальному сайту федеральной службы государственной статистики. Возьмем от туда размер средней пенсии в России за последние одиннадцать лет и введем эти числа в поле Y, (15400 14900 14300 13620 13132 11783 10888 10400 9040 8202 7476 5191). Теперь в поле X внесем соответствующие им года (2020 2019 2018 2017 2016 2015 2014 2013 2012 2011 2010 2009).
После нажатия на кнопку «Вычислить», в поле «Наклон» (взято математическое название данной величины, не сарказм), вы увидите величину на которую каждый год изменяется размер средней пенсии. Поле «Корреляция» говорит нам о том, на сколько эти два числовых диапазона взаимосвязаны. Если ближе к -1, то противоположная связь. Если ближе к +1, то значение Y прямо зависит от значения X. Ели ближе к нулю, то зависимость между данными отсутствует.
Если вы хотите предсказать какое нибудь значение, тогда воспользуйтесь второй частью данного калькулятора. В поле «Введите X» поставьте год, в котором вы хотите узнать какой будет размер пенсии, затем нажмите «Вычислить». В поле «Значение Y» появится число, означающее размер пенсии в соответствующий период времени. Например если в поле «Введите X» поставим 2024 год, то узнаем какая средняя пенсия будет в этом году, она равна 19624 рублей.
Задача №1 Построение уравнения регрессии
Имеются следующие данные разных стран об индексе розничных цен на продукты питания (х) и об индексе промышленного производства (у).
Индекс розничных цен на продукты питания (х) | Индекс промышленного производства (у) | |
---|---|---|
1 | 100 | 70 |
2 | 105 | 79 |
3 | 108 | 85 |
4 | 113 | 84 |
5 | 118 | 85 |
6 | 118 | 85 |
7 | 110 | 96 |
8 | 115 | 99 |
9 | 119 | 100 |
10 | 118 | 98 |
11 | 120 | 99 |
12 | 124 | 102 |
13 | 129 | 105 |
14 | 132 | 112 |
Требуется:
1. Для характеристики зависимости у от х рассчитать параметры следующих функций:
В) равносторонней гиперболы.
2. Для каждой модели рассчитать показатели: тесноты связи и среднюю ошибку аппроксимации.
3. Оценить статистическую значимость параметров регрессии и корреляции.
4. Выполнить прогноз значения индекса промышленного производства у при прогнозном значении индекса розничных цен на продукты питания х=138.
Решение:
1. Для расчёта параметров линейной регрессии
Решаем систему нормальных уравнений относительно a и b:
Построим таблицу расчётных данных, как показано в таблице 1.
Таблица 1 Расчетные данные для оценки линейной регрессии
№ п/п | х | у | ху | x 2 | y 2 | ||
---|---|---|---|---|---|---|---|
1 | 100 | 70 | 7000 | 10000 | 4900 | 74,26340 | 0,060906 |
2 | 105 | 79 | 8295 | 11025 | 6241 | 79,92527 | 0,011712 |
3 | 108 | 85 | 9180 | 11664 | 7225 | 83,32238 | 0,019737 |
4 | 113 | 84 | 9492 | 12769 | 7056 | 88,98425 | 0,059336 |
5 | 118 | 85 | 10030 | 13924 | 7225 | 94,64611 | 0,113484 |
6 | 118 | 85 | 10030 | 13924 | 7225 | 94,64611 | 0,113484 |
7 | 110 | 96 | 10560 | 12100 | 9216 | 85,58713 | 0,108467 |
8 | 115 | 99 | 11385 | 13225 | 9801 | 91,24900 | 0,078293 |
9 | 119 | 100 | 11900 | 14161 | 10000 | 95,77849 | 0,042215 |
10 | 118 | 98 | 11564 | 13924 | 9604 | 94,64611 | 0,034223 |
11 | 120 | 99 | 11880 | 14400 | 9801 | 96,91086 | 0,021102 |
12 | 124 | 102 | 12648 | 15376 | 10404 | 101,4404 | 0,005487 |
13 | 129 | 105 | 13545 | 16641 | 11025 | 107,1022 | 0,020021 |
14 | 132 | 112 | 14784 | 17424 | 12544 | 110,4993 | 0,013399 |
Итого: | 1629 | 1299 | 152293 | 190557 | 122267 | 1299,001 | 0,701866 |
Среднее значение: | 116,3571 | 92,78571 | 10878,07 | 13611,21 | 8733,357 | х | х |
8,4988 | 11,1431 | х | х | х | х | х | |
72,23 | 124,17 | х | х | х | х | х |
Среднее значение определим по формуле:
Cреднее квадратическое отклонение рассчитаем по формуле:
и занесём полученный результат в таблицу 1.
Возведя в квадрат полученное значение получим дисперсию:
Параметры уравнения можно определить также и по формулам:
Таким образом, уравнение регрессии:
Следовательно, с увеличением индекса розничных цен на продукты питания на 1, индекс промышленного производства увеличивается в среднем на 1,13.
Рассчитаем линейный коэффициент парной корреляции:
Связь прямая, достаточно тесная.
Определим коэффициент детерминации:
Вариация результата на 74,59% объясняется вариацией фактора х.
Подставляя в уравнение регрессии фактические значения х, определим теоретические (расчётные) значения .
,
следовательно, параметры уравнения определены правильно.
Рассчитаем среднюю ошибку аппроксимации – среднее отклонение расчётных значений от фактических:
В среднем расчётные значения отклоняются от фактических на 5,01%.
Оценку качества уравнения регрессии проведём с помощью F-теста.
F-тест состоит в проверке гипотезы Н0 о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического Fфакт и критического (табличного) Fтабл значений F-критерия Фишера.
Fфакт определяется по формуле:
где n – число единиц совокупности;
m – число параметров при переменных х.
Таким образом, Н0 – гипотеза о случайной природе оцениваемых характеристик отклоняется и признаётся их статистическая значимость и надёжность.
Полученные оценки уравнения регрессии позволяют использовать его для прогноза.
Если прогнозное значение индекса розничных цен на продукты питания х = 138, тогда прогнозное значение индекса промышленного производства составит:
2. Степенная регрессия имеет вид:
Для определения параметров производят логарифмирование степенной функции:
Для определения параметров логарифмической функции строят систему нормальных уравнений по способу наименьших квадратов:
Построим таблицу расчётных данных, как показано в таблице 2.
Таблица 2 Расчетные данные для оценки степенной регрессии
№п/п | х | у | lg x | lg y | lg x*lg y | (lg x) 2 | (lg y) 2 |
---|---|---|---|---|---|---|---|
1 | 100 | 70 | 2,000000 | 1,845098 | 3,690196 | 4,000000 | 3,404387 |
2 | 105 | 79 | 2,021189 | 1,897627 | 3,835464 | 4,085206 | 3,600989 |
3 | 108 | 85 | 2,033424 | 1,929419 | 3,923326 | 4,134812 | 3,722657 |
4 | 113 | 84 | 2,053078 | 1,924279 | 3,950696 | 4,215131 | 3,702851 |
5 | 118 | 85 | 2,071882 | 1,929419 | 3,997528 | 4,292695 | 3,722657 |
6 | 118 | 85 | 2,071882 | 1,929419 | 3,997528 | 4,292695 | 3,722657 |
7 | 110 | 96 | 2,041393 | 1,982271 | 4,046594 | 4,167284 | 3,929399 |
8 | 115 | 99 | 2,060698 | 1,995635 | 4,112401 | 4,246476 | 3,982560 |
9 | 119 | 100 | 2,075547 | 2,000000 | 4,151094 | 4,307895 | 4,000000 |
10 | 118 | 98 | 2,071882 | 1,991226 | 4,125585 | 4,292695 | 3,964981 |
11 | 120 | 99 | 2,079181 | 1,995635 | 4,149287 | 4,322995 | 3,982560 |
12 | 124 | 102 | 2,093422 | 2,008600 | 4,204847 | 4,382414 | 4,034475 |
13 | 129 | 105 | 2,110590 | 2,021189 | 4,265901 | 4,454589 | 4,085206 |
14 | 132 | 112 | 2,120574 | 2,049218 | 4,345518 | 4,496834 | 4,199295 |
Итого | 1629 | 1299 | 28,90474 | 27,49904 | 56,79597 | 59,69172 | 54,05467 |
Среднее значение | 116,3571 | 92,78571 | 2,064624 | 1,964217 | 4,056855 | 4,263694 | 3,861048 |
8,4988 | 11,1431 | 0,031945 | 0,053853 | х | х | х | |
72,23 | 124,17 | 0,001021 | 0,0029 | х | х | х |
Продолжение таблицы 2 Расчетные данные для оценки степенной регрессии
№п/п | х | у | ||||
---|---|---|---|---|---|---|
1 | 100 | 70 | 74,16448 | 17,34292 | 0,059493 | 519,1886 |
2 | 105 | 79 | 79,62057 | 0,385112 | 0,007855 | 190,0458 |
3 | 108 | 85 | 82,95180 | 4,195133 | 0,024096 | 60,61728 |
4 | 113 | 84 | 88,59768 | 21,13866 | 0,054734 | 77,1887 |
5 | 118 | 85 | 94,35840 | 87,57961 | 0,110099 | 60,61728 |
6 | 118 | 85 | 94,35840 | 87,57961 | 0,110099 | 60,61728 |
7 | 110 | 96 | 85,19619 | 116,7223 | 0,11254 | 10,33166 |
8 | 115 | 99 | 90,88834 | 65,79901 | 0,081936 | 38,6174 |
9 | 119 | 100 | 95,52408 | 20,03384 | 0,044759 | 52,04598 |
10 | 118 | 98 | 94,35840 | 13,26127 | 0,037159 | 27,18882 |
11 | 120 | 99 | 96,69423 | 5,316563 | 0,023291 | 38,6174 |
12 | 124 | 102 | 101,4191 | 0,337467 | 0,005695 | 84,90314 |
13 | 129 | 105 | 107,4232 | 5,872099 | 0,023078 | 149,1889 |
14 | 132 | 112 | 111,0772 | 0,85163 | 0,00824 | 369,1889 |
Итого | 1629 | 1299 | 1296,632 | 446,4152 | 0,703074 | 1738,357 |
Среднее значение | 116,3571 | 92,78571 | х | х | х | х |
8,4988 | 11,1431 | х | х | х | х | |
72,23 | 124,17 | х | х | х | х |
Решая систему нормальных уравнений, определяем параметры логарифмической функции.
Получим линейное уравнение:
Выполнив его потенцирование, получим:
Подставляя в данное уравнение фактические значения х, получаем теоретические значения результата . По ним рассчитаем показатели: тесноты связи – индекс корреляции и среднюю ошибку аппроксимации.
Связь достаточно тесная.
В среднем расчётные значения отклоняются от фактических на 5,02%.
Таким образом, Н0 – гипотеза о случайной природе оцениваемых характеристик отклоняется и признаётся их статистическая значимость и надёжность.
Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение индекса розничных цен на продукты питания х = 138, тогда прогнозное значение индекса промышленного производства составит:
3. Уравнение равносторонней гиперболы
Для определения параметров этого уравнения используется система нормальных уравнений:
Произведем замену переменных
и получим следующую систему нормальных уравнений:
Решая систему нормальных уравнений, определяем параметры гиперболы.
Составим таблицу расчётных данных, как показано в таблице 3.
Таблица 3 Расчетные данные для оценки гиперболической зависимости
№п/п | х | у | z | yz | ||
---|---|---|---|---|---|---|
1 | 100 | 70 | 0,010000000 | 0,700000 | 0,0001000 | 4900 |
2 | 105 | 79 | 0,009523810 | 0,752381 | 0,0000907 | 6241 |
3 | 108 | 85 | 0,009259259 | 0,787037 | 0,0000857 | 7225 |
4 | 113 | 84 | 0,008849558 | 0,743363 | 0,0000783 | 7056 |
5 | 118 | 85 | 0,008474576 | 0,720339 | 0,0000718 | 7225 |
6 | 118 | 85 | 0,008474576 | 0,720339 | 0,0000718 | 7225 |
7 | 110 | 96 | 0,009090909 | 0,872727 | 0,0000826 | 9216 |
8 | 115 | 99 | 0,008695652 | 0,860870 | 0,0000756 | 9801 |
9 | 119 | 100 | 0,008403361 | 0,840336 | 0,0000706 | 10000 |
10 | 118 | 98 | 0,008474576 | 0,830508 | 0,0000718 | 9604 |
11 | 120 | 99 | 0,008333333 | 0,825000 | 0,0000694 | 9801 |
12 | 124 | 102 | 0,008064516 | 0,822581 | 0,0000650 | 10404 |
13 | 129 | 105 | 0,007751938 | 0,813953 | 0,0000601 | 11025 |
14 | 132 | 112 | 0,007575758 | 0,848485 | 0,0000574 | 12544 |
Итого: | 1629 | 1299 | 0,120971823 | 11,13792 | 0,0010510 | 122267 |
Среднее значение: | 116,3571 | 92,78571 | 0,008640844 | 0,795566 | 0,0000751 | 8733,357 |
8,4988 | 11,1431 | 0,000640820 | х | х | х | |
72,23 | 124,17 | 0,000000411 | х | х | х |
Продолжение таблицы 3 Расчетные данные для оценки гиперболической зависимости
№п/п | х | у | ||||
---|---|---|---|---|---|---|
1 | 100 | 70 | 72,3262 | 0,033231 | 5,411206 | 519,1886 |
2 | 105 | 79 | 79,49405 | 0,006254 | 0,244083 | 190,0458 |
3 | 108 | 85 | 83,47619 | 0,017927 | 2,322012 | 60,61728 |
4 | 113 | 84 | 89,64321 | 0,067181 | 31,84585 | 77,1887 |
5 | 118 | 85 | 95,28761 | 0,121031 | 105,8349 | 60,61728 |
6 | 118 | 85 | 95,28761 | 0,121031 | 105,8349 | 60,61728 |
7 | 110 | 96 | 86,01027 | 0,10406 | 99,79465 | 10,33166 |
8 | 115 | 99 | 91,95987 | 0,071112 | 49,56344 | 38,6174 |
9 | 119 | 100 | 96,35957 | 0,036404 | 13,25272 | 52,04598 |
10 | 118 | 98 | 95,28761 | 0,027677 | 7,357059 | 27,18882 |
11 | 120 | 99 | 97,41367 | 0,016024 | 2,516453 | 38,6174 |
12 | 124 | 102 | 101,46 | 0,005294 | 0,291565 | 84,90314 |
13 | 129 | 105 | 106,1651 | 0,011096 | 1,357478 | 149,1889 |
14 | 132 | 112 | 108,8171 | 0,028419 | 10,1311 | 369,1889 |
Итого: | 1629 | 1299 | 1298,988 | 0,666742 | 435,7575 | 1738,357 |
Среднее значение: | 116,3571 | 92,78571 | х | х | х | х |
8,4988 | 11,1431 | х | х | х | х | |
72,23 | 124,17 | х | х | х | х |
Значения параметров регрессии a и b составили:
Связь достаточно тесная.
В среднем расчётные значения отклоняются от фактических на 4,76%.
Таким образом, Н0 – гипотеза о случайной природе оцениваемых характеристик отклоняется и признаётся их статистическая значимость и надёжность.
Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение индекса розничных цен на продукты питания х = 138, тогда прогнозное значение индекса промышленного производства составит:
По уравнению равносторонней гиперболы получена наибольшая оценка тесноты связи по сравнению с линейной и степенной регрессиями. Средняя ошибка аппроксимации остаётся на допустимом уровне.
http://calculators.vip/ru/lineynaya-regressiya/
http://ecson.ru/economics/econometrics/zadacha-1.postroenie-regressii-raschyot-korrelyatsii-oshibki-approximatsii-otsenka-znachimosti-i-prognoz.html