Для уравнения регрессии y 200 78 x

Задача №3. Расчёт параметров регрессии и корреляции с помощью Excel

По территориям региона приводятся данные за 200Х г.

Номер регионаСреднедушевой прожиточный минимум в день одного трудоспособного, руб., хСреднедневная заработная плата, руб., у
178133
282148
387134
479154
589162
6106195
767139
888158
973152
1087162
1176159
12115173

Задание:

1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.

2. Рассчитайте параметры уравнения линейной регрессии

.

3. Оцените тесноту связи с помощью показателей корреляции и детерминации.

4. Дайте с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.

5. Оцените с помощью средней ошибки аппроксимации качество уравнений.

6. Оцените с помощью F-критерия Фишера статистическую надёжность результатов регрессионного моделирования.

7. Рассчитайте прогнозное значение результата, если прогнозное значение фактора увеличится на 10% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости .

8. Оцените полученные результаты, выводы оформите в аналитической записке.

Решение:

Решим данную задачу с помощью Excel.

1. Сопоставив имеющиеся данные х и у, например, ранжировав их в порядке возрастания фактора х, можно наблюдать наличие прямой зависимости между признаками, когда увеличение среднедушевого прожиточного минимума увеличивает среднедневную заработную плату. Исходя из этого, можно сделать предположение, что связь между признаками прямая и её можно описать уравнением прямой. Этот же вывод подтверждается и на основе графического анализа.

Чтобы построить поле корреляции можно воспользоваться ППП Excel. Введите исходные данные в последовательности: сначала х, затем у.

Выделите область ячеек, содержащую данные.

Затем выберете: Вставка / Точечная диаграмма / Точечная с маркерами как показано на рисунке 1.

Рисунок 1 Построение поля корреляции

Анализ поля корреляции показывает наличие близкой к прямолинейной зависимости, так как точки расположены практически по прямой линии.

2. Для расчёта параметров уравнения линейной регрессии
воспользуемся встроенной статистической функцией ЛИНЕЙН.

1) Откройте существующий файл, содержащий анализируемые данные;
2) Выделите область пустых ячеек 5×2 (5 строк, 2 столбца) для вывода результатов регрессионной статистики.
3) Активизируйте Мастер функций: в главном меню выберете Формулы / Вставить функцию.
4) В окне Категория выберете Статистические, в окне функция – ЛИНЕЙН. Щёлкните по кнопке ОК как показано на Рисунке 2;

Рисунок 2 Диалоговое окно «Мастер функций»

5) Заполните аргументы функции:

Известные значения у – диапазон, содержащий данные результативного признака;

Известные значения х – диапазон, содержащий данные факторного признака;

Константа – логическое значение, которое указывает на наличие или на отсутствие свободного члена в уравнении; если Константа = 1, то свободный член рассчитывается обычным образом, если Константа = 0, то свободный член равен 0;

Статистика – логическое значение, которое указывает, выводить дополнительную информацию по регрессионному анализу или нет. Если Статистика = 1, то дополнительная информация выводится, если Статистика = 0, то выводятся только оценки параметров уравнения.

Щёлкните по кнопке ОК;

Рисунок 3 Диалоговое окно аргументов функции ЛИНЕЙН

6) В левой верхней ячейке выделенной области появится первый элемент итоговой таблицы. Чтобы раскрыть всю таблицу, нажмите на клавишу , а затем на комбинацию клавиш + + .

Дополнительная регрессионная статистика будет выводиться в порядке, указанном в следующей схеме:

Значение коэффициента bЗначение коэффициента a
Стандартная ошибка bСтандартная ошибка a
Коэффициент детерминации R 2Стандартная ошибка y
F-статистикаЧисло степеней свободы df
Регрессионная сумма квадратов

Остаточная сумма квадратов

Рисунок 4 Результат вычисления функции ЛИНЕЙН

Получили уровнение регрессии:

Делаем вывод: С увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,92 руб.

3. Коэффициент детерминации означает, что 52% вариации заработной платы (у) объясняется вариацией фактора х – среднедушевого прожиточного минимума, а 48% — действием других факторов, не включённых в модель.

По вычисленному коэффициенту детерминации можно рассчитать коэффициент корреляции: .

Связь оценивается как тесная.

4. С помощью среднего (общего) коэффициента эластичности определим силу влияния фактора на результат.

Для уравнения прямой средний (общий) коэффициент эластичности определим по формуле:

Средние значения найдём, выделив область ячеек со значениями х, и выберем Формулы / Автосумма / Среднее, и то же самое произведём со значениями у.

Рисунок 5 Расчёт средних значений функции и аргумент

Таким образом, при изменении среднедушевого прожиточного минимума на 1% от своего среднего значения среднедневная заработная плата изменится в среднем на 0,51%.

С помощью инструмента анализа данных Регрессия можно получить:
— результаты регрессионной статистики,
— результаты дисперсионного анализа,
— результаты доверительных интервалов,
— остатки и графики подбора линии регрессии,
— остатки и нормальную вероятность.

Порядок действий следующий:

1) проверьте доступ к Пакету анализа. В главном меню последовательно выберите: Файл/Параметры/Надстройки.

2) В раскрывающемся списке Управление выберите пункт Надстройки Excel и нажмите кнопку Перейти.

3) В окне Надстройки установите флажок Пакет анализа, а затем нажмите кнопку ОК.

• Если Пакет анализа отсутствует в списке поля Доступные надстройки, нажмите кнопку Обзор, чтобы выполнить поиск.

• Если выводится сообщение о том, что пакет анализа не установлен на компьютере, нажмите кнопку Да, чтобы установить его.

4) В главном меню последовательно выберите: Данные / Анализ данных / Инструменты анализа / Регрессия, а затем нажмите кнопку ОК.

5) Заполните диалоговое окно ввода данных и параметров вывода:

Входной интервал Y – диапазон, содержащий данные результативного признака;

Входной интервал X – диапазон, содержащий данные факторного признака;

Метки – флажок, который указывает, содержит ли первая строка названия столбцов или нет;

Константа – ноль – флажок, указывающий на наличие или отсутствие свободного члена в уравнении;

Выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона;

6) Новый рабочий лист – можно задать произвольное имя нового листа.

Затем нажмите кнопку ОК.

Рисунок 6 Диалоговое окно ввода параметров инструмента Регрессия

Результаты регрессионного анализа для данных задачи представлены на рисунке 7.

Рисунок 7 Результат применения инструмента регрессия

5. Оценим с помощью средней ошибки аппроксимации качество уравнений. Воспользуемся результатами регрессионного анализа представленного на Рисунке 8.

Рисунок 8 Результат применения инструмента регрессия «Вывод остатка»

Составим новую таблицу как показано на рисунке 9. В графе С рассчитаем относительную ошибку аппроксимации по формуле:

Рисунок 9 Расчёт средней ошибки аппроксимации

Средняя ошибка аппроксимации рассчитывается по формуле:

Качество построенной модели оценивается как хорошее, так как не превышает 8 – 10%.

6. Из таблицы с регрессионной статистикой (Рисунок 4) выпишем фактическое значение F-критерия Фишера:

Поскольку при 5%-ном уровне значимости, то можно сделать вывод о значимости уравнения регрессии (связь доказана).

8. Оценку статистической значимости параметров регрессии проведём с помощью t-статистики Стьюдента и путём расчёта доверительного интервала каждого из показателей.

Выдвигаем гипотезу Н0 о статистически незначимом отличии показателей от нуля:

.

для числа степеней свободы

На рисунке 7 имеются фактические значения t-статистики:

t-критерий для коэффициента корреляции можно рассчитать двумя способами:

I способ:

где – случайная ошибка коэффициента корреляции.

Данные для расчёта возьмём из таблицы на Рисунке 7.

II способ:

Фактические значения t-статистики превосходят табличные значения:

Поэтому гипотеза Н0 отклоняется, то есть параметры регрессии и коэффициент корреляции не случайно отличаются от нуля, а статистически значимы.

Доверительный интервал для параметра a определяется как

Для параметра a 95%-ные границы как показано на рисунке 7 составили:

Доверительный интервал для коэффициента регрессии определяется как

Для коэффициента регрессии b 95%-ные границы как показано на рисунке 7 составили:

Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью параметры a и b, находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля.

7. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение прожиточного минимума составит:

Тогда прогнозное значение прожиточного минимума составит:

Ошибку прогноза рассчитаем по формуле:

где

Дисперсию посчитаем также с помощью ППП Excel. Для этого:

1) Активизируйте Мастер функций: в главном меню выберете Формулы / Вставить функцию.

2) В окне Категория выберете Статистические, в окне функция – ДИСП.Г. Щёлкните по кнопке ОК.

3) Заполните диапазон, содержащий числовые данные факторного признака. Нажмите ОК.

Рисунок 10 Расчёт дисперсии

Получили значение дисперсии

Для подсчёта остаточной дисперсии на одну степень свободы воспользуемся результатами дисперсионного анализа как показано на Рисунке 7.

Доверительные интервалы прогноза индивидуальных значений у при с вероятностью 0,95 определяются выражением:

Интервал достаточно широк, прежде всего, за счёт малого объёма наблюдений. В целом выполненный прогноз среднемесячной заработной платы оказался надёжным.

Условие задачи взято из: Практикум по эконометрике: Учеб. пособие / И.И. Елисеева, С.В. Курышева, Н.М. Гордеенко и др.; Под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2003. – 192 с.: ил.

04. Решение типовых задач

По районам региона приводятся данные за 200Х г. (табл. 1.1).

Среднедушевой прожиточный минимум в день одного трудоспособного, руб., Х

Среднедневная заработная плата, руб., У

1. Построить линейное уравнение парной регрессии у от х.

2. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.

3. Оценить статистическую значимость параметров регрессии и корреляции.

4. Выполнить прогноз заработной платы у при прогнозном значении среднедушевого прожиточного минимума х, составляющем 107% от среднего уровня.

5. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.

1. Для расчета параметров уравнения линейной регрессии строим расчетную таблицу (табл. 1.2).

;

YI

.

Получено уравнение регрессии: .

С увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,92 руб.

2. Тесноту линейной связи оценит коэффициент корреляции:

; .

Это означает, что 52% вариации заработной платы (у) объясняется вариацией фактора х – среднедушевого прожиточного минимума.

Качество модели определяет средняя ошибка аппроксимации:

.

Качество построенной модели оценивается как хорошее, так как средняя относительная ошибка аппроксимации не превышает 8-10%.

3. Оценку статистической значимости параметров регрессии проведем с помощью t-статистики Стьюдента и путем расчета доверительного интервала каждого из показателей.

Выдвигаем гипотезу Н0 о статистически незначимом отличии показателя от нуля: .

Определим случайные ошибки Ma, mb, :

;

;

.

; ;

.

Фактические значения t-статистики превосходят табличные значения:

; ; ,

Поэтому гипотеза Н0 отклоняется, т. е. A, B и Rxy не случайно отличаются от нуля, а статистически значимы.

Рассчитаем доверительный интервал для A и B. Для этого определим предельную ошибку для каждого показателя:

; .

;

;

;

;

;

.

Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью параметры A и B, находясь в указанных границах, не принимают нулевые значения, т. е. не являются статистики незначимыми и существенно отличаются от нуля.

4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение промежуточного минимума составит: тыс. руб., тогда прогнозное значение прожиточного минимума составит: тыс. руб.

5. Ошибка прогноза составит:

тыс. руб.

Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:

.

Доверительный интервал прогноза:

;

руб.;

руб.

Выполненный прогноз среднемесячной заработной платы оказался надежным, но неточным, т. к. диапазон верхней и нижней границ доверительного интервала составляет 1,95 раза (121/62,2).

Зависимость потребления продукта А от среднедушевого дохода по данным 20 семей характеризуется следующим образом:

— уравнение регрессии ;

— индекс корреляции ;

— остаточная дисперсия .

Требуется провести дисперсионный анализ полученных результатов.

Результаты дисперсионного анализа приведены в табл. 1.3.

Расчет линейной регрессии онлайн

Быстрая навигация по странице:

Общая характеристика линейной регрессии

Под линейной регрессией понимается функция вида Y = a0 + a1X1 + a2X2 + … anXn, объясняющая изменение величины зависимой (или эндогенной) переменной Y от изменения величин объясняющих (независимых) переменных X1, X2, … Xn. В том случае, когда в построенной функции объясняющая переменная (или фактор) X только одна, то тогда такую регрессию называют парной, если же в модели используется несколько факторных переменных X – то множественной регрессией. Особенностью линейной регрессии является то, что изменение (приращение) зависимой переменной Y пропорционально изменению объясняющих факторов X, а графиком такой регрессии является прямая линия. Расчет параметров линейной регрессии выполняется, как правило, при помощи метода наименьших квадратов (МНК). Качество построенной модели во многом зависит от количества значений наблюдений, используемых для построения уравнения линейной регрессии.

Размещено на www.rnz.ru

Формулы уравнения и коэффициентов линейной регрессии

Общая формула парной линейной регрессии следующая:

Y^ = a + b*x + ε
где: Y^ — теоретические (расчетные) значения зависимого показателя (зависимой переменной), получаемые по построенному уравнению;
a — свободный член уравнения регрессии;
b — коэффициент уравнения регрессии

Для нахождения параметров (коэффициентов) линейной регрессии существует множество формул. Приведем некоторые из них:

— формулы для нахождения свободного члена уравнения регрессии a:

— формулы для нахождения коэффициента регрессии b:

Для расчета параметров уравнения регрессии также можно решить следующую систему уравнений:

Пример расчета уравнения регрессии

Приведем пример расчета параметров уравнения регрессии для значений, приведенных в следующей таблице (пример условный):

По семи территориям Уральского региона известны значения двух признаков за 201_ год:

РайонРасходы на покупку продовольственных товаров в общих расходах, %, yСреднедневная заработная плата одного работающего, руб., х
Удмуртская республика66.341.5
Свердловская область59.957.7
Республика Башкортостан57.355.8
Челябинская область53.159.4
Пермский край51.756.7
Курганская область50.744.6
Оренбургская область4852.7

1. Для характеристики зависимости y от x рассчитать параметры уравнения парной линейной регрессии;
2. Рассчитать линейный коэффициент парной корреляции и дать его интерпретацию;
3. Рассчитать коэффициент детерминации и дать его интерпретацию;
4. Рассчитать коэффициент эластичности для линейной парной регрессии и дать его интерпретацию.

Для построения уравнения парной линейной регрессии составим таблицу вспомогательных расчетов, где будут произведены необходимые промежуточные вычисления:

№ районаРасходы на покупку продовольственных товаров в общих расходах, %, yСреднедневная заработная плата одного работающего, руб., хyx
166.341.52751.45
259.957.73456.23
357.355.83197.34
453.159.43154.14
551.756.72931.39
650.744.62261.22
74852.72529.6
Итого387368.420281.37
Среднее значение55.2952.632897.34
σ5.846.4
σ 234.0640.93

Далее рассчитаем коэффициенты уравнения парной линейной регрессии.

Коэффициент b вычислим по формуле:

Формула расчета коэффициента b уравнения парной линейной регрессии

Пример расчета коэффициента b уравнения парной линейной регрессии: b = (2897.34-55.29*52.63)/40.93 = -0.31

Коэффициент a вычислим по формуле:

Формула расчета коэффициента a уравнения парной линейной регрессии

Пример расчета коэффициента a уравнения парной линейной регрессии: a = 55.29 — -0.31*52.63 = 71.61

Получим следующее уравнение парной линейной регрессии:

Линейный коэффициент парной корреляции рассчитаем по формуле:

Формула расчета линейного коэффициента парной корреляции

Пример расчета линейного коэффициента парной корреляции:

ryx = -0.31*6.4 / 5.84 = -0.3397

Далее вычислим коэффициент детерминации по формуле:

Формула расчета коэффициента детерминации

Пример расчета значения коэффициента детерминации:

r 2 yx = -0.3397*-0.3397 = 0.1154 или 11.54%

Интерпретация значения коэффициента детерминации: согласно полученному значению коэффициента детерминации вариация расходов на покупку продовольственных товаров в общих расходах только на 11.54% определяется вариацией среднедневной заработной платой одного работающего, что является низким показателем.

Далее рассчитаем коэффициент эластичности для линейной регресии по формуле:

Формула расчета коэффициента эластичности для линейной регрессии

Пример расчета величины коэффициента эластичности для линейной регрессии:

Интерпретация значения коэффициента эластичности для линейной регрессии: полученное значение коэффициента эластичности показывает, что с изменением среднедневной заработной платы одного работающего на 1% от своего среднего значения величина расходов на покупку продовольственных товаров изменится на -0.295% в среднем по совокупности.

Далее рассчитаем значение F-критерия Фишера для построенного уравнения парной линейной регрессии. Расчет F-критерия Фишера выполним по формуле:

Формула расчета F-критерия Фишера

Пример расчета F-критерия Фишера: F = 0.1154 / 0.8846*5 = 0.65.

Интерпретация значения F-критерия Фишера. Так как полученное значение F-критерия Фишера меньше табличного критерия, то полученное уравнение парной линейной регрессии является статистически незначимым и не пригодным для описания зависимости доли расходов на покупку продовольственных товаров в общих расходах только от величины среднедневной заработной платой одного работающего. Показатель тесноты связи также признается статистически незначимым.

Онлайн калькулятор расчета уравнения регрессии

В заключении приводим небольшой онлайн калькулятор расчета параметров уравнения линейной регрессии, используя который, Вы можете самостоятельно определить значения соответствующих коэффициентов и построить линейную регрессии онлайн. При заполнении приведенной формы калькулятора внимательно соблюдайте размерность полей, что позволит выполнить построить уравнение регрессии онлайн быстро и точно. В приведенной форме онлайн калькулятора уже содержатся данные условного примера, чтобы пользователь мог посмотреть, как это работает. Для определения значений соответствующих показателей по своим данным просто внесите их в соответствующие поля формы онлайн калькулятора и нажмите кнопку «Выполнить вычисления». При заполнении формы соблюдайте размерность показателей! Дробные числа записываются с точной, а не запятой!

Приведенная форма рассчитана на ввод максимум 10 значений. Если у вас их меньше, то обязательно оставьте «лишние» поля формы пустыми!

Онлайн-калькулятор расчета коэффициента корреляции:

Заказать решение задач на построение уравнения регрессии

Мы можем помочь Вам выполнить построение различных уравнений регрессии, как линейных, так и нелинейных:


источники:

http://matica.org.ua/metodichki-i-knigi-po-matematike/ekonometrika-m-a-krivtcova/4-reshenie-tipovykh-zadach

http://www.rnz.ru/econometrica/regressija.php