Выборочное уравнение линейной регрессии по корреляционной таблице

Корреляционная таблица

Пример 1 . По данной корреляционной таблице построить прямые регрессии с X на Y и с Y на X . Найти соответствующие коэффициенты регрессии и коэффициент корреляции между X и Y .

y/x152025303540
10022
12043103
140250710
160143
18011

Решение:
Уравнение линейной регрессии с y на x будем искать по формуле

а уравнение регрессии с x на y, использовав формулу:

где x x , y — выборочные средние величин x и y, σx, σy — выборочные среднеквадратические отклонения.
Находим выборочные средние:
x = (15(1 + 1) + 20(2 + 4 + 1) + 25(4 + 50) + 30(3 + 7 + 3) + 35(2 + 10 + 10) + 40(2 + 3))/103 = 27.961
y = (100(2 + 2) + 120(4 + 3 + 10 + 3) + 140(2 + 50 + 7 + 10) + 160(1 + 4 + 3) + 180(1 + 1))/103 = 136.893
Выборочные дисперсии:
σ 2 x = (15 2 (1 + 1) + 20 2 (2 + 4 + 1) + 25 2 (4 + 50) + 30 2 (3 + 7 + 3) + 35 2 (2 + 10 + 10) + 40 2 (2 + 3))/103 — 27.961 2 = 30.31
σ 2 y = (100 2 (2 + 2) + 120 2 (4 + 3 + 10 + 3) + 140 2 (2 + 50 + 7 + 10) + 160 2 (1 + 4 + 3) + 180 2 (1 + 1))/103 — 136.893 2 = 192.29
Откуда получаем среднеквадратические отклонения:
и
Определим коэффициент корреляции:

где ковариация равна:
Cov(x,y) = (35•100•2 + 40•100•2 + 25•120•4 + 30•120•3 + 35•120•10 + 40•120•3 + 20•140•2 + 25•140•50 + 30•140•7 + 35•140•10 + 15•160•1 + 20•160•4 + 30•160•3 + 15•180•1 + 20•180•1)/103 — 27.961 • 136.893 = -50.02
Запишем уравнение линий регрессии y(x):

и уравнение x(y):

Построим найденные уравнения регрессии на чертеже, из которого сделаем следующие вывод:
1) обе линии проходят через точку с координатами (27.961; 136.893)
2) все точки расположены близко к линиям регрессии.

Пример 2 . По данным корреляционной таблицы найти условные средние y и x . Оценить тесноту линейной связи между признаками x и y и составить уравнения линейной регрессии y по x и x по y . Сделать чертеж, нанеся его на него условные средние и найденные прямые регрессии. Оценить силу связи между признаками с помощью корреляционного отношения.
Корреляционная таблица:

X / Y246810
154200
206330
300123
500001

Уравнение линейной регрессии с y на x имеет вид:

Уравнение линейной регрессии с x на y имеет вид:

найдем необходимые числовые характеристики.
Выборочные средние:
x = (2(5) + 4(4 + 6) + 6(2 + 3 + 1) + 8(3 + 2) + 10(3 + 1) + )/30 = 5.53
y = (2(5) + 4(4 + 6) + 6(2 + 3 + 1) + 8(3 + 2) + 10(3 + 1) + )/30 = 1.93
Дисперсии:
σ 2 x = (2 2 (5) + 4 2 (4 + 6) + 6 2 (2 + 3 + 1) + 8 2 (3 + 2) + 10 2 (3 + 1))/30 — 5.53 2 = 6.58
σ 2 y = (1 2 (5 + 4 + 2) + 2 2 (6 + 3 + 3) + 3 2 (1 + 2 + 3) + 5 2 (1))/30 — 1.93 2 = 0.86
Откуда получаем среднеквадратические отклонения:
σx = 2.57 и σy = 0.93
и ковариация:
Cov(x,y) = (2•1•5 + 4•1•4 + 6•1•2 + 4•2•6 + 6•2•3 + 8•2•3 + 6•3•1 + 8•3•2 + 10•3•3 + 10•5•1)/30 — 5.53 • 1.93 = 1.84
Определим коэффициент корреляции:


Запишем уравнения линий регрессии y(x):

и вычисляя, получаем:
yx = 0.28 x + 0.39
Запишем уравнения линий регрессии x(y):

и вычисляя, получаем:
xy = 2.13 y + 1.42
Если построить точки, определяемые таблицей и линии регрессии, увидим, что обе линии проходят через точку с координатами (5.53; 1.93) и точки расположены близко к линиям регрессии.
Значимость коэффициента корреляции.

По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=30-m-1 = 28 находим tкрит:
tкрит (n-m-1;α/2) = (28;0.025) = 2.048
где m = 1 — количество объясняющих переменных.
Если tнабл > tкритич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).
Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически — значим.

Пример 3 . Распределение 50 предприятий пищевой промышленности по степени автоматизации производства Х (%) и росту производительности труда Y (%) представлено в таблице. Необходимо:
1. Вычислить групповые средние i и j x y, построить эмпирические линии регрессии.
2. Предполагая, что между переменными Х и Y существует линейная корреляционная зависимость:
а) найти уравнения прямых регрессии, построить их графики на одном чертеже с эмпирическими линиями регрессии и дать экономическую интерпретацию полученных уравнений;
б) вычислить коэффициент корреляции; на уровне значимости α= 0,05 оценить его значимость и сделать вывод о тесноте и направлении связи между переменными Х и Y;
в) используя соответствующее уравнение регрессии, оценить рост производительности труда при степени автоматизации производства 43%.
Скачать решение

Пример . По корреляционной таблице рассчитать ковариацию и коэффициент корреляции, построить прямые регрессии.

Пример 4 . Найти выборочное уравнение прямой Y регрессии Y на X по данной корреляционной таблице.
Решение находим с помощью калькулятора.
Скачать
Пример №4

Пример 5 . С целью анализа взаимного влияния прибыли предприятия и его издержек выборочно были проведены наблюдения за этими показателями в течение ряда месяцев: X — величина месячной прибыли в тыс. руб., Y — месячные издержки в процентах к объему продаж.
Результаты выборки сгруппированы и представлены в виде корреляционной таблицы, где указаны значения признаков X и Y и количество месяцев, за которые наблюдались соответствующие пары значений названных признаков.
Решение.
Пример №5
Пример №6
Пример №7

Пример 6 . Данные наблюдений над двумерной случайной величиной (X, Y) представлены в корреляционной таблице. Методом наименьших квадратов найти выборочное уравнение прямой регрессии Y на X. Построить график уравнения регрессии и показать точки (x;y)б рассчитанные по таблице данных.
Решение.
Скачать решение

Пример 7 . Дана корреляционная таблица для величин X и Y, X- срок службы колеса вагона в годах, а Y — усредненное значение износа по толщине обода колеса в миллиметрах. Определить коэффициент корреляции и уравнения регрессий.

X / Y02712172227323742
03600000000
125108448200000
230506021550000
311133321323100
4055131372000
500121263210
60101002101
70011000100

Решение.
Скачать решение

Пример 8 . По заданной корреляционной таблице определить групповые средние количественных признаков X и Y. Построить эмпирические и теоретические линии регрессии. Предполагая, что между переменными X и Y существует линейная зависимость:

  1. Вычислить выборочный коэффициент корреляции и проанализировать степень тесноты и направления связи между переменными.
  2. Определить линии регрессии и построить их графики.

Скачать

Корреляционно-регрессионный анализ в Excel: инструкция выполнения

Регрессионный и корреляционный анализ – статистические методы исследования. Это наиболее распространенные способы показать зависимость какого-либо параметра от одной или нескольких независимых переменных.

Ниже на конкретных практических примерах рассмотрим эти два очень популярные в среде экономистов анализа. А также приведем пример получения результатов при их объединении.

Регрессионный анализ в Excel

Показывает влияние одних значений (самостоятельных, независимых) на зависимую переменную. К примеру, как зависит количество экономически активного населения от числа предприятий, величины заработной платы и др. параметров. Или: как влияют иностранные инвестиции, цены на энергоресурсы и др. на уровень ВВП.

Результат анализа позволяет выделять приоритеты. И основываясь на главных факторах, прогнозировать, планировать развитие приоритетных направлений, принимать управленческие решения.

  • линейной (у = а + bx);
  • параболической (y = a + bx + cx 2 );
  • экспоненциальной (y = a * exp(bx));
  • степенной (y = a*x^b);
  • гиперболической (y = b/x + a);
  • логарифмической (y = b * 1n(x) + a);
  • показательной (y = a * b^x).

Рассмотрим на примере построение регрессионной модели в Excel и интерпретацию результатов. Возьмем линейный тип регрессии.

Задача. На 6 предприятиях была проанализирована среднемесячная заработная плата и количество уволившихся сотрудников. Необходимо определить зависимость числа уволившихся сотрудников от средней зарплаты.

Модель линейной регрессии имеет следующий вид:

Где а – коэффициенты регрессии, х – влияющие переменные, к – число факторов.

В нашем примере в качестве У выступает показатель уволившихся работников. Влияющий фактор – заработная плата (х).

В Excel существуют встроенные функции, с помощью которых можно рассчитать параметры модели линейной регрессии. Но быстрее это сделает надстройка «Пакет анализа».

Активируем мощный аналитический инструмент:

  1. Нажимаем кнопку «Офис» и переходим на вкладку «Параметры Excel». «Надстройки».
  2. Внизу, под выпадающим списком, в поле «Управление» будет надпись «Надстройки Excel» (если ее нет, нажмите на флажок справа и выберите). И кнопка «Перейти». Жмем.
  3. Открывается список доступных надстроек. Выбираем «Пакет анализа» и нажимаем ОК.

После активации надстройка будет доступна на вкладке «Данные».

Теперь займемся непосредственно регрессионным анализом.

  1. Открываем меню инструмента «Анализ данных». Выбираем «Регрессия».
  2. Откроется меню для выбора входных значений и параметров вывода (где отобразить результат). В полях для исходных данных указываем диапазон описываемого параметра (У) и влияющего на него фактора (Х). Остальное можно и не заполнять.
  3. После нажатия ОК, программа отобразит расчеты на новом листе (можно выбрать интервал для отображения на текущем листе или назначить вывод в новую книгу).

В первую очередь обращаем внимание на R-квадрат и коэффициенты.

R-квадрат – коэффициент детерминации. В нашем примере – 0,755, или 75,5%. Это означает, что расчетные параметры модели на 75,5% объясняют зависимость между изучаемыми параметрами. Чем выше коэффициент детерминации, тем качественнее модель. Хорошо – выше 0,8. Плохо – меньше 0,5 (такой анализ вряд ли можно считать резонным). В нашем примере – «неплохо».

Коэффициент 64,1428 показывает, каким будет Y, если все переменные в рассматриваемой модели будут равны 0. То есть на значение анализируемого параметра влияют и другие факторы, не описанные в модели.

Коэффициент -0,16285 показывает весомость переменной Х на Y. То есть среднемесячная заработная плата в пределах данной модели влияет на количество уволившихся с весом -0,16285 (это небольшая степень влияния). Знак «-» указывает на отрицательное влияние: чем больше зарплата, тем меньше уволившихся. Что справедливо.

Корреляционный анализ в Excel

Корреляционный анализ помогает установить, есть ли между показателями в одной или двух выборках связь. Например, между временем работы станка и стоимостью ремонта, ценой техники и продолжительностью эксплуатации, ростом и весом детей и т.д.

Если связь имеется, то влечет ли увеличение одного параметра повышение (положительная корреляция) либо уменьшение (отрицательная) другого. Корреляционный анализ помогает аналитику определиться, можно ли по величине одного показателя предсказать возможное значение другого.

Коэффициент корреляции обозначается r. Варьируется в пределах от +1 до -1. Классификация корреляционных связей для разных сфер будет отличаться. При значении коэффициента 0 линейной зависимости между выборками не существует.

Рассмотрим, как с помощью средств Excel найти коэффициент корреляции.

Для нахождения парных коэффициентов применяется функция КОРРЕЛ.

Задача: Определить, есть ли взаимосвязь между временем работы токарного станка и стоимостью его обслуживания.

Ставим курсор в любую ячейку и нажимаем кнопку fx.

  1. В категории «Статистические» выбираем функцию КОРРЕЛ.
  2. Аргумент «Массив 1» — первый диапазон значений – время работы станка: А2:А14.
  3. Аргумент «Массив 2» — второй диапазон значений – стоимость ремонта: В2:В14. Жмем ОК.

Чтобы определить тип связи, нужно посмотреть абсолютное число коэффициента (для каждой сферы деятельности есть своя шкала).

Для корреляционного анализа нескольких параметров (более 2) удобнее применять «Анализ данных» (надстройка «Пакет анализа»). В списке нужно выбрать корреляцию и обозначить массив. Все.

Полученные коэффициенты отобразятся в корреляционной матрице. Наподобие такой:

Корреляционно-регрессионный анализ

На практике эти две методики часто применяются вместе.

  1. Строим корреляционное поле: «Вставка» — «Диаграмма» — «Точечная диаграмма» (дает сравнивать пары). Диапазон значений – все числовые данные таблицы.
  2. Щелкаем левой кнопкой мыши по любой точке на диаграмме. Потом правой. В открывшемся меню выбираем «Добавить линию тренда».
  3. Назначаем параметры для линии. Тип – «Линейная». Внизу – «Показать уравнение на диаграмме».
  4. Жмем «Закрыть».

Теперь стали видны и данные регрессионного анализа.

Расчет линейной регрессии онлайн

Быстрая навигация по странице:

Общая характеристика линейной регрессии

Под линейной регрессией понимается функция вида Y = a0 + a1X1 + a2X2 + … anXn, объясняющая изменение величины зависимой (или эндогенной) переменной Y от изменения величин объясняющих (независимых) переменных X1, X2, … Xn. В том случае, когда в построенной функции объясняющая переменная (или фактор) X только одна, то тогда такую регрессию называют парной, если же в модели используется несколько факторных переменных X – то множественной регрессией. Особенностью линейной регрессии является то, что изменение (приращение) зависимой переменной Y пропорционально изменению объясняющих факторов X, а графиком такой регрессии является прямая линия. Расчет параметров линейной регрессии выполняется, как правило, при помощи метода наименьших квадратов (МНК). Качество построенной модели во многом зависит от количества значений наблюдений, используемых для построения уравнения линейной регрессии.

Размещено на www.rnz.ru

Формулы уравнения и коэффициентов линейной регрессии

Общая формула парной линейной регрессии следующая:

Y^ = a + b*x + ε
где: Y^ — теоретические (расчетные) значения зависимого показателя (зависимой переменной), получаемые по построенному уравнению;
a — свободный член уравнения регрессии;
b — коэффициент уравнения регрессии

Для нахождения параметров (коэффициентов) линейной регрессии существует множество формул. Приведем некоторые из них:

— формулы для нахождения свободного члена уравнения регрессии a:

— формулы для нахождения коэффициента регрессии b:

Для расчета параметров уравнения регрессии также можно решить следующую систему уравнений:

Пример расчета уравнения регрессии

Приведем пример расчета параметров уравнения регрессии для значений, приведенных в следующей таблице (пример условный):

По семи территориям Уральского региона известны значения двух признаков за 201_ год:

РайонРасходы на покупку продовольственных товаров в общих расходах, %, yСреднедневная заработная плата одного работающего, руб., х
Удмуртская республика66.341.5
Свердловская область59.957.7
Республика Башкортостан57.355.8
Челябинская область53.159.4
Пермский край51.756.7
Курганская область50.744.6
Оренбургская область4852.7

1. Для характеристики зависимости y от x рассчитать параметры уравнения парной линейной регрессии;
2. Рассчитать линейный коэффициент парной корреляции и дать его интерпретацию;
3. Рассчитать коэффициент детерминации и дать его интерпретацию;
4. Рассчитать коэффициент эластичности для линейной парной регрессии и дать его интерпретацию.

Для построения уравнения парной линейной регрессии составим таблицу вспомогательных расчетов, где будут произведены необходимые промежуточные вычисления:

№ районаРасходы на покупку продовольственных товаров в общих расходах, %, yСреднедневная заработная плата одного работающего, руб., хyx
166.341.52751.45
259.957.73456.23
357.355.83197.34
453.159.43154.14
551.756.72931.39
650.744.62261.22
74852.72529.6
Итого387368.420281.37
Среднее значение55.2952.632897.34
σ5.846.4
σ 234.0640.93

Далее рассчитаем коэффициенты уравнения парной линейной регрессии.

Коэффициент b вычислим по формуле:

Формула расчета коэффициента b уравнения парной линейной регрессии

Пример расчета коэффициента b уравнения парной линейной регрессии: b = (2897.34-55.29*52.63)/40.93 = -0.31

Коэффициент a вычислим по формуле:

Формула расчета коэффициента a уравнения парной линейной регрессии

Пример расчета коэффициента a уравнения парной линейной регрессии: a = 55.29 — -0.31*52.63 = 71.61

Получим следующее уравнение парной линейной регрессии:

Линейный коэффициент парной корреляции рассчитаем по формуле:

Формула расчета линейного коэффициента парной корреляции

Пример расчета линейного коэффициента парной корреляции:

ryx = -0.31*6.4 / 5.84 = -0.3397

Далее вычислим коэффициент детерминации по формуле:

Формула расчета коэффициента детерминации

Пример расчета значения коэффициента детерминации:

r 2 yx = -0.3397*-0.3397 = 0.1154 или 11.54%

Интерпретация значения коэффициента детерминации: согласно полученному значению коэффициента детерминации вариация расходов на покупку продовольственных товаров в общих расходах только на 11.54% определяется вариацией среднедневной заработной платой одного работающего, что является низким показателем.

Далее рассчитаем коэффициент эластичности для линейной регресии по формуле:

Формула расчета коэффициента эластичности для линейной регрессии

Пример расчета величины коэффициента эластичности для линейной регрессии:

Интерпретация значения коэффициента эластичности для линейной регрессии: полученное значение коэффициента эластичности показывает, что с изменением среднедневной заработной платы одного работающего на 1% от своего среднего значения величина расходов на покупку продовольственных товаров изменится на -0.295% в среднем по совокупности.

Далее рассчитаем значение F-критерия Фишера для построенного уравнения парной линейной регрессии. Расчет F-критерия Фишера выполним по формуле:

Формула расчета F-критерия Фишера

Пример расчета F-критерия Фишера: F = 0.1154 / 0.8846*5 = 0.65.

Интерпретация значения F-критерия Фишера. Так как полученное значение F-критерия Фишера меньше табличного критерия, то полученное уравнение парной линейной регрессии является статистически незначимым и не пригодным для описания зависимости доли расходов на покупку продовольственных товаров в общих расходах только от величины среднедневной заработной платой одного работающего. Показатель тесноты связи также признается статистически незначимым.

Онлайн калькулятор расчета уравнения регрессии

В заключении приводим небольшой онлайн калькулятор расчета параметров уравнения линейной регрессии, используя который, Вы можете самостоятельно определить значения соответствующих коэффициентов и построить линейную регрессии онлайн. При заполнении приведенной формы калькулятора внимательно соблюдайте размерность полей, что позволит выполнить построить уравнение регрессии онлайн быстро и точно. В приведенной форме онлайн калькулятора уже содержатся данные условного примера, чтобы пользователь мог посмотреть, как это работает. Для определения значений соответствующих показателей по своим данным просто внесите их в соответствующие поля формы онлайн калькулятора и нажмите кнопку «Выполнить вычисления». При заполнении формы соблюдайте размерность показателей! Дробные числа записываются с точной, а не запятой!

Приведенная форма рассчитана на ввод максимум 10 значений. Если у вас их меньше, то обязательно оставьте «лишние» поля формы пустыми!

Онлайн-калькулятор расчета коэффициента корреляции:

Заказать решение задач на построение уравнения регрессии

Мы можем помочь Вам выполнить построение различных уравнений регрессии, как линейных, так и нелинейных:


источники:

http://exceltable.com/otchety/korrelyacionno-regressionnyy-analiz

http://www.rnz.ru/econometrica/regressija.php