Индекс детерминации для нелинейного уравнения регрессии

Показатели корреляции и детерминации для нелинейных моделей регрессии

Индексом корреляции для нелинейных форм связи называется коэффициент корреляции, который вычисляется для оценки качества построенной нелинейной модели регрессии.

Индекс корреляции для нелинейных форм вычисляется с помощью теоремы о разложении дисперсий по формуле:

где G 2 (y) – это общая дисперсия зависимой переменной;

σ 2 (y) – это объяснённая с помощью построенной модели регрессии дисперсия переменной у, которая рассчитывается по формуле:

δ 2 (y) – необъяснённая или остаточная дисперсия переменной у, которая рассчитывается по формуле:

Также индекс корреляции для нелинейных форм можно рассчитать с помощью теоремы о разложении сумм квадратов по формуле:

где RSS (Regression Sum Square) – сумма квадратов объяснённой регрессии:

ESS (Error Sum Square) – сумма квадратов остатков модели множественной регрессии с n независимыми переменными:

TSS (TotalSumSquare) – общая сумма квадратов модели множественной регрессии с n независимыми переменными:

Индекс корреляции для нелинейных форм связи изменяется в пределах от нуля до единицы. С его помощью нельзя охарактеризовать направление связи между результативной и факторными переменными. Чем ближе значение индекса корреляции для нелинейных форм связи к единице, тем сильнее взаимосвязь между результативной и независимыми переменными, и наоборот, чем ближе значение индекса корреляции для нелинейных форм связи к нулю, тем слабее взаимосвязь между результативной и независимыми переменными.

Индексом детерминации называется квадрат индекса корреляции для нелинейных форм связи.

Расчёт индекса детерминации с помощью теоремы о разложении дисперсий:

Расчёт индекса детерминации с помощью теоремы о разложении сумм квадратов:

Индекс детерминации характеризует, на сколько процентов построенная модель регрессии объясняет вариацию значений результативной переменной относительно своего среднего уровня, т. е. показывает долю общей дисперсии результативной переменной, объяснённой вариацией факторных переменных, включённых в модель регрессии.

Коэффициент множественной детерминации также называется количественной характеристикой объяснённой построенной моделью регрессии дисперсии результативной переменной. Чем больше значение коэффициента множественной детерминации, тем лучше построенная модель регрессии характеризует взаимосвязь между переменными.

Пример нахождения коэффициента детерминации

Коэффициент детерминации рассчитывается для оценки качества подбора уравнения регрессии. Для приемлемых моделей предполагается, что коэффициент детерминации должен быть хотя бы не меньше 50%. Модели с коэффициентом детерминации выше 80% можно признать достаточно хорошими. Значение коэффициента детерминации R 2 = 1 означает функциональную зависимость между переменными.

Для линейной зависимости коэффициент детерминации равен квадрату коэффициента корреляции rxy: R 2 = rxy 2 .
2 «>Рассчитать свое значение
Например, значение R 2 = 0.83, означает, что в 83% случаев изменения х приводят к изменению y . Другими словами, точность подбора уравнения регрессии — высокая.

В общем случае, коэффициент детерминации находится по формуле: или
В этой формуле указаны дисперсии:
,
где ∑(y- y ) 2 — общая сумма квадратов отклонений;
— сумма квадратов отклонений, обусловленная регрессией («объясненная» или «факторная»);
— остаточная сумма квадратов отклонений.

В случае нелинейной регрессии коэффициент детерминации рассчитывается через этот калькулятор. При множественной регрессии, коэффициент детемрминации можно найти через сервис Множественная регрессия

Пример . Дано:

  • доля денежных доходов, направленных на прирост сбережений во вкладах, займах, сертификатах и в покупку валюты, в общей сумме среднедушевого денежного дохода, % (Y)
  • среднемесячная начисленная заработная плата, тыс. руб. (X)

Следует выполнить: 1. построить поле корреляции и сформировать гипотезу о возможной форме и направлении связи; 2. рассчитать параметры уравнений линейной и A1; 3. выполнить расчет прогнозного значения результата, предполагая, что прогнозные значения факторов составят B2 % от их среднего уровня; 4. оценить тесноту связи с помощью показателей корреляции и детерминации, проанализировать их значения; 5. Дать с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом; 6. Оценить с помощью средней ошибки аппроксимации качество уравнений; 7. Оценить надежность уравнений в целом через F-критерий Фишера для уровня значимости а = 0,05. По значениям характеристик, рассчитанных в пп. 5,6 и данном пункте, выберете лучшее уравнение регрессии и дайте его обоснование.

  • Решение онлайн
  • Видео решение

Уравнение имеет вид y = ax + b
1. Параметры уравнения регрессии.
Средние значения

Связь между признаком Y фактором X сильная и прямая.
Уравнение регрессии

Коэффициент детерминации для линейной регрессии равен квадрату коэффициента корреляции.
R 2 = 0.91 2 = 0.83, т.е. в 83% случаев изменения х приводят к изменению y. Другими словами — точность подбора уравнения регрессии — высокая

xyx 2y 2x ∙ yy(x)(y-y cp ) 2(y-y(x)) 2(x-x p ) 2
15.1255228.01650253850.5505.26527451.1762630.22420.25
17261289681214437549.38518772.0783161.41345.96
12293144858493516433.28473699.5319678.51556.96
10310100961003100386.84450587.755904.58655.36
741425547620306251054501872.88196906.672006001474.56
831985688939402251647552081.861007497.339381.62246.76
852549722564974012166652128.32457813.93176990.62440.36
812012656140481441629722035.421062428.38548.492061.16
221562484243984434364665.47337260.88803758.38184.96
103861001489963860386.84354332.480.71655.36
4383161466891532247.52357913.0318353.53998.56
14.1354.1198.81125386.814992.81482.04393327.5816368.87462.25
427.211775.127710.8219692405.81709494.3111775.18137990.811397376.912502.5
2. Оценка параметров уравнения регрессии
Значимость коэффициента корреляции

По таблице Стьюдента находим Tтабл
Tтабл (n-m-1;a) = (10;0.05) = 1.812
Поскольку Tнабл > Tтабл , то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициента корреляции статистически — значим

Анализ точности определения оценок коэффициентов регрессии

S a = 3.3432
Доверительные интервалы для зависимой переменной

Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и X = 1
(-557.64;913.38)
Проверка гипотез относительно коэффициентов линейного уравнения регрессии
1) t-статистика

Статистическая значимость коэффициента регрессии a подтверждается (6.95>1.812).

Статистическая значимость коэффициента регрессии b не подтверждается (0.96 Fkp, то коэффициент детерминации статистически значим

Индекс детерминации для нелинейного уравнения регрессии

Если коэффициент корреляции возвести в квадрат, то получим коэффициент (индекс) детерминации, который показывает, чему равна доля влияния изучаемого фактора на совокупный показатель. [c.51]

При значениях тесноты связи меньше 0,7 величина индекса детерминации d всегда будет меньше 50%. Это означает, что на долю вариации факторного признака х приходится меньшая доля по сравнению с другими признаками, влияющими на изменение результативного показателя. Синтезированные при таких условиях математические модели связи практического значения не имеют. [c.51]

Оценку качества построенной модели даст коэффициент (индекс) детерминации, а также средняя ошибка аппроксимации. [c.6]

Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака у характеризует коэффициент (индекс) детерминации R [c.7]

Качество построенной модели в целом оценивает коэффициент (индекс) детерминации. Коэффициент множественной детерминации рассчитывается как квадрат индекса множественной корреляции [c.52]

Поскольку в расчете индекса корреляции используется соотношение факторной и общей суммы квадратов отклонений, то R2 имеет тот же смысл, что и коэффициент детерминации. В специальных исследованиях величину Л2 для нелинейных связей называют индексом детерминации. [c.85]

Индекс детерминации используется для проверки существенности в целом уравнения нелинейной регрессии по F-критерию Фишера [c.85]

Индекс детерминации R2n можно сравнивать с коэффициентом детерминации г2 для обоснования возможности применения линейной функции. Чем больше кривизна линии регрессии, тем величина коэффициента детерминации г2 меньше индекса детерминации R2 , Близость этих показателей означает, что нет необходимости усложнять форму уравнения регрессии и можно использовать линейную функцию. Практически если величина (Л2 — г2 ) не превышает 0,1, то предположение о линейной форме связи считается оправданным. В противном случае проводится оценка существенности различия R2 , вычисленных по одним и тем же исходным данным, через /-критерий Стьюдента [c.86]

Оценив параметры этого уравнения по МНК, можно найти теоретические значения объема продукции г и соответственно остаточную сумму квадратов (/ — Р)2, которая используется в расчете индекса детерминации (корреляции) [c.118]

Поскольку Х0> —у) I (у —у) = 1 — R2, то величину скорректированного индекса детерминации можно представить в виде [c.119]

Как было показано выше, ранжирование факторов, участвующих в множественной линейной регрессии, может быть проведено через стандартизованные коэффициенты регрессии (/ -коэффициенты). Эта же цель может быть достигнута с помощью частных коэффициентов корреляции — для линейных связей. При нелинейной взаимосвязи исследуемых признаков эту функцию выполняют частные индексы детерминации. Кроме того, частные показатели корреляции широко используются при решении проблемы отбора факторов целесообразность включения того или иного фактора в модель доказывается величиной показателя частной корреляции. [c.121]

Индекс детерминации для данной модели составит [c.152]

Коэффициент (индекс) детерминации га (т. е. квадрат коэффициента корреляции) определяется как доля общей дисперсии, объясняемой регрессией, т. е. [c.82]

Относительные показатели, характеризующие взаимосвязь признаков в совокупности явлений, а также взаимосвязь результативных признаков-следствий с факторными признаками-причинами, например, связь уровня душевого дохода с размером потребления мяса или фруктов на одного человека связь дозы удобрений с урожайностью картофеля и т.п. К таким показателям относятся рассматриваемые в главе 8 коэффициенты корреляции, эластичности, детерминации, а также в главе 10 аналитические индексы. Относительные показатели взаимосвязи могут быть как отвлеченными, так и именованными числами. [c.48]

Метод регрессии предполагает анализ взаимосвязи случайных величин (признаков), среди которых выделяется один результативный признак, зависящий от прочих независимых между собой факторов. Оценка связи выполняется с помощью коэффициента детерминации (индекса корреляции). [c.467]

Коэффициент детерминации — R2 вычисляется как отношение факторной дисперсии к общей дисперсии, индекс корреляции — R является корнем квадратным из коэффициента детерминации. Для оценки значимости индекса R рассчитывается показатель [c.468]

Коэффициент детерминации — квадрат коэффициента или индекса корреляции. [c.7]

Тот же результат даст и индекс множественной детерминации, определенный через соотношение остаточной и общей дисперсии результативного признака. [c.117]

Формула скорректированного индекса множественной детерминации имеет вид [c.119]

В статистических пакетах прикладных программ в процедуре множественной регрессии обычно приводится скорректированный коэффициент (индекс) множественной корреляции (детерминации). Величина коэффициента множественной детерминации используется для оценки качества регрессионной модели. Низкое значение коэффициента (индекса) множественной корреляции означает, что в регрессионную модель не включены существенные факторы — с одной стороны, а с другой стороны — рассматриваемая форма связи не отражает реальные соотношения между переменными, включенными в модель. Требуются дальнейшие исследования по улучшению качества модели и увеличению ее практической значимости. [c.120]

Рассчитайте коэффициент детерминации и скорректированный индекс множественной корреляции. Охарактеризуйте тесноту связи рассматриваемого набора факторов с исследуемым результативным признаком. [c.11]

По своему аналитическому выражению коэффициент надежности (или надежность) является квадратом коэффициента корреляции (т.е. коэффициентом детерминации) результатов измерения с истинными результатами, а его квадратный корень (т.е. коэффициент корреляции R) принято называть индексом надежности. [c.79]

Портфельные менеджеры используют как традиционный подход, так и подход современной портфельной теории, каждый из которых акцентирует внимание на преимуществах снижения риска за счет диверсификации. Традиционный подход основан на подборе акций и облигаций хорошо известных компаний различных отраслей экономики. Современная портфельная теория (СПТ) использует такие статистические понятия, как дисперсия, корреляция и коэффициент детерминации, для измерения риска и потенциала диверсификации альтернативных инвестиционных инструментов. Отрицательно коррелированные вложения обеспечивают максимальный эффект диверсификации. Недиверсифицируемый риск ценной бумаги или портфеля измеряется с помощью фактора «бета», описанного в главе 5. Фактор «бета» измеряет реакцию ценной бумаги или портфеля на изменения рыночного индекса, например «Стэндард энд пур з 500». Чем выше коэффициент детерминации, который измеряет объясняющую способность регрессионного уравнения, тем надежнее оценки фактора «бета». Коэффициент детерминации фактора «бета» выше для портфелей, чем для отдельных ценных бумаг, в результате чего портфельные менеджеры больше доверяют портфельным пока- [c.178]

Приступая к статистическому исследованию зависимостей между анализируемыми переменными, исследователь должен в первую очередь установить сам факт наличия статистических связей и попытаться измерить степень их тесноты. В качестве основных измерителей степени-тесноты связей между количественными переменными в практике статистических исследований используются индекс корреляции, корреляционное отношение, парные, частные и множественные коэффициенты корреляции, коэффициент детерминации. [c.97]

Пусть исследуется вопрос о среднем спросе на кофе AQ (в граммах на одного человека). В качестве объясняющих переменных предполагается использовать следующие переменные P — индекс цен на кофе, In YD — логарифм от реального среднедушевого дохода, POP — численность населения, РТ -индекс цен на чай. Можно ли априори предвидеть, будут ли в этом случае значимыми все t-статистики и будет ли высоким коэффициент детерминации R Какими будут ваши предложения по уточнению состава объясняющих переменных. [c.256]

Индекс детерминации для нелинейных по оцениваемым параметрам функций в некоторых работах по эконометрике принято называть квази-/ 2 . Для его определения по функциям, использующим логарифмические преобразования (степенная, экс понента), необходимо сначала найти теоретические значения пу (в нашем примере In/ ), затем трансформировать их через антилогарифмы антилогарифм (1пу ) = у, т. е. найти теоретические значения результативного признака и далее определять индекс детерминации как квази- R , пользуясь формулой [c.118]

Коэффициент детерминации ( oeffi ient of determination) представляет собой пропорцию, в которой изменение доходности акций компании WM связано с изменением доходности рыночного индекса. Другими словами, он показывает, в какой степени колебания доходности WM можно отнести за счет колебаний доходности рыночного индекса. [c.512]

Так как коэффициент неопределенности ( oeffi ient of nondetermination) равен I минус коэффициент детерминации, то он представляет собой пропорцию, в которой изменение доходности акций компании WM не связано с изменением доходности рыночного индекса. Так, 73% величины колебания доходности акций компании WM нельзя приписать колебаниям доходности рыночного индекса. [c.513]

Значение Л-квадрат (R-squared) аналогично равно коэффициенту детерминации, приведенному в табл. 17.228. Так, 37% величины колебаний цен акций компании Ask omputer может быть отнесено за счет колебаний рыночного индекса, рассматриваемого за 60-месячный период. [c.514]

Скорректированный индекс множественной детерминации содержит поправку на число степеней свободы и рассчитьгоается по [c.53]

Следовательно, оценка МНК есть такая, при которой коэффициенты уравнения регрессии равны В = (XTXJ 1XTY (индекс —1 означает обратную матрицу). Коэффициент детерминации (скорректированный) равен [c.81]

Коэффициент детерминации будет принимать значения от нуля, когда X не влияет на Y, до единицы, когда изменение Y объясняется изменением X. Значение Л2 для рефессии данных по индексам FTSE 100 и S P 500 из табл. 6.1 составляет 0,8548. Обычная интерпретация коэффициента детерминации такова число (значение), скажем Л2 = 0,8548, умножается на 100 и выражается как процентная доля вариации Y, которая объясняется вариацией X. Таким образом, в этом примере 85,48% изменения Y (индекс FTSE 100) объясняются изменением X (индекс S P 500). Доверяете вы или нет тому, что рынок акций США имеет сильное определяющее влияние на рынок Великобритании, будет зависеть от того, насколько основательно вы исследовали конкурирующие теории. Вспомните, что данная регрессионная модель — это только математическое выражение той одной гипотезы. которая проверялась. [c.279]

Таким образом, введенный с помощью (1.6) индекс корреляции /л. между результи-рующим показателем г и объясняющими переменными формально определен для любой двумерной системы наблюдений. Квадрат его величины (I -i) показывает, какая доля дисперсии исследуемого результирующего показателя rj определяется (детерминируется) изменчивостью (дисперсией) соответствующей функции регрессии / от аргумента , поэтому часто называется коэффициентом детерминации. Соответственно оставшаяся доля дисперсии к (т. е. 1 — n-l) объясняется воздействием неконтролируемой случайной остаточной компоненты ( помехи ), а следовательно, определяет ту верхнюю границу точности, с которой мы сможем восстанавливать (предсказывать) значения rj по заданным значениям объясняющих переменных . [c.61]


источники:

http://math.semestr.ru/corel/prim2.php

http://economy-ru.info/info/15186/