Значение индекса детерминации для данного уравнения составляет

Пример нахождения коэффициента детерминации

Коэффициент детерминации рассчитывается для оценки качества подбора уравнения регрессии. Для приемлемых моделей предполагается, что коэффициент детерминации должен быть хотя бы не меньше 50%. Модели с коэффициентом детерминации выше 80% можно признать достаточно хорошими. Значение коэффициента детерминации R 2 = 1 означает функциональную зависимость между переменными.

Для линейной зависимости коэффициент детерминации равен квадрату коэффициента корреляции rxy: R 2 = rxy 2 .
2 «>Рассчитать свое значение
Например, значение R 2 = 0.83, означает, что в 83% случаев изменения х приводят к изменению y . Другими словами, точность подбора уравнения регрессии — высокая.

В общем случае, коэффициент детерминации находится по формуле: или
В этой формуле указаны дисперсии:
,
где ∑(y- y ) 2 — общая сумма квадратов отклонений;
— сумма квадратов отклонений, обусловленная регрессией («объясненная» или «факторная»);
— остаточная сумма квадратов отклонений.

В случае нелинейной регрессии коэффициент детерминации рассчитывается через этот калькулятор. При множественной регрессии, коэффициент детемрминации можно найти через сервис Множественная регрессия

Пример . Дано:

  • доля денежных доходов, направленных на прирост сбережений во вкладах, займах, сертификатах и в покупку валюты, в общей сумме среднедушевого денежного дохода, % (Y)
  • среднемесячная начисленная заработная плата, тыс. руб. (X)

Следует выполнить: 1. построить поле корреляции и сформировать гипотезу о возможной форме и направлении связи; 2. рассчитать параметры уравнений линейной и A1; 3. выполнить расчет прогнозного значения результата, предполагая, что прогнозные значения факторов составят B2 % от их среднего уровня; 4. оценить тесноту связи с помощью показателей корреляции и детерминации, проанализировать их значения; 5. Дать с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом; 6. Оценить с помощью средней ошибки аппроксимации качество уравнений; 7. Оценить надежность уравнений в целом через F-критерий Фишера для уровня значимости а = 0,05. По значениям характеристик, рассчитанных в пп. 5,6 и данном пункте, выберете лучшее уравнение регрессии и дайте его обоснование.

  • Решение онлайн
  • Видео решение

Уравнение имеет вид y = ax + b
1. Параметры уравнения регрессии.
Средние значения

Связь между признаком Y фактором X сильная и прямая.
Уравнение регрессии

Коэффициент детерминации для линейной регрессии равен квадрату коэффициента корреляции.
R 2 = 0.91 2 = 0.83, т.е. в 83% случаев изменения х приводят к изменению y. Другими словами — точность подбора уравнения регрессии — высокая

xyx 2y 2x ∙ yy(x)(y-y cp ) 2(y-y(x)) 2(x-x p ) 2
15.1255228.01650253850.5505.26527451.1762630.22420.25
17261289681214437549.38518772.0783161.41345.96
12293144858493516433.28473699.5319678.51556.96
10310100961003100386.84450587.755904.58655.36
741425547620306251054501872.88196906.672006001474.56
831985688939402251647552081.861007497.339381.62246.76
852549722564974012166652128.32457813.93176990.62440.36
812012656140481441629722035.421062428.38548.492061.16
221562484243984434364665.47337260.88803758.38184.96
103861001489963860386.84354332.480.71655.36
4383161466891532247.52357913.0318353.53998.56
14.1354.1198.81125386.814992.81482.04393327.5816368.87462.25
427.211775.127710.8219692405.81709494.3111775.18137990.811397376.912502.5
2. Оценка параметров уравнения регрессии
Значимость коэффициента корреляции

По таблице Стьюдента находим Tтабл
Tтабл (n-m-1;a) = (10;0.05) = 1.812
Поскольку Tнабл > Tтабл , то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициента корреляции статистически — значим

Анализ точности определения оценок коэффициентов регрессии

S a = 3.3432
Доверительные интервалы для зависимой переменной

Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и X = 1
(-557.64;913.38)
Проверка гипотез относительно коэффициентов линейного уравнения регрессии
1) t-статистика

Статистическая значимость коэффициента регрессии a подтверждается (6.95>1.812).

Статистическая значимость коэффициента регрессии b не подтверждается (0.96 Fkp, то коэффициент детерминации статистически значим

Значение индекса детерминации для данного уравнения составляет

Если коэффициент корреляции возвести в квадрат, то получим коэффициент (индекс) детерминации, который показывает, чему равна доля влияния изучаемого фактора на совокупный показатель. [c.51]

При значениях тесноты связи меньше 0,7 величина индекса детерминации d всегда будет меньше 50%. Это означает, что на долю вариации факторного признака х приходится меньшая доля по сравнению с другими признаками, влияющими на изменение результативного показателя. Синтезированные при таких условиях математические модели связи практического значения не имеют. [c.51]

Оценку качества построенной модели даст коэффициент (индекс) детерминации, а также средняя ошибка аппроксимации. [c.6]

Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака у характеризует коэффициент (индекс) детерминации R [c.7]

Качество построенной модели в целом оценивает коэффициент (индекс) детерминации. Коэффициент множественной детерминации рассчитывается как квадрат индекса множественной корреляции [c.52]

Поскольку в расчете индекса корреляции используется соотношение факторной и общей суммы квадратов отклонений, то R2 имеет тот же смысл, что и коэффициент детерминации. В специальных исследованиях величину Л2 для нелинейных связей называют индексом детерминации. [c.85]

Индекс детерминации используется для проверки существенности в целом уравнения нелинейной регрессии по F-критерию Фишера [c.85]

Индекс детерминации R2n можно сравнивать с коэффициентом детерминации г2 для обоснования возможности применения линейной функции. Чем больше кривизна линии регрессии, тем величина коэффициента детерминации г2 меньше индекса детерминации R2 , Близость этих показателей означает, что нет необходимости усложнять форму уравнения регрессии и можно использовать линейную функцию. Практически если величина (Л2 — г2 ) не превышает 0,1, то предположение о линейной форме связи считается оправданным. В противном случае проводится оценка существенности различия R2 , вычисленных по одним и тем же исходным данным, через /-критерий Стьюдента [c.86]

Оценив параметры этого уравнения по МНК, можно найти теоретические значения объема продукции г и соответственно остаточную сумму квадратов (/ — Р)2, которая используется в расчете индекса детерминации (корреляции) [c.118]

Поскольку Х0> —у) I (у —у) = 1 — R2, то величину скорректированного индекса детерминации можно представить в виде [c.119]

Как было показано выше, ранжирование факторов, участвующих в множественной линейной регрессии, может быть проведено через стандартизованные коэффициенты регрессии (/ -коэффициенты). Эта же цель может быть достигнута с помощью частных коэффициентов корреляции — для линейных связей. При нелинейной взаимосвязи исследуемых признаков эту функцию выполняют частные индексы детерминации. Кроме того, частные показатели корреляции широко используются при решении проблемы отбора факторов целесообразность включения того или иного фактора в модель доказывается величиной показателя частной корреляции. [c.121]

Индекс детерминации для данной модели составит [c.152]

Коэффициент (индекс) детерминации га (т. е. квадрат коэффициента корреляции) определяется как доля общей дисперсии, объясняемой регрессией, т. е. [c.82]

Относительные показатели, характеризующие взаимосвязь признаков в совокупности явлений, а также взаимосвязь результативных признаков-следствий с факторными признаками-причинами, например, связь уровня душевого дохода с размером потребления мяса или фруктов на одного человека связь дозы удобрений с урожайностью картофеля и т.п. К таким показателям относятся рассматриваемые в главе 8 коэффициенты корреляции, эластичности, детерминации, а также в главе 10 аналитические индексы. Относительные показатели взаимосвязи могут быть как отвлеченными, так и именованными числами. [c.48]

Метод регрессии предполагает анализ взаимосвязи случайных величин (признаков), среди которых выделяется один результативный признак, зависящий от прочих независимых между собой факторов. Оценка связи выполняется с помощью коэффициента детерминации (индекса корреляции). [c.467]

Коэффициент детерминации — R2 вычисляется как отношение факторной дисперсии к общей дисперсии, индекс корреляции — R является корнем квадратным из коэффициента детерминации. Для оценки значимости индекса R рассчитывается показатель [c.468]

Коэффициент детерминации — квадрат коэффициента или индекса корреляции. [c.7]

Тот же результат даст и индекс множественной детерминации, определенный через соотношение остаточной и общей дисперсии результативного признака. [c.117]

Формула скорректированного индекса множественной детерминации имеет вид [c.119]

В статистических пакетах прикладных программ в процедуре множественной регрессии обычно приводится скорректированный коэффициент (индекс) множественной корреляции (детерминации). Величина коэффициента множественной детерминации используется для оценки качества регрессионной модели. Низкое значение коэффициента (индекса) множественной корреляции означает, что в регрессионную модель не включены существенные факторы — с одной стороны, а с другой стороны — рассматриваемая форма связи не отражает реальные соотношения между переменными, включенными в модель. Требуются дальнейшие исследования по улучшению качества модели и увеличению ее практической значимости. [c.120]

Рассчитайте коэффициент детерминации и скорректированный индекс множественной корреляции. Охарактеризуйте тесноту связи рассматриваемого набора факторов с исследуемым результативным признаком. [c.11]

По своему аналитическому выражению коэффициент надежности (или надежность) является квадратом коэффициента корреляции (т.е. коэффициентом детерминации) результатов измерения с истинными результатами, а его квадратный корень (т.е. коэффициент корреляции R) принято называть индексом надежности. [c.79]

Портфельные менеджеры используют как традиционный подход, так и подход современной портфельной теории, каждый из которых акцентирует внимание на преимуществах снижения риска за счет диверсификации. Традиционный подход основан на подборе акций и облигаций хорошо известных компаний различных отраслей экономики. Современная портфельная теория (СПТ) использует такие статистические понятия, как дисперсия, корреляция и коэффициент детерминации, для измерения риска и потенциала диверсификации альтернативных инвестиционных инструментов. Отрицательно коррелированные вложения обеспечивают максимальный эффект диверсификации. Недиверсифицируемый риск ценной бумаги или портфеля измеряется с помощью фактора «бета», описанного в главе 5. Фактор «бета» измеряет реакцию ценной бумаги или портфеля на изменения рыночного индекса, например «Стэндард энд пур з 500». Чем выше коэффициент детерминации, который измеряет объясняющую способность регрессионного уравнения, тем надежнее оценки фактора «бета». Коэффициент детерминации фактора «бета» выше для портфелей, чем для отдельных ценных бумаг, в результате чего портфельные менеджеры больше доверяют портфельным пока- [c.178]

Приступая к статистическому исследованию зависимостей между анализируемыми переменными, исследователь должен в первую очередь установить сам факт наличия статистических связей и попытаться измерить степень их тесноты. В качестве основных измерителей степени-тесноты связей между количественными переменными в практике статистических исследований используются индекс корреляции, корреляционное отношение, парные, частные и множественные коэффициенты корреляции, коэффициент детерминации. [c.97]

Пусть исследуется вопрос о среднем спросе на кофе AQ (в граммах на одного человека). В качестве объясняющих переменных предполагается использовать следующие переменные P — индекс цен на кофе, In YD — логарифм от реального среднедушевого дохода, POP — численность населения, РТ -индекс цен на чай. Можно ли априори предвидеть, будут ли в этом случае значимыми все t-статистики и будет ли высоким коэффициент детерминации R Какими будут ваши предложения по уточнению состава объясняющих переменных. [c.256]

Индекс детерминации для нелинейных по оцениваемым параметрам функций в некоторых работах по эконометрике принято называть квази-/ 2 . Для его определения по функциям, использующим логарифмические преобразования (степенная, экс понента), необходимо сначала найти теоретические значения пу (в нашем примере In/ ), затем трансформировать их через антилогарифмы антилогарифм (1пу ) = у, т. е. найти теоретические значения результативного признака и далее определять индекс детерминации как квази- R , пользуясь формулой [c.118]

Коэффициент детерминации ( oeffi ient of determination) представляет собой пропорцию, в которой изменение доходности акций компании WM связано с изменением доходности рыночного индекса. Другими словами, он показывает, в какой степени колебания доходности WM можно отнести за счет колебаний доходности рыночного индекса. [c.512]

Так как коэффициент неопределенности ( oeffi ient of nondetermination) равен I минус коэффициент детерминации, то он представляет собой пропорцию, в которой изменение доходности акций компании WM не связано с изменением доходности рыночного индекса. Так, 73% величины колебания доходности акций компании WM нельзя приписать колебаниям доходности рыночного индекса. [c.513]

Значение Л-квадрат (R-squared) аналогично равно коэффициенту детерминации, приведенному в табл. 17.228. Так, 37% величины колебаний цен акций компании Ask omputer может быть отнесено за счет колебаний рыночного индекса, рассматриваемого за 60-месячный период. [c.514]

Скорректированный индекс множественной детерминации содержит поправку на число степеней свободы и рассчитьгоается по [c.53]

Следовательно, оценка МНК есть такая, при которой коэффициенты уравнения регрессии равны В = (XTXJ 1XTY (индекс —1 означает обратную матрицу). Коэффициент детерминации (скорректированный) равен [c.81]

Коэффициент детерминации будет принимать значения от нуля, когда X не влияет на Y, до единицы, когда изменение Y объясняется изменением X. Значение Л2 для рефессии данных по индексам FTSE 100 и S P 500 из табл. 6.1 составляет 0,8548. Обычная интерпретация коэффициента детерминации такова число (значение), скажем Л2 = 0,8548, умножается на 100 и выражается как процентная доля вариации Y, которая объясняется вариацией X. Таким образом, в этом примере 85,48% изменения Y (индекс FTSE 100) объясняются изменением X (индекс S P 500). Доверяете вы или нет тому, что рынок акций США имеет сильное определяющее влияние на рынок Великобритании, будет зависеть от того, насколько основательно вы исследовали конкурирующие теории. Вспомните, что данная регрессионная модель — это только математическое выражение той одной гипотезы. которая проверялась. [c.279]

Таким образом, введенный с помощью (1.6) индекс корреляции /л. между результи-рующим показателем г и объясняющими переменными формально определен для любой двумерной системы наблюдений. Квадрат его величины (I -i) показывает, какая доля дисперсии исследуемого результирующего показателя rj определяется (детерминируется) изменчивостью (дисперсией) соответствующей функции регрессии / от аргумента , поэтому часто называется коэффициентом детерминации. Соответственно оставшаяся доля дисперсии к (т. е. 1 — n-l) объясняется воздействием неконтролируемой случайной остаточной компоненты ( помехи ), а следовательно, определяет ту верхнюю границу точности, с которой мы сможем восстанавливать (предсказывать) значения rj по заданным значениям объясняющих переменных . [c.61]

Коэффициент детерминации: формулы, расчет, интерпретация, примеры

Коэффициент детерминации: формулы, расчет, интерпретация, примеры — Наука

Содержание:

В коэффициент детерминации — число от 0 до 1, которое представляет долю точек (X, Y), которые следуют за линией регрессии соответствия набора данных с двумя переменными.

Он также известен как степень соответствия и обозначается R 2 . Для его вычисления берется частное между дисперсией данных Ŷi, оцененных с помощью регрессионной модели, и дисперсией данных Yi, соответствующих каждому Xi данных.

Если 100% данных находятся на линии функции регрессии, то коэффициент детерминации будет равен 1.

Напротив, если для набора данных и некоторой функции настройки коэффициент R 2 оказывается равным 0,5, то можно сказать, что посадка на 50% удовлетворительна или хороша.

Аналогично, когда регрессионная модель возвращает значения R 2 ниже 0,5, это означает, что выбранная функция настройки не адаптируется удовлетворительно к данным, поэтому необходимо искать другую функцию настройки.

И когда ковариация или коэффициент корреляции стремится к нулю, то переменные X и Y в данных не связаны, и поэтому R 2 он также будет стремиться к нулю.

Как рассчитать коэффициент детерминации?

В предыдущем разделе было сказано, что коэффициент детерминации рассчитывается путем нахождения частного между дисперсиями:

-Оценено функцией регрессии переменной Y

-То переменной Yi, соответствующей каждой переменной Xi из N пар данных.

Математически это выглядит так:

Из этой формулы следует, что R 2 представляет собой долю дисперсии, объясняемую регрессионной моделью. В качестве альтернативы R можно рассчитать 2 используя следующую формулу, полностью эквивалентную предыдущей:

Где Sε представляет собой дисперсию остатков εi = Ŷi — Yi, а Sy представляет собой дисперсию набора значений Yi данных. Для определения Ŷi применяется функция регрессии, что означает утверждение, что Ŷi = f (Xi).

Дисперсия набора данных Yi, где i от 1 до N, рассчитывается следующим образом:

Sy = [Σ (Yi — ) 2 ) / (N-1)]

А затем поступаем аналогичным образом для Sŷ или для Sε.

Иллюстративный случай

Чтобы показать детали того, как расчет коэффициент детерминации Мы возьмем следующий набор из четырех пар данных:

Для этого набора данных предлагается линейная регрессия, полученная с помощью метода наименьших квадратов:

Применяя эту функцию регулировки, крутящие моменты получаются:

Затем мы вычисляем среднее арифметическое для X и Y:

= (1 + 2 + 3 + 4) / 4 = 2.5

= (1 + 3 + 6 + 7) / 4 = 4.25

Дисперсия Sy

Sy = [(1–4,25) 2 + (3 – 4.25) 2 + (6 – 4.25) 2 +…. ….(7 – 4.25) 2 ] / (4-1)=

= [(-3.25) 2 + (-1.25) 2 + (1.75) 2 + (2.75) 2 ) / (3)] = 7.583

Дисперсия Sŷ

Sŷ = [(1,1 — 4,25) 2 + (3.2 – 4.25) 2 + (5.3 – 4.25) 2 +…. ….(7.4 – 4.25) 2 ] / (4-1)=

= [(-3.25) 2 + (-1.25) 2 + (1.75) 2 + (2.75) 2 ) / (3)] = 7.35

Коэффициент детерминации R 2

р 2 = Sŷ / Sy = 7,35 / 7,58 = 0,97

Интерпретация

Коэффициент детерминации для иллюстративного случая, рассмотренного в предыдущем сегменте, оказался равным 0,98. Другими словами, линейная регулировка через функцию:

Он на 98% надежен в объяснении данных, с которыми он был получен с использованием метода наименьших квадратов.

Помимо коэффициента детерминации, есть коэффициент линейной корреляции или также известный как коэффициент Пирсона. Этот коэффициент, обозначаемый какр, рассчитывается по следующей зависимости:

Здесь числитель представляет собой ковариацию между переменными X и Y, а знаменатель — это произведение стандартного отклонения для переменной X и стандартного отклонения для переменной Y.

Коэффициент Пирсона может принимать значения от -1 до +1. Когда этот коэффициент стремится к +1, существует прямая линейная корреляция между X и Y. Если вместо этого он стремится к -1, существует линейная корреляция, но когда X увеличивается, Y уменьшается. Наконец, он близок к нулю, между двумя переменными нет корреляции.

Следует отметить, что коэффициент детерминации совпадает с квадратом коэффициента Пирсона, только если первый был рассчитан на основе линейной аппроксимации, но это равенство не действует для других нелинейных аппроксимаций.

Примеры

— Пример 1

Группа старшеклассников решила определить эмпирический закон для периода маятника в зависимости от его длины. Для достижения этой цели они проводят серию измерений, в которых измеряют время колебания маятника на разной длине, получая следующие значения:

Длина (м)Период (ы)
0,10,6
0,41,31
0,71,78
11,93
1,32,19
1,62,66
1,92,77
33,62

Требуется построить диаграмму рассеяния данных и выполнить линейную аппроксимацию через регрессию. Также покажите уравнение регрессии и его коэффициент детерминации.

Решение

Наблюдается довольно высокий коэффициент детерминации (95%), поэтому можно подумать, что линейная аппроксимация является оптимальной. Однако, если рассматривать точки вместе, оказывается, что они имеют тенденцию изгибаться вниз. Эта деталь не рассматривается в линейной модели.

— Пример 2

Для тех же данных в Примере 1 сделайте диаграмму рассеяния данных.В этом случае, в отличие от примера 1, требуется корректировка регрессии с использованием потенциальной функции.

Также покажите функцию подгонки и ее коэффициент детерминации R 2 .

Решение

Потенциальная функция имеет вид f (x) = Ax B , где A и B — константы, определяемые методом наименьших квадратов.

На предыдущем рисунке показана потенциальная функция и ее параметры, а также коэффициент детерминации с очень высоким значением 99%. Обратите внимание на то, что данные соответствуют кривизне линии тренда.

— Пример 3

Используя те же данные из примера 1 и примера 2, выполните полиномиальную аппроксимацию второй степени. Показать график, подобрать полином и коэффициент детерминации R 2 корреспондент.

Решение

При подборе полинома второй степени вы можете увидеть линию тренда, которая хорошо соответствует кривизне данных. Кроме того, коэффициент детерминации выше линейного соответствия и ниже потенциального соответствия.

Сравнение пригодности

Из трех показанных подгонок тот, у которого самый высокий коэффициент детерминации, является потенциальным подгонкой (пример 2).

Подгонка потенциала совпадает с физической теорией маятника, которая, как известно, устанавливает, что период маятника пропорционален квадратному корню из его длины, а коэффициент пропорциональности равен 2π / √g, где g — ускорение свободного падения.

Этот тип потенциального соответствия не только имеет самый высокий коэффициент детерминации, но и показатель степени и константа пропорциональности соответствуют физической модели.

Выводы

— Регулировка регрессии определяет параметры функции, которая направлена ​​на объяснение данных с использованием метода наименьших квадратов. Этот метод состоит в минимизации суммы квадратов разницы между значением Y настройки и значением Yi данных для значений Xi данных. Это определяет параметры функции настройки.

-Как мы видели, наиболее распространенной функцией настройки является линия, но она не единственная, поскольку настройки также могут быть полиномиальными, потенциальными, экспоненциальными, логарифмическими и другими.

-В любом случае коэффициент детерминации зависит от данных и типа корректировки и является показателем качества примененной корректировки.

-Наконец, коэффициент детерминации указывает процент общей изменчивости между значением Y данных по отношению к значению соответствия для данного X.

Ссылки

  1. Гонсалес К. Общая статистика. Получено с: tarwi.lamolina.edu.pe
  2. МАКО. Арагонский институт медицинских наук. Получено с: ics-aragon.com
  3. Салазар К. и Кастильо С. Основные принципы статистики. (2018). Получено с: dspace.uce.edu.ec
  4. Суперпроф. Коэффициент детерминации. Получено с: superprof.es
  5. USAC. Руководство по описательной статистике. (2011). Получено с: statistics.ingenieria.usac.edu.gt.
  6. Википедия. Коэффициент детерминации. Получено с: es.wikipedia.com.

Глобозиды: строение, биосинтез, функции и патологии

Сочетание алкоголя и марихуаны оказывает такое влияние на мозг


источники:

http://economy-ru.info/info/15186/

http://ru1.warbletoncouncil.org/coeficiente-de-determinacion-11466