Нулевая гипотеза при проверке коэффициента уравнения

Нулевая гипотеза в статистике: пример. Проверка нулевой гипотезы

Статистика — сложная наука об измерении и анализе различных данных. Как и во многих других дисциплинах, в этой отрасли существует понятие гипотезы. Так, гипотеза в статистике — это какое-либо положение, которое нужно принять или отвергнуть. Причём в данной отрасли есть несколько видов таких допущений, схожих между собой по определению, но отличающихся на практике. Нулевая гипотеза — сегодняшний предмет изучения.

От общего к частному: гипотезы в статистике

От основного определения предположений отходит ещё одно, не менее важное, — статистическая гипотеза есть изучение генеральной совокупности важных для науки объектов, относительно коих учёными делаются выводы. Ее можно проверить с помощью выборки (части генеральной совокупности). Приведём несколько примеров статистических гипотез:

1. Успеваемость всего класса, возможно, зависит от уровня образования каждого учащегося.

2. Начальный курс математики в равной степени усваивается как детьми, пришедшими в школу в 6 лет, так и детьми, пришедшими в 7.

Простой гипотезой в статистике называют такое предположение, которое однозначно характеризует определённый параметр величины, взятой учёным.

Сложная состоит из нескольких или бесконечного множества простых. Указывается некоторая область или нет точного ответа.

Полезно понимать несколько определений гипотез в статистике, чтобы не путать их на практике.

Концепция нулевой гипотезы

Нулевая гипотеза — это теория о том, что есть некие две совокупности, которые не различаются между собой. Однако на научном уровне нет понятия «не различаются», но есть «их сходство равно нулю». От этого определения и было образовано понятие. В статистике нулевая гипотеза обозначается как Н0. Причём крайним значением невозможного (маловероятного) считается от 0.01 до 0.05 или менее.

Лучше разобрать, что такое нулевая гипотеза, пример из жизни поможет. Педагог в университете предположил, что различный уровень подготовки учащихся двух групп к зачётной работе вызван незначительными параметрами, случайными причинами, не влияющими на общий уровень образования (разница в подготовке двух групп студентов равна нулю).

Однако встречно стоит привести пример альтернативной гипотезы — допущения, опровергающего утверждение нулевой теории (Н1). Например: директор университета предположил, что различный уровень в подготовке к зачётной работе у учащихся двух групп вызван применением педагогами разных методик обучения (разница в подготовке двух групп существенна и на то есть объяснение).

Теперь сразу видна разница между понятиями «нулевая гипотеза» и «альтернативная гипотеза». Примеры иллюстрируют эти понятия.

Проверка нулевой гипотезы

Создать предположение — это ещё полбеды. Настоящей проблемой для новичков считается проверка нулевой гипотезы. Именно тут многих и ожидают трудности.

Используя метод альтернативной гипотезы, утверждающей нечто обратное нулевой теории, можно сравнить оба варианта и выбрать верный. Так действует статистика.

Пусть нулевая гипотеза Н0, а альтернативная Н1, тогда:

Н0: c = c0;
Н1: c ≠ c0.

Здесь c — это некое среднее значение генеральной совокупности, которое предстоит найти, а c0 — данное изначально значение, по отношению к которому проверяется гипотеза. Также есть некоторое число Х — среднее значение выборки, по которому определяется c0.

Итак, проверка заключается в сравнении Х и c0, если Х=c0 ,то принимается нулевая гипотеза. Если же Х≠c0, то по условию верной считается альтернативная.

«Доверительный» способ проверки

Существует наиболее действенный способ, с помощью которого нулевая статистическая гипотеза легко проверяется на практике. Он заключается в построении диапазона значений до 95% точности.

Для начала понадобится знать формулу расчёта доверительного интервала:
X — t*Sx ≤ c ≤ X + t*Sx,

где Х — данное изначально число на основе альтернативной гипотезы;
t — табличные величины (коэффициент Стьюдента);
Sx — стандартная средняя ошибка, которая рассчитывается как Sx = σ/√n, где в числителе стандартное отклонение, а в знаменателе — объём выборки.

Итак, предположим ситуацию. До ремонта конвейер в день выпускал 32.1 кг конечной продукции, а после ремонта, как утверждает предприниматель, коэффициент полезного действия вырос, и конвейер, по недельной проверке, начал выпускать 39.6 кг в среднем.

Нулевая гипотеза будет утверждать, что ремонт никак не повлиял на КПД конвейера. Альтернативная гипотеза скажет, что ремонт коренным образом изменил КПД конвейера, поэтому производительность его повысилась.

По таблице находим n=7, t = 2,447, откуда формула примет следующий вид:

39,6 – 2,447*4,2 ≤ с ≤ 39,6 + 2,447*4,2;

Получается, что значение 32.1 входит в диапазон, а следовательно, значение, предложенное альтернативой — 39.6 — не принимается автоматически. Помните, что сначала проверяется на правильность нулевая гипотеза, а потом — противоположная.

Разновидности отрицания

До этого рассматривался такой вариант построения гипотезы, где Н0 утверждает что-либо, а Н1 это опровергает. Откуда можно было составить подобную систему:

Н0: с = с0;
Н1: с ≠ с0.

Но существует ещё два родственных способа опровержения. К примеру, нулевая гипотеза утверждает, что средняя оценка успеваемости класса больше 4.54, а альтернативная тогда скажет, что средняя успеваемость того же класса менее 4.54. И выглядеть в виде системы это будет так:

Нулевая гипотеза в статистике – определение, проверка и примеры

Статистика — это наука об измерениях различных данных и их анализе. Как и в других дисциплинах, в статистике есть понятие гипотезы. В данном случае, гипотеза – это какое-либо состояние, которое нужно принять или исключить. В данном направлении существуют несколько похожих между собой допущений, но имеющих некоторое отличие.

Статистическая гипотеза — это изучение генеральной совокупности (множество возможных результатов исследований) основных для науки объектов, относительно которых делаются выводы.

Как проверить гипотезу

Проверить ее возможно посредством выборки. Например, рассмотрим несколько статистических гипотез:

  1. — от степени образования каждого ученика, возможно зависит успеваемость класса в целом;
  2. — начальный курс математики одинаково усваивается как детьми, которые начали обучение в шестилетнем возрасте, так и детьми, начавшими обучение с 7 лет.

Предположение, характеризующее конкретные границы величины, взятые учеными, называется простой гипотезой. Из множества простых гипотез складывается сложная гипотеза, указывается какое-либо направление либо четкого ответа нет.

Подробности

Пример

Для понимания понятия нулевая гипотеза, рассмотрим пример. Профессор в институте предположил, что разная степень подготовки студентов двух групп к зачетной сессии вызвана некоторыми причинами, которые не влияют на общую степень образования (разница в степени подготовки двух групп учащихся равна нулю). В науке не существует понятия «не различаются», есть понятие- «сходство равно нулю».

Таким образом, нулевая гипотеза – это теория, утверждающая, что между сравнимыми характеристиками отсутствуют различия, а видимые колебания можно объяснить случайными отклонениями в выборках, которые лежат в основе проводимых сравнений. Иными словами, имеются две совокупности, сходство которых равно нулю.

Рассмотрим другой пример альтернативной теории – профессор в институте предположил, что разная степень подготовленности студентов двух групп к зачетной сессии обусловлена применением двух различных по сути методов обучения (подготовленность двух групп существенно отличается и на это есть разъяснение).

Из этих примеров видно, чем отличаются две гипотезы (нулевая и альтернативная) друг от друга

При использовании способа альтернативной гипотезы, которая утверждает обратное понятие по отношению к нулевой, можно путем сравнения из двух вариантов выбрать правильный. Это принцип статистики.

Если нулевая гипотеза в науке – НО, а альтернативная — Н1, отсюда следует формула:

где, с — некоторая средняя величина генеральной совокупности, которую нужно найти, а с0 — это изначальная величина, по отношению к которой исследуется гипотеза. Так же имеется число Х — средняя величина выборки, по которой определяется с0.

Исследование заключается в сравнении величин Х и с0, в случае если они равны – принимается нулевая гипотеза, если неравны, то правильной является альтернативная гипотеза.

Проверка нулевой гипотезы в статистике состоит в применении статистического критерия, который подчиняется разным законам распределения. Статистические критерии используются для опровержения правильности нулевой гипотезы, а не для ее доказательства.

Например, есть F — критерий, рассчитываемый по распределению Фишера, Т – критерий, который рассчитывается по распределению Стьюдента и т.д. Возьмем отрезок либо точку на оси Х (область допустимых значений), на которой имеется много величин статистики (при этих значениях нулевая гипотеза верна). Критическими значениями будем считать крайние точки отрезка, а соответственно, лучи расположенные в стороны отрезка (левую и правую) называются критическими областями. В случае, если вычисленное значение входит в них, то нулевая гипотеза опровергается, а альтернативная будет верной.

В процессе проверки нулевой теории возможны ошибки двух видов:

  1. Опровержение верной нулевой гипотезы (а=1).
  2. Принятие ложной нулевой теории (а=2).

Надо сказать, что это различные параметры, результаты ошибок могут иметь различные выборки и отличаться между собой. Рассмотрим на примере:

В производстве нового медицинского препарата необходима большая осторожность, потому что повышенная доза одного из входящих в состав компонентов может губительно сказаться на жизни пациентов. Рассчитать передозировку на химическом уровне не представляется возможным. Поэтому, перед запуском в продажу, медицинский препарат испытывают на кроликах либо крысах.

В случае, если в результате применения большинство животных не выживает, препарат в продажу не допускается, если, наоборот, все подопытные животные выжили – лекарство поступает в аптечную сеть. В первом случае медицинский препарат не был токсичен, просто во время испытания допустили ошибку и лекарство посчитали токсичным из-за гибели подопытных животных, и, соответственно, запретили к продаже — А=1.

Во втором случае, в процессе другого испытания, проверяя другую партию препарата было принято решение, что он не токсичен и препарат был допущен к продаже. Однако, в действительности он был токсичен — А=2. В первой ситуации, компания-поставщик понесет убытки, потому что всю партию медицинского препарата придется уничтожить и начать производство с нуля. Во втором случае, при покупке и употреблении препарата возможна смерть пациентов.

Для того, чтобы исключить ошибку, необходимо проверить правильность нулевой гипотезы

Для этого существует несколько этапов:

  1. — устанавливается допустимое значение ошибочной вероятности (Р=0,05),
  2. — подбирается статистика для эталона 1,
  3. — определяется область допустимых значений,
  4. — рассчитывается значение тестовой статистики (Т),
  5. — в случае, если статистика (Т) входит в область принятия нулевой теории, то нулевая гипотеза (и предположения) верны.

По этому принципу действует статистика: при правильной проверке нулевая гипотеза будет либо принята, либо отвергнута. Первые три этапа проверки самые сложные, чаще всего их доверяют специалистам-математикам, 4 и 5 пункты, зная статистические методы, может применить любой человек.

Проверка гипотез

Общий обзор

Часто делают выборку, чтобы определить аргумен­ты против гипотезы относительно популяции (генеральной совокупности). Этот процесс известен как проверка гипотез (проверка статистических гипотез или проверка значимости), он представляет количественную меру аргументов про­тив определенной гипотезы.

Установлено 5 стадий при проверке гипотез:

  1. Определение нулевой () и альтернативной гипотезы () при исследовании. Определение уровня значимости критерия.
  2. Отбор необходимых данных из выборки.
  3. Вычисление значения статистики критерия, отвечающей .
  4. Вычисление критической области, проверка статистики критерия на предмет попадания в критическую область.
  5. Интерпретация достигнутого уровня значимости р и результатов.

Определение нулевой и альтернативной гипотез, уровня статистической значимости

При проверке значимости гипотезу следует формулировать независимо от используемых при ее проверке данных (до проведения проверки). В таком случае можно получить действительно продуктивный результат.

Всегда проверяют нулевую гипотезу (), которая отвергает эффект (например, разница средних равняется нулю) в популяции.

Например, при сравнении показателей курения у мужчин и женщин в популяции нулевая гипотеза означала бы, что показатели курения одинаковые у женщин и мужчин в популяции.

Затем определяют альтернативную гипотезу (), которая принимается, если нулевая гипотеза неверна. Альтернативная гипотеза больше относится к той теории, которую собираются исследовать. Итак, на этом примере альтернативная гипотеза заключается в утверждении, что показатели курения различны у женщин и мужчин в популяции.

Разницу в показателях курения не уточнили, т.е. не установили, имеют ли в популяции мужчины более высокие или более низкие показатели, чем женщины. Такой подход известен как двусторонний критерий, потому что учитывают любую возможность, он рекомендуется постольку, поскольку редко есть уверенность заранее в направлении какого-либо различия, если таковое существует.

В некоторых случаях можно использовать односторонний критерий для гипотезы , в котором направление эффекта задано. Его можно применить, например, если рассматривать заболевание, от которого умерли все пациенты, не получившие лечения; новый препарат не мог бы ухудшить положение дел.

Уровень значимости. Важным этапом проверки статистических гипотез является определение уровня статистической значимости , т.е. максимально допускаемой исследователем вероятности ошибочного отклонения нулевой гипотезы.

Получение статистики критерия, определение критической области

После того как данные будут собраны, значения из выборки подставляют в формулу для вычисления статистики критерия (примеры различных статистик критериев см. ниже). Эта величина количественно отражает аргументы в наборе данных против нулевой гипотезы.

Критическая область. Для принятия решения об отклонении или не отклонении нулевой гипотезы необходимо также определить критическую область проверки гипотезы.

Выделяют 3 вида критических областей:

  • двусторонняя:

Рис. 1 Двусторонняя критическая область

Рис. 2 Левосторонняя критическая область

Рис. 3 Правосторонняя критическая область

— заданный исследователем уровень значимости.

Если наблюдаемое значение критерия (K) принадлежит критической области (Kкр, заштрихованная область на рис.1-3), гипотезу отвергают, если не принадлежит — не отвергают.

Для краткости можно записать и так:

| K | 0,05, то аргументов недостаточно, чтобы отвергнуть нулевую гипотезу. Не отвергая нулевую гипотезу, можно заявить, что результаты не значимы на 5% уровне. Данное заключение не означает, что нулевая гипотеза истинна, просто недостаточно аргументов (возможно, маленький объем выборки), чтобы ее отвергнуть.

Уровень значимости (т.е. выбранная «граница отсечки») 5% задается произвольно. На уровне 5% можно отвергнуть нулевую гипотезу, когда она верна. Если это может привести к серьезным последствиям, необходимо потребовать более веских аргументов, прежде чем отвергнуть нулевую гипотезу, например, выбрать значение = 0,01 (или 0,001).

Определение результата только как значимого на определенном уровне граничного значения (например 0, 05) может ввести в заблуждение. Например, если р = 0,04, то нулевую гипотезу отвергаем, но если р = 0,06, то ее не отвергли бы. Действительно ли они различны? Мы рекомендуем всегда указывать точное значение р, обычно получаемое путем компьютерного анализа.

Проверка гипотез против доверительных интервалов

Доверительные интервалы и проверка гипотез тесно связаны. Первоначальная цель проверки гипотезы состоит в том, чтобы принять решение и предоставить точное значение р.

Доверительный интервал (ДИ) количественно определяет изучаемый эффект (например, разницу в средних) и дает возможность оценить значение результатов. ДИ предоставляют интервал вероятных значений для истинного эффекта, поэтому его также можно использовать для принятия решения даже без точных значений р.

Например, если бы гипотетическое значение для данного эффекта (например, значение, равное нулю) находилось вне 95% ДИ, можно было бы счесть гипотетическое значение неправдоподобным и отвергнуть . В этом случае станет известно, что р


источники:

http://onlineserviceip.ru/polezno/nulevaya-gipoteza-v-statistike-primer-proverka.html

http://statistica.ru/theory/proverka-gipotez/