Проверка статистических гипотез в MS EXCEL о дисперсии нормального распределения

Рассмотрим использование MS EXCEL при проверке статистических гипотез о дисперсии нормального распределения. Вычислим тестовую статистику χ2 и Р-значение (Р-value).

Первое знакомство с процедурой проверки гипотез (Hypothesis testing) для дисперсии рекомендуется начать с изучения построения соответствующего доверительного интервала (см. статью Доверительный интервал для оценки дисперсии в MS EXCEL).

Примечание: Перечень статей о проверке гипотез приведен в статье Проверка статистических гипотез в MS EXCEL.

СОВЕТ: Для проверки гипотез потребуется знание следующих понятий:

Формулировка задачи. Из генеральной совокупности имеющей нормальное распределение с неизвестным средним значением μ (мю) и неизвестной дисперсией σ2 (сигма2) взята выборка размера n. Необходимо проверить двустороннюю статистическую гипотезу о равенстве неизвестной дисперсии σ2 заданному исследователем значению σ02 (англ. Inference on the variance of a normal population).

Примечание: Изложенный ниже метод проверки гипотез о дисперсии,очень чувствителен к выполнению требования о нормальности распределения, из которого берется выборка. Если это требование не выполняется, то этот метод проверки гипотез будет давать неточные значения.

В качестве точечной оценкой дисперсии распределения, из которого взята выборка, используют Дисперсию выборки s2.

Перед процедурой проверки гипотезы, исследователь устанавливает требуемый уровень значимости – это допустимая для данной задачи ошибка первого рода, т.е. вероятность отклонить нулевую гипотезу, когда она верна (уровень значимости обозначают буквой α (альфа) и чаще всего выбирают равным 0,1; 0,05 или 0,01).

Тестовой статистикой для проверки этой гипотезы является величина:

В статье про χ2-распределение показано, что выборочное распределение этой статистики, имеет χ2-распределение с n-1 степенью свободы, которое является «эталонным распределением» (англ. Reference distribution) для данного теста о равенстве дисперсии.

Значение, которое приняла χ2-статистика обозначим χ02.

Нулевая гипотеза Н0 о равенстве дисперсии значению σ02 отвергается в том случае, если χ022α/2,n-1 или χ0221-α/2,n-1

где:

  •  χ2α/2,n-1 – верхний α/2-квантиль распределения χс n-1 степенью свободы (такое значение случайной величины χ2n-1, что P(χ2n-1>=χ2α/2,n-1)=α/2).
  • χ21-α/2,n-1 – верхний (1-α/2)-квантиль распределения χс n-1 степенью свободы (такое значение случайной величины χ2n-1, что P(χ2n-1>=χ21-α/2,n-1)=1-α/2).

Примечание: Подробнее про квантили распределения можно прочитать в статье Квантили распределений MS EXCEL.

В MS EXCEL верхний α/2-квантиль распределения χвычисляется с помощью формулы
=ХИ2.ОБР.ПХ(α/2; n-1)

Верхний (1-α/2)-квантиль вычисляется с помощью аналогичной формулы
=ХИ2.ОБР.ПХ(1-α/2; n-1)

или через равный ему нижний квантиль

=ХИ2.ОБР(α/2; n-1)

Вычисления приведены в файле примера.

В случае односторонней гипотезы речь идет об отклонении дисперсии только в одну сторону: либо больше либо меньше σ02. Если альтернативная гипотеза звучит как σ2> σ02, то гипотеза Н0 отвергается в случае χ02> χ2α,n-1. Если альтернативная гипотеза звучит как σ2 < σ02, то гипотеза Н0 отвергается в случае χ02< χ21-α,n-1.

СОВЕТ: О проверке гипотезы о равенстве дисперсий двух нормальных распределений (F-test) см. статью Двухвыборочный тест для дисперсии: F-тест в MS EXCEL.

Вычисление Р-значения

При проверке гипотез большое распространение также получил еще один эквивалентный подход, основанный на вычислении p-значения (p-value).

СОВЕТ: Подробно про p-значение написано в статье Проверка статистических гипотез в MS EXCEL о равенстве среднего значения распределения (дисперсия известна).

Если p-значение, вычисленное на основании выборки, меньше чем заданный уровень значимости α, то нулевая гипотеза отвергается и принимается альтернативная гипотеза. И наоборот, если p-значение больше α, то нулевая гипотеза не отвергается.

Формула для вычисления p-значения зависит от формулировки альтернативной гипотезы:

  • Для односторонней гипотезы σ2 < σ02 p-значение вычисляется как =ХИ2.РАСП(χ02; n-1;ИСТИНА)
  • Для другой односторонней гипотезы σ2 > σ02 p-значение вычисляется как =ХИ2.РАСП.ПХ(χ02; n-1)
  • Для двусторонней гипотезы p-значение вычисляется как =2*МИН(ХИ2.РАСП(χ02;n-1;ИСТИНА); ХИ2.РАСП.ПХ(χ02;n-1))

Соответственно, χ02= (СЧЁТ(выборка)-1)* ДИСП.В(выборка)/ σ02, где выборка – ссылка на диапазон, содержащий значения выборки.

СОВЕТ: Подробнее про вышеуказанные функции MS EXCEL см. статью про χ2-распределение.

В файле примера на листе Дисперсия показано решение задач проверки двусторонней и односторонних гипотез.

Связанные статьи

Похожие задачи
Прочитайте другие статьи, решающие похожие задачи в MS Excel. Это позволит Вам решать широкий класс подобных задач.
Средняя: 5 (1 оценка)
Яндекс.Метрика