Учебники Онлайн


624 Распределение Хи-квадрат

При проверке статистических гипотез рассматриваются вопросы о критериях согласованности. Последние позволяют решить задачу о соответствии или несоответствии определенного закона распределения, выбранного для отра браження исследуемого эмпирического ряда распределениеу.

Рассчитанные критерии согласия обусловливают возможность (или невозможность) принятие для исследуемого ряда распределения модели, которая выражается некоторым теоретическим законам распределения. Та или иная модель распределения в соответствующей определенному закону может быть принята путем сравнения графических изображений. Учеными-математиками разработан ряд критериев согласованности, вычисление которых позволяет дать количественную оценку н аближености эмпирических и теоретических распределений. Некоторые из них оценивают вероятность различия фактического и теоретического распределения, а некоторые дают прямой ответ о возможности отражения исследуемой ого эмпирического распределения избранным теоретическим закононом.

Для характеристики (оценки) различие эмпирических и теоретических частот английским статистиком. Карлом. Пирсоном (1900) разработан критерий согласованности, так называемый"хи - квадрат"Данный критерий применения ся в тех случаях, когда необходимо определить степень отличия фактического распределения частот от теоретичногеоретичного.

Теоретический аспект определения хи - квадрата качестве критерия может быть сведен к таким рассуждениям

Если выборку из генеральной совокупности, распределенной по нормальному закону (^ ^Хп), ввести центрированные и нормированные

х - X

"- o o

величины ( в) и суммировать их квадраты, получим значение

2 -

величины"хи - квадрат"(%) '

^ 2 _ (Х 1 ~Х) 2+ ( - * 2 ~ Х) 2+ Х 3~ Х) 2+ + (Хп ~Х) 2 _Х и ~Х) 2

а а а а 1 =1 а

В данном случае величинах, которая предопределяется дисперсией °2 распределяется по закону:

1 ^

I (Xі) =и и2)2 е2,

2-Г (-) 2 2

.... Д-)

где и) - число степеней свободы, равное п-1;2 - гамма-функция

частности. Г (п 1) = п

Как видно из приведенного выше выражения, распределение"хи - квадрат"определяется одним параметром - числом степеней свободы

Для разных объемов выборки (точнее - значений числа степеней свободы) распределение величины"хи - квадрат"будет асимметричным. При этом, чем меньше выборка, тем сильнее проявляется асимметрия. С увеличением нням численности выборочной совокупности асимметрия уменьшается и распределение і розподіл "хи - квадрат"переходит в нормальный. Наглядно характер такого изменения иллюстрирует график (рис 18)

рис 18 гозподил ("хи - квадрат"при различных значениях числа степеней свободы

Если принять род эмпирических и теоретических частот соответственно зап - и. Пп, вычисления"хи - квадрат"- критерия выразится формулой:

Судя по параметрам формулы, величина критерия. Пирсона представляет собой сумму отношений между квадратами разниц эмпирических и теоретических частот до теоретических частот

Интегрирование дифференциальной функции распределения (по ее сложности) представляет определенные вычислительные затруднения. В связи с этим. РФишером разработаны стандартные математические таблицы распределения"хи - квадрат"(приложения 6, 7). Эти таблицы позволяют вычислить вероятность того, что случайная величина, которая подчиняется закону распределения"хи - квадрат"с определенным числом степеней свободы

превысит некоторое фиксированное значениех * или р (х

Второй аспект использования названных стандартных таблиц заключается в том, что с их помощью можно установить критическое значение"хи - квадрата", превышение которого для известного числа степеней свободы бы будет свидетельствовать о несоответствии исследуемого распределения нормальному закону. Есть и другие аспекты практического использованиякористання "хи - квадрат"- критерия. Рассмотрим лишь пример для случая установления вероятности р (х

Для выборки с числом степеней свободы и) = 21, подчиняется

закона"хи - квадрат"распределения (%) необходимо определить отклонения. Я *, вероятность превышения которого равна 0,05, т.е. необходимо найти"хи -

квадрат"при и) = 21, для которого ^ 21) = 0,05. Искомая величина будет

находиться (приложение 7) на пересечении строки 21 и графы 0,95 и составит. Ху =

32,7. Отсюда имеем: р (%2 32,7) = 0,05

2

Таким образом, величина%у, вероятность превышения которой 0,05, будет 32,7

Следует отметить некоторые неточности, которые существуют в учебной литературе при изложении вопросов"хи - квадрат - критерия"Относительно его открытия, кроме даты 1900 г (Пирсон), следует помнить и дату 1876 г (Хель ьмертр. (Хельмерт).

2

Что же касается стандартной таблицых - распределения, то будет неточным ее информацию называть"Критерий. Персона", потому разработка этой таблицы следует. РФишеру. Последний считал вместо значений вероятностейр%, отвечающие некоторому ряду%, рассчитывать значениях, относящихся к выбранным уровней вероятностей при разном числе степеней свободы

Еще одно замечание относительно символики написания"хи - квадрат"

2 февраля

Обычно принята формах. Более правильным будет. ХТ. Но если исключена возможность неверного понимания, ее можно записывать с одним подстрочным числом (индексом). Если это не мешает правильному восприятию смысловой нагрузки параметра, запись его может быть и без подстрочных индексев.

625 Распределение Фишера - Снедекора

В целом ряде задач, решаемых математической статистикой

частности в дисперсионной и корреляционно - регрессионного анализа

используется"распределение. Б", названный так по первым буквам

фамилии английского статистика-математика. Р. Фишера. ЕслиИ 1 и

И2 независимые случайные величины с распределениями%, и с и ^

степенями свободы соответственно, то случайная переменная. Б будет

... . Я? : в. П уг г = -1-1 = - х-.

И: V. И V равна:2 -2 2 1

Полученная величина называется случайной переменной с

распределением. Фишера-Снедекора с1 ^ и ^ степенями свободы

Принимая, чтои 1 ^2 величина. Б будет иметь лишь значение, не

менее. И

Плотность вероятности случайной переменной. Б, имеет распределение. Фишера-Снедекора с ^ и ^ степенями свободы, имеет вид:

. Н (Р) = -2-у ±-р2 (1+. Р)2

Вследствие большой сложности расчета интегралов доказательства здесь не приводится. Но, как видно, распределение. Б обусловлен определяется двумя параметрами, то есть числами степеней свободы ^ иу 2. Распределение случайной переменной. Б представлен в виде специальных математических таблиц. Последние построены так, чтобы для разных уровней доверительной вероятности (в основном для. Р = 0,95;. Р = 0,99,. Р = 0,999) и д для различных сочетаний числа степеней свободыі у 1 иу 2 даются значения. Б. Если принять обозначения расчетной и табличной

величины. Б соответственно как гг ир т, то для них справедлива будет равенствор^р^. Рт ~ а;. Такие таблицы приведены в приложениях 8 и 9. Практическое их использования будет рассмотрен в разделах"Дисперсионный анализ","Корреляционно - регрессионный анализ","Методы многомерного статистического анализа"Ту ут приведем лишь схематический. Примеромаведемо лише схематичний приклад.

. Пример. Изучив количественное влияние фактора уровня производительности труда на ее оплату по выборке 60 предприятий, получены следующие характеристики:

факторная дисперсия * ~ 3,06, остаточная дисперсияа г = 0,15. Число ступеней

свободы для факторного признакау* = 3 - I = 2, для неучтенных факторов 60 -

3 = 57

Расчетная величина и - критерия составит: 015 .

По стандартной таблицей. Р - распределения находим для уровня вероятности

Р = 0,95 и степеней свободы. У1 = второй ^= 57 табличное значение. Рт = 3,15;. Рр. Тг (204 3,15)

Найденные параметры свидетельствуют о том, что в исследуемых предприятиях влияние уровня производительности труда на ее оплату оказался вероятным с уровнем вероятности 0,95

В заключение отметим, почему распределение и называют распределением. Фишера-Снедекора. Дело в том, что. РФишер первый исследовал распределение отношений двух выборочных дисперсий, но предметом его изучения был распределение не отношений дисперсий а

логарифмической величины2 °2. Несколько позже американский

статистик. ДжСнедекор рассчитал таблицы распределения переменной (°2), что оказалось значительно удобнее для практического использования в расчетах. Данный раздел он назвал в честь. Фишера"Распределением. Р"Позже данный вид распределения стали называть"Распределением. Фишера-Снедек кораФішера-Снедекора".