Учебники Онлайн


4.4. Мода, медіана, квартілі і децилі

Кроме вышеперечисленных средних в статистическом анализе как обобщающие характеристики совокупности используют такие значения признака, которые отличаются особым расположением в вариационном ряду расп разделения. Это так называемые структурные (позиционные) средние. Из них чаще всего применяют моду и медиану

Размер моды и медианы зависит только от характера частот, т.е. от структуры распределения. Если величина средней арифметической зависит от всех значений признака, то величина моды и медианы не зависит от крайних значений признака. Это особенно важно для рядов распределения, в которых крайние значения признака имеют нечетко выраженные границы (до и болеед).

. Модой называют значение признака, которое имеет наибольшую частоту в статистическом ряду распределения. Способ вычисления моды зависит от того, в каком виде дано значение признака: дискретного или интервального ряда раз разделением. В дискретных вариационных рядах моду вычисляют без дополнительных расчетов по значению варианты с наибольшей частотой. Например, известный переменный выработка деталей рабочими цехаху:

выработка деталей, шт 30 33 35 38

число рабочих, чел 10 июля 15 декабря

В данном примере модальной величиной является 35 деталей, так как эта величина в исследуемой совокупности имеет наибольшую частоту - 15 случаев модальной цене на тот или иной продукт на рынке является та цена, которая с наблюдается частаяе.

При расчете моды в интервальном вариационном ряду распределения сначала нужно определить модальный интервал, в пределах которого находятся мода, а затем значение модальной величины признака

В интервальном вариационном ряду распределения модой приближении считают центральный вараинт так называемого модального интервала, т.е. того интервала, который имеет наибольшую частоту. В пределах интервала необходимо в найти то значение признака, которое является модойю.

В интервальных вариационных рядах распределения моду определяют по формуле:

где х0 - нижняя (минимальная) граница модального интервала;к - величина интервала; / 1 - частота передмодального интервала; / 2 - частота модального интервала; / 3 - частота пислямодального интервала

Формула основывается на предположении, что расстояния от нижней границы модального интервала до моды и от моды к верхней границе модального интервала прямо пропорциональны разностям между численности (частотами) м модального интервала и интервалов, прилегающие к нему.

Расчет моды в интервальном вариационном ряду распределения покажем на примере распределения 100 хозяйств по надою молока на корову (табл. 48)

. Таблица 48. Данные для расчета моды и медианы в интервальном ряду распределения

Номер группы

Группы хозяйств по надою молока на корову, ц

Число хозяйств

Накопленные частоты

I

26-28

8

8

II

28-30

16

24 (8 16)

III

30-32

17

41 (17 24)

IV

32-34

25

66 (25 41)

V

34-36

18

84 (18 66)

VI

36-38

11

95 (11 84)

VII

38-40

5

100 (5 95)

Вместе

-

100

-

Интервал, в котором содержится мода, будет 32 - 34 ц, так как этот интервал наибольшую частоту

Подставив соответствующие числовые значения в формулу моды, получим:

Итак, в исследуемой совокупности наибольшее число хозяйств имеет производительность коров 33,07 ц

Мода и средняя величина по-разному характеризуют совокупность. Мода определяет непосредственно размер признаки, присущей хотя и значительной части совокупности, но не всей совокупности. Мода по своему обобщаю ющим значением менее точная по сравнению со средней арифметической, которая характеризует совокупность в целом с учетом всех без исключения элементов совокупноститі.

. Медианой называют такое значение признака, которое делит ранжированный ряд распределения на две равные части, то есть значение, которое находится в середине ряда распределения. Если в дискретном вариационном ряду 2т 1 случае ов, то значение признака в случае т 1 является медианным. Если в ряду четное число 2 т случаев, медиану определяют как среднюю арифметическую из двух середенних значений. Например, если 15 комбайнеров агрофирмы расположить в порядке возрастания, то есть в ранжированный ряд по количеству намолочено ого ими зерна, то намолот зерна в восьмого комбайнера будет медианным. Если же число комбайнеров будет 16 человек, то медианой будет среднее значение намолот зерна восьмого и девятого комбайнерів.

Медиану с четным и нечетным числом вариант в дискретном ряду распределения вычисляют по формулам:

В интервальном вариационном ряду распределения медиану определяют по формуле:

где х 0 - нижняя (минимальная) граница медианного интервала;к - величина интервала, 0,5 ^ й - половина суммы накопленных частот интервального ряда распределения; 3т, -1 - сумма накопленных частот интервала, предшествующего медианному;/ т - частота медианного интервала

Для определения медианы в интервальном вариационном ряду распределения надо вычислить накопленные частоты и отыскать медианный интервал. Во накопленными частотами понимают нарастающий итог частот, начиная с первого интервала медианной тот интервал, на который приходится первое накопленная частота, превышает половину всего объема совокупности

Вычислим медиану по данным этого же интервального ряда распределения (табл. 48). По данным таблицы построим ряд накопленных частот и найдем медианный интервал медианного интервала является интервал 32 - 34 ц, так как на этот интервал приходится первая накопленная частота, превышает половину всего объема совокупности (66 превышаетund; /: 2 = 100:2 = 50)

Медианное значение продуктивности коров составит:

Итак, продуктивность коров, равна 32,72 ц и есть вариант, что разделяет вариационный ряд распределения 100 хозяйств на две равные части (50 хозяйств имеет надой на корову меньше 32,72 ц и 50 хозяйств - более 32,72 ц.

Мода и медиана, как правило, отличаются от значения средней, совпадая с ней только в случае симметричного распределения частот вариационного ряда: х = M0 = Me. Поэтому соотношение моды, медианы и сэр варительной арифметической позволяет оценить асимметрию ряда распределения (см. разд 5 5).

Для умеренно асимметричных распределений. КПирсон установил следующее приближенное соотношение между этими характеристиками:

Медиана является лучшей характеристикой центральной тенденции, когда границы крайних интервалов открыты. Медиана является приемлемой характеристикой и в случае, если в ряду распределения значительно большие и значительно малые зн чения, которые влияют на среднюю величину, а на медиану - нет. Медиана, кроме того, обладает свойством линейного минимума: сумма абсолютных значений отклонений величины признака у всех единиц совокупности е д медианы, наименьшее, т.е.то

Это свойство имеет большое значение для решения некоторых практических задач - например, для расчета самой короткой из всех возможных расстояний

для различных видов транспорта, для размещения станций технического обслуживания таким образом, чтобы расстояние до всех обслуживаемых машин данной станцией, была минимальной и т п

Моду и медиану применяют обычно в тех случаях, когда определять среднюю арифметическую нецелесообразно. Так, нет смысла вычислять средний размер одежды и обуви, которые производят фабрики для этого достаточно во знать модальные размеры одежды и обуви, то есть те, которые пользуются наибольшим спросом у населения с тем, чтобы фабрики, планируя свое производство, могли как можно лучше удовлетворить спрос покупателей именно на эти размеры одежды и обувитя.

Медиана широко используется при проектировании мест строительства объектов массового обслуживания населения (школьных и дошкольных учреждений, кинотеатров, предприятий службы быта и торговли и т.д.). Например, продовольственный магазин в сельском поселке целесообразно расположить в такой точке, чтобы он обслуживал половину количества жителей поселка, а не располагался точно в середине його.

Дополнительно к медианы для характеристики структуры вариационного ряда распределения вычисляют квартили, разделяющих ранжированный ряд на 4 равные части, и дециле, разделяющих ранжированный ряд на 10 ров в них частей. Второй квартиль 22 - равна медиане, а первый - 21 и третий - 23 вычисляют аналогично расчету медиане, только вместо медианного интервала берут для первого квартиль интервал, в как ом находится варианта, отделяет 1/4 количества частот, а для третьего квартиль - интервал, в котором находится варианта, отделяющей 3/4 количества частостот.

В интервальном ряду распределения первый и третий квартиль рассчитывают по следующим формулам:

где х0 - нижние (минимальные) границы квартальных интервалов;к - величина интервала; amp; - частоты квартальных интервале.

Расчет первого и третьего кварталов рассмотрим на примере табл 48

Вычислим первый квартиль. Для нахождения интервала, в котором находится первый квартиль, используем накопленные частоты. Первый квартиль находится в интервале, в который входит первая накопленная ч частота, превышает четверть общего объема совокупности (0,25 100 = 25). Итак, первый квартиль (1 находится в третьем интервале (с удоем молока от 30 до 32 ц), который имеет сумму накопленных частот 4 41.

Значение первого квартиль:

Это означает, что одна четверть хозяйств имеет надежд 30,12 ц, а три четверти - более 30,12 ц

Чтобы определить третий квартиль, найдем интервал, в котором он находится на этот интервал приходится первая накопленная частота, превышает три четверти общего объема совокупности (0,75 - 100 = 75). Вот тже, третий квартиль находится в интервале 34 - 36 ц, имеющий сумму накопленных частот, равную 8рівну 84.

Значение третьего квартиль:

Итак, три четверти хозяйств имеют надой молока на корову в 35,00 ц, а одна четверть - более 35,00 ц

В интервальном ряду распределения дециле определяют по формуле:

где х0 - нижняя (минимальная) предел соответствующего децильных интервала;к - величина интервала, - сумма накопленных частот интервалов, предшествующих децильных;. Фв - частоты соответствующих децильных интервалов

Подставив данные табл 48 в формулу, определим первый дециль:

Итак, десятая часть всех хозяйств имеет надой на корову 28,25 ц и меньше, а остальные (90%) - более 28,25 ц

Аналогично рассчитываются и остальные децилей (второй, третий и тд)