Учебники Онлайн


622 Нормальное распределение

Закон нормального распределения, так называемый. Закон. Гаусса, - один из самых распространенных законов. Это фундаментальный закон в теории вероятностей и в ее применении. Нормальное распределение часто встречается у изучении природных и социально-экономических явлений. Иначе говоря, большинство статистических совокупностей в природе и обществе подчиняется закону нормального распределения. Соответственно можно сказать, что с укупности значительной части больших по объему выборок подчиняются закону нормального распределения. Те из совокупностей, которые отклоняются от нормального распределения в результате специальных преобразований могут быть приближены к нормальному. В связи с этим следует помнить, что принципиальная особенность этого закона применительно к другим законам распределения заключается в том, что он является законом границы, к которой приближается аються другие законы распределения в определенных (типовых) условиеумовах.

Следует отметить, что термин"нормальное распределение"имеет условное содержание, как общепринятый в математической и статистико-математической литературе термин. Утверждение, что тот или иной признак любого явления во дпорядковуеться закону нормального распределения, вовсе не означает незыблемость норм, будто присущих исследуемому явлению, а отнесение последнего ко второму виду закона не означает какую-то анормальнисть данного явления. В этом смысле термин"нормальное распределение"не совсем вдалиquot; не зовсім вдалий.

Нормальное распределение (закон. Гаусса-Лапласа) является типом непрерывного распределения. Где. Муавра (1773,. Франция) вывел нормальный закон распределения вероятностей. Основные идеи этого открытия были использованы в теории й ошибок впервые. К. Гауссом (1809,. Германия) и. АЛапласом (1812,. Франция), которые внесли витчутний теоретический вклад в разработку самого закона частности,. КГаусс в своих разработках исходил из признания наиболее вероятным значением случайной величины-среднюю арифметическую. Общие условия возникновения нормального распределения установил. АМЛяпунов. Им было доказано, что если исследуемая признак представляет собой результат сумм арной действия многих факторов, каждый из которых мало связан с большинством остальных, и влияние каждого фактора на конечный результат намного перекрывается суммарным воздействием всех остальных факторов, то распределение в ае близким к нормальногормального.

Нормальным называют распределение вероятностей непрерывной случайной величины, имеющей плотность:

_ 11 (2

/ (х, х, т) = - ^ е2 ст2

гдех - математическое ожидание или средняя величина. Как видно, нормальное распределение определяется двумя параметрами:х и °. Чтобы задать нормальное распределение, достаточно знать математическое ожидание, или среднее и среднее квадратическое отклонение. Эти две величины определяют центр группировки и форму

кривой на графике. График функции й (хх, в) называется нормальной кривой (кривая. Гаусса) с параметрамих и в (рис 12)

Кривая нормального распределения имеет точки перегиба при X ± 1. Если представить графически, то между X = l и 1 = -1 находится 0,683 части всей площади кривой (т.е. 68,3%). В границах X = 2 и X-2 находятся 0,954 площади (95,4%), а между X = 3 и X = - 3 - 0,997 роилюстрований характер нормального распределения с одно-, двух-и трисигмовою границамцями.

При нормальном распределении средняя арифметическая, мода и медиана будут равны между собой. Форма нормальной кривой имеет вид одновершиннои симметричной кривой, ветки которой асимптотически приближаются к оси абс сцис. Наибольшая ордината кривой соответствуетє х = 0 этой точке на оси абсцисс размещается численное значение признаков, равное средней арифметической, моде и медиане. По обе стороны от вершины кривой ее ветки приходят, изменяя в определенных точка ах форму выпуклости на вогнутость. Эти точки симметричные и соответствуют значениямям х = ± 1 есть величинам признаки, отклонение которых от средней численно равна среднему квадратичному отклонению. Ордината, что соответствует средней арифметической, делит всю площадь между кривой и осью абсцисс п пополам. Итак, вероятности появления значений исследуемого признака больших и меньших среднеої

арифметической будут равны 0,50, т.е. х (~ ^ х) = 0,50. У

. Рис12. Кривая нормального распределения (кривая. Гаусса)

Форму и положение нормальной кривой обусловливают значение средней и среднего квадратичного отклонения. Математически доказано, что изменение величины среднего (математического ожидания) не меняет формы нор рмальнои кривой, а приводит лишь к ее смещение вдоль оси абсцисс. Кривая сдвигается вправо, если ~ растет, и влево, если ~ спадаає.

. Рис14. Кривые нормального распределения с различными значениями параметрао

Об изменении формы графика нормальной кривой при изменении

среднего квадратического отклонения можно судить по максимуму

дифференциальной функции нормального распределения, равный1

Как видно, при росте величины ° максимальная ордината кривой будет уменьшаться. Следовательно, кривая нормального распределения будет сжиматься к оси абсцисс и принимать более плосковершинные форму

И, наоборот, при уменьшении параметра в нормальная кривая вытягивается в положительном направлении оси ординат, а форма"колокола"становится более гостровершиною (рис 14). Отметим, что независимо от величины параметров ~ и в площадь, ограниченная осью абсцисс и кривой, всегда равна единице (свойство плотности распределения). Это наглядно иллюстрирует график (рис 13)

Названные выше особенности проявления"нормальности"распределения позволяют выделить ряд общих свойств, которые имеют кривые нормального распределения:

1) любая нормальная кривая достигает точки максимума(х =х) приходит непрерывно вправо и влево от него, постепенно приближаясь к оси абсцисс;

2) любая нормальная кривая симметрична по относительно прямой

параллельной оси ординат и проходит через точку максимума(х =х);

1

максимальная ордината равна ^ ^ ^ я;

3) любая нормальная кривая имеет форму"колокола", имеет выпуклость, направленную вверх до точки максимума. В точкахх ~ ° их + в она меняет выпуклость, и, чем меньшеа, тем острее"колокол", а чем большеа, тем более похилишою становится вершина"колокола"(рис14). Изменение математического ожидания (при неизменной величине

в) не приводит к модификации формы кривой

Прих =0 и ° =1 нормальную кривую называют нормированной кривой или нормальным распределением в каноническом виде

Нормированная кривая описывается следующей формулой:

Построение нормальной кривой по эмпирическим данным производится по формуле:

пи 1 -""= --- 7 =е

гдеи ™ - теоретическая частота каждого интервала (группы) распределения,"- сумма частот, равную объему совокупности"- шаг интервала;

ж - отношение длины окружности к ее диаметру, которое составляет

3,1416;

е - основа натуральных логарифмов, равна 2,71828;

х - X

Вторая и третья части формулы)є функцией

нормированного отклонения. ЦЧ), которую можно рассчитать для любых значений X. Таблицы значений. ЦЧ) обычно называют"Таблица ординат нормальной кривой"(приложение 3). При использовании этих функций рабочая формула нормального распределения приобретает простого видаого вигляду:

а

. Пример. Рассмотрим случай построения нормальной кривой на примере данных о распределении 57 работников по уровню дневного заработка (табл. 42). По данным таблицы 42, находим среднее арифметическое:

~= ^= и6 54 =

57

Рассчитываем среднее квадратическое отклонение:

Для каждой строки таблицы находим значение нормированного отклонения

хі ~х | 12 г = - = - ^ 2 - = 192

а 625 (ддЯ первого интервала и тд)

В графе 8 табл 42 записываем табличное значение функции. Ди) из приложения, например, для первого интервала X = 192 находим"1,9"против"2"(00 632)

Для вычисления теоретических частот, т.е. ординат кривой нормального распределения, вычисляется множитель:

* = ^ = 36,5 а 6,25

Все найденные табличные значения функции / (г) умножаем на 36,5. Так, для первого интервала получаем 0,0632 x36, 5 = 2,31 т.. Принято немногочисленные

частоты(п '5) объединять (в нашем примере - первые два и последние два интервала)

Если крайние теоретические частоты значительно отличаются от нуля, расхождение между суммами эмпирических и теоретических частот может оказаться значительной

График распределения эмпирических и теоретических частот (нормальная кривая) по данным рассматриваемого примера показано на рисунке 15

Рассмотрим пример определения частот нормального распределения для случая, когда в крайних интервалах отсутствует частота (табл. 43). Здесь эмпирическая

2

X - нормированное отклонение, ( в);а - среднее квадратическое отклонение

частота первого интервала равна нулю. Полученная сумма неуточненных частот не равна сумме их эмпирических значений (56 * 57). В этом случае рассчитывается теоретическая частота для условно полученных значений ь центра интервала, нормированного отклонения и его функцииії.

В таблице 43 эти величины обведено прямоугольником. При построении графика нормальной кривой в таких случаях теоретическую кривую продолжают. В рассматриваемом случае нормальная кривая будет продолжена в сторону отъем мних отклонений от средней, поскольку первая не уточнена частота равна 5. Рассчитана теоретическая частота (уточненная) для первого интервала будет равен единице. По сумме уточненные частоты совпадают с эмпирическимними

(57 = 57)

. Таблица 42

. Расчет частот нормального распределения (выравнивание эмпирических частот по нормальному закону)

Расчетные величины

Статистические параметры

Интервал

0 = 4)

Срединное значение (центр) интервала

Хи

Количество единиц

П1

xt-x

-X?

-х)2 n

нормированное отделение

а

табличное значение функции, f (t)

теоретическая

частота нормального ряда распределения

/ 0) х -а

уточненное значение теоретической частоты

щ

А

1

2

3

4

5

6

1

8

9

10

15-19

17

4

68

-12

144

576

1,92

0,0632

2,31

9

19-23

21

6

126

-8

64

384

1,28

01758

6,42

23-27

25

9

225

-4

16

144

0,64

0,3251

11,87

12

27-31

29

17

493

0

0

0

0

0,3989

14,56

15

31-35

33

13

429

4

16

208

0,64

0,3251

11,87

12

35-39

37

3

111

8

64

192

1,28

0,1758

6,42

39-43

41

5

205

12

144

720

1,92

0,0632

2,31

9

Всего

X

57

1654

0

X

2224

X

X

55,76

57

г = 4

je = 29

а = 6,25

^ i = 36,5а

. Таблица 43

. Расчет частот нормального распределения (выравнивание эмпирических частот по нормальному закону)

Количество единиц

П1

Расчетные величины

Статистические параметры

Интервал (и-2)

Срединное значение (центр) интервала

Хи

XfHs

xt-x

(je-xf

^ xt-x)1ni

нормированное отклонение

xs - х

t =x - L

a

табличное значение функции, f (t)

теоретическая

частота нормального ряда распределения

/ (х - а

уточненное значение теоретической частоты

А

1

2

3

4

5

6

1

8

9

10

19-21

ш

-

-

-

-

2,49

'0, 0180

-

111

21-23

22

5

110

-4

16

80

1,66

0,1006

5

5

23-25

24

15

360

-2

4

60

0,83

0,2827

13

13

25-27

26

20

520

0

0

0

0

0,3989

19

19

27-29

28

10

280

2

4

40

0,83

0,2827

13

13

29-31

ЗО

5

150

4

16

80

1,66

0,1006

5

5

31-33

32

2

64

6

36

72

2,49

0,0180

І

I

Всего

X

57

1484

X

X

332

X

X

56

57

i = 2

х = 26

о = 2,41

^ = 47,3

ct

рис 15. Эмпирический распределение (1) и нормальная кривая (2)

Кривую нормального распределения по изучаемой совокупности можно построить и другим способом (в отличие, от рассмотренного выше). Так, если необходимо иметь приближенную представление о соответствии фактического рас одели нормальном, вычисления осуществляют в такой последовательности. Определяют максимальную ординату, которая соответствует среднему размеру признаки), затем, вычислив среднее квадратическое отклонение, рассчитываю во координаты точек кривой нормального распределения по схеме, изложенной в таблицах 42 и 43. Так, по исходным и расчетным данным таблицы 43 должны среднюю ~ = = 26. Эта величина средней совпадает с центром четвёртому интервала (25-27). Итак, частота этого интервала"20"может быть принята (при построении графика) за максимальную ординату). Имея исчисленную дисперсию ю дисперсію ( в = 2,41 см. табл 43), рассчитываем значение координат всех необходимых точек кривой нормального распределения (табл. 44, 45). По полученным координатам чертим нормальную кривую (рис 16), приняв за максимальную ординату частоту четвёртым интервалрвалу.

Согласованность эмпирического распределения с нормальным может быть установлена ??также путем упрощенных расчетов. Так, если отношение показателя степени асимметрии (^) к своей середнеквадраты-ческой ошибкиша"или отношение показателя эксцесса (Ех) к своей среднее квадратическое ошибки т превышает по абсолютной величине число"3", делается вывод о несоответствии эмпирического распределения характера нормального распределения (т.е.

А ц. Ех

еслиА 3 илише ' 3)

Есть и другие, нетрудоемкие приемы установления"нормальности"распределения: а) сравнение средней арифметической с модой и медианой б) использование чисел. Вестергард в) применения графического способа по а помощью полулогарифмическом сеткиної сітки . Турбина; г) вычисление специальных критериев согласования и др.

. Таблица 44

. Координаты 7 точек кривой нормального распределения

Точка

1

2 и 3

4 и 5

6 и 7

абсцисс х

X

х ± 0,5 сг

х ± а

х ± 1,5 (7

Ордината у

у шах

7

8 ^

5

8 * ™

25

таблице 45

. Вычисление координат точек кривой нормального распределения

X

x - 1,5 (7 =

= 22,4

х - а = 23,6

х - 0,5 (7 = = 24,8

х = 26

х 0,5 ст = 27,2

х а = 28,4

X 1,5 (7 =

= 29,6

У

6

12

17

20

17

12

6

рис 16. Кривая нормального распределения, построенная по семи точках

На практике при исследовании совокупности на предмет согласования ее распределения с нормальным часто пользуются"правилом 3сг"

Математически доказано вероятность того, что отклонение от средней по абсолютной величине будет меньше тройного среднего квадратичного отклонения, равна 0,9973, т.е. вероятность того, что абсолютная величина отклонения превышает тройное среднее квадратическое отклонение, равен 0,0027 или очень мала. Исходя из принципа невозможности маловероятных событий, можно считать практически невозможным"случай превышения"ення" 3 ст. Если случайная величина распределена нормально, то абсолютная величина ее отклонения от математического ожидания (от средней) не превышает тройного среднего квадратического отклонения

В практических расчетах действуют таким образом. Если при неизвестном характере распределения исследуемой случайной величины рассчитанное значение отклонения от средней окажется меньше значения 3. СТ, то есть основания считать, что исследуемая признак распределена нормально. Если же указанный параметр превысит числовое значение 3. СТ, можно считать, что распределение исследуемой величины не согласуется с нормальным распределением

Вычисление теоретических частот для исследуемого эмпирического ряда распределения принято называть выравниванием эмпирических кривых по нормальному (или любом другом) закона распределения. Этот процесс имеет весь жливе как теоретическое, так практическое значение. Выравнивание эмпирических данных раскрывает закономерность в их распределении, которая может быть завуалирована случайной форме своего проявления. Установленную таким образом зак ономирнисть можно использовать для решения ряда практических задачань.

С распределением, близким к нормальному, исследователь встречается в разных сферах науки и областях практической деятельности человека. В экономике такого рода распределения встречаются реже, чем, скажем, в техн. Ницце или биологии. Обусловлено это самой природой социально-экономических явлений, которые характеризуются большой сложностью взаимосвязанных и взаимосвязанных факторов, а также наличием ряда условий, которые ограничивают свободную"игру"случаев. Но экономист должен обращаться к нормальному распределению, анализируя строение эмпирических распределений, как к некоторому эталону. Такое сравнение позволяет выяснить характер тех внутреннего них условий, определяющих данную фигуру распределениегуру розподілу.

Проникновение сферы статистических исследований в область социально-экономических явлений позволило раскрыть существование большого количества различного типа кривых распределения. Однако не надо считать, что теоретическая конце епция кривой нормального распределения вообще мало пригодна в статистико-математическом анализе такого типа явлений. Она может быть не всегда приемлема в анализе конкретного статистического распределения, но в обл. Асти теории и практики выборочного метода исследования имеет первостепенное значениеня.

Назовем основные аспекты применения нормального распределения в статистико-математическом анализе

1. Для определения вероятности конкретного значения признака. Это необходимо при проверке гипотез о соответствии того или иного эмпирического распределения нормальному

2. При оценке ряда параметров, например, средних, методом максимального правдоподобия. Суть его заключается в определении такого закона, которому подчиняется совокупность. Определяется и оценка, которая дает есть максимальные значения. Лучше приближения к параметрам генеральной совокупности дает отношениення:

1

у = -2=е 2

3. Для определения вероятности выборочных средних относительно генеральных средних

4. При определении доверительного интервала, в котором находится приближенное значение характеристик генеральной совокупности