Учебники Онлайн


ТЕМА 6 АНАЛИЗ ПОДОБИЯ распределите

§ 61 Статистическая оценка параметров распределения

Вопросы статистической оценки связывают в единое целое такие проблемные аспекты математической статистики, как научная методология, случайные величины, статистические распределения и др.. Для любой выборки притом манные ошибки, обусловленные неполнотой охвата единиц, ошибками измерения и тому подобными причинами. Такие ошибки в реальной жизни придают каждой гипотезе (в частности, сформулированной на базе экономических них выводов) случайный, стохастический характер. Независимо от количества переменных, предусмотренных теоретическими гипотезами, делается предположение, что влияние разных видов ошибок может быть достаточно точно опи сани с помощью лишь одной составляющей. Такой методологический подход позволяет ограничиться одномерным распределением вероятностей при одновременном оценивании нескольких параметретрів.

. Статистическая оценка - это один из двух типов статистического суждения (второй тип - проверка гипотез). Она представляет собой особого рода метод суждения о числовые значения характеристик (параметров) распределения генеральной су укупности по данным выборки из этой совокупности есть, имея результаты выборочного наблюдения, мы пытаемся оценить (с наибольшей точностью) значения определенных параметров, от которых зависит рас ил признаки (переменной), которая нас интересует, в генеральной совокупности. Поскольку выборка включает только часть единиц генеральной совокупности (иногда очень малое их число), существует риск допустить ошибку. Незваж аючы на ??уменьшение такого риска с увеличением числа единиц наблюдения, он все же имеет место при выборочном наблюдении. Отсюда, принятым по результатам выборки решением предоставляют вероятностный ха рактер. Но было бы неверным рассматривать статистические суждения только с позиций вероятностей. Такой подход не всегда оказывается достаточным для построения правильных теоретических предположений относительно параметров генеральной совокупности. Часто требуется еще ряд дополнительных суждений, которые бы обеспечили более глубокое обоснование. Например, нужно оценить с возможно большим приближением значения средней численности квалифицированных рабочих на предприятиях региона. При этом оценивается средняя арифметическая переменной х из генеральной совокупности, имеющей нормальное распределение. Получив выборку по данному признаку в количестве кількості п единиц, необходимо решить вопрос: какую величину по данным выборки необходимо принять как наиболее близкую к средней в генеральной совокупности? является искомом параметру (или близкое к нему), можно привести несколько: а) средняя арифметическая б) мода в) медиана г) средняя, ??исчисленная по размаху вариации, и тд.

С вероятностной точки зрения каждой из названных выше величин можно считать дают лучшее приближение к искомого параметра генеральной совокупности (х), поскольку математическое ожидание каждой из этих функций (особенно для больших выборок) равна генеральной средней обусловлено такое предположение тем, что при многократном повторении выборки из той самой генеральной совокупности будет получен"в среднем"правильный результай результат.

Правильность"в среднем"объясняется равенством повторений положительных и отрицательных отклонений возникающих ошибок оценки генеральной средней, т.е. средняя ошибка оценки будет равна нулю

В практических условиях, как правило, организуют одну выборку, поэтому исследователя интересует вопрос о более точную оценку искомого параметра по результатам конкретной выборки. Для решения такой задачи я, кроме выводов, которые вытекают непосредственно из абстрагированного вычисления вероятностей, нужны дополнительные правила мотивирования наилучшего приближения оценки к искомого параметра генеральной сукупнос ті.

Существует достаточное количество способов оценки констант по выборочным наблюдениям. Какие из них лучшие в решении конкретных задач исследования - занимается теория статистического оценивания. Она исследует есть условия, которым должна подчиняться та или иная оценка, ориентирует на оценки, более превосходящие при данных обстоятельствах. Теория оценок указывает на преимущество одной оценки по сравнению с иногошої.

Как известно, информация, полученная на основе выборки, не носит категорического характера в заключении. Если, например, изучаемых 100 голов животных по их заболевания здоровыми оказались 99, то существует есть вероятность, что одно животное, оставшейся необследованной именно носит в себе вирус предполагаемого заболевания. Поскольку это маловероятно, делается вывод об отсутствии данного заболевания. В бил ьшости случаев такой вывод полностью оправдываетсяься.

Руководствуясь подобными выводами в практической деятельности, экспериментатор (исследователь) опирается не на достоверность информации, а лишь на ее вероятность

Вторая сторона выборочного наблюдения, как уже отмечалось, решает задачи возможно более объективного определения степени надежности получаемых выборочных оценок решения этой задачи намагают ться предоставить как можно точнее вероятностный выражение, то есть речь идет об определении степени точности оценки. Здесь исследователь определяет границы возможного расхождения между оценкой, полученной при выборке и настоящим зн аченням ее величины в генеральной совокупноститі.

Точность оценки обусловливается способом ее расчета по данным выборки и способом отбора единиц в выборочную совокупность

Способ получения оценок предполагает любую вычислительную процедуру (метод, правило, алгебраическую формулу). Это приоритет теории статистического оценивания. Способы отбора ведут к вопросам техники осу ния выборочных исследованияхня.

Изложенное выше позволяет дать определение понятию"статистическая оценка"

. Статистическая оценка - это приближенное значение искомого параметра генеральной совокупности, которое получено по результатам выборки и обеспечивает возможность принятия обоснованных решений о неизвестные параметры генеральной совокупный ности.

Предположим, что ^"- статистическая оценка неизвестного параметра ^ теоретического распределения. По многократно осуществляемыми одинакового

0 0 0 0

объема выборками из генеральной совокупности найдены оценкии 2 ^"'п,

имеющих различные значения. Поэтому оценку ^", можно рассматривать как

0 0 0 0

случайную величину, а 17 2, 3 ~ 'п - как ее возможные значения. Как случайная величина, она характеризуется определенной функцией плотности вероятностей. Поскольку эта функция обусловлена ??результатом выборочного наблюдения (эксперимента), то ее называють выборочным распределением. Такая функция описывает плотность вероятности для каждой из оценок, используя определенное число выборочных

наблюдений. Если предположить, что статистическая оценка ^"- это алгебраическая функция от определенного набора данных и такой набор будет получен при осуществлении выборочного наблюдения, то в

общем виде оценка получит выражение: ®п = f (XlX2 ^ 3,. Хт).

По окончании выборочного обследования данная функция уже не является оценкой общего вида, а принимает - конкретное значение, то есть становится количественной оценке (числом). Другими словами, из вышеприведенного выражения фун фу следует, что любой из показателей, характеризующих результаты выборочного наблюдения, можно считать оценкой. Выборочная средняя является оценкой генеральной средней. Рассчитанная по выборке дисп ерсия или вычисленное из нее значение среднего квадратичного отклонения являются оценками соответствующих характеристик генеральной совокупности и тет.ін

Как уже отмечалось, расчет статистических оценок не гарантирует исключение ошибок. Суть заключается в том, что последние не должны быть систематическими. Наличие их должно носить случайный характер. Рассмотрим методологическую сторону этого положенияння.

Предположим, оценка ^"дает неправильный оценки ^ генеральной совокупности с нехваткой. В этом случае каждое вычисленное значение= 1,2,3,, п) будет меньше действительное значение величины $

По этой причине математическое ожидание (среднее значение) случайной величиныв будет меньше, чемв, т.е. (М ( ^ п. И, наоборот, если дает оценку с избытком, то и математическое ожидание

случайной ^"станет больше, чем $

Отсюда следует, что использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, приводит к систематическим погрешностям, то есть до неслучайных ошибок, которые искажают ь результаты измерений в один би.

Возникает естественное требование: математическое ожидание оценки ^"должно равняться оцениваемому параметру. Соблюдение этого требования не устраняет ошибок в целом, так выборочные значения оценки могут быть би ильши или меньше действительного значения оценки генеральной совокупности. Но ошибки в один и другая сторона от значений ^ будут встречаться (согласно теории вероятностей) с одинаковой частотой. Таким образом, соблюдение этого требования, что математическое ожидание выборочной оценки должно равняться оцениваемому параметру, исключает получение систематических (неслучайных) ошибок, т.е.к, тобто

М (в) = 6

Выбор статистической оценки, которая дает лучшее приближение оцениваемого параметра, представляет собой важную задачу в теории оценивания. Если известно, что распределение исследуемой случайной величины в генеральной су укупности соответствует закону нормального распределения, то по выборочным данным необходимо оценить математическое ожидание и среднее квадратичное отклонение. Объясняется это тем, что названные две характеристики полностью определяют основы, на которых построено нормальное распределение. Если исследуемая случайная величина распределена по закону. Пуассона, оценивают параметр ^, поскольку он определяет этот распредділ.

Математическая статистика различает такие методы получения статистических оценок по выборочным данным: метод моментов, метод максимума правдоподобия

При получении оценок методом моментов моменты генеральной совокупности заменяются моментами выборочной совокупности (вместо вероятностей при весе используют частоты)

Чтобы статистическая оценка давала"наилучшее приближение"к генеральной характеристики, она должна иметь ряд свойств. О них речь пойдет ниже

Возможность выбора наилучшей оценки обусловлена ??знанием их основных свойств и умением классифицировать оценки этими свойствами. В математической литературе"свойства оценок"иногда называют"в требования к оценкам"или"критерии оценок"К основным свойствам статистических оценок относятся: незмищенисть, эффективность, способность, достаточностьність, спроможність, достатність.

Если принять, что выборочная средняя (~) и выборочная дисперсия

(. Создать) являются оценками соответствующих генеральных характеристик (^), то есть их математическим ожиданием, учитываем, что при большом количестве

единиц выборки названные характеристики (~) будут приближены к их математических ожиданий. Если же число единиц выборки небольшой, эти характеристики могут значительно отличаться от соответствующих математических них ожиданияь.

Если среднее значение выборочных характеристик, выбранных в качестве оценки, соответствует значению генеральной характеристики, оценка называется несмещенной. Доказательством того, что математическое ожидание выборочной августа дварительной равна генеральной средней(м(х) = х), свидетельствует о том, что величина ~ является несмещенной генеральной

_2

средней. Иначе обстоит дело с избирательной дисперсией (o) ее

_. М (. СТ2) = - о-2 . .

математическое ожиданиеп, не равна генеральной

22

дисперсии. Итака ч является смещенной оценкойа"Чтобы устранить систематическую ошибку и получить несмещенную оценку, выборочную

п

дисперсию умножают на поправкуп -1 (это следует из образования

в2 _2 п п -1"п -1

приведенного выше уравненияп)

Таким образом, при немногочисленной выборке дисперсия равна:

2. Цх, - ~)2 п. Е (хі - ~)2

сгв =-х-= -

п п - 1 п -1

п

Дробь (п -1) называют поправкой. Бесселя. Математик. Бесселя первого установил, что выборочная дисперсия является смещенной оценкой генеральной дисперсии и применил указанную поправку для корректировки

п

оценок. Для малых выборок поправка (п -1) значительно отличается от 1. С увеличением числа единиц наблюдения она быстро приближается к 1. Прип 50 разница между оценками исчезает, т.е.

_2 __ 2

° ~ '-. Из всего сказанного выше вытекают следующие определения требований несмещенности

смещена называют статистическую оценку, математическое ожидание которой при любом объеме выборки равен значению

параметра генеральной совокупности, т.е. м (^) = 9; м (х) = х.

Категорию"математическое ожидание"изучают в курсе теории вероятностей. Это числовая характеристика случайной величины. Математическое ожидание приближенно равна среднему значению случайной величины. Математическим ожидания дискретной случайной величины называют сумму произведений всех ее возможных значений на их вероятности. Предположим, выполненоп исследований, в которых случайная величинах принялаш 1 раз значениеш 2 раз значениеШі раз значениеХк. При этомШ1 + Ш2 + Ш3 +... + Шк = п. Тогда сумма всех значений, принятыхх, равна

х1ш1 + х2 ш2 + х3ш3 +... + хкшк

Средняя арифметическая этих значений составит:

- х1ш1 + х2ш2 + х3ш3 +... + хкшк - ш1 ^ ш2 ^ ш3 ^ ^ шк

п или1 п2 п3 п1 п.

Посколькуп - относительная частота ^ значениех ^п - относительная частота значениех 2 и тд, приведенное выше уравнение примет вид:

. Х =. Х11 +. Х22 +. Х33. Хк. Нк

При большом количестве выборочных наблюдений относительная частота примерно равна вероятности появления события, т.е.

и 1 =Л; 2 =. Щ = ™ к =. Рка потомух 2 х1р 1+ х2р 2Х3р 3... + Х. КРК. тогда

х ~м ( х) вероятностный смысл полученного результата расчетов заключается в том, что математическое ожидание приближенно равна (тем точнее, чем больше выборка) среднему арифметическому наблюдаемых значений случайной величиныМ(х-) = ~1.

Критерий несмещенности гарантирует отсутствие систематических ошибок в оценке параметров генеральной совокупности

Заметим, что выборочная оценка (^) - случайная величина, значение которой может изменяться от одной выборки к другой. Меру ее вариации (рассеивания) вокруг математического ожидания параметра генерально й совокупности ст2(^) .

Пусть в-, иО- - две несмещенные оценки параметра ^, т.е.М( в") = 6 и. М( д) = в.. Дисперсии их о 1 (в-) иогф-) с двух 0 эти нок В. Арто отдать предпочтение той, которая имеет меньшее рассеивание вокруг оцениваемого параметра. Если дисперсия оценки ^"меньше дисперсии

оценки. Вп, то за оценку

несмещенной оценки ^, имеющее наименьшую дисперсию среди всех возможных несмещенных оценок параметра ^, вычисленных по выборкам одинакового объема, называется эффективной оценкой. Это - второе свойство (требованиями. ОГА) статистических оценок параметров генеральной совокупности. Надо, помнить, что эффективная оценка параметра генеральной совокупности, подчиненной определенному закону распределения, не совпадает с эффективной оценке параметра второй разделлу.

При рассмотрении выборок большого объема статистические оценки должны обладать свойством способности. Оценка состоянии (используется также термин"пригодна"или"согласована") означает, что чем больше объем выбо. Ирки, тем больше вероятность того, что ошибка оценки не превысит сколько угодно малого додатногодно малого додатного

числа. Е. Оценка 6 параметров ^ называется состоятельной, если она подчиняется закону больших чисел, т.е. выполняется такое равенство:

/. ШГ | г в-в. Е = 1

Как видим, способной называют такую ??статистическую оценку, которая прип приближается по вероятности к оцениваемому параметра. Иными словами, это значение показателя, полученное по выборке и которое приближается (совпадает по вероятности) в силу закона больших чисел при возр льшенни объема выборки до своего математического ожидания. Например, если дисперсия несмещенной оценки прии п приближается к нулю, то такая оценка оказывается и способной, поскольку имеет наименьшее возможное дисперсию (при заданном объеме выборки)

состоятельные оценки являются:

1) доля признака в выборочной совокупности, т.е. частисть как оценка доли признака в генеральной совокупности;

2) выборочная средняя как оценка генеральной средней;

3) выборочная дисперсия как оценка генеральной дисперсии;

4) выборочные коэффициенты асимметрии и эксцесса как оценка генеральных коэффициентов

В литературе по математической статистике почему-то не всегда можно встретить описание четвёртая свойства статистических оценок-достаточность. Оценка достаточное (или исчерпывающая) - это оценка, которая обусловливает (обеспечивает) полноту охвата всей выборочной информации о неизвестный параметр генеральной совокупности. Таким образом, достаточное оценка включает всю информацию, а содержится в выборке относительно исследуемой статистической характеристики генеральной совокупности. Ни одна из рассматриваемых ранее трех оценок не может дать необходимых дополнительных сведений об изучаемом и параметр, как достаточное статистическая оценкака.

Итак, средняя арифметическая выборочная ~ является несмещенной оценкой средней арифметической генеральнойх. Фактор несмещенности этой оценки показывает: если из генеральной совокупности взять большое количество случайных выборок, то их средние * отличались бы от генеральной средней в большую и меньшую сторону от днаково, т.е. свойство несмещенности хорошей оценки также показывает, что среднее значение бесконечно большого числа выборочных средних равна значению генеральной средненьої.

В симметричных рядах распределения медиана является несмещенной оценкой генеральной средней. А при условии, что численность выборочной совокупности приближается к генеральной (П ~ * N), медиана может быть в таких рядах и способной оценке генеральной середньоиЩо же касается критерия эффективности относительно медианы как оценки средней арифметической генеральной совокупности, можно доказать, что в выборках большого объема среднеквадратичная ошибка медианы(. Стме) равна 1,2533 среднеквадратической ошибки выборочной средней

2 72

) есть. Стме *. Поэтому медиана не может быть эффективной оценке средней арифметической генеральной совокупности, поскольку ее средняя квадратическая ошибка больше средней квадратичной ошибки средней арифметической выбо. Ирки. К тому же средняя арифметическая удовлетворяет условиям несмещенности и способности, а, следовательно, является лучшей оценкойою.

Возможна и такая постановка. Может средняя арифметическая выборки быть несмещенной оценке медианы в симметричных распределениях совокупности, для которой совпадают значения средней и медианы? а средняя способной оценке медианы генеральной совокупности? щено и согласованные оценкиою.

Помня, что. Стме ~ 1,2533 в й, приходим к выводу: средняя арифметическая выборки, а не медиана, более эффективной оценке медианы исследуемой генеральной совокупности

Каждая характеристика выборки не обязательно является лучшей оценкой соответствующей характеристики генеральной совокупности. Знание свойств оценок позволяет решать вопросы не только выбора оценок, но и их улучшения качестве примера можно рассмотреть случай, когда расчеты показывают, что значения средних квадратических отклонений нескольких выборок из одной генеральной совокупности во всех случаях оказываются я меньше среднего квадратического отклонения генеральной совокупности, причем величина разности обусловлена ??объемом выборки. Умножив значение среднего квадратического отклонения выборки на поправочный ко коэффициент, получим улучшенную оценку среднего квадратического отклонения генеральной совокупности. За такой поправочный коэффициент используют поправку. Бесселясела

п а Iп

(п -1), т.е. для устранения смещения оценки получают 'п -1. Такой числовое выражение показывает, что среднее квадратическое отклонение выборки, использовано как оценка, дает заниженное значение параметра генеральной совокупности

Как известно, статистические характеристики выборочной совокупности являются приближенными оценкам неизвестных параметров генеральной совокупности. Сама оценка может иметь форму одного числа или какой-либо определенной точки. Эти инка, которая определяется одним числом, называется точечной. Так, выборочная средняя (~) является несмещенной и наиболее эффективной точечной оценкой генеральной среднейї (х), а выборочная дисперсия) - смещенной точечной оценкой генеральной

а2

дисперсии (). Если обозначить среднюю ошибку выборочной среднейт , то точечную оценку генеральной средней можно записать в видех ± т °. Это означает, что ~ - оценка генеральной среднейх с ошибкой, равнойт"Понятно, что точечные статистические оценких и o не должны иметь систематической ошибки в

o o o ~ o у2

сторону завышения или занижения оцениваемых параметровх и. Как было сказано ранее, оценки, которые удовлетворяют такое условие, называются

несмещенными. Что же представляет собой ошибка параметрат"?. Это средняя из множества конкретных ошибок:

Точечная оценка параметра генеральной совокупности заключается в том, что из разных возможных выборочных оценок сначала избирается та, которая имеет оптимальные свойства, а затем вычисляется значение этой оценки и. Полученное расчетное значение последней рассматривается как наилучшее приближение к неизвестному истинному значению параметра генеральной совокупности. Дополнительные расчеты, связанные с определением возможной ошибки оценки, не всегда обязательные (в зависимости от решения задач оценки), но, как правило, осуществляются практически всегдди.

Рассмотрим примеры определения точечной оценки для средней исследуемых признаков и для их доли в генеральной совокупности

. Пример. Посевы зерновых культур района составляют 20 000 га. При 10%-м выборочном обследовании полей получили такие выборочные характеристики: средняя урожайность - 30 ц с I га, дисперсия урожайности - 4, площадь а посевов высокоурожайных культур - 1200 гектарев.

Что знать о величине показателя средней урожайности зерновых культур в районе и которое числовое значение показателя доли (удельного веса) высокоурожайных культур в общей площади зерновых ис уваног

региона? х, г) в генеральной совокупности. Для расчета оценок имеем:

= 1200= 060

N = 20000 ; - = 20000х 0,1 = 2000; ~ = 30 , т = л / 4; № 2000

Как известно, выборочная средняя арифметическая является эффективной оценкой

генеральной средней арифметической. Таким образом, можно принять, что

лучшая оценка генерального параметра (^) есть 30. Чтобы определить степень

точности оценки необходимо найти среднюю (стандартную) ее ошибке

иа п ~. И апреля 2000ч . ППЛ

т =Л - (1 -) = - (1 -) = 0,04

v п N и2000 2000 ^

Полученная величина ошибки свидетельствует о большой точность оценки. Значениет здесь означает, что при многократном повторении таких выборок ошибка оценки параметра составила бы в среднем 0,04 есть за точечной

оценке средняя урожайность в хозяйствах района будетх = 30 - 0,04 ц с I га

Для получения точечной оценки показателя доли посевов высокоурожайных культур зерновых в общей площади зерновых за лучшую оценку может быть принято показатель доли в выборке можно сказать, что по результатам наблюдений лучшей оценкой искомого показателя структуры будет числе 0,6. Уточняя вычисления, следует рассчитать среднюю ошибку этой оценкии: т і (1 _п) и 06 (1 - 0б) (1= 0,01

vп N v 2000 2000а

Как видим, средняя ошибка оценки генеральной характеристики равна 0,01

Полученный результат означает, что если бы многократно повторить выборку с объемом в 2000 га зерновых, средняя ошибка принятой оценки доли (удельного веса) высокоурожайных культур на площади зерновых культур р предприятий района была бы ± 0,01. В таком случае. Р = 0,6 ± 0,01. В процентном выражении доля высокоурожайных культур в общей площади зерновых района составит в среднем 60 ± I.

Расчеты показывают, что для конкретного случая лучшей оценкой искомого показателя структуры будет число 0,6, а средняя ошибка оценки в той или иной сторону будет примерно равна 0,01. Как видим, в оценка достаточно арифметическийа.

Известно несколько способов точечной оценки среднего квадратического отклонения в случаях, когда выборка осуществлена ??из генеральной совокупности единиц с нормальным распределением и параметр в неизвестный простой (наиболее легкой в ??вычислениях) оценкой является размах вариации (й °) выборки, умноженный на поправочный коэффициент, взятый по стандартным таблицами и который зависит от объема выборки (для малых выборок). Параметр среднего квадратического отклонения в генеральной сук купности можно оценить с помощью вычисленной выборочной дисперсии с учетом числа степеней свободы. Корень квадратный из этой дисперсии дает величину, которая будет использована как оценка генератора льного среднеквадратического отклонения ).

Используя значение параметра в", вычисляют среднюю ошибку оценки генеральной средней (х ') способом, рассмотренным выше

Как указывалось ранее, согласно требованию способности уверенность в точности той или иной точечной оценки повышается при увеличении численности выборки. Продемонстрировать это теоретическое положение на а примере точечной оценки несколько затруднено. Влияние объема выборки на точность оценки очевиден при исчислении интервальных оценок. О них речь пойдет нижежче.

В таблице 39 приведены наиболее часто используемые точечные оценки параметров генеральной совокупности

. Таблица 39

. Основные точечные оценки_

Характеристика генеральной совокупности

Оценка

Средняя арифметическаях

Разница средних двух генеральных совокупностейХ 1 ~х2

Среднее квадратическое отклонение, ° '-

аа

Доля признаки, р"

w

Разность частот двух признаков генеральных совокупностей, ^ ~ ^2

и1 - и2

Суммарные параметры генеральной совокупности

N

Количество элементов в группе генеральной совокупности

Вычисленные разными способами значения оценок могут быть неодинаковы по величине. В этой связи в практических расчетах следует заниматься не последовательным вычислением возможных вариантов, а, опираясь на свойства различных оценок, выбрать одну из них.

При малом количестве единиц наблюдений точечная оценка значительной мере случайно, следовательно, мало надежная. Поэтому в малых выборках она может сильно отличаться от оцениваемой характеристики генеральной совокупный ности. Такое положение приводит к грубым ошибкам в выводах, которые распространяются на генеральную совокупность по результатам выборки. По этой причине при выборках малого объема пользуются интервальными эти нкамами.

В отличие от точечной интервальная оценка дает диапазон точек, внутри которого должен находиться параметр генеральной совокупности. Кроме того, в интервальной оценке указывается вероятность, а, следовательно, вон на имеет важное значение в статистическом анализі.

Интервального называют оценку, которая характеризуется двумя числами - границами интервала, который охватывает (покрывает) оцениваемый параметр. Такая оценка представляет собой некоторый интервал, в котором с заданной вероятно ностью находится искомый параметр. За центр интервала принимается выборочная точечной оценкика.

Таким образом, интервальные оценки является дальнейшим развитием точечного оценивания, когда такая оценка при малом объеме выборки неэффективна

Задачу интервального оценивания в общем виде можно сформулировать так: по данным выборочного наблюдения необходимо построить числовой интервал, в отношении которого с ранее выбранным уровнем вероятно ости можно утверждать, что в пределах данного интервала находится оцениваемый парамет.

Если взять достаточно большое количество единиц выборки, то, пользуясь теоремой. Ляпунова, можно доказать вероятность того, что ошибка выборки не превысит некоторую заданную величину а, т.е.

И ~"*!"А или I"р йа.

частности, эта теорема дает возможность оценивать погрешности приближенных равенств:

-"р (пі - частота) х"х п

Если ^ * 2Xз,х - ~ независимые случайные величины ип, то вероятность их средней (х) находится в пределах ота к6 и может быть определена уравнениями

р (а (х (е) 1 е2 сии

-. Е (х); _ в -. Е (х). ДЕ °а

Вероятность. Р при этом называют доверительной вероятностью

Таким образом, доверительной вероятностью (надежностью) оценки генерального параметра по выборочной оценке называют вероятности, с которой осуществляются неравенства:

|~ | а ; | и,-р | д

где а - предельная ошибка оценки, согласно средней и доли

Границы, в которых с этой заданной вероятностью может находиться генеральная характеристика, называют доверительными интервалами (доверительными границами). А границы этого интервала получили название границ доверия

Доверительные (или толерантные) границы - это границы, выход за пределы которых данной характеристикой вследствие случайных колебаний имеет незначительную вероятность (Л ^ 0,5; р 2 0,01;. Л 0,001). Понятие"доверительный интервал"введено. ДжНейманом и. КПирсоном (1950 г). Это установленный по выборочным данным интервал, с заданной вероятностью (доверительной вероятностью) охватывает (покрывает) настоящее, ал ле неизвестно для нас значение параметра. Если уровня доверительной вероятности принять значения 0,95, то эта вероятность свидетельствует о том, что при частом применении данного способа (метода) вычислений доверие рчий интервал примерно в 95% случаев будет покрывать параметр. Доверительный интервал генеральной средней и генеральной доли определяется на основе приведенных выше неравенств, с якирівностей, з яких

следует, что ~-х - ~+ А; -р- + А.

В математической статистике надежности того или иного параметра оценивают по значению трех следующих уровней вероятности (иногда называют"пороги вероятности"):. Л = 0,95; ^2 = 0,99;Р3 = 0,999. Вероятности, которыми решено пренебрегать, т.е.а1= 005;;а2= 001;"3 = 0,001 называют уровнями значимости, или уровнями существенности. Из приведенных уровней надежные выводы обеспечивает вероятностьР3 = 0,999. Каждому уровню доверительной вероятности соответствует определенное значение нормированного отклонения (табл. 27). Если нет в распоряжении стандартных таблиц значений интервала вероятностей, то эту вероятные ость можно вычислить с определенной степенью приближения по формулелою:

. Р () = - = ^ = 1 е"~ йи

На рисунке 11 заштрихованы те части общей площади, ограниченной нормальной кривой и осью абсцисс, которые соответствуют значениям = ± 1; = ± 2; = и3 и для которых вероятности равны 0,6287, 0,9545; 0,9973. При точечном оценке рассчитывается как уже известно, средняя ошибка выборки, при интервальном - предельная

зависимости от принципов отбора единиц (повторного или без повторного) структурные формулы расчета ошибок выборки

1 -

различаются по величине поправки (N)

. Рис 11. Кривая нормального распределения вероятностей

В таблице 40 приведены формулы расчетов ошибок оценок генерального параметра

Рассмотрим конкретный случай интервальной оценки параметров генеральной совокупности по данным выборочного наблюдения

. Пример. При выборочном обследовании хозяйств района установлено, что среднесуточный надой коров (х) составляет 10 кг. Доля чистопородного скота в общей численности поголовья составляет 80%. Ошибка выборки с доверительной вероятностью. Р = 0,954 оказалась равной 0,2 кг для частного чистопородного скота 1 %.

Таким образом, границы, в которых может находиться генеральная средняя

производительность, будут 9,8 х 10,2, для генеральной доли скота -79. Р 81

Вывод: с вероятностью 0,954 можно утверждать, что разница между выборочной средней продуктивностью коров и генеральной производительностью составляет 0,2 кг. Предел среднесуточного надоя - 9,8 и 10,2 кг. Время стка (удельный вес) чистопородного скота в предприятиях района находится в пределах от 79 до 81%, ошибка оценки не превышает 1 %.

. Таблица 40

. Расчет точечных и интервальных ошибок выборки

При организации выборки важное значение имеет определение необходимой ее численности (п). Последняя зависит от вариации единиц обследуемой совокупности. Чем больше коливнисть, тем большей должна быть чисе ельнисть выборки. Обратная связь между численностью выборки и ее предельной ошибкой. Стремление получить меньшую ошибку требует увеличения численности выборочной совокупностиості.

Необходимая численность выборки определяется на основе формул предельной ошибки выборки (д) с заданным уровнем вероятности (Р). Путем математических преобразований получают формулы расчета численности выб бирки (табл. 411).

таблицы 41

. Расчет необходимой численности выборки_

Следует отметить, что все изложенное относительно статистических оценок основывается на предположении, что выборочная совокупность, параметры которой используются при оценке, полученная с использованием метода (способа) в отбора, который обеспечивает получение вероятностей выборка.

При этом, выбирая доверительную вероятность оценки, следует руководствоваться тем принципом, что выбор ее уровня не является математическим задачам, а определяется конкретно решаемой проблемой. В подтверждение сказанному г рассмотрим. Примеромд.

. Пример. Предположим, на двух предприятиях вероятность выпуска готовой (качественной) продукции равна. Р = 0,999, то есть вероятность получения брака продукции составита = 0,001 ли в рамках математических рассуждений, не интересуясь характером продукции, решить вопрос о том, имела ли велика вероятность бракаа = 0,001. Допустим, одно предприятие выпускает сеялки, а второе - самолеты для обработки посевов. Если на 1000 сеялок случится одна бракованная, то с этим можно мириться, потому переплавка 0,1% сеялок дешев вше, чем перестройка технологического процесса. Если же на 1000 самолетов встретится один бракованный, это, безусловно, приведет к серьезным последствиям при его эксплуатации. Итак, в первом случае вероятность получения бракааку а= 0,001 может приниматься, во втором случае - нет. По этой причине выбор доверительной вероятности в расчетах вообще и при исчислении оценок, в частности, следует осуществлять исходя из конкретных условий задачи

зависимости от задач исследования может возникнуть необходимость вычисления одной или двух доверительных границ. Если особенности решаемой задачи требуют установки только одной из границ, верхней или нижней, можно убедиться, что вероятность, с которой устанавливается эта граница, будет выше, чем при указании обоих границ для одного и того же значения коэффициента доверия1

Пусть доверительные границы установлены с вероятностью. Р = 0,95, т.е.

в 95% случаев генеральная средняя (х) будет не меньше нижнего

доверительного интервалах ™ -х 'м и не больше верхнего доверительного

интервала. Хверх -= х +. В этом случае лишь с вероятностьюа = 0,05 (или 5%) средняя генеральная может выйти за указанные границы. Поскольку распределение X симметричный, то половина из этого уровня

вероятности, т.е. 2,5% будет приходиться на случай, когдах(х ™-а вторая половина - на случай, когдах^х"^ -. Из этого следует, что вероятность того, что средняя генеральная может быть меньше, чем значение верхней

доверительной границы. Хвеи"- равна 0,975 (т.е. 0,95 0,025). Следовательно, создаются условия, когда при двух доверительных границах мы пренебрегаем

значениемх как меньшех""*., так и большими или. Хеерх. Называя

только одну доверительную границу, например,. Хверх, мы пренебрегаем только теми ~, превышающих эту границу. Для одного и того же значения коэффициента доверия X уровень значимостиа здесь оказывается в два раза меньше

Если рассчитываются только значение признака, которые превышают

(или наоборот не превышают) значение искомого параметрах, доверительный интервал называется односторонним. Если рассматриваемые значения ограничиваются с обеих сторон, доверительный интервал носит название двустороннего. Из сказанного выше следует, что гипотезы и ряд критерии ел, в частности критерий. Х-Стьюдента, нужно рассматривать как односторонние и двусторонние. Поэтому при двусторонней гипотезе уровень значимости для одного и того же значения X будет в два раза больше, чем односто. Ронни. Если мы хотим при односторонней гипотезе оставить таким же уровень значимости (и уровень доверительной вероятности), как при двусторонней гипотезе, то величину X следует принять меньшую. Эта особенность учитывается ана при составлении стандартных таблиц критериев. Х-Стьюдента (приложение 1ок 1).

Известно, что с практической стороны чаще представляют интерес не столько доверительные интервалы возможной величины генеральной средней, сколько те максимальные и минимальные величины, больше или меньше которых с задан ной (доверительной) вероятностью генеральная средняя быть не может. В математической статистике их называют гарантированным максимумом и гарантированным минимумом средней. Обозначив названы параметрри

соответственно через их ™, можно записать:. ХШ= х +; хшип = х ~

При исчислении гарантированных максимальных и минимальных значений генеральной средней, как границы одностороннего доверительного интервала в приведенных выше формулах, величина1 берется как критерий односторонний

. Пример. По 20 участках выборки установлена ??средняя урожайность сахарной свеклы 300 н / га. Данная выборочная средняя характеризует соответствующий

параметр генеральной совокупности (х) с ошибкой 10 н / га. Согласно избирательности оценок генеральная средняя урожайность может быть как больше, так и меньше выборочной среднейх = 300. С вероятностью. Р = 0,95 можно утверждать, что искомый параметр не будет больше. ХШ"= 300 1,73 х10 = 317,3 ц / га

Величина 1 взята для числа степеней свободы ^ = 20-1 при односторонней критической области и уровне значимостиа= 0,05 (приложение 1). Итак, с вероятностью. Р = 0,95 гарантированный максимально возможный уровень генеральной средней урожайности оценивается в 317 н / га, то есть при благоприятных условиях средняя урожайность ц сахарной свеклы не превышает указанной величиныи.

В некоторых отраслях знаний (например, в естественных науках) теория оценки уступает теории проверки статистических гипотез. В экономической науке методы статистической оценки играют очень важную роль в деле проверки надежности результатов исследований, а также в различного рода практических расчетах. Прежде всего это касается использования точечной оценки исследуемых статистических совокупностей. В ибир можно лучшей оценки - основная проблема точечной оценки. Возможность такого выбора обусловлена ??знанием основных свойств (требований) статистических. Оценитеінок.