WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     || 2 |
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ВОРОНЕЖСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Часть 3 Учебно-методическое пособие для студентов По специальности 010101 (010100) Математика Воронеж 2005 2 Утверждено научно-методическим советом математического факультета 14 июня 2005 года Протокол №11 Составители: Баркова Л.Н.

Михайлова И.В.

Учебно-методическое пособие подготовлено на кафедре уравнений в частных производных и теории вероятностей математического факультета Воронежского государственного университета Рекомендуется для студентов 5 курса вечернего отделения математического факультета Учебно-методическое пособие написано в соответствии с программой курса «Математическаястатистика», содержит теоретические сведения и набор задач для самостоятельной работы студентов 3 ИНТЕРВАЛЬНЫЕ ОЦЕНКИ И ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ 1. Понятия интервальной оценки и доверительного интервала При оценивании неизвестных параметров наряду с рассмотренными выше точечными оценками используются также интервальные оценки.

В отличие от точечной оценки интервальная оценка позволяет получить вероятностную характеристику точности оценивания неизвестного параметра.

Пусть - случайнаявыборка объема n из генеральной совокупноn сти с функцией распределения F x;, зависящей от параметра, значе( ) ние которого неизвестно.

Предположим, что для параметра построен интервал, ( ( ) ( ) n n ), где и являются функциями случайной выборки, такими, что ( ) ( ) n n n выполняется равенство < < (1) { ( ) ( ) nn }=.

В этом случае интервал, ( ( ) ( ) n n ) называют интервальной оценкой для параметра с коэффициентом доверия (или, сокращенно, доверительной интервальной оценкой), а и соответственно ( ) ( ) n n нижней и верхней границами интервальной оценки.

Интервальная оценка, ( ( ) ( ) n n ) представляет собой интервал со случайными границами, который с заданной вероятностью накрывает неизвестное истинное значение параметра. Таким образом, для различных реализаций случайной выборки x, т.е. для различных элементов выn борочного пространства статистики и могут принимать раз( ) ( ) n n личные значения.

Более того, согласно (1), существует подмножество K выборочного пространства такое, что если x K, то x, x n n n ( ( ) ( ) ).

При этом вероятностной характеристикой точности оценивания параметра является случайнаявеличина l = -, ( ) ( ) ( ) n n n котораядля любой реализации x случайной выборки есть длина инn n тервала x, x Интервал x, x называют доверительным инn n n n ( ( ) ( ) ( ( ) ( ) ). ) тервалом для параметра с коэффициентом доверия или доверительным интервалом.

Заметим, что нарядус термином "коэффициент доверия" широко используют также термины доверительная вероятность и уровень доверия.

При этом коэффициент доверия чаще всего выбирают равным 0,9, 0,или 0,99, т.е. близким к 1.

В некоторых ситуациях (например, при рассмотрении дискретных случайных величин) вместо равенства (1) удается обеспечить лишь неравенство < < { ( ) ( ) nn }, т.е. построить интервальную оценкудля параметра с коэффициентом доверия, не меньшим. Иногда требуется оценить параметр только снизуили только сверху. При этом, если < { ( ) }=, n то статистику называют односторонней нижней ( ) n доверительной границей для параметра. Аналогично, если < { ( ) n }=, то статистику называют односторонней верхней -доверительной ( ) n границей для параметра.

Пример 1. Пусть — среднее значение предела прочности некоторого материала, которое оценивают независимо друг от друга в каждой из N различных лабораторий по результатам п независимых натурных испытаний. Иначе говоря, среднее значение предела прочности в каждой лаборатории оценивают по "своим" экспериментальным данным, представленным выборкой объема п, и в каждой лаборатории получают "свои" значения верхней и нижней границ -доверительного интервала (рис.3.1). - Возможны случаи, когда -доверительный интервал для параметра не накрывает его истинного значения. Если М - число таких случаев, то при больших значениях N должно выполняться приближенное равенство N ( - M ). Таким образом, если опыт - получение выборки объема п в лаN боратории, то уровень доверия - доля тех опытов (при их многократном независимом повторении), в каждом из которых -доверительный интервал накрывает истинное значение оцениваемого параметра.

2. Построение интервальных оценок Пусть - случайная выборка объема п из генеральной совокупности n с функцией распределения F(x, ), зависящей от параметра, значение ко торого неизвестно. Рассмотрим один из наиболее распространенных методов построения интервальных оценок для, связанный с использованием центральной статистики - любой статистики,, функция рас( ) n пределения которой F t =, < t зависит от параметра. Примеры централь( ) ( ) { }не n ных статистик приведем в дальнейшем.

Для упрощения дальнейших рассуждений будем предполагать следующее:

1) функция распределения F t является непрерывной и возрастаю( ) щей;

2) заданы такие положительные числа и, что коэффициент доверия =1- - ;

3) для любой реализации x выборки из генеральной совокупности n функция x, является непрерывной и возрастающей (убывающей) n ( ) функцией параметра.

Согласно допущению 1, для любого q 0,1 существует единствен( ) ный корень hq уравнения F t = q, который называют квантилью уровняq ( ) функции распределения F t случайной величины,.Таким обра( ) ( ) n зом, согласно допущению 2, имеют место равенства < x, < h1- n ( ) {h } = F h1- - F h =1- - =, (2) ( ) ( ) которые справедливы для любых возможных значении параметра, так как, - центральнаястатистика, и ее функция распределения F t не ( ) ( ) n зависит от. Для построения искомой интервальной оценки воспользуемся следующими соображениями.



Пусть для определенности функция, является возрастающей ( ) n функцией параметра. Тогда, согласно допущению 3, для каждой выборки xn уравнения x, = h и x, = h1- имеют единственные решеn n ( ) ( ) n ния x и x соответственно. При этом неравенства h < x, n n n ( ) ( ) ( ) < h1- и xn < < xn являются равносильными, т.е. для любой реа( ) ( ) лизации выборки xn они выполняются или не выполняются одновременно. Таким образом, = <, < h1- = < <, ( ) } и ( ) искомая {h } { ( ) ( ) ( ) ( ) n nn n n интервальнаяоценка.

Завершая рассуждения, заметим, что фактически построение доверительного интервала сводится к выполнению следующих действий:

1) построение центральной статистики, с известной функцией ( ) n распределения F t ;

( ) 2) представление заданного коэффициента доверия в виде =1- - ;

3) нахождение квантилей ha и h1- уровня и 1- функции распределения F t ;

( ) 4) нахождение значений нижней xn и верхней xn границ иско( ) ( ) мой интервальной оценки путем решения уравнений x, = h, x, = h1- (3) nn ( ) ( ) соответственно в случае, когда x, — возрастающаяфункция параметn ( ) ра. Если же x, — убывающая функция параметра, то и n ( ) ( ) n получают путем решения уравнений xn, = h1- и x, = h соn ( ) ( ) ( ) n ответственно.

3. Примеры построения интервальных оценок Рассмотрим построение интервальной оценки для параметров некоторых часто используемых распределений.

Экспоненциальное распределение. Пусть — случайная выборка n объема п из генеральной совокупности с экспоненциальным законом распределения, имеющим плотность распределения f x = e- x[0,+) x, где - неизвестный параметр.

( ) ( ) Требуется построить интервальную оценку для параметра по данным случайной выборки.

n В данном случае =. Рассмотрим статистику, = 2 n, где ( ) n - выборочное среднее для. Эта статистика имеет -распределение n с 2 n степенями свободы, т.е. является центральной статистикой. Уравнения (3) в данном случае принимают вид 22 2 n= 2n, 2 n=, где 2n — квантиль уровняq для хи( ) ( ) 1- q квадрат распределения с 2n степенями свободы.

Получаем, что нижняя и верхняя границы интервальной оценки скоэффициентом доверия =1- - для параметра экспоненциального распределения имеют вид 2 2n 2n ( ) ( ) 1==, ( ) ( ) nn 2n 2n Нормальное распределение. Пусть — случайнаявыборка объема п x из генеральной совокупности, распределенной по нормальному закону с параметрами и. Рассмотрим некоторые варианты построения интервальных оценок для этих параметров.

Вариант1 - оценка для математического ожидания при известной дисперсии. В данном случае статистика -, = n ( ) n имеет стандартное нормальное распределение с параметрами- = 0, = 1, т.е. является центральной статистикой. Функция, является ( ) n убывающей функцией по, и система уравнений (3) принимает вид n - xn n - xn ( ) ( ) (x ) (x ) = u1-, = u, где uq - квантиль уровняq стандартного нормального pacпpеделения.

Учитывая что для нормального закона u1- = u получаем следующие, нижнюю и верхнюю границы -доверительного интервала для параметра при =1- - :

xn = x - u1-, xn = x + u1-.

( ) ( ) nn Вариант 2 - оценка математического ожидания при неизвестной дисперсии. При неизвестной дисперсии статистика -, = n ( )S n является центральной, так как имеет распределение Стьюдента с (n -1) степенями свободы, которое не зависит от и. Система уравнений (3) в данном случае принимает вид n - xn n - xn ( ) ( ) (x ) (x ) = t1- ( -1, = t n -1, n ) ( ) SS где tq n -1 — квантиль уровняq распределения Стьюдента с. п - ( ) степенями свободы. Посколькуплотность распределения Стьюдента - четная функция, то t n -1 =-t1- ( -1. Отсюда заключаем, что нижняя и n ( ) ) верхняя границы интервальной оценки с коэффициентом доверия =1- - для параметра в случае снеизвестной дисперсией можно определить по формулам SS xn = x - t1-, xn = x + t1- ( ) ( ) nn Вариант 3 - оценка среднего квадратичного отклонения. Рассмотрим статистику n ( -1 S2 n ) ( ), =.

( ) n Эта статистика является центральной, таккакимеет хи-квадрат распределение с n -1 степенями свободы, которое не зависит от и. При этом, - убывающаяфункция параметра. Исходя из этого, соглас( ) n но (3), находим нижнюю и верхнюю границы интервальной оценки для параметра с коэффициентом доверия =1- - :

S n -1 S n -( ) ( ) nn ==,, ( ) ( ) nn nn ( -) ( -) 1где n -1 - квантиль уровняq для хи-квадрат распределения с n -( ) q степенями свободы.

4 Приближенные интервальные оценки Сначала рассмотрим частный случай построения таких оценок.

Пусть требуется найти интервальную оценку для математического ожидания в случае, когда закон распределения генеральной совокупности неизвестен. Предполагаем, что существуют конечные математическое ожидание = MX и дисперсия = DX.

Рассмотрим статистику = n.

( )- n В соответствии с центральной предельной теоремой эта статистика при больших объемах случайной выборки имеет закон распределения, n близкий к стандартному нормальному. Поэтому при достаточно больших n неравенства - -u1- n u1выполняются с вероятностью, близкой к величине =1- -, где uq — квантиль уровня q стандартного нормального распределения. Приведенные неравенства эквивалентны следующим:

- u1- + u1- / nn Эти неравенства не дают еще интервальной оценки для параметра, таккак их леваяи праваячасти содержат неизвестный параметр. Применяя еще одно приближение, а именно: подставляя в указанные неравенства вместо неизвестного точного значения его оценку S, получаем ( ) n нижнюю и верхнюю границы (приближенной) интервальной оценки скоэффициентом доверия =1- -, для математического ожидания :





S xn S xn ( )u, (xn) =+ ( )u xn =( ) 1- 1nn Приведенный способ построения приближенного доверительного интервала может применяться и в следующей более общей ситуации.

Пусть - точечнаянесмещенная оценка для параметра, построенная ( ) n по данным случайной выборки. Обозначим через п Vn = M - значение дисперсии оценки. Предположим, что ( ) ( ) ( ) ( n ) n оценка имеет асимптотически нормальное распределение. Другими ( ) n ( ) n словами, нормированнаяслучайнаявеличина = n Vn ( ) имеет распределение, которое при n сходится к стандартному нормальному распределению. В этом случае неравенства ( ) n -u1- = u1-, n Vn ( ) где uq - квантиль уровняq стандартного нормального закона распределения, выполняются с вероятностью, которую при достаточно больших n можно считать приближенно равной =1- -.

Указанные неравенства эквивалентны следующим:

- u1- Vn + u1- Vn.

( ) ( ) ( ) ( ) n n Записанные неравенства еще не дают интервальной оценки для, так как их леваяи праваячасти содержат неизвестный параметр. Подставляя в левую и правую части указанных неравенств вместо оценку, получаем окончательно следующие нижнюю и верхнюю границы ( ) n для параметра с коэффициентом доверия =1- - :

= - u1- Vn и = +u1- Vn ( ) ( ) ( ) ( ) ( ) ( ) n n n n Изложенный метод является приближенным и может применяться при достаточно большом объеме случайной выборки. Заметим, что его использование фактически связано с "двойным приближением", а именно:

закон распределения оценки заменяют нормальным и, кроме того, в приведенных формулах для границ интервальной оценки в дисперсию Vn ( ) вместо точного значения подставляют его оценку. При малых и ( ) n средних объемах случайной выборки применение указанного метода может приводить к значительным ошибкам. Поэтому использовать его следует сдостаточной степенью осторожности и лишь в качестве первого приближения.

Пример 1. Рассмотрим построение приближенного доверительного интервала для параметра р биномиального распределения. Пусть проводилось n = 16 независимых испытаний с неизвестной вероятностью р "успеха" в каждом испытании, при этом наблюдалось к = 8 „успехов". Определим значения границ доверительного интервала для р с коэффициентом доверия = 0,9.

Значение точечной оценки параметра р определяется как k p = n p 1- p ( ) дисперсия этой оценки Vn p = ( ) n Применяя приведенные выше формулы, получаем следующие значения для нижней и верхней границ доверительного интервала:

p pp p (1- ) (1- ) p = p - u0,95 = 0, 294, p = p +u0,95 = 0,706.

nn Пример 2. Из большой партии электроламп было отобрано случайным образом 400 шт. для определения средней продолжительности горения. Выборочнаясредняя продолжительность горения ламп оказалась равной 1220 ч. Найдем скоэффициентом доверия = 0,997 доверительный интервал для средней продолжительности горения электролампы по всей партии, если среднее квадратичное отклонение продолжительности горения равно 35 ч.

Независимо от закона распределения генеральной совокупности (продолжительности горения электролампы) статистика n - n, где = xi имеет асимптотически нормальное распреде n i=ление спараметрами (0,1), что следует из центральной предельной теоремы. Посколькуобъем выборки большой ( n = 400), то границы доверительного интервала находим по формулам приближенного доверительного интервала. Для =1- = 0,003 находим квантиль нормального распределения u = 2,98. В силу соотношений 1u 5,52 получаем доверительный интервал 1n (1220-5,52; 1220+5,52)или (1214,48, 1225,52).

Пример 3. В результате пусков 10 ракет получены (в условных единицах) значения боковых отклонений точек попадания от точек прицеливания (табл.1).

Таблица Номер раке- 1 2 3 4 5 6 7 8 9 ты Отклонение 1,0 0,2, 1,0 -0,1 -0,5 5,0 -1,0 3,0 0,5 1,Полагая, что случайнаявеличина (случайное отклонение точекпопадания от точек прицеливания) имеет нормальное распределение, построим доверительный интервал для ее математического ожидания с коэффициентом доверия =0,99.

Для нахождения доверительного интервала воспользуемся статистикой - n -1, xn ( ) котораяимеет распределение Стьюдента с п - 1 степенью свободы.

Выборочное среднее имеет значение n x = x = 1 (1+0,2+1-0,1-0,5+5-1+3+0,5+1) = 1,01, i n i=n 2 а выборочная дисперсия — значение = xi - x = ( ) n i=( (-0,01)2+0,992+…+(-0,01)2)=2,8673.

Значение выборочного среднего квадратичного отклонения равно = 2,8649 = 1,69. По таблице квантилей распределения Стьюдента для n - 1 = 9 находим квантиль t n -1 уровня 1-. По условию задачи ( ) 1=1- =1-0,99 =0,01.

Следовательно, t n -1 = t0,995 9 = 3,25. Вычислив ( ) ( ) 11,t n -1 = 3,25 1,79,получаем доверительный интервал ( ) 1n -(1,01-1,79, 1,01 + 1,79), или (-0,78, 2,80).

Пример 4. Из партии однотипных высокоомных сопротивлений отобрано 10 штук. У каждого из них измерены отклонения сопротивления от номинального значения (табл. 2).

Таблица Номер изизде- 1 2 3 4 5 6 7 8 9 лия Отклонение 1 3 -2 2 4 2 5 3 -2 Предполагая, что контролируемый признакимеет нормальный закон распределения, найдем выборочное среднее, исправленную выборочную дисперсию S2 и доверительный интервал для дисперсии с коэффициентом доверия = 0,96.

Pages:     || 2 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.