WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     || 2 | 3 | 4 | 5 |   ...   | 8 |
САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ _ Б.И. Положинцев Теория вероятностей и математическая статистика Введение в математическую статистику Санкт-Петербург Издательство СПбГПУ 2010 УДК 519.2 Положинцев Б.И. Теория вероятностей и математическая статистика. Введение в математическую статистику: Учебное пособие.

– СПб.: Изд-во Политехн. ун-та, 2010.– 95 с.

Пособие соответствует государственным образовательным стандартам направлений подготовки «Телекоммуникации» и «Радиотехника» по дисциплине «Теория вероятностей и математическая статистика».

Наряду с изложением основных понятий и методов по разделам дисциплины, относящимся к математической статистике – статистическим методам обработки экспериментальных данных, точечному и интервальному оцениванию, проверке статистических гипотез, в пособии также рассмотрены прикладные аспекты, связанные со спецификой указанных направлений обучения.

Предназначено для студентов кафедры «Радиоэлектронные средства защиты информации» радиофизического факультета СПбГПУ.

2 СОДЕРЖАНИЕ 1. Определение случайной выборки…………………….…………. 5 2. Закон распределения порядковых статистик…………….……... 6 3. Эмпирическая функция распределения……………….………… 8 4. Группирование выборочных данных, гистограмма...………….. 11 5. Определение и свойства точечных оценок параметров распределения: состоятельность, несмещенность, эффективность…………………………………….……………... 13 6. Оценки основных числовых характеристик распределения и их свойства……………………………………….………………. 16 7. Выборочные квантили……………………………………………. 21 8. Нахождение оценок параметров распределений методом максимального правдоподобия……………….………………… 23 9. Примеры нахождения оценок максимального правдоподобия (МП- оценок) параметров распределений……………………… 25 10. Понятие доверительного интервала…………………………… 28 11. Основные этапы процедуры построения доверительных интервалов………………………………………………….……. 12. Доверительный интервал для математического ожидания нормального распределения при известной дисперсии.

Пример 1_ди…………………………………….……………….. 13. Распределение 2, распределение Стьюдента, лемма Фишера..

14. Доверительный интервал для математического ожидания нормального распределения при неизвестной дисперсии Пример 2_ди и Пример 3_ди…………………………….……… 15. Доверительный интервал для стандартного отклонения нормального распределения………………………………..…… 16. Приближенная интервальная оценка для математического ожидания произвольного распределения по выборке большого объема………………………………………….……... 17. Приближенная интервальная оценка параметра p биномиального распределения по выборке большого объема.

Пример 4_ди……………………………………………….……..

18. Постановка задачи проверки статистических гипотез.

Пример 1_кз………..………………………………….................. 19. Критерии значимости: гипотезы, критическая область, решения, ошибки……………………………………………….... 20. Основные этапы процедуры проверки статистических гипотез……………………………………………………….…… 21. Подход к проверке статистических гипотез о параметрах распределений, основанный на доверительных интервалах Пример 1_кди……………………………………………….…… 22. Примеры проверки гипотез о параметрах распределений:

Пример 2_кз_кди; Пример 3_кз_кди (левосторонний критерий); Пример 4_кз (правосторонний критерий);

Пример 5_кз_кди (двусторонний критерий)……………..…….. 23. Распределение Фишера, свойство квантилей…………….……. 24. Проверка гипотезы о равенстве дисперсий двух нормальных распределений (критерий Фишера). Пример 6_кз………….…. 25. Проверка гипотезы о равенстве математических ожиданий двух нормальных распределений (критерий Стьюдента).

Пример 7_кз…………………………………………………….... 26. Теорема Пирсона, проверка простой статистической гипотезы………………………………………………….………. 27. Проверка гипотезы о виде распределения – метод 2 для простой гипотезы……………………………………….………..

28. Проверка гипотезы о виде распределения – метод 2 для сложной гипотезы………………………………………..……….

29. Пример 1_кс (нормальное распределение)………..……...……. 30. Пример 2_кс (распределение Пуассона)……………….………. 31. Проверка гипотезы о равенстве параметров p1 и p(вероятностей) двух биномиальных распределений по выборкам большого объема………………………….………….

32. Понятие p – значения……………………………………….…… Приложение 1. Предельные теоремы теории вероятностей….…... Приложение 2. Получение выборки из заданного распределения.. Литература…………………………………………………….……... В пособии рассматриваются основные понятия и методы анализа данных, полученных в результате опыта – наблюдений (измерений, регистраций) величин, случайных по своей природе. При этом принципиально осуществимой предполагается возможность неограниченного числа таких наблюдений в одних и тех же условиях.

В большинстве случаев далее считается, что статистические данные представляют собой результат серии независимых опытов, в каждом из которых зарегистрировано значение исследуемой одномерной случайной величины.

1. Определение случайной выборки Пусть X – исследуемая случайная величина, FX (x) = P(X < x) – ее функция распределения (вообще говоря, неизвестная). В ряде случаев может быть известен вид распределения случайной величины, а неизвестными являются один или несколько параметров, от которых зависит функция распределения. Ради краткости в записи FX (x) индекс может в дальнейшем опускаться. Условимся также указывать, непрерывной или дискретной является исследуемая случайная величина.

Пусть проводится серия n независимых наблюдений (измерений) случайной величины X в одних и тех же условиях (эксперимент). В результате эксперимента получают n чисел – значений x1, x2, …, xn, которые случайная величина X последовательно принимала в данной серии наблюдений. Эти числа будем считать значениями n одинаково распределенных независимых случайных величин X1,..., Хn, каждая из которых имеет функцию распределения FX (x) – ту же, что исследуемая случайная величина X.



Конечную последовательность n независимых одинаково распределенных случайных величин будем называть случайной выборкой X1,..., Хn (короче – выборкой) из распределения FX (x), а указанные числа x1, x2, …, xn, полученные в данном эксперименте – реализацией выборки. Отметим, что множество всех возможных значений исследуемой случайной величины называют генеральной совокупностью.

На основе выборок строят оценки параметров распределения исследуемой случайной величины X, таких как математическое ожидание, стандартное отклонение и других, а также судят о виде функции распределения FX (x).

Понятно, что числа x1, x2, …, xn можно также рассматривать как значение n - мерной случайной величины (X,...,Хn), компоненты которой X1,..., Хn независимы и одинаково распределены.

Всякую функцию выборки (X1,...,Хn) называют статистикой.

Статистика (X1,...,Хn) – случайная величина, распределение которой зависит от распределения FX (x), из которого извлечена выборка, и от объема выборки n.

2. Закон распределения порядковых статистик Пусть X,...,Хn – выборка объема n из распределения FX (x);

x1, x2, …, xn – некоторая ее реализация.

Упорядочим числа x1, x2,…, xn по возрастанию и обозначим их следующим образом: x(1), x(2), …, x(n), где x( ) = min (x, x2, …, xn), 1 x(n) = max (x1, x2,…, xn), x(1) x(2) …. x(n).

Представим, что упорядочены все возможные реализации выборки X1,..., Хn и введем новую случайную величину X(k) – порядковую статистику порядка k (k = 1, 2, …, n).

Множество возможных значений случайной величины X(k) определим так: оно состоит из тех и только тех чисел xi, которые ( ) k оказываются на k - м месте при упорядочении любой реализации x1, x2,…, xn выборки X1,..., Хn (индекс i = 1,2,…– номер реализации).

Таким образом, по выборке X1,..., Хn построена последовательность X(1), …, X(k),..., Х(n), называемая вариационным рядом. Элементы вариационного ряда – порядковые статистики удовлетворяют соотношениям: X … X(k)... Х(n), при этом в ( ) любой реализации вариационного ряда числа xi, …, xi,…, xi (1) ( ) ( ) k n связаны неравенствами xi … xi … xi (верхний индекс i – (1) ( ) ( ) k n номер реализации, i = 1, 2, …).

x1,... x1... x(1) ( ) ( ) k n...

...

...

xi... xi... xi (1) ( ) ( ) k n...

...

...

X(k) X(n) X(1)......

Найдем функцию распределения k-й порядковой статистики X(k): FX (x) = P(X(k) < x) (k = 1, 2, …, n).

(k) Эмпирической частотой Nn (x) назовем случайную величину, равную числу элементов выборки X1,..., Хn, меньших x (иначе – числу элементов вариационного ряда X(1), …, Х(n), меньших x). Ясно, что возможные значения эмпирической частоты Nn (x) – число осуществлений события (X < x) на выборке X1,..., Хn объема n – это числа m = 0,1,…, n. Действительно, (Nn (x) = 0) = ( x X(1));

(Nn (x) = m) = (X(m)< x X(m+1)) m = 1, …, n – 1;

(Nn (x) = n ) = ( x > X(n)).

x X(1) X(m) X(m+1) X(n) Извлечение выборки из распределения FX (x) представляет собой серию n независимых испытаний – n наблюдений (регистраций значений) исследуемой случайной величины X. Для каждого из указанных испытаний вероятность события (X < x) равна P(X < x) = FX (x).

Отсюда следует, что случайная величина Nn (x) подчиняется биномиальному распределению:

P(Nn (x) = m) = Cm ( FX (x) )m (1 FX (x) )n– m (m = 0,1,…,n ).

n Заметим, что события (X(k) < x) и (Nn (x) k) равносильны, X(k) X(k+1) x n (N m) то есть (X(k) < x) = (Nn (x) k) =.

n(x) mk Таким образом, получаем:

n FX (x) P(X(k) < x) = = Cm(FX(x))m(1 FX(x))nm, k = 1, …, n – n (k) mk – закон распределения порядковых статистик.

При k = 1 и k = n имеем распределения экстремальных порядковых статистик:

FX (x) минимальной X(1): = 1– (1– FX (x) )n и (1) FX (x) максимальной X(n): = ( FX (x) )n.

(n) 3. Эмпирическая функция распределения Пусть X1,..., Хn – выборка из распределения FX (x), X, … X(k),..., Х(n) – вариационный ряд, Nn (x) – эмпирическая частота.

( ) Случайная величина Fn (x) = Nn (x) / n, называемая эмпирической функцией распределения – относительная частота числа элементов выборки X1,..., Хn, удовлетворяющих условию Xi < x.

Ясно, что множество возможных значений эмпирической функции распределения есть: 0, 1/n, …, m/n, …, n/n.

События (Fn (x) = m/n) и (Nn (x) = m) – равносильны, эмпирическая частота Nn (x) распределена по биномиальному закону, поэтому P (Fn (x) = m/n) = Cm(FX(x))m(1 FX(x))nm (m = 0,1,…, n) – n – закон распределения эмпирической функции распределения Fn (x).

С помощью функции единичного скачка (функции Хевисайда) эмпирическая функция распределения может быть записана в виде:

n Fn (x) = e (x X(k)), n k 0, x где e (x)= – функция Хевисайда.

1, x Заметим, что для каждой реализации выборки эмпирическая функция распределения обладает всеми свойствами функции распределения. Действительно, пусть x1, x2,…, xn – некоторая реализация выборки, x(1), x(2), …, x(n) – соответствующая реализация вариационного ряда, где x(1) x(2) … x(n).

Среди чисел x1, x2,…, xn выберем только различные, упорядочим их и обозначим через xi, xi,…, xi, тогда k x(1) = xi < …< xi = x(n) (k n) k xi xi... xim...





k n1... nm... nk n1 / n... nm /n... nk /n Здесь nm – абсолютная, nm /n – относительная частота элемента k k nm xim, при этом, очевидно: nm = n; = 1.

n m1 mВведем случайную величину X*, заданную рядом распределения xi xi X* xi...

...

k m xi 1 / n P(X*= ) n... nm /n... nk /n m Заметим, что таким образом каждому элементу реализации выборки x1, x2,…, xn приписана вероятность 1 / n.

Обозначим через Fn*(x) реализацию случайной величины Fn (x), отвечающую данной реализации выборки, тогда nm Fn*(x) = P(X*< x ) =.

n m: xim x Fn*(x) – кусочно-постоянная (ступенчатая) функция, принимающая свои значения на отрезке [0; 1]. В каждой точке x, кроме точек xim, функция Fn*(x) непрерывна; в точках xim – она непрерывна справа, величина скачка слева равна nm /n (m = 1, 2, …, k).

График эмпирической функции распределения для некоторой реализации выборки приведен ниже:

Fn*(x) nk/n n2/n n1/n x xi xi xi k Эмпирическая функция распределения Fn (x) как относительная частота числа осуществлений на выборке события (X < x) при любом x сходится по вероятности к вероятности этого события P(X < x) = FX (x), – к теоретической функции распределения, вообще P говоря, неизвестной: x, поэтому, если объем F (x)nFX(x) n выборки n достаточно велик, то значение эмпирической функции распределения Fn (x) в каждой точке x оказывается близким к соответствующему значению теоретической функции распределения FX (x).

Доказано (теорема Гливенко), что отклонение эмпирической функции распределения Fn (x) – случайной величины – от теоретической функции распределения FX (x) с вероятностью сколь угодно мало при достаточно большом объеме выборки n:

P (sup| F (x) FX(x)| )n+ > 0, n x при этом Fn (x) служит равномерным приближением FX (x) на всей числовой оси. Заметим, что разность (Fn (x) – FX (x)) асимптотически нормальна с нулевым математическим ожиданием.

4. Группирование выборочных данных, гистограмма Эмпирическая функция распределения является характеристикой выборки, позволяющей наглядно представлять статистические данные и выдвигать предположения о виде неизвестной функции распределения исследуемой (наблюдаемой) случайной величины.

Другой способ представления статистического материала – это построение группированного статистического ряда и гистограммы.

Пусть исследуемая случайная величина Х – непрерывна. Если выборка достаточно большая (обычно в статистике большими считают выборки объемом n 100), то ее реализацию (x1, x2,…, xn ) подвергают группировке следующим образом.

Отрезок [x(1); x(n)], где x(1) = min (x1, x2,…, xn ), x(n) = max (x1, x2,…, xn ), содержащий все элементы выборки, разбивают на k равных интервалов i (обычно 5 k 15):

(0) = x(1), (k) = x(n), i = (i –1 ;i) (i = 1,…, k) ;

x(n) x(1) | i | = = h – шаг разбиения.

k x(1) i x(n) 0 1 i – 1 i k ni Число ni – частота, – относительная частота числа элементов n k k ni реализации выборки, попавших в i - й интервал ( = n, = 1).

n i n i1 i Группированный статистический ряд – это совокупность интервалов 1,…, k и соответствующих им частот n1,…, nk (или n1 nk относительных частот,…, ).

n n Наглядное графическое представление группированного статистического ряда дает гистограмма. Гистограммой называют ступенчатую фигуру, построенную следующим образом: на каждом интервале i = (i –1 ; i), как на основании длиной h = |i |, строят ni прямоугольник с высотой, равной, так что площадь Si каждого nh ni такого прямоугольника оказывается равной относительной частоте n числа элементов выборки, попавших в интервал i (i =1,…,k).

ni Si = n 1 i k Относительная частота события по вероятности сходится к вероятности этого события, поэтому если длина интервалов ni разбиения h достаточно мала, то fX(x) h x i. При больших n n верхний контур гистограммы (ступенчатый график) служит приближением графика плотности вероятности fX(x) (вообще говоря, неизвестной). Таким образом, разумно построенная гистограмма позволяет выдвинуть гипотезу о виде распределения исследуемой случайной величины Х. Заметим, что слишком малое или слишком большое число интервалов разбиения k при построении гистограммы может привести к ее недостаточной информативности.

Число интервалов k при разбиении отрезка [x(1); x(n)] обычно определяют по формуле k = 1+ 3,32 lgn (формула Старджесса), либо по формуле k = 1,72 n1/3.

5. Определение и свойства точечных оценок параметров распределения: состоятельность, несмещенность, эффективность Пусть – некоторый параметр распределения FX (x, ).

Информация, необходимая для нахождения оценки неизвестного параметра, содержится в выборке Х1, …, Хn из данного распределения. Таким образом, возникает задача построения оценки параметра распределения как функции случайной выборки:

= (Х1, …, Хn).

Заметим, что оценка параметра распределения является случайной величиной (статистикой). В результате проведения эксперимента (серии n независимых наблюдений) получают реализацию выборки – числа x1, x2, …, xn. При этом оценка принимает соответствующее числовое значение e=(x1, x2,…, xn), которое является приближенным значением неизвестного параметра. Оценки указанного типа называют точечными, их применение целесообразно при достаточно больших выборках. При малых объемах выборок используют интервальные оценки, которые будут рассмотрены далее.

Pages:     || 2 | 3 | 4 | 5 |   ...   | 8 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.