WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 || 3 | 4 |   ...   | 7 |

2.2. Представление случайной величины статистическим рядом распределния Результат любого вероятностного эксперимента можно характеризовать качественно и количественно. Качественный результат вероятностного эксперимента – случайное событие. Любая количественная характеристика, которая в результате эксперимента может принять одно из некоторого множества значений, – случайная величина.

Первичный материал статистического наблюдения оформляется в виде простых таблиц и статистических рядов распределения.

Статистический ряд распределения представляет собой упорядоченное распределение изучаемой совокупности по определенному варьирующему признаку. Следующая таблица – пример статистического ряда:

Ii X1 - X2 X2 - X3... Xi - Xi+1... Xk - Xk+P *i P *1 P *2... P *i... P *k Каф. ЭСВТ ЭЛТИ Здесь Ii – обозначение i-го разряда; xi - xi+1 – его границы; p*t – соответствующая частота; k – число разрядов.

В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения. Последние, в свою очередь, в зависимости от характера вариации признака делятся на дискретные (прерывные) и интервальные (непрерывные) ряды распределения.

При больших размерах массивов становится удобнее ряды распределения анализировать с помощью их графического изображения (рис.2.2), позволяющего визуально судить о форме распределения.

Эксперимент 2.Задание. Получить массивы первичных значений случайной величины, различающиеся по объему в 10, 100 и 1000 раз, и изучить на этом материале работу закона больших чисел. Для наблюдения за свойствами случайной величины в зависимости от размера выборки выполнить следующее для каждого из трех массивов:

• построить ряды распределения;

• рассчитать статистическую вероятность P*(X ) ;

• построить в одних осях три графика, называемых многоугольниками (полигонами) распределения, по оси абсцисс на которых отклаРис.2.1. Пример документированния эксперимента Каф. ЭСВТ ЭЛТИ дываются возможные значения случайной величины, а по оси ординат – вероятности этих значений.

Рекомендации. Для проведения эксперимента использовать программу Excel. Исследовать дискретную и непрерывную случайные величины. Каждый эксперимент выполнять на отдельном листе. Массивы значений создать с помощью программной генерации (Приложение1, раздел Б). Подсчет частоты (статистической вероятности) можно выполнять вручную или (рекомендуется) с помощью инструментария Excel. На приведенном рис. 2.1 изображен пример документирования эксперимента по бросанию игральной кости, на гранях которой написаны числа от 1 до 6, для серии из 100 исходов.

Количество элементарных исходов определено с помощью формулы массива {=ЧАСТОТА(массив_данных; двоичный_массив)} (Приложение 2, Б и В).

Выводы сделать по результатам проведенного эксперимента.

2.3. Функции распределения случайной величины Функция распределения является “паспортом” случайной величины: она содержит всю информация о случайной величине и поэтому изучать случайную величину рекомендуем через исследование ее функции распределения, которую часто называют просто распределением.

Различают интегральную и дифференциальную функции распределения.

2.3.1. Интегральная функция распределения [integral distribution function; лат.: integer – нетронутый, незатронутый, невредимый, целый; integratio – восстановление] Определение: интегральной функцией распределения называют функцию F(x), определяющую для каждого значения x случайной величины X вероятность того, что величина X примет значение, x меньшее x, то есть F(x) = P(X < x) = p(x)dx.

- Распространено краткое название – «функция распределения».

Распределение вероятностей дискретной случайной величины может быть задано перечнем всех ее возможных значений и их вероятностей. Такой способ задания неприменим для непрерывных случайных величин. Общим способом описания распределений любых типов случайных величин является функция распределения. Пусть x – действительное число. Вероятность события, состоящего в том, что случайная величина X примет значение, меньшее x, то есть вероятность события Каф. ЭСВТ ЭЛТИ X < x обозначим через F(x). Интегральной функцией распределения называют функцию F(x), определяющую для каждого значения x вероятность того, что случайная величина X примет значение, меньшее x, то есть F(x) = P(X < x). Геометрически это равенство можно истолковать так: F(x) есть вероятность того, что случайная величина примет значение левее точки x.

Если функция распределения F(x) непрерывна, то случайная величина X называется непрерывной случайной величиной, а если F(x) прерывна (дискретна), то и случайная величина X называется дискретной случайной величиной.

Интегральная функция распределения (функция распределения) имеет следующие свойства.

1. Значения интегральной функции принадлежат отрезку оси ординат (0,1): 0 F(x) 1. График расположен в полосе, ограниченной прямыми y = 0, y = 1.

2. F(x) – неубывающая функция, то есть F(x2) F(x1), если x2 > x1.

3. F(x) 0 при х - и F(x) 1 при х +.

4. Если возможные значения случайной величины принадлежат интервалу (a, b), то F(x) = 0 при x a, F(x) = 1 при x b.

2.3.2. Функция распределения дискретной случайной величины Если X –дискретная случайная величина, принимающая значения x1

Функция распределения дискретной случайной величины на интервале ее существования ( x1…xn ) имеет вид 0, при x < x1, при x1 x < xp1, при x2 x < x p1 + p2, F(x) =..., при xi x < xi+p1 + p2 +... + pi,..., 1, при x xn.



Каф. ЭСВТ ЭЛТИ У дискретной случайной величины функция распределения ступенчатая. Например, для случайного числа очков, выпадающих при бросании игральной кости, распределение, функция распределения и график функции распределения имеют вид xi 1 2 3 4 5 pi 1/6 1/6 1/6 1/6 1/6 1/Рис.2.2. Три формы представления дискретной случайной величины Показанные три формы описания случайных величин – численная (распределение задано таблицей значений), аналитическая и графическая являются универсальными и применимы для любых других видов случайных величин.

2.3.3. Дифференциальная функция распределения случайной величины Наглядное представление о случайной величине дает дифференциальная функция распределения [differential distribution function;

лат.: differentia – разница, различия].

Определение: дифференциальной функцией распределения, плотностью вероятности или плотностью распределения вероятностей f ( x ) называют первую производную от интегральной dF(x) функции распределения F(x): f ( x ) = F ' ( x ).

dx Из приведенного определения следует, что интегральная функция является первообразной для дифференциальной функции. Отсюда, в ча стности, следует, что для любой случайной величины f (x)dx = 1.

- Каф. ЭСВТ ЭЛТИ График дифференциальной функции распределения называют графиком плотности распределения.

Примечание. Знание функции распределения позволяет определить вероятность того, что значение случайной величины X попадает в произвольный интервал (a…b). Эта вероятность вычисляется по формулам:

b P(a < X < b) = f (x)dx = F(b) - F(a) – для непрерывной, a P(a < X < b) = pi = F(b) - F(a) – для дискретной случайных вели i : xi (a,b) чин.

Если a= –, то P(a < X < b) = P(X < b) = F(b), если b=, то P(a < X < b) = P(a < X ) = 1- P(X < a) = 1- F(a).

2.4. Числовые характеристики случайных величин Во многих практических задачах нет необходимости характеризовать случайную величину полностью, исчерпывающим образом, приводя функцию распределения или плотность распределения. Широко используются отдельные числовые параметры, характеризующие важные для решения задач черты случайной величины. Важнейшую роль в вероятностных расчетах имеет математическое ожидание и дисперсия случайной величины.

2.4.1. Математическое ожидание случайной величины Математическое ожидание – число, вокруг которого сосредоточены значения случайной величины. Математическое ожидание иногда называют средним значением случайной величины. Математическое ожидание случайной величины X обозначается M(X).

Математическое ожидание дискретной случайной величины X с коX1 … xi … xn нечным числом значений и распределением есть P1 … pi … pn x1 p1 +... + xi pi +... + xn pn n величина M (X ) = = pi.

xi p1 +... + pi +... + pn i =Если число значений случайной величины счетно, то M (X ) = xi pi. При этом, если ряд в правой части равенства расходит i = Каф. ЭСВТ ЭЛТИ ся, то говорят, что случайная величина X не имеет математического ожидания.

Математическое ожидание непрерывной случайной величины с плотностью вероятностей f (x) вычисляется по формуле M (X ) = xf (x)dx. При известных пределах xa, xb интервала значений X нижний и верхний пределы интеграла можно заменить соответственно xb на xa и xb: M (X ) = xf (x)dx.

xa Обратим внимание, что здесь аналогом pi из формулы M(X) для дискретных величин является f (x)dx.

Если интеграл расходится, то случайная величина X не имеет математического ожидания.

По экспериментальным (статистическим) данным математическое ожидание для случайных величин обеих типов определяется по формуn *(X ле M ) = xi, где n – количество опытов, xi – значение случайной n i = величины X в i-м опыте.

k Если в эксперименте значения xi появляются mi раз, то n = mi и i = k *(X mi xi тогда M ) =, где k – число отображаемых интервалов (или n i = mi разрядов) на диапазоне наблюденных значений X; – относительная n частота i-го интервала X, i = 1,k.

Основные свойства математического ожидания:

• математическое ожидание константы равно этой константе, M(c)= c;

• для любых двух случайных величин X, Y и произвольных постоянных a и b справедливо: M(aX + bY ) = a M(X )+ b M(Y );

• математическое ожидание произведения двух независимых случайных величин равно произведению их математических ожиданий, т.е.

M(X Y ) = M(X )M(Y ).

Каф. ЭСВТ ЭЛТИ 2.4.2. Дисперсия случайной величины Дисперсия случайной величины характеризует меру разброса случайной величины около ее математического ожидания.

Если случайная величина X имеет математическое ожидание M(X), то дисперсией случайной величины X называется величина D(X) = M{[X – M(X)]2}. Другими словами, дисперсия характеризует математическое ожидание квадрата отклонений X от математического ожидания M(X).

Определяют дисперсию по следующим формулам:

n D(X ) = pi[xi - M (X )]2 – для дискретной случайной величины, i = xb D(X ) = [x - M (X )]2 f (x)dx – для непрерывной случайной величины.

xa По экспериментальным (статистическим) данным дисперсию для случайных величин обеих типов определяется по формуле n *(X D*(X ) = [xi - M )]2, n i = где n – количество опытов, xi – значение случайной величины X в i-м опыте.

Для определения меры разброса значений случайной величины часто используется среднеквадратичное отклонение (X ) = D(X ).





Основные свойства дисперсии:

• дисперсия любой случайной величины неотрицательна, D(X) 0;

• дисперсия константы равна нулю, D(c) = 0;

• для произвольной константы D(cX ) = c2D(X);

• дисперсия суммы двух независимых случайных величин равна сумме их дисперсий: D(X + Y ) = D(X) + D(Y).

Эксперимент 2.Задание. Получить два массива первичных значений случайных величин. Удобно использовать в качестве шаблона отчет по предыдущему эксперименту: cделайте копию файла первого эксперимента, назовите, например, «Эксперимент2.2», откройте его и сделайте генерацию массивов случайных чисел с помощью пакета Анализ данных (Приложение 1, Б) с параметрами, заданными преподавателем. На листе с дискретной случайной величиной изучите распределение Пуассона (Приложение 4), а на листе с непрерывной случайной величиной – эксКаф. ЭСВТ ЭЛТИ поненциальное. Если есть проблемы с генерацией средствами Exсel, воспользуетесь программной генерацией (Приложение 1, Б).

После заполнения массивов для каждой случайной величины:

определить её тип;

определить границы интервала (или диапазона) её возможных значений (a, b);

разделить диапазон на 5 – 10 равных частей (разрядов) и для каждого из разрядов рассчитать значения функции распределения F(x) и плотности распределения f(x);

распределение представить в виде таблицы и графиков;

изучить свойства функций распределения;

сопоставить вид полученных кривых с кривыми известных распределений (Приложение 4) и указать близкие по форме;

определить числовые характеристики.

Рекомендации. Для проведения эксперимента использовать программу Excel (пример исследования распределения Пуассона на рисунке ниже). Предварительное планирование эксперимента удобно выполнять на листе бумаги.

Рис.2.3. Пример документирования исследования распределения Пуассона Каф. ЭСВТ ЭЛТИ 2.5. Гистограмма и полигон: графическое представление случайной величины Другой распространенный способ представления случайных величин – построение гистограммы (представление случайных величин в виде статистических рядов рассмотрено разделе 2.2).

В простейшем случае на оси абсцисс откладываются значения интервалов, а частоты в абсолютных единицах измерения изображаются прямоугольниками, построенными на соответствующих интервалах. В результате получается гистограмма – график, на котором ряд распределения представлен в виде смежных друг с другом областей. Интервалы должны иметь одинаковую величину и тогда высота столбиков гистограммы будет пропорциональна абсолютным частотам ряда распределения.

В технических приложениях, например в теории надежности электрических систем, и в тех случаях, если интервалы (разряды) исходных данных не одинаковы, то для построения гистограммы исчисляют плотность статистического распределения. Для этого определяют, сколько значений случайной величины приходится на каждый интервал (или разряд) и в относительных единицах откладывают по оси ординат.

При необходимости гистограмма интервального ряда распределения может быть преобразована в полигон (многоугольник). Для этого нужно середины верхних сторон прямоугольников соединить прямыми линиями.

Эксперимент 2.Задание. Используя массивы первичных значений случайных величин, полученные в предыдущем эксперименте для каждой случайной величины:

построить гистограмму на основе исчисления плотности распределения;

проверить правильность построения гистограммы, определив площадь фигуры под кривой;

используя гистограмму получить график интегральной функции распределения (другими словами – восстановить первообразную).

2.6. Сглаживание статистических рядов и подбор аналитических описаний распределний Экспериментально полученный массив значений случайной величины содержит систематическую составляющую и случайный шум (ошибку). Это затрудняет обнаружение регулярных компонент при анаКаф. ЭСВТ ЭЛТИ лизе или подборе аналитических описаний (формул) законов распределения случайных величин. Для выделения систематической составляющей исходные данные фильтруют, удаляя шум путем сглаживания.

В зависимости от формы разложения ряда на систематическую d и случайную составляющие е различают аддитивную (x = d + е) и мультипликативную (у = de) модели. В систематической компоненте ряда d обычно выделяют две медленных составляющих: тренд tr и периодическую компоненту с. Аддитивную модель ряда можно представить следующим образом:

x = tr + c + e.

Для выделения тренда широко распространен метод наименьших квадратов, для выделения тренда и циклической компоненты – метод скользящей средней и метод взвешенной скользящей средней или экспоненциального сглаживания.

Эксперимент 2.Задание. Для всех статистических рядов исследуемых случайных величин, построенных по выборкам различных объемов, выполнить следующее:

• выравнить ряды методом экспоненциального сглаживания (Приложение 6);

• экспериментально найти оптимальные значения коэффициентов экспоненциального сглаживания;

• к сглаженным рядам подобрать аналитическое описание (формулы) из числа распространенных (Приложение 4); для подгонки описаний исследуемых Вами распределений используйте метод моментов (Приложение 6); покажите, что выбранное описание отличается наибольшей точностью.

Рекомендации. Для наблюдения за результатами выравнивания рядов, эффективностью подбора аналитического описания распределений используйте графическое представление результатов.

Pages:     | 1 || 3 | 4 |   ...   | 7 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.