WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 |   ...   | 4 | 5 || 7 |

b - a b-a b - a x > 1.

1, x x a b a b Рис.П4.4. Графики f(x) и F(x) Экспоненциальное распределение. Плотность распределения f(x) и функция распределения F(x) имеют соответственно вид * e-x,0 1- e-x, x <, x > 0, f (x) = и F(x) = x < 0, 0, 0, x 0, где (лямбда) – параметр экспоненциальной функции равен, e – основание натуральных логарифмов (2.718281828).

Рис.П4.5. Графики экспоненциального распределения ( =1/M(X) = 1/7 = 0.14, объем выборки – 2000 случаев) Математическое ожидание и дисперсия экспоненциального распре1 деления: M (X ) =, D(X ) =.

Экспоненциальное распределение наиболее широко используется в качестве статистической модели для времени безотказной работы. Оно играет основную роль в теории надежности, подобно тому, как нормальное распределение играет основную роль в других областях. Это распределение описывает время до момента появления одного события, Каф. ЭСВТ ЭЛТИ если события появляются независимо друг от друга с постоянной средней интенсивностью.

Наиболее широко экспоненциальное распределение используется как статистическая модель для определения времени безотказной работы отдельных компонентов или системы, когда интенсивность отказов считается постоянной. Следует заметить, что экспоненциальное распределение более приемлемо в качестве статистической модели для определения времени безотказной работы сложной системы, даже если распределение времени безотказной работы отдельных ее компонентов не является экспоненциальным.

Вместе с тем необходимо отметить, что простота теории и связанных с ней вычислений не должна создавать впечатления, будто время безотказной работы любых компонентов имеет экспоненциальное распределение. Такое допущение может быть так же ошибочным, как и допущение об универсальности нормального распределения в задачах, не связанных с испытаниями на долговечность, и даже более ошибочным, поскольку во многих случаях экспоненциальное распределение не обладает такими устойчивыми свойствами, как нормальное распределение.

Справедливость принятого допущения о виде распределения можно оценить на основе критериев согласия Хи2.

Нормальное (гауссовское) распределение. Нормальное распределение (этот термин был впервые использован Гальтоном в 1889 г.) играет исключительно важную роль в теории вероятностей и математической статистике.

Случайная величина X нормально распределена с параметрами M(X) и, >0, если ее плотность распределения f(x ) и функция распределения F(x) имеют соответственно вид [x - M (X )]2 [x - M (X )]- x 2 1 2 f (x) = e, F(x) = e dx, 2 - где e – число Эйлера (2.71828...), – число Пи (3.14159...) Часто используемая запись X ~ N(M(X), ) означает, что случайная величина X имеет нормальное распределение с параметрами M(X) и.

Говорят, что случайная величина X имеет стандартное нормальное распределение, если M(X) = 0 и = 1 (X ~ N(0, 1)).

Если X ~ N(M(X), ), то случайную величину = (x – M(X))/ называют стандартизованной или нормированной случайной величиной;

~ N(0, 1) – имеет стандартное нормальное распределение.

Каф. ЭСВТ ЭЛТИ Рис.П4.6. Графики нормального распределения (M(X) =7, объем выборки – 2000 случаев, заметен шум на графике плотности) Дисперсия нормального распределения равняется квадрату стандартного (или среднеквадратичного) отклонения X: D(X) = 2.

Приложение Числовые характеристики случайных величин Математическое ожидание. Математическое ожидание (или среднее, центральный момент) показывает "центральное положение" (центр) переменной и для лучшего описания случайной величины рассматривается, как правило, совместно с доверительным интервалом.

Обычно интерес представляют статистики (например, среднее), дающие информацию об объекте в целом. Чем больше размер выборки, тем более надежна оценка среднего. Чем больше изменчивость данных (больше разброс), тем оценка менее надежна.

Математическое ожидание: M(X) = (xi)/n, где n – число наблюдений (объем выборки).

Дисперсия. Дисперсия (термин впервые введен Фишером, 1918) вычисляется по формуле:

2 = (xi-µ)2/n, где M(X) – среднее, n – объем выборки или количество опытов.

Стандартное отклонение или среднеквадратическая ошибка.

Стандартное отклонение (термин был впервые введен Пирсоном, 1894) – это широко используемая мера разброса или вариабельности (изменчивости) данных. Стандартное отклонение показателя статистического объекта определяется формулой:

= [ (xi- M(X))2/n]1/2, где M(X) – среднее, n – объем выборки или количество опытов.

Каф. ЭСВТ ЭЛТИ Стандартная ошибка. Термин стандартная ошибка среднего был впервые введен Юлом (Yule, 1897). Эта величина характеризует стандартное отклонение выборочного среднего, рассчитанное по выборке размера n из генеральной совокупности, и зависит от дисперсии генеральной совокупности (сигма) и объема выборки (n):

= (2/n)1/2, x где 2 – дисперсия генеральной совокупности, n – число наблюдений в выборке.

Медиана. Медиана выборки (термин был впервые введен Гальтоном в 1882 г.) – это значение, которое разбивает выборку на две равные части. Половина наблюдений лежит ниже медианы и половина наблюдений лежит выше медианы. Медиана вычисляется следующим образом. Изучаемая выборка упорядочивается в порядке возрастания. Получаемая последовательность xk, где k=1,..., 2*m+1 называется вариационным рядом или порядковыми статистиками. Если число наблюдений нечетно, то медиана оценивается как: m = xm+1. Если число наблюдений четно, то xm + xm+медиана оценивается как m =.

Мода. Мода выборки (термин был впервые введен Пирсоном, 1894) – это значение, наиболее часто встречающееся в выборке.



Нормальная функция Лапласа или интеграл вероятностей Для определения вероятности попадания случайной величины X, подчиненной нормальному закону (Приложение 4,Б) с параметрами т (математическое ожидание) и (среднеквадратичное отклонение), на участок от до используется общая формула: P( < X <) = F() – F(), где F (х) – функция распределения величины X.

(x - m)Плотность распределения величины Х равна f (x) = e, (x - m)x x функция распределения F(x) = f (x)dx = e dx.

- - t t x - m Если в интеграле заменить на t, то F(x) = e dt.

- Каф. ЭСВТ ЭЛТИ Этот интеграл не выражается через элементарные функции и его вычисляют через специальную функцию, называемую нормальной функt t цией Лапласа или интегралом вероятностей: Ф(t) = e dt. Для - распределения X с параметрами m = 0 и = 1 составлены таблицы. При этих параметрах t = x и F(x) = Ф(x), а вычисление вероятности попадания на участок от до по классической формуле заменяется формулой с нормальной функцией Лапласа:

- m - m P( < X <) =Ф - Ф = Ф( )- Ф().

- m Аргументы функции Ф имеют простой смысл: есть расстояние от правого конца участка до центра рассеивания m, выраженное в - m среднеквадратических отклонениях ; – расстояние для левого конца участка. Расстояние считается положительным, если конец расположен справа от центра рассеивания, и отрицательным, если слева.

Из симметричности нормального распределения с параметрами т = 0, = 1 относительно начала координат следует, что Ф (– х) = 1 – Ф (х).

При составлении таблиц Ф(x) использовано это свойство и числовые значения функции Ф* (х) ограничены только положительными значениями аргумента.

Таблица П5.Нормированная функция Лапласа Сотые доли для x x 0 1 2 3 4 5 6 7 8 0,0 0,0000 040 080 0,0120 160 199 239 279 319 0,0,1 0,0398 438 478 517 0,0557 596 636 675 714 0,0,2 0,0793 832 871 910 0,0948 0,0987 0,1026 0,1064 0,1103 0,0,3 0,1179 0,1217 255 293 331 368 406 443 480 0,0,4 0,1554 591 628 664 700 736 772 808 844 0,0,5 0,1915 950 0,1985 019 0,2054 088 123 157 190 0,0,6 0,2257 291 324 357 389 422 454 486 517 0,0,7 0,2580 611 642 673 703 734 764 794 823 0,0,8 0,2881 910 939 967 0,2995 0,3023 0,3051 0,3078 0,3106 0,0,9 0,3159 186 212 238 264 289 315 340 365 0,1,0 0,3413 437 461 485 508 583 554 577 599 0,1,1 0,3643 665 686 708 729 749 770 790 810 0,1,2 0,3849 869 888 907 925 944 962 0,3980 0,3997 0,Каф. ЭСВТ ЭЛТИ 1,3 0,4032 0,4049 0,4066 0,4082 099 115 131 147 162 1.4 192 207 222 0,4236 251 265 279 292 306 1,5 332 345 357 370 0,4382 394 406 418 429 1,6 452 463 474 484 495 0,4505 515 525 535 1,7 554 564 573 582 591 599 0,4608 616 625 1.8 641 649 656 664 671 678 686 0,4693 699 1,9 713 719 726 732 738 744 750 756 0,4761 2.0 772 778 783 788 793 798 803 808 812 0,2,1 0,4821 826 830 834 838 842 846 850 854 2,2 860 0,4864 867 871 874 877 880 883 886 2,3 892 895 0,4898 900 903 906 908 911 913 2,4 918 920 922 0,4924 926 928 930 932 934 2,5 937 939 941 942 0,4944 946 947 949 950 2,6 0,4953 954 956 957 958 0,4959 960 962 963 2,7 965 966 967 968 969 970 0,4971 971 972 Окончание табл. П5.Сотые доли для x x 0 1 2 3 4 5 6 7 8 2,8 0,4974 975 975 976 977 978 979 0,4979 980 2,9 981 981 982 983 983 984 984 985 0,4985 3,0 0,4986 986 987 987 988 988 988 989 989 0,3,1 0,4990 990 990 991 991 0,4991 992 992 992 3,2 993 993 993 993 994 994 0,4994 994 994 3,3 995 995 995 995 995 996 996 0,4996 996 3,4 966 996 996 996 997 997 997 997 0,4997 3,5 997 997 997 997 997 998 998 998 998 0,3,6 0,4998 998 998 998 998 998 998 998 998 3,7 998 0,4998 999 999 999 999 999 999 999 3,8 999 999 0,4999 999 999 999 999 999 999 3,9 999 999 999 0,4999 999 999 999.999 999 4,0 999 999 999 999 0,4999 999 999 999 999 4,1 999 999 999 999 999 0,4999 999 999 999 4,2 999 999 999 999 999 999 0,4999 999 999 4,3 999 999 999 999 999 999 999 0,4999 999 4,4 0,4999 999 999 999 999 999 999 999 0,4999 4,5 999 999 999 999 999 999 999 999 999 0,5,0 0,Примечание. В таблице заданы лишь три последних десятичных знака из четырех; первый из них записан в графе «0» данной строки или выше данной. Если перед последними тремя десятичными знаками стоит точка, то это означает, что первый десятичный знак надо смотреть в Каф. ЭСВТ ЭЛТИ графе «0» следующей строки. Например, для x = 0,53 имеем Ф (0,53) = 0,2019 (а не 0,1019).

Приложение Выравнивание статистических рядов и подбор аналитических описаний распределений А. Методы сглаживания Метод простой скользящей средней. Сглаживание представляет собой способ локального усреднения данных, при котором несистематические компоненты взаимно погашают друг друга. Метод скользящей средней основан на замене текущих «мгновенных» значений случайной величины средними, определяемыми по небольшому количеству смежных значений. При этом выбранный интервал осреднения («окно») скользит вдоль оси i. Получаемые таким образом значения X ведут себя более гладко, чем исходные.

Определение. Пусть имеются дискретные наблюдения x1, x2, …, xi, …, xn, где i – порядковый номер местоположения значения xi в наборе данных; n – объем выборки. Пусть длина окна сглаживания выражается нечетным числом р = 2m + 1.

Тогда метод скользящей средней состоит в том, что исходный эмпирический ряд x1, …, xn преобразуется в ряд сглаженных значений по формуле i + m xi = x, j p j = i - m где p – размер окна; j – порядковый номер уровня в окне сглаживания;

m – величина, определяемая по формуле m = (p – 1)/2.

Определение скользящей средней по четному числу членов ряда (р = 2m) несколько сложнее, поскольку вычисленное по аналогичной формуле усредненное значение нельзя сопоставить какому-либо определенному моменту i, так как средняя может быть отнесена только к середине между двумя моментами, находящимися в середине окна сглаживания.





Для определения сглаженного значения при р = 2m применяется метод центрирования, который заключается в нахождении средней из двух смежных скользящих средних для отнесения полученного уровня к определенному значению xi.

Выбор размера окна сглаживания должен осуществляться исходя из характера решаемой задачи. Для сглаживания чаще всего размер окна выбирают равным трем, пяти и семи. Чем больше размер окна, тем более гладкий вид имеет график скользящих средних. Рассмотренный меКаф. ЭСВТ ЭЛТИ тод приемлем, если графическое изображение временного ряда напоминает прямую линию. В этом случае не искажается динамика исследуемого явления.

Если тренд выравниваемого ряда имеет явно нелинейный характер и желательно сохранить мелкие волны, то использовать для сглаживания ряда этот метод нецелесообразно, так как простая скользящая средняя может привести к значительным искажениям исследуемого процесса. Более надежным является метод взвешенной скользящей средней.

Метод взвешенной скользящей средней. При определении взвешенной средней участвуют все наблюдения исходного ряда, но с разными весовыми коэффициентами (в методе простой скользящей средней все наблюдения имеют вес, равный 1/р). Взвешенная средняя обладает большей устойчивостью.

Для этого метода сглаживания более старым наблюдениям приписываются экспоненциально убывающие вес (отсюда метод называют также «экспоненциального» сглаживания). В отличие от скользящего среднего учитываются все предшествующие наблюдения ряда, а не те, что попали в определенное окно. Формула метода простого экспоненциального сглаживания имеет следующий вид:

xi = (1-)xi -1 +xi, где 0 < < 1 – коэффициент экспоненциального сглаживания.

При рекуррентном применении формулы каждое новое теоретическое сглаженное значение вычисляется как взвешенное среднее текущего наблюдения и теоретического сглаженного значения предыдущих значений.

Результат сглаживания зависит от параметра. Чем больше, тем сильнее сказывается текущее значение и при = 1 среднее предыдущего периода игнорируется. Чем меньше, тем сильнее сказываются предыдущие значения, а при = 0 результат будет представлять среднее по всему массиву данных от x1 до xi. Значение необходимо выбирать из соображений получения приемлемой фильтрации «быстрых» колебаний случайной величины.

Б. Методы подбора формул Полиномиальная подгонка. При выборе такого варианта аппроксимации к данным подгоняется полиномиальная функция следующего вида:

y = b0 + b1x + b2x2 + b3x3 +... + bnxn, где n есть степень полинома.

Каф. ЭСВТ ЭЛТИ Линейная подгонка. К точкам диаграммы рассеяния подгоняется линейная функция y = b0 + b1x.

Квадратичная подгонка. К точкам диаграммы рассеяния подгоняется полином второй степени y = b0 + b1x + b2x2.

Метод моментов. С помощью этого метода можно оценить неизвестные параметры распределения. Метод моментов приравнивает моменты теоретического распределения к моментам эмпирического распределения (распределения, построенного по наблюдениям) и получают оценки параметров распределения.

Например, для распределения с двумя параметрами первые два момента (среднее и дисперсия распределения) будут приравнены первым двум эмпирическим (выборочным) моментам (среднему и дисперсии выборки) и затем будет произведено оценивание качества описания эмпирического распределения.

Нормальная подгонка. Нормальные/наблюдаемые гистограммы являются наиболее распространенным графическим способом проверки нормальности. При этой подгонке на распределение частот накладывается кривая нормального распределения.

Нормальная функция подгонки к гистограмме определяется так: f(x) = N * step * normal(x, среднее, ст.откл.).

Нормальная функция подгонки к гистограмме с накопленными частотами определяется так:

f(x) = N * inormal(x, среднее, ст.откл.), где N – число наблюдений, step – размер шага категоризации или разряд (например, 1), normal – нормальная функция, inormal – интеграл нормальной функции.

В. Оценка качества подбора Минимаксный метод. Смысл в оценивании наибольших и наименьших отклонений функции на всем исследуемом диапазоне X и минимизации таких отклонений.

Метод наименьших квадратов. Общий смысл оценивания по методу наименьших квадратов заключается в определении и минимизации суммы квадратов отклонений наблюдаемых значений зависимой переменной от значений, предсказанных моделью.

Чрезмерно близкая подгонка. При восстановлении функции по набору ее значений – построение кривой с большой кривизной, которая хорошо удовлетворяет заданным значениям, но плохо моделирует исКаф. ЭСВТ ЭЛТИ ходное отображение, поскольку форма кривой искажена помехами, присутствующими в данных.

Г. Методы восстановления значений функции Интерполяция. Восстановление значения функции в промежуточной точке по известным ее значениям в соседних точках.

Экстраполяция. Прогнозирование неизвестных значений путем продолжения функций за границы области известных значений.

Приложение Базовые математические понятия Декартовы координаты. Декартовы (или прямоугольные) координаты (x, y или x, y, z) представляют собой направленные расстояния от двух (или трех) перпендикулярных осей.

Положение точки в пространстве определяется соотZ Y ветствующими координатами X на осях X и Y (или X, Y и Z).

Pages:     | 1 |   ...   | 4 | 5 || 7 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.