WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 || 3 | 4 |   ...   | 9 |

n n (x - m )3 pi (xi - x)3 ni 3 i=1 i x 3 i=A = = Aв = = 3 3 3 nдля дискретной величины + n (x - m ) f (x)dx (xi - x) x 3 i=3 A = = Aв = = 3 3 nдля непрерывной величины А = 0 – распределение случайной величины симметрично, А < 0 и А > 0 – распределение асимметрично – соответственно левая и правая асимметрия. Коэффициент асимметрии безразмерен. На практике принято асимметрию при значении A 0,25считать малой, 0,25 < A 0,5 – умеренной, A > 0,5 – большой, A > 1,– исключительно большой.

n n 4 (x - m ) p (x - x) n i x i i i 4 i=1 4 i=E = - 3 = - E = - 3 = - x 4 4 x 4 n для дискретной величины + n (x - x) (x - m ) f (x)dx i x 4 i=4 E = - 3 = - E = - 3 = - 3 x 4 x 4 n для непрерывной величины Именно число 3 вычитается потому, что для весьма распростра ненного нормального закона распределения отношение =.

Следовательно, для нормального распределения E = ; для боx лее островершинного распределения по сравнению с нормальным E > ; для более плосковершинного распределения по x сравнению с нормальным.

E < x Отклонение от нормального распределения может приобретать не только асимметричную форму. Имеются распределения, у которых в силу воздействия тех или иных факторов сохраняется симметричность ряда и его кривой распределения, но наблюдается нехарактерное для нормального распределения скопление частот в центре ранжированного ряда. Это скопление образует высокую пикообразную кривую, ветви которой круто опускаются по осям ординат к оси абсцисс и затем резко переходят в «шлейфы» по обеим сторонам. Такой тип кривой называют эксцессивным ( ). Для кривых с существенно положительным эксцесEx > x xmax сом характерно, что крайние значения и не доходят до min границ X ± 3. При кривая распределения может иметь E < x провал, что соответствует генетической неоднородности ряда случайных величин. Оценки эксцесса колеблются в [- 2,[. Если Ex = -2 – кривая распределения распадается на две отдельные, при - 0,5 < Ex < 3 считают, что распределение приближается к нормальному.

Центральные моменты выше четвертого порядка на практике используются очень редко из-за быстрого накопления ошибок округления при расчетах.

Коэффициент корреляции между двумя случайными величинами Х и У характеризует степень тесноты линейной зависимости.

n n (x - mx )(y - my)pij i j n n i=1 j=rxy = (x - x)(y - y)nij i j xy i=1 j=rxy = nxy для дискретной величины + + n n (x - x)(y - y) i j (x - mx )(y - my)f (x, y)dxdy i=1 j=- rxy = rxy = nxy xy n для непрерывной величины (x - x)(yi - y) i i=rxy = при i=j.

nxy – вероятность совместной реализации значений x и y, p ij i j f (x, y) – двумерная функция плотности вероятности.

rxy – безразмерная величина, -1 rxy +1.

Если rxy = 0, то между случайными величинами нет линейной связи; связь нелинейная может иметь место, и ее надо находить другими методами (в этом случае говорят, что величины некоррелируемы, но могут быть зависимыми).

Если rxy > 0, то говорят о положительной корреляции, т. е. с увеличением одной случайной величины другая имеет тенденцию возрастать.

Если rxy < 0, то говорят об отрицательной корреляции, т. е. с увеличением одной случайной величины другая имеет тенденцию убывать.

Среди часто используемых характеристик случайной величины следует также дополнительно отметить:

из характеристик положения:

моду (Мо) – наиболее вероятное значение случайной величины, медиану (Ме) – значение случайной величины, приходящееся на середину упорядоченного ряда, q-квантиль q = P(X < xq)= F(xq)= q.

Очевидно, что медиана является частным случаем 50 % квантили, так как P(X < x0,5)= P(X < x50% ) = F(x0,5)= 0,5 = 50% или P(X < Me) = P(X > Me) = 0,5.

Если значения среднего значения случайной величины, ее моды и медианы совпадают, то говорят, что распределение этой величины симметрично. При левой асимметрии X < Me < Mo, при правой – X > Me > Mo.

Естественно, что все характеристики положения имеют размерность самой случайной величины.

Из характеристик разброса:

размах R = xmax - xmin, n X - X i-среднее абсолютное отклонение d =, n x x = 100% коэффициент вариации, или, ис = 100 % mx X пользуемый для оценки однородности (неритмичности) рядов. На практике при коэффициенте вариации более 33 % необходимо тщательно проанализировать рассматриваемый ряд случайных величин, чтобы выяснить причину его неоднородности. Такие причины могут быть обусловлены грубыми ошибками наблюдателя или оператора, антропогенным вмешательством человека, климатическими изменениями и пр. Ошибки необходимо устранить, либо разбить ряд на однородные части.

1.2. Введение в теорию ошибок Теория ошибок – изучение и оценка погрешностей в измерениях. Опыт показывает, что ни одно измерение, как бы тщательно оно ни проводилось, не может быть совершенно свободно от ошибок. Поскольку в основе любой науки и ее применений заложены измерения, исключительно важно рассчитывать эти ошибки и сводить их к минимуму.

В науке слово «ошибка» не имеет обычного бытового значения чего-то неправильного. «Ошибка» в научном измерении означает неизбежную погрешность, которая сопутствует всем измерениям. Ошибки, как таковые, часто нельзя отнести к промахам экспериментатора, он не сможет их избежать, стараясь быть очень внимательным. Лучшее, на что можно рассчитывать, – это свести ошибки к возможному минимуму и надежно рассчитать их величины. Часто слово «ошибка» заменяют словом «погрешность».

Экспериментальные погрешности, которые можно обнаружить с помощью многократных измерений, называются случайными ошибками, а те, которые нельзя обнаружить таким способом, называются систематическими ошибками.

Чтобы проиллюстрировать различия между этими видами ошибок, рассмотрим несколько примеров. Предположим, что мы измеряем время оборота равномерно вращающегося диска. Одним из источников ошибок будет время нашей собственной реакции при запуске и остановке секундомера. Если бы это время реакции было всегда точно одним и тем же, то два запаздывания, обусловленные реакцией экспериментатора, компенсировали бы фактически друг друга. Однако время нашей реакции изменяется: мы можем больше промедлить при запуске и недооценить время оборота, или больше задержаться при остановке секундомера и переоценить время. Так как обе возможности равновероятны, то знак эффекта случаен. При многократном повторении измерения мы иногда будем переоценивать время полного оборота диска, а иногда – недооценивать. Таким образом, переменное время нашей реакции проявится в различии полученных результатов. Анализируя разброс в результатах методами статистики, мы можем получить очень достоверную оценку ошибки этого (случайного) типа.

С другой стороны, если наш секундомер постоянно отстает, то все измеренные значения времени будут недооценены и никакое количество повторений измерений (с тем же секундомером) не обнаружит этого источника ошибок. Ошибка такого типа называется систематической, поскольку она всегда систематически смещает наш результат в одну и ту же сторону. Систематические ошибки нельзя обнаружить статистическими методами.

В качестве второго примера проявления случайных и систематических ошибок рассмотрим измерение точно определенной длины с помощью рулетки. Один из источников погрешности – это необходимость в интерполяции между делениями шкалы, и эта погрешность, очевидно, случайна (при интерполяции мы с равной вероятностью как переоцениваем, так и недооцениваем результат).

Но имеется также вероятность того, что наша рулетка дефектна, а это уже будет приводить к систематической ошибке.

Подобно этим двум примерам почти все измерения подвержены как случайным, так и систематическим погрешностям. Необходимо обратить внимание на то, что типичные источники случайных погрешностей – это небольшие ошибки наблюдателей (как например, в случае с интерполяцией); небольшие помехи, воздействующие на аппаратуру (подобные механическим вибрациям) и др. Наиболее очевидная причина систематических ошибок – это раскалибровка измерительных приборов (отстающий секундомер, вытянутая линейка, неустановленная точно на нуле стрелка прибора и др.).

Различия между случайными и систематическими ошибками не всегда можно ясно определить. Например, при изменении положения головы наблюдателя по отношению к типичному стрелочному прибору результаты считывания могут изменяться. Этот эффект называется параллаксом, и он приводит к тому, что правильное считывание со шкалы возможно только в случае, когда взгляд наблюдателя направлен точно по перпендикуляру к стрелке. Однако даже очень аккуратному наблюдателю не всегда удается правильно направить свой взгляд на стрелку, а потому измерения будут содержать малые погрешности, связанные с параллаксом, и эти погрешности будут, вероятно, случайными. С другой стороны, неосторожный экспериментатор, который поставит стрелочный прибор сбоку от себя и забудет о влиянии параллакса, внесет систематическую ошибку во все свои измерения. Таким образом, один и тот же эффект параллакса может привести и к случайным, и к систематическим погрешностям.

Учет случайных ошибок совершенно отличен от учета систематических. Статистические методы дают достоверную оценку случайных погрешностей и, как мы увидим ниже, указывают на точно определенный способ их уменьшения. Систематические ошибки бывает трудно оценить и даже обнаружить. Опытный наблюдатель должен уметь предвидеть возможные источники систематических ошибок и позаботиться о том, чтобы все систематические ошибки были меньше требуемой точности наблюдения. Для этого потребуется, например, проверка используемых приборов по принятым стандартам, или даже, если необходимо, приобретение более совершенных приборов.

Если мы производим n измерений некоторой величины X (используя одну и ту же аппаратуру и метод измерения) и получаем n значений: x1,x2,...,xn, то наилучшей оценкой величины X будет ее среднее значение:

n xi i=Xнаил = X =.

n Если принять, что X – это наилучшая оценка величины X, то естественно рассмотреть разность xi - X = di. Эта разность, называемая отклонением (или остатком) xi от X, показывает, насколько результат i-го измерения отличается от своего среднего значения. Если все di малы, то наши измерения сделаны сравнительно точно, в противном случае – результаты грубы.

Часто вместо di находят среднее квадратическое отклонение:

n (xi - X) i= =.

n 1.2.1. Особенности обработки ограниченного числа наблюдений. Оценки для неизвестных параметров закона распределения На практике часто приходится иметь дело со статистическим материалом весьма ограниченного объема, на основе которого необходимо (хотя бы ориентировочно) определить важнейшие числовые характеристики случайной величины. Если вид закона распределения случайной величины известен заранее, то требуется оценить только некоторые параметры, от которых он зависит (например, для нормального закона распределения – это математическое ожидание и среднее квадратическое отклонение, для закона Пуассона – только математическое ожидание). Наконец, в некоторых задачах вид закона распределения вообще несущественен, а требуется знание только числовых характеристик.

Рассмотрим ряд задач об определении неизвестных параметров, от которых зависит закон распределения случайной величины, по ограниченному числу опытов.

Прежде всего, надо отметить, что любое значение искомого параметра, вычисленное на основе ограниченного числа опытов, всегда будет содержать элемент случайности. Такое приближенное случайное значение мы будем называть оценкой параметра. Например, оценкой для математического ожидания может служить среднее арифметическое наблюдаемых значений случайной величины в n независимых опытах. При очень большом числе опытов среднее арифметическое будет с большой вероятностью весьма близко к математическому ожиданию. Если же число опытов n невелико, то замена математического ожидания средним арифметическим приводит к какой-то ошибке. Эта ошибка в среднем тем больше, чем меньше число опытов. Также будет обстоять дело и с оценками других неизвестных параметров генеральной совокупности. Любая из таких оценок случайна; при пользовании ею неизбежны ошибки. Желательно выбрать такую оценку, чтобы эти ошибки были по возможности минимальны.

Рассмотрим следующую общую задачу. Имеется случайная величина X, закон распределения которой содержит неизвестный параметр а. Требуется найти подходящую оценку для параметра а по результатам n независимых опытов, в каждом из которых величина X приняла определенные значения: x1, x,..., x.

2 n ~ Обозначим через a оценку параметра а, которая естественно есть функция xi i = 1,2,...,n ~ ~ a = a(x1,x2,..., xn ) и, следовательно, сама является случайной величиной. Закон рас~ пределения a зависит, во-первых, от закона распределения величины X (в частности, от самого неизвестного параметра а) и, во~ вторых, от числа опытов n. Предъявим к оценке a ряд требований, которым она должна удовлетворять, чтобы быть в каком-то смысле «доброкачественной» оценкой.

~ Естественно потребовать от оценки a, чтобы при увеличении числа опытов N она приближалась (сходилась по вероятности) к параметру а. Оценка, обладающая таким свойством, называется состоятельной.

~ Желательно, чтобы, пользуясь величиной a, мы, по крайней мере, не делали систематической ошибки в сторону завышения или занижения, т. е. чтобы выполнялось условие:

M(~)= a.

a Оценка, удовлетворяющая такому условию, называется несмещенной.

Наконец, желательно, чтобы выбранная несмещенная оценка обладала (по сравнению с другими) наименьшей дисперсией, т. е.

D(~)= min. Оценка, обладающая таким свойством, называется эфa фективной.

На практике не всегда удается удовлетворить всем этим трем требованиям. Например, может оказаться, что даже если эффективная оценка существует, формулы для ее вычисления оказываются слишком сложными и приходится удовлетворяться другой оценкой, дисперсия которой несколько больше. Иногда применяются, в интересах простоты расчетов, незначительно смещенные оценки. Однако выбору оценки всегда должен предшествовать ее критическое рассмотрение со всех перечисленных выше точек зрения.

1.2.2. Оценки для неизвестных параметров генеральной совокупности: математического ожидания и дисперсии Пусть в результате наблюдений случайная величина Х приняла какие-то значения x1, x2,..., xn. Математическое ожидание и дисперсия генеральной совокупности этой случайной величины неизвестны. Требуется найти для них «доброкачественную оценку».

В качестве оценки для математического ожидания естественно принять среднее арифметическое выборки:

n xi i=~ m = X =.

x n Согласно Закону больших чисел эта оценка является состоя~ тельной, так как при увеличении опытов n величина m сходится по вероятности к m.

~ Оценка mx является и несмещенной, так как n xi n n 1 1 ~ M(mx ) = M(X)= M i=1 = M xi = M(X) = nmx = mx.

n n n n i=1 i= Здесь и в дальнейшем используется условие, что операции суммирования и математического ожидания перестановочны.

n xi 1 Dx ~ Дисперсия оценки D(mx ) = D i=1 = nDx =.

n n n Эффективность или неэффективность оценки зависит от вида закона распределения случайной величины Х. Можно доказать, что если Х распределена по нормальному закону, то дисперсия бу~ дет минимально возможной, т. е. оценка mx является эффективной. Для других законов распределения это может быть и не так.

Dx Перейдем теперь к оценке для неизвестной дисперсии генеральной совокупности. Наиболее естественной оценкой предDв ставляется дисперсия выборки.

n (xi - X) ~ i=Dx = Dв =.

n Проверим, является ли эта оценка состоятельной. Для этого ~ выразим оценку через начальные оценочные моменты k (где целочисленный индекс к определяет порядок момента):

~ ~ ~ D = Dв = 2 - 1.

Из Закона больших чисел при n оценочные моменты выборки сходятся по вероятности к соответствующим начальным моментам генеральной совокупности, т. е. с вероятностью P ~ ~ ~ 1 1, 2 2, а потому DxDx, и мы можем утверждать, что оценка состоятельна.

~ ~ Проверим, является ли оценка D несмещенной: M(D)= D.

Найдем сначала n n n n n i j x2 x x2 x2 x x i i i i ~ i< j ~ ~ i=1 i=1 i=1 i= D = 2 - 1 = - = - - 2 = n n n n2 n n x x i j n n -= x2 2 i< j.

i n2 ni=Теперь найдем n n n n -n ~ -1 2 n M(D)= M - M ix = (xi )- (xix ).

x2 x n2 M 2 M i j j n2 n2 n i=1 i< j i=1 i< j Так как дисперсия не зависит от выбора начала координат, то ~ выберем его в точке X = mx. Так как опыты независимы, то 0 0 0 M(xix )= MXi MX j = Kij = 0 MXi и MX, где j j – математические ожидания центрированных величин, Kij – второй центральный смешанный корреляционный момент.

Pages:     | 1 || 3 | 4 |   ...   | 9 |






















© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.