WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     || 2 | 3 | 4 | 5 |   ...   | 9 |
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ГОУ ВПО «ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ» А. А. Аргучинцева МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ И АНАЛИЗА ГИДРОМЕТЕОРОЛОГИЧЕСКИХ НАБЛЮДЕНИЙ Учебное пособие Иркутск 2007 1 УДК 551.46+551.501 ББК 26.23 А 79 Печатается по решению редакционно-издательского совета Иркутского государственного университета Рецензенты: П. Г. Ковадло, ст. науч. сотр. института солнечно-земной физики, д-р физ.-мат. наук; А. А. Кречетов, доц. кафедры метеорологии и охраны атмосферы Иркутского госунивер ситета, канд. геогр. наук Аргучинцева А. В.

Методы статистической обработки и анализа гидрометеоролоА 79 гических наблюдений : учеб. пособие / А. В. Аргучинцева. – Иркутск : Иркут. гос. ун-т, 2007. – 105 с.

Излагаются основные теоретические знания методов обработки и анализа гидрометеорологической информации, базирующиеся на положениях теории вероятностей, математической статистики и теории случайных процессов. Приводятся примеры конкретных расчетов, проводимых с помощью методов полиномиальной и оптимальной интерполяции, четырехмерного численного анализа и методов контроля исходной информации.

Пособие предназначено для студентов очного и заочного отделений специальностей «Гидрология» и «Метеорология», а также направления «Гидрометеорология».

Библиогр. 43 назв. Ил. 2. Табл. 1.

ISBN 978-5-9624-0165-2 Пособие подготовлено при поддержке ведомственной целевой программы «Развитие научного потенциала высшей школы (2006–2008) проект РНП.

2.2.1.1.7334 «Научно-образовательный центр Байкал».

УДК 551.46+551.501 ББК 26.23 ISBN 978-5-9624-0165-2 © Аргучинцева А. В., 2007 © ГОУ ВПО «Иркутский государственный университет», 2007 2 ОГЛАВЛЕНИЕ ВВЕДЕНИЕ 5 1. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 6 1.1. Основные понятия 6 1.2. Введение в теорию ошибок 18 1.2.1. Особенности обработки ограниченного числа наблюдений. Оценки для неизвестных параметров закона распределения 1.2.2. Оценки для неизвестных параметров генеральной совокупности: математического ожидания и дисперсии 1.3 Множественное линейное уравнение регрессии. Множественный коэффициент корреляции 1.4 Метод наименьших квадратов 1.4.1. Линейная связь между двумя случайными величинами 1.4.2 Построение нелинейных уравнений множественной регрессии 2. СЛУЧАЙНЫЕ ФУНКЦИИ 2.1. Основные понятия 2.2. Основные характеристики случайной функции 2.3. Система случайных функций 2.4. Суммирование случайных функций 2.5. Стационарные случайные функции 2.5.1. Система стационарных случайных функций 2.6. Положительно определенные функции 2.7. Свойство эргодичности случайных процессов 2.8. Структурная функция 2.9. Случайные поля 2.9.1. Основные понятия 2.9.2. Однородные и изотропные случайные поля и их характеристики 2.10. Экстраполяция, интерполяция и сглаживание случайных функций 2.11. Влияние ошибок измерения на статистические характеристики корреляционного анализа 3. ЧИСЛЕННЫЙ АНАЛИЗ ГИДРОМЕТЕОРОЛОГИЧЕСКОЙ ИНФОРМАЦИИ 3.1. Метод полиномиальной интерполяции 3.2. Метод оптимальной интерполяции 3.3. Четырехмерный численный анализ 3.4. Метод контроля исходной информации ВВЕДЕНИЕ В настоящее время остро ощущается недостаток учебной литературы, в которой методически и в разумных пределах строгости были бы освещены необходимые разделы для освоения грамотной статистической обработки и анализа гидрометеорологических наблюдений. Дисциплина относится к основополагающим курсам в системе подготовки высококвалифицированных специалистов, независимо от их специализации в области гидрометеорологии.

Цель пособия – освоение теоретических и практических основ прикладного статистического анализа.

Пособие рассчитано на знание основ математического анализа, теории вероятностей и математической статистики в рамках программного курса для студентов, обучающихся по специальностям гидрология, метеорология или по направлению гидрометеорология. Материал, изложенный в пособии, может оказать существенную помощь и при изучении таких дисциплин, как «Гидрологические прогнозы», «Численные методы анализа и прогноза погоды», «Синоптическая метеорология», «Речной сток и гидрологические расчеты», «Водохозяйственные расчеты», «Моделирование в задачах охраны окружающей среды».

Учебное пособие состоит из введения, трех глав, списка основной и дополнительной литературы в алфавитном порядке.

Формулы имеют тройную нумерацию: первая цифра – номер главы, вторая – номер параграфа в соответствующей главе, третья – номер формулы в рассматриваемом параграфе. Количество рисунков ограничено, а потому их нумерация сквозная.

1. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 1.1. Основные понятия Теория вероятностей и математическая статистика изучают закономерности в массовых случайных явлениях.

Случайное явление – это такое явление, которое при неоднократном воспроизведении одного и того же опыта протекает каждый раз несколько по-иному.

Совершенно очевидно, что в природе нет ни одного физического явления, в котором не присутствовали бы в той или иной мере элементы случайности. Как бы точно и подробно ни были фиксированы условия опыта, невозможно достигнуть того, чтобы при повторении опыта результаты полностью и в точности совпадали.

Случайные отклонения неизбежно сопутствуют любому закономерному явлению. Тем не менее, в ряде практических задач этими случайными элементами можно пренебречь, рассматривая вместо реального явления его упрощенную схему, «модель», и предполагая, что в данных условиях опыта явление протекает вполне определенным образом. При этом из бесчисленного множества факторов, влияющих на данное явление, выделяются самые главные, основные, решающие; влиянием остальных, второстепенных, факторов просто пренебрегают.



Однако для решения ряда вопросов описанная схема так называемых «точных наук» оказывается плохо приспособленной.

Существуют такие задачи, где интересующий нас исход опыта за висит от столь большого числа факторов, что практически невозможно зарегистрировать и учесть все эти факторы. Это – задачи, в которых многочисленные второстепенные, тесно переплетающиеся между собой случайные факторы играют заметную роль, а вместе с тем число их так велико и влияние столь сложно, что применение методов исследования «точных наук» себя не оправдывает.

Очевидно, должна существовать принципиальная разница в методах учета основных, решающих факторов, определяющих в главных чертах течение явления, и вторичных, второстепенных факторов, влияющих на течение явления в качестве «погрешностей» или «возмущений». Элемент неопределенности, сложности, многопричинности, присущий случайным явлениям, потребовал создания специальных методов для изучения этих явлений. Именно такие методы разработаны в теории вероятностей, математической статистике, теории случайных процессов.

Практика показывает, что, наблюдая в совокупности массы однородных случайных явлений, обычно обнаруживаются определенные закономерности, своего рода устойчивости, свойственные именно массовым случайным явлениям.

Подобные специфические, так называемые «статистические», закономерности наблюдаются всегда, когда мы имеем дело с массой однородных случайных явлений. Закономерности, проявляющиеся в этой массе, оказываются практически независимыми от индивидуальных особенностей отдельных случайных явлений, входящих в массу. Эти отдельные особенности в массе как бы взаимно погашаются, нивелируются, и средний результат массы случайных явлений оказывается уже практически не случайным.

Именно эта многократно подтвержденная опытом устойчивость массовых случайных явлений и служит базой применения вероятностных (статистических) методов исследования.

Обычно случайные величины обозначают большими (прописными) буквами латинского алфавита, а их возможные значения – соответствующими малыми (строчными) буквами с цело численными индексами. Например, случайная величина X с возможными значениями x1,x2,...,xn. Рассматривают случайные величины двух типов: дискретные и непрерывные. Возможные значения дискретных величин можно перечислить (количество гидрометеорологических станций и постов в городе, количество телефонных звонков, поступающих абоненту в сутки, количество студентов в группе и пр.). Возможные значения непрерывных величин заполняют некоторый промежуток, который иногда имеет резко выраженные границы, а чаще – границы неопределенные, расплывчатые. Примеры непрерывных величин – давление, модуль скорости ветра, температура среды, рост человека и пр.

Необходимо вспомнить, что в теории вероятностей и математической статистике давались определения m классической вероятности –, P = n где n – общее число исходов, m – число исходов, благоприятствующих появлению интересуемого события. Иначе классическую вероятность можно назвать теоретической вероятностью, или вероятностью генеральной совокупности, или вероятностью до опыта (apriori). Определить такую вероятность можно при условии, что для случайных событий выполнима схема случаев, т. е. выполняются три условия: события образуют полную группу, несовместны и равновозможны.

Если хотя бы одно из трех условий не выполняется, то определить классическую (теоретическую) вероятность нельзя. В этом случае необходимо проделать серию опытов и определить так называемую m * статистическую вероятность –, P = n где n – общее число опытов, m – число опытов, в которых появилось (наблюдалось) интересуемое событие. Иначе статистическую вероятность можно назвать эмпирической, или вероятностью выборочной совокупности, или вероятностью после опыта (a posteriori).

Между статистической и классической вероятностью существует связь, определяемая законом больших чисел в виде теоремы Бернулли (студенту предлагается вспомнить).

Случайная величина полностью определяется законом распределения (для дискретных величин – это ряд распределения или функция распределения, для непрерывных величин – это функция распределения или функция плотности вероятности).

Ряд (таблица) распределения – это задание возможных значений случайной величины с соответствующими вероятностями.

Например, Х х1 х2 … хn Р p1 p2 … pn n Здесь, n – либо общее число исходов, либо число p = i i=опытов. Рассматривая каждую пару значений (x, pi ) как точку на i плоскости, можно ряд распределения представить геометрически как многоугольник распределения.

Функция распределения F(x) – это универсальный (интегральный) закон распределения, справедливый и для дискретных, и для непрерывных случайных величин. Ее аналитическая запись:

F(x) = P(X < x) = P(- < X < x) – вероятность того, что случайная величина X окажется левее какого-либо возможного своего значения. Очевидно, что функция распределения безразмерна. Ее свойства: если x > x1, то F(x ) F(x1) – неубывающая функция сво2 его аргумента, limF(x) = 0, limF(x) = 1.

x- x+ Дополнение функции распределения F(x) до 1, т. е. 1- F(x) называют в гидрологии функцией обеспеченности (в биологии – функцией выживаемости, экономике – функцией риска). Если обозначить функцию обеспеченности через P(x), то P(x)=1 - F(x)= P(X x), т. е. функция обеспеченности показывает вероятность превышения некоторого заданного значения x и обладает свойствами:





при x2 > x1 P(x2) P(x1);

limP(x)=1, limP(x)= 0;

x- x+ F(x)= P(x)= 0,5.

Функция плотности распределения (вероятности) f(x) – это дифференциальный закон распределения непрерывных слу чайных величин: f(x)= F (x) (при условии, что F(x) дифференцируема для всех значений случайной величины). Вспомнив определение производной, можно утверждать, что функция плотности распределения имеет размерность, обратную размерности случайной величины. Функция плотности распределения, являясь производной неубывающей функции распределения F(x), будет неотри+ цательной, т. е. f(x) 0 и f (x) dx = 1, где f(x)dx есть элемент вероятности (безразмерный).

Благодаря функции плотности вероятности можно оценить вероятность попадания случайной величины в любую область из множества ее значений. Например, x b P(X < x)= P(- < X < x)= f(x)dx, f(x)dx, P(a < X < b) = - a где x, a и b принадлежат области определения случайной величины X.

Существует очень большое количество различных теоретических законов распределения (равномерный, Бернулли, Коши, Пуассона, нормальный, логнормальный, Гумбеля, Крицкого– Менкеля, Джонсона, 13 кривых распределения Пирсона и др.).

Наиболее употребительным является нормальный закон распределения. В гидрометеорологической практике, как правило, рассматривают законы распределения, зависящие от небольшого числа параметров (обычно два–три).

Однако найти конкретный закон распределения для случайной величины не всегда возможно, а иногда и не нужно. Поэтому часто достаточно охарактеризовать поведение случайной величины числовыми характеристиками, из которых студенту надо вспомнить обыкновенные (степенные) начальные, центральные и смешанные моменты. Чтобы четко понимать различие и сходство моментов теоретических и статистических, условимся в левой половине листа записывать моменты теоретические, а в правой – статистические, разделяя их вертикальной чертой.

Теоретические моменты Статистические моменты (моменты генеральной (моменты выборочной совокупности) совокупности) Начальные моменты к-порядка n n k k k = xi pi – для дискрет- xi ni i=1 i=k = – начальный моn ной величины, где при n мент, взвешенный по частотам.

должно выполняться условие Здесь n – общее количество сходимости ряда.

опытов, ni – количество опытов, в которых появилось интересуемое событие.

n k xi i=k = – простой начальный n момент.

В дальнейшем все формулы будут записаны в двойном виде (моменты, взвешенные по частотам и простые).

+ k = f(x)dx – для непреx k рывной величины при условии, что несобственный интеграл сходится.

Из начальных моментов самостоятельное значение имеет только 1-й, который получил специальное название – математическое ожидание m, или M(X) (теоретическое среднее, среднее x генеральной совокупности), размерность которого совпадает с размерностью самой случайной величины. Для выборки 1-й начальный момент – это среднее арифметическое.

n n = x p = m x n 1 i i x i i i=i= = = x – среднее арифn + = xf (x)dx = m метическое, взвешенное по час 1 x тотам (среднее выборки).

n x i i= = = x – простое среднее n арифметическое Студенту предлагается вспомнить связь между математическим ожиданием и средней арифметической (теорема Чебышева из закона больших чисел).

Среднее многолетнее значение величин (многолетний период такой продолжительности, при увеличении которой полученное среднее существенно не меняется) называют нормой, например, норма годового стока, норма сроков вскрытия и замерзания водных объектов, норма дат начала и окончания весеннего половодья, норма высоты снежного покрова, климатическая норма и пр.

Начальные моменты выше первого порядка самостоятельного значения не имеют и используются как вспомогательные для более быстрого вычисления центральных моментов.

Центральные моменты к-порядка n n k k для дис = (x - m ) p (x - x) n k i x i i i i=1 i= = k n кретной величины n k (x - x) + i k i= = (x - m ) f (x)dx = k x k n для непрерывной величины Центральные моменты самостоятельного значения 0 = 1, 1 = не имеют.

имеет самостоятельное значение и его называют дисперсией (D).

n n для = D = (x - m ) p 2 i x i (x - x)2 ni i i=i=2 = Dв =, дискретной величины n + n = D = (x - m ) f (x)dx 2 x (x - x)i i=2 = Dв =, для непрерывной величины n n (xi - x) i=2 = Dв = для n < n -Дисперсия имеет размерность, равную размерности квадрата случайной величины. Поэтому, чтобы получить характеристику разброса той же размерности, что и случайная величина, из дисперсии извлекают квадратный корень. Положительный корень из дисперсии: + D = – среднее квадратическое отклонение (по английской терминологии – стандарт), который характеризует разброс случайной величины вокруг своего среднего.

На практике измерить все значения случайной величины не всегда возможно. В этих случаях поступают следующим образом:

в расчет включают дополнительную характеристику, которая позволяет по среднему значению, полученному на основании ограниченного числаn n наблюдений, судить об общей (истинной) величине средней всей совокупности. Такого рода характеристиками являются средние случайные ошибки. Так, средняя ошибка n xi - X i=средней арифметической x =, а средняя ошибка средn n n (xi - X) i=него квадратического отклонения = =. Отn n ношение должно находиться в пределах 1,25 1,30, согласно x которым случайные ошибки подчиняются закону нормального распределения.

Центральные моменты 3 и 4 используют для расчетов соответственно асимметрии (А) и эксцесса (Ex).

Pages:     || 2 | 3 | 4 | 5 |   ...   | 9 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.