WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     || 2 | 3 |
CАРАТОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИ ВЕРСИТЕТ Факультет нелинейных процессов Кафедра электроники, колебаний и волн CАРАТОВСКОЕ ОТДЕЛЕНИЕ ИНСТИТУТА РАДИОТЕХНИКИ И ЭЛЕКТРОНИКИ РАН Учебно-научная лаборатория «Нелинейная динамика (физический эксперимент)» Поддержано ФЦП «Интеграция» (проект А0057/99) и грантом «Ведущие научные школы» (проект РФФИ (96-15-96536) Б.П. БЕЗРУЧКО, Д.А. СМИРНОВ СТАТИСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ПО ВРЕМЕННЫМ РЯДАМ Учебно-методическое пособие Государственный учебно-научный центр «Колледж» Cаратов, 2000 УДК 530.18 Б 39 Безручко Б.П., Смирнов Д.А.

Б 39 Статистическое моделирование по временным рядам. Учебнометодическое пособие, – Саратов: Издательство ГосУНЦ “Колледж”, 2000 – 23 с.

Рассматриваются подходы к использованию дискретных последовательностей экспериментальных данных (временных рядов) для конструирования статистических моделей, предназначенных для прогноза поведения объекта.

Представлены: экстраполяция временной зависимости, а также линейные модели авторегрессии и проинтегрированного скользящего среднего. Предлагается, пользуясь готовыми программами, по экспериментальным временным рядам сконструировать прогностические модели и оценить их качество.

Работа предназначена для практических занятий по курсу “Математическое моделирование” для студентов факультета нелинейных процессов и физического факультета Саратовского госуниверситета.

Рецензент: старший научный сотрудник Саратовского отделения института радиотехники и электроники РАН, к.ф.-м.н. Селезнев Е.П.

© Б.П. Безручко, Д.А. Смирнов, 2000 © Изд-во ГосУНЦ «Колледж», 2000 2 Содержание 1. Введение (динамический и статистический подходы к моделированию) 4 2. Временные ряды 6 3. Экстраполяция временной зависимости 7 4. Модель в виде случайного процесса 9 5. Модель скользящего среднего 10 6. Модель авторегрессии 11 7. ARIMA-модель 12 8. Методика построения ARIMA-модели по временному ряду 9. Практическое задание Приложение. О методах максимального правдоподобия и наименьших квадратов Литература Контрольные вопросы 1. Введение (динамический и статистический подходы к моделированию) Математическая модель – описание какого-либо класса явлений внешнего мира, выраженное с помощью математической символики. Формальная математическая конструкция становится моделью после «наполнения» ее физическим содержанием, указанием связи символов с характеристиками объекта. Поэтому при моделировании очень важно выбрать математический аппарат, наиболее соответствующий целям моделирования, и структуру формул, наиболее приспособленную к упомянутому «наполнению». Этот выбор делается на начальном этапе моделирования при исходном рассмотрении объекта или информации о нем и определяется целями моделирования. Так если требуется однозначный прогноз и имеется возможность точного задания величин, характеризующих состояние объекта, конструируют динамические модели. Для этого обычно используют аппарат дифференциальных уравнений и однозначные отображения. Если от претензий на точное описание объекта отказываются и объявляют наблюдаемые процессы случайными (непредсказуемыми), строят статистические (вероятностные) модели. Обычно это делают с помощью математического аппарата статистики и теории вероятностей, если по условиям задачи достаточно указать вероятность того или иного из возможных состояний системы или устраивает приближенное описание с помощью усредненных величин. Более того, в ряде случаев динамическое описание даже не представляется возможным из-за сложности моделируемой системы или ее поведения.

Следует добавить, что хаотические решения простых (маломерных) нелинейных динамических систем могут представлять собой весьма нерегулярные, беспорядочные зависимости от времени, так что для их описания тоже весьма уместны статистические характеристики. С другой стороны для описания непредсказуемых однозначно явлений в системах с малыми шумами используют стохастические дифференциальные уравнения (с малыми случайны ми добавками). Эти представители вероятностных моделей в некотором смысле находятся на стыке с динамическими.

В данной работе мы ограничимся статистическим рассмотрением процессов эволюции: определением зависимостей величин, характеризующих объект, от времени с целью прогноза их дальнейшего поведения. Кроме того, разговор пойдет лишь об эмпирических моделях, которые конструируют непосредственно из экспериментальных данных, представленных в виде временных рядов (последовательностей чисел) 1. Впервые задача построения модели по временному ряду была поставлена в рамках статистики в связи с проблемой прогноза.

В самом деле, естественным представляется следующий вопрос: если известно поведение объекта до настоящего момента времени, то возможно ли предсказать его будущее, и насколько далеко Сначала задача прогноза наблюдаемого процесса формулировалась как одна из наиболее распространенных задач статистического анализа — изучение связи между переменными. До 1920-х гг. она решалась методом экстраполяции наблюдаемой временной зависимости, затем появились и получили развитие другие методы, в которых, главным образом, ограничиваются линейными приближениями [1-3]. Несмотря на активное повсеместное продвижение нелинейных представлений, эти ставшие классическими подходы остаются актуальными, а знакомство с ними, реализуемое в данной работе, — необходимым.

Выделяют неструктурные (непараметрические) и структурные (параметрические) методы анализа временного ряда. К первым относят оценивание по данным спектра Фурье, автокорреляционной функции, гистограммы и т.д. Эти методы характеризуются тем, что по временному ряду оценивается очень большое число параметров, “данные говорят сами за себя” [2] (так, например, значение автокорреляционной функции для каждого времени задержки — это отдельный параметр). Ко вторым относят методы, ориентированные на оценку по данным небольшого числа параметров при некоторых дополнительных предположениях о свойствах наблюдаемых величин. Например, построение гистограммы по наблюдаемым значениям — это неструктурный подход к оцениванию плотности распределения вероятностей слуxчайной величины. А выбор явного вида функции, например, p(x) = exp(- ) 2, и оценка ее параметра — подход структурный. К структурным относятся и подходы. о которых пойдет речь дальше.



2. Временные ряды Временными рядами называют дискретные последовательности чисел, характеризующих состояние объекта наблюдения в отдельные моменты времени2. Такой способ представления информации о явлениях, эволюционных процессах, движениях весьма распространен. В одних случаях дискретное задание наблюдаемой естественно или даже единственно возможно. Например, курс валют устанавливается с дневным интервалом, статистические данные о состоянии производства собираются по годам и кварталам, подсчеты численности биологических популяций ведутся по сезонам, данные о погоде представляются метеостанциями также дискретно. В других случаях дискретность является результатом приближения или связана с выбором способа наблюдения. Так непрерывное во времени изменение положения движущегося тела становится дискретным при его наблюдении с использованием стробоскопа, а непрерывный сигнал – после преобразования с помощью аналого-цифрового преобразователя.

Далее мы будем рассматривать лишь примеры эволюции во времени и временные ряды с отсчетами, сделанными с постоянным шагом – через равные интервалы времени t (интервалы выборки). Члены ряда vi – значения наблюдаемой величины в дискретные моменты – будем называть точками, i – порядковым номером точки или дискретным временем; количество точек в ряде N – длиной ряда (или длиной временной реализации). Для обозначения самого ряда будем использовать фигурные скобки: {vi}= v1,v2,...,vN.

Скалярным называют ряд, сформированный из отсчетов скалярной наблюдаемой – когда величина, характеризующая моделируемый объект или явление единственна и ей соответствует точка на числовой оси. В случаях, когда “Дискретный” – раздельный, состоящий из отдельных частей. В отличие от “непрерывного” (способного принимать любое значение, без промежутков, “континуального”) дискретный набор значений содержит, например, только 0 или 1, только целые, только рациональные числа и т.п. Здесь речь идет о дискретности значений только времени, а значения величины, характеризующей объект наблюдения, (будем ее называть просто “наблюдаемой” или “переменной”) могут быть любыми.

состояние объекта или явление в данный момент времени характеризуется двумя и более скалярными величинами, говорят о векторном ряде.

3. Экстраполяция временной зависимости N Пусть имеется скалярный временной ряд {vi}. Необходимо найти i=(предсказать) значения величины v в моменты времени t > tN. Одним из возможных подходов является экстраполяция3 наблюдаемой временной зависимости. Для реализации этого подхода предполагают явный вид функциональной зависимости v от t и оценивают неизвестные параметры по временному ряду. Затем полученная функция используется для прогноза дальнейшего поведения. Обычно ищется зависимость среднего значения v от t – регрессия4.

Например, если экспериментальные точки на плоскости v-t (рис.1а) располагаются вдоль некоторой прямой, целесообразно использовать линейную функцию v(t) (линейный регрессионный анализ). Модель строится в виде vi = b0 + b1ti + ai, (1) где ai — независимые одинаково распределенные случайные величины: значения некоторого случайного процесса в моменты времени ti. Параметры b0 и bоцениваются методом максимального правдоподобия (см. Приложение). Если предположить, что величины ai распределены по нормальному закону, то этот Экстраполяцией называется продолжение некоторой функции v(t) за пределы области ее определения. В физике под экстраполяцией часто понимается распространение полученной экспериментально временной зависимости v(t) на другие промежутки времени. В зависимости от того, насколько значения, полученные путем непосредственных измерений на новом промежутке, совпадают со значениями функции v(t) на нем говорят об успехе или неуспехе экстраполяции.

Регрессией называется зависимость среднего значения некоторой величины v от другой величины параметра t. Иногда этим же термином обозначают и процесс отыскания рассматриваемой зависимости. Необходимость отыскания функции среднего возникает в двух основных случаях: первый — когда по каким-либо причинам невозможно точно измерить величину v; второй случай заключается в том, что природа измеряемой величины такова, что она в действительности v принимает различные значения при одном и том же t в разных экспериментах (то есть, существуют некоторые факторы, которые не удается учесть в процессе измерения вследствие незнания, либо эти факторы намеренно игнорируются).

метод сводится к методу наименьших квадратов. Выбираются такие значения параметров модели, которые минимизируют средний квадрат «ошибки» a:

N (2) (v - b0 - b1ti )2 = min.

i N i=В данном случае задача сводится к решению линейной системы двух алгебраических уравнений. После того, как значения параметров b0 и b1 определены, Рис.1. Возможные варианты изменения наблюдаемой величины v, для которых достаточно просто подобнаиболее вероятное значерать явный вид зависимости v(t): а) линейная, б) эксние величины v в любой поненциальная, в) полиномиальная (3-го порядка).





момент времени t можно вычислять по формуле v(t) = b0 + b1t. Можно также определить границы доверительного интервала, в который с заданной вероятностью попадет значение v(t). Экстраполяция и состоит в использовании полученной формулы для прогноза значений v при t > tN.

Для проверки адекватности полученной модели экспериментальным данным полезно провести анализ остатков (остаточных ошибок) модели5. Модель (1) можно считать удовлетворительной, если остатки некоррелированы и распределены (приблизительно) по нормальному закону. Для проверки этих утверждений необходимо рассчитать автокорреляционную функцию остатков и плотность их распределения (построить гистограмму).

В общем случае могут потребоваться другие аппроксимирующие функции (см. например, рис.1б,в, где точки располагаются явно нелинейно). Как при выборе линейного вида зависимости v(t), так и при использовании нелинейных функций (экспоненты, полинома и т.д.), описанный метод прогноза эффективен Поясним, что такое остатки или остаточные ошибки модели. Пересчитаем наиболее вероятные значения переменной v, исходя из построенной модели (т.е. vi = b0 + b1ti ), для моментов времени ti. Эти значения называются предсказанными значениями. Разность между исходными и предсказанными значениями называется остатками.

лишь для узкого класса процессов, соответствующих выбранному виду временной зависимости. Однако во многих случаях удовлетворительно подобрать явный вид v(t) не удается.

4. Модель в виде случайного процесса В тех случаях, когда в распределении экспериментальных точек на плоскости v-t не просматривается какой-либо закономерности (разброс точек очень велик), может оказаться более эффективным моделирование временного ряда случайным процессом. Случайный процесс — это функция v = v(ti,), где — случайное событие (т.е. значение v в любой момент времени является случайной величиной).

В качестве базовой модели при таком подходе обычно принимают нормальный белый шум a(t). Это случайный процесс, значения которого в различные моменты времени статистически независимы, а значения в любой фиксированный момент времени распределены одинаково по нормальному закону ap(a) = e, где — дисперсия6 (среднее значение принято равным нулю).

Однако свойства наблюдаемого процесса могут противоречить гипотезе о том, что это нормальный белый шум (например, автокорреляции могут быть существенно отличны от нуля для ненулевых задержек). В этом случае полезным для многих практических ситуаций оказался следующий подход. Предпо В общем случае, чтобы полностью описать случайный процесс, необходимо определить всевозможные конечномерные распределения этого процесса. Однако можно показать, что для полного описания нормального случайного процесса (т.е. процесса, для которого одномерное распределение в любой момент времени является нормальным) достаточно задать только его среднее значение, дисперсию и автокорреляционную функцию. Таким образом, для построения модели в виде нормального белого шума по данным нужно оценить только его дисперсию и среднее значение (значения автокорреляционной функции при любой ненулевой задержке равны нулю). Нормальный белый шум описывает так называемое случайное блуждание, можно сказать, что это наиболее непредсказуемый процесс. Кроме того, выделенное положение нормального закона распределения обусловлено тем, что суммарный лагалось, что наблюдаемый процесс — это нормальный белый шум, преобразованный линейным фильтром7.

Значение нормального белого шума, преобразованного линейным фильтром, для любого момента времени tn определяется выражением vn = an + an-i, (3) i i= где веса должны удовлетворять условию const, чтобы процесс vn i i i=был стационарным8.

Таким образом, вид модели выбран на основе двух предположений: к наблюдаемому временному ряду имеют отношение нормальный белый шум и линейный фильтр. Для построения модели вида (3) необходимо оценить по данным дисперсию белого шума и веса i.5. Модель скользящего среднего Разумеется, вычислить бесконечное количество весов не представляется возможным, однако, как правило, значения i быстро убывают с ростом номера i и на практике достаточно ограничиться моделью с конечным числом весов q. Таким образом, можно получить модель скользящего среднего порядка q — MA(q) (от английского «Moving Average» — скользящее среднее):

q vn = an - an-i, (4) i i=вклад очень большого числа случайных факторов распределен асимптотически нормально (согласно центральной предельной теореме).

Как известно, линейный фильтр обладает тем свойством, что если на его вход подан нормальный белый шум, то выходной сигнал может не быть -коррелированным. Кроме того, линейные фильтры были хорошо изучены и широко использовались на практике.

Процесс называется стационарным в узком смысле, если его всевозможные конечномерные распределения не меняются при сдвиге по времени. Процесс называется стационарным в широком смысле, если его среднее значение и дисперсия не зависят от времени (причем дисперсия конечна), а автокорреляционная функция зависит только от модуля разности аргументов. Для рассматриваемого нормального случайного процесса оба понятия совпадают.

В принципе, нужно также оценить среднее значение шума. Но мы (без потери общности) будем считать, что наблюдаемый процесс предварительно приведен к нулевому среднему.

Эта модель содержит q+1 параметров (1, 2, …, q и ), значения которых нужно оценить по временному ряду.

Pages:     || 2 | 3 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.