WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 |   ...   | 2 | 3 || 5 | 6 |

5.3. Автокорреляция ошибок Пусть теперь наблюдения однородны по дисперсии и их последовательность имеет физический смысл и жестко фиксирована (например, наблюдения проводятся в последовательные моменты времени).

Для проверки гипотезы о наличии линейной автокорреляции 1-го порядка ошибок по наблюдениям = + i, E() = 0, E(/ ) = 2, = + = = IN = + = = = + = = i i-- где - коэффициент авторегрессии 1-го порядка;

- N-вектор-столбец {i};

можно использовать критерий Дарбина-Уотсона или DW-критерий (при автокорреляции 2-го и более высоких порядков его применение становится ненадежным).

Фактическое значение dc статистики Дарбина-Уотсона (отношения ФонНеймана) или DW-статистики раcсчитывается следующим образом:

N (ei - ei-1)=i= = = = dc = = = N e i = i== = Оно лежит в интервале от 0 до 4, в случае отсутствия автокорреляции ошибок приблизительно равно 2, при положительной автокорреляции смещается в меньшую сторону, при отрицательной - в большую сторону.

Если = 0, величина d распределена нормально, но параметры этого распределения зависят не только от N и n. Поэтому существует по два значения для каждого (двустороннего) квантиля, соответствующего определенным, N и n: его нижняя dL и верхняя dU границы. Нулевая гипотеза принимается, если dU dc 4 - dU ; она отвегается в пользу гипотезы о положительной автокорреляции, если dc < dL, и в пользу гипотезы об отрицательной < < < автокорреляции, если dc > 4 - dL. Если dL dc < dU или > - < > - < > - < - < 4 - dU < dc 4 - dL, вопрос остается открытым (это - зона неопределенности - < - < DW-критерия).

Пусть нулевая гипотеза отвергнута. Тогда необходимо дать оценку матрицы.

Оценка r параметра авторегрессии определяется из приближенного равенства dc r 1 -, или рассчитывается непосредственно из регрессии e на него самого со двигом на одно наблюдение.

1 r r2.. rN - -r 1 r.. rN - Оценкой матрицы, а матрица D является - r2 r 1.. rN -.....

.....

N -1 - - -2 -- - - - r rN rN.. 1 - r2 0 0.. преобразований в пространстве наблюдений равна -r 1 0.. 0.

0 -r 1.......

.....

0 0 0.. Для преобразования в простанстве наблюдений, называемом в данном случае авторегрессионным, используют обычно указанную матрицу без 1-й строки, что ведет к сокращению количества наблюдений на одно. В результате такого преобразования из каждого наблюдения, начиная со 2-го, вычитается предыдущее, умноженное на r, теоретическими остатками становятся i, которые удовлетворяют гипотезе 2.

После этого преобразования снова оцениваются параметры регрессии. Если новое значение DW-статистики неудовлетворительно, то можно провести следующее авторегрессионное преобразование.

Обобщает процедуру последовательных авторегрессионных преобразований метод Кочрена-Оркарта, который заключается в следующем.

Для одновременной оценки r, a и b используется критерий ОМНК (в обозначениях исходной формы уравнения регрессии):

N - - - - - ((x -- - - - - rx ) - (zi - rzi-1)a - (1 - r)b)2 min, - - - - - - i i-1 - N =i = = = где zi - n-вектор-строка значений независимых факторов в i-м наблюдении (iстрока матрицы Z).

Поскольку производные функционала по искомым величинам нелинены относительно них, применяется итеративная процедура, на каждом шаге которой сначала оцениваются a и b при фиксированном значении r предыдущего шага (на первом шаге обычно r = 0), а затем - r при полученных значениях a и b. Процесс, как правило, сходится.

Теоретические вопросы и задания 1(*) Почему нарушение гипотезы 3 в части матрицы ковариации ошибок сохраняет несмещенность оценок, но приводит к потере их эффективности в классе линейных оценок 2. Построить оператор ОМНК-оценивания, вывести формулу для матрицы ковариации оценок параметров в этом случае.

3(*). Показать, что ОМНК-оценки относятся к классу BLUE.

4. Убедиться, что в случае гетероскедастичности ошибок для преобразования в пространстве наблюдений используется указанная матрица.

5(*). Почему при использовании критерия Дарбина-Уотсона требуется знать два критических значения для расчетной статистики 6. Доказать, что в случае автокорреляции ошибок 1-го порядка матрица ковариации ошибок по наблюдениям и матрица авторегрессионного преобразования имеют указанную форму.

7. Вывести формулу ОМНК-критерия и построить процедуру оценивания коэффициента авторегрессии в методе Кочрена-Оркарта.

6. Ошибки измерения факторов и фиктивные переменные 6.1. Ошибки измерения факторов Пусть теперь нарушается гипотеза 2, и независимые факторы наблюдаются с ошибками (здесь используются обозначения первых двух форм уравнения регрессии):

z = z0 +, или в разрезе наблюдений: Z = Z0 +, где z0 и - n-вектора-строки истинных значений факторов и ошибок их измерений;

Z0 и - соответствующие N n-матрицы значений этих величин по наблюдениям.

Предполагается, что истинные значения и ошибки независимы друг от друга (по крайней мере, не скоррелированы друг с другом) и известны их матрицы ковариации (одинаковые для всех наблюдений):

E(z0/, E(z0/,z0) = M0, E(/) = ) = 0,.

Уравнение регрессии можно записать в следующей форме:

X = Z + -, = + = + = + (т.е. остатки теперь не могут быть независимыми от факторов-регрессоров) и в рамках сделанных предположений доказать, что E(M) = M0 +, E(a) = (M0 + )-1M0, т.е. МНК-оценки теряют в такой ситуации даже свойство несмещенности. Как правило, они преуменьшены по сравнению с истинными значениями (в случае n = 1, z = E(a) = ).



= = 20 + + z + + Существуют три подхода к оценке параметров регрессии в случае наличия ошибок измерения независимых факторов.

а) Простая регрессия. Если имеется оценка W ковариационной матрицы ошибок и ошибки регрессоров взаимно независимы с изучаемой переменной, то можно использовать следующий оператор оценивания:

a = (M-W)-1m, который обеспечивает несмещенность оценок.

б) Инструментальные переменные. Если имеется n факторов y, которые взаимно независимы как с ошибками уравнения, так и ошибками основных факторов, то оценка a = (Y/ Z)-1(Y/ X) = = = несмещена.

Исторически первой в этом классе получена оценка Вальда для случая n = 1.

Для получения этой оценки i-я компонента вектора-столбца Y принимается равной единице, если zi больше своей медианы, и минус единице, если - меньше медианы (при нечетном N среднее значение теряется). В результате получается, что x2 - xa = = = = z2 - zгде x2, z2 - средние значения переменных по верхней части выборки, x1, z1 - их средние значения по нижней части выборки.

Такая оценка более эффективна, если исключить примерно треть “средних” наблюдений.

Позже эта оценка была обобщена: матрицу значений инструментальных переменных было предложено формировать столбцами рангов по наблюдениям соответствующих переменных z.

в) Ортогональная регрессия. Если ошибки факторов не зависят друг от друга и от ошибок в уравнениях (которые в этом случае интерпетируются как ошибки изучаемой переменной), их дисперсии одинаковы и равны дисперсии ошибки изучаемой переменной, а между истинными значениями переменных имеется линейная зависимость, то можно использовать ортогональную регрессию.

Возвращаясь к обозначениям 3-го раздела, X = и = = = (M - In)a = 0, a/a = 1.

- - - В этом случае матрица ковариации ошибкок переменных имеет вид 2In.

Если матрица ковариации ошибок есть 2, то применяется регрессия в метрике :

(M - )a = 0, a/a = 1.

- = = - = = - = = Для доказательства проводится преобразование в пространстве переменных с - - - помощью матрицы C, такой, что = C-1/C-1, после которого матрица = = = ковариации ошибок переменных приобретает вид 2In, и становится возможным применить обычную ортогональную регрессию.

Ортогональная регрессия при принятых гипотезах приводит к состоятельным оценкам параметров.

6.2. Фиктивные переменные С помощью фиктивных или псевдо- переменных, принимающих дискретные, обычно, целые значения, в регрессию включают качественные факторы.

Уточнение обозначений:

Z - Nn-матрица наблюдений за “обычными” независимыми факторами;

- n-вектор-столбец параметров регрессии при этих факторах;

Z0 = 1N ;

= = = 0 =.

В этих обозначениях уравнение регрессии записывается следующим образом:

= + + X = Z + Z00 +.

= + + = + + Пусть имеется один качественный фактор, принимающий два значения (например: “мужчина” и “женщина”, если речь идет о модели некоторой характеристики отдельных людей, или “годы войны” и “годы мира” - в модели, построенной на временных рядах наблюдений, которые охватывают периоды войны и мира, и т.д.). Ставится вопрос о том, влияет ли этот фактор на значение свободного члена регрессии.

~ = - ZF = {zF} - N 2-матрица наблюдений за качественным фактором (матрица = - = - ij фиктивных переменных): zF равен единице, если фактор в i-м наблюдении iпринимает 1-е значение, и нулю в противном случае; zF равен единице, если iфактор в i-м наблюдении принимает 2-е значение, и нулю в противном случае.

~ = - 2-х компонентный вектор-столбец параметров при фиктивных = = = переменных.

Исходная форма регрессии с фиктивными переменными:

~ X = Z + Z00 + ZF~ +.

= + + + = + + + = + + + ~ Поскольку сумма столбцов матрицы ZF равна Z0, оценка параметоров непосредственно по этому уравнению невозможна.

Проводится преобразование фиктивных переменных одним из двух спасобов.

а) В исходной форме регрессии исключается один из столбцов матрицы фиктивных переменных, в данном случае - первый.

F Z - матрица фиктивных переменных без первого столбца;

С = = 1 1 0.

= = = 0 -1 Тогда эквивалентная исходной запись уравнения имеет вид:

F X = Z + [Z0, Z ]C + = + = +, = + ~ и после умножения матрицы С справа на вектор параметров получается запись уравнения регресии в которой отсутствует линейная зависимость между факторамирегрессорами:

F = + 0 + + X = Z + Z0 + Z +, = + + + = + + + 0 = + = - где = 0 + 1, = 2 - 1.

= + = - = + = - После оценки этих параметров можно определить значения исходных ~ параметров 0 и, предполагая, что сумма параметров при фиктивных переменных (в данном случае 1 + 2) равна нулю, т.е. влияние качественного фактора приводит к колебаниям вокруг общего уровня свободного члена:

2 = 2, 1 = -2, 0 = + 2.

= = - = 0 + = = - = + = = - = + б) Предполагая, что сумма параметров при фиктивных переменных равна нулю, в исходной форме регрессии исключается один из этих параметров, в данном случае - первый.

- вектор-стобец параметров при фиктивных переменных без первого элемента;

-- - - C.

= = = = Эквивалентная исходной запись уравнения принимает форму:

~ X = Z + Z00 + ZFC +, = + + + = + + + = + + + и после умножения матрицы C слева на матрицу наблюдений за фиктивными переменными получается запись уравнения регрессии, в которой также отсутствует линейная зависимость между регрессорами:





= + + + X = Z + Z00 + ZF +.

= + + + = + + + После оценки параметров этого уравнения недостающаяся оценка параметра 1 определяется из условия 1 = -2.

Качественный фактор может принимать больше двух значений. Так, в классической модели выделения сезонных колебаний он принимает 4 значения в случае поквартальных наблюдений и 12 значений, если наблюдения проводились по ~ месяцам. Матрица ZF в этой модели имеет размерность, соответственно, N4 или N 12.

Пусть в общем случае качественный фактор принимает k значений. Тогда:

~ ~ матрица ZF имеет размерность Nk, вектор-столбец - размерность k, F матрицы Z и ZF - N -1), вектора-столбцы и -1;

(k- - k - - 1 1 = k(k+1) матрица =, k - матрица C = (k-1) = 0 -1k-1 Ik- - - - - - - -1/ - - - - k-- - ~ С = = = = ; 1/ ~ = 0, C = = = = = = = = = =, ZFC = ZF.

~ Ik-1 k - - - Можно показать, что 1 1/ (Ik-1 - - 1 -1/ - 0 0 - 1k-1 ) - k-1 - 0 - k--, или, k = = = = = = = = - - - - - - - - 0 Ik-1 - 1k-1 - - - 0 Ik-1 - 1k-1 - - - k где 1k-1 = 1k-11/ - - (k- (k= - = -1) -1)-матрица, состоящая из единиц; и далее = - - - k-- показать, что результаты оценки параметров уравнения с фиктивными переменными при использовании обоих указанных подходов к устранению линейной зависимости факторов-регрессоров одинаковы.

После оценки регрессии можно применить t-критерий для проверки значимости влияния качественного фактора на свободный член уравнения.

Если k слишком велико и приближается к N, то на параметры при фиктивных переменных накладываются более жесткие ограничения (чем равенство нулю их суммы). Так, например, если наблюдения проведены в последовательные моменты времени, и вводится качественный фактор “время”, принимающий особое значение в ~ каждый момент времени, то ZF = IN, и обычно предполагается, что значение = = = параметра в каждый момент времени (при фиктивной переменной каждого момента времени) больше, чем в предыдущий момент времени на одну и ту же величину.

Тогда роль матрицы C играет N-вектор-столбец T, состоящий из чисел ~ натурального ряда, начиная с 1, и = TT, где T - скаляр. Уравнение регрессии с = = = фактором времени имеет вид (эквивалентная исходной форма уравнения при использовании способа “б” исключения линейной зависимости фиктивных переменных):

= + + + X = Z + Z00 + TT +.

= + + + = + + + Метод фиктивных переменных можно использовать для проверки влияния качественного фактора на коэффициент регрессии при любом обычном факторе.

Исходная форма уравнения, в которое вводится качественный фактор для параметра j, имеет следующий вид:

~ j ~ = + + + X = Z + Z00 + Z ZF +, = + + + = + + + j где Z - j-й столбец матрицы Z, j j ~ - k-вектор-столбец параметров влияния качественного фактора на j;

в векторе j-я компонента теперь обозначается 0 - средний уровень j параметра j;

- операция прямого произведения столбцов матриц.

Замечание Прямое произведение матриц AB, имеющих размерность, соответственно, mAnA и mBnB есть матрица размерности (mAmB)(nAnB) следующей структуры:

a11B.. a1nA B...

...

a B.. amA B mA 1 nA Прямое произведение матриц обладает следующими свойствами:

(AB)(CD) = (AC)(BD), если произведения AC и BD имеют смысл, - - - - - - = = (A B)/ = A/ B/, (A B)-1 = A-1 B- = =.

= = Прямое произведение столбцов матриц применимо к матрицам, имеющим одинаковое число строк, и осуществляется путем проведения операции прямого произведения последовательно с векторами-строками матриц.

Приоритет прямого произведения матриц выше, чем обычного матричного произведения.

При использовании способа “а” эквивалентная исходной форма уравнения имеет вид (форма “а”):

F = - + + + X = Z- j- j + Z00 + Z [Z0, Z ]C~ j +, = - + + + = - + + + - j j где Z- j - матрица Z без j-го столбца, - j - вектр - - без j-го элемента;

- а в случае применения способа “б” (форма “б”):

~ j X = Z + Z00 + Z ZFC +.

= + + + = + + + = + + + j Все приведенные выше структуры матриц и соотношения между матрицами и векторами сохраняются.

В уравнение регрессии можно включать более одного качественного фактора.

В случае двух факторов, принимающих, соответственно, k1 и k2 значения, форма “б” уравнения записывается следующим образом:

= + + + + X = Z + Z00 + Z11 + Z22 +, = + + + + = + + + + где вместо “F” в качестве индекса качественного фактора используется его номер.

Это уравнение может включать фиктивные переменные совместного влияния качественных факторов (взаимодействия фактров). В исходной форме компонента совместного влияния записывается следующим образом:

~ ~ Z1 Z2~, ~ где 12 - k1k2-вектор-столбец (12,...,12,12,...,12,...,12,...,12 ) /, 11 1k2 21 2k k11 k1kа 12i2 - параметр при фиктивной переменной, которая равна 1, если 1-й i фактор принимает i1-е значение, а 2-й фактор - i2-е значение, и равна 0 в остальных случаях (вектором-столбцом наблюдений за этой переменной является (k1(i1-1)+i2)~ ~ й столбец матрицы Z1 Z2 ).

Как и прежде, вектор параметров, из которого исключены все компоненты, линейно выражаемые через остальные, обозначается 12. Он имеет размерность - (k1-1)(k2-1) и связан с исходным вектором параметров таким образом:

Pages:     | 1 |   ...   | 2 | 3 || 5 | 6 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.