WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     || 2 |
НОВОЕ В МЕТОДАХ ПРИМЕНЕНИЕ МЕТОДА «АНАЛИЗ НАСТУПЛЕНИЯ СОБЫТИЯ (EVENT HISTORY ANALYSIS)» С ПОМОЩЬЮ ПАКЕТА SPSS А.Я. Бурдяк, магистр экономики, НИСП Наблюдение за событиями и процессами, развивающимися во времени, неизбежно приводит к сопоставлению этих событий друг с другом, поиску закономерностей и попытке предугадать ход развития процессов. Первые примеры изучения смертности населения в зависимости от возраста датируются 1700-ми гг. [Hald A., 1990]. По мере развития науки разрабатывались разнообразные методы анализа наступления или ненаступления определенных событий, а появление мощной вычислительной техники расширило возможности исследователей в технической обработке информации. На современном уровне исследование процессов и событий, зависящих от времени, проводится в течение, по крайней мере, четырех десятков лет [Кокс Д., Льюис П., 1969. Кокс Д., Оукс Д., 1988] в медицине, демографии, технике, — и область применения подобных исследований расширяется. Модели для изучения длительности какого-либо процесса или времени нахождения в каком-либо состоянии встречаются в литературе под названием моделей «времени жизни» [Магнус Я.Р., Катышев П.К, Пересецкий А.А., 2004] благодаря их изначальному применению в медицине для исследования эффективности лекарственных препаратов при лечении смертельных недугов.

Эконометрические основы методов в данной статье представлены не будут, так как целью изложения является именно прикладной аспект. С теорией можно ознакомиться в учебниках эконометрики, например, по книге Greene [Greene W.H., 1997], содержащей практически все разделы современной эконометрики. Описание существующих типов моделей данного вида и некоторых примеров их применения сделано О. Савинцевой. Лекция по Event History Analysis была прочитана в Независимом институте социальной политики Л.И. Ниворожкиной. Широкому рассмотрению регрессионных методов исследования событий во времени посвящена книга D. Hosmer, S. Lemeshov [David W. et al., 1999], которая удачно объединяет описания нюансов выбора данных, определения и иллюстрации используемых статистических характеристик и интерпретации итоговых результатов моделирования. Курсы по Event History Analysis (другие названия survival analysis, hazard analysis, duration analysis, failure-time analysis) включены в программу обучения многих зарубежных университетов, конспекты лекций, задания по курсам и базы данных для выполнения практических заданий доступны в сети Интернет и являются хорошим методическим материалом для исследователей [Scheike Th.]. Недавно опубликована книга данных авторов по этой тематике [Torben Martinussen, Thomas Scheike, 2006]. Особого упоминания заслуживают лекции для социологов, которые читает профессор Кноук в университете Миннесоты [Knoke D.H.], — в его курсе изложение теоретических основ метода проводится в ракурсе практического применеSPERO | №6 Весна-Лето ния к задаче исследования возраста первого вступления юношей и девушек в брачный союз. Исследование проводится на базе данных Национального ежегодного обследования молодежи 1979–1991 (National Longitudinal Survey of Youth), осуществляемого Государственным университетом Огайо при финансовой поддержке Министерства труда США.

Так как исследования длительности процессов и наступления событий широко применяются в различных областях, непосредственно не связанных с медициной или демографией, в дальнейшем для метода Event History Analysis будем использовать название Анализ наступления события (АНС), наиболее общее и не связанное с контекстом изучаемых явлений.

АНС проводится в демографических, экономических и социологических исследованиях на микро- и на макроуровнях. Наиболее распространенными примерами применения метода на микроуровне являются:

• возраст завершения образования;

• возраст вступления в самостоятельную жизнь;

• возраст первого вступления в брак;

• длительность супружества;

• возраст женщины на момент рождения ребенка (детей);

• длительность поиска работы;

• динамика повышений по службе;

• частота наступления страховых случаев;

• продолжительность срока службы оборудования в зависимости от условий эксплуатации.

Хотя исторически метод был сконструирован для исследования событий в жизни людей, он может применяться и для анализа хода слияний или закрытий предприятий, перехода на новые технологии, перерастания конфликтов в вооруженные, хода реформ власти или национальных революций.

С помощью метода АНС изучаются данные, протяженные по времени.

Они могут быть собраны либо с помощью регулярно повторяющихся опросов одной и той же группы респондентов, либо в результате ретроспективных опросов. Анализируются цензурированные выборки — в модели учитываются и респонденты, для которых интересующее нас событие произошло, и те, для которых оно еще не случилось на момент последнего наблюдения или проведения опроса. В данной статье будет рассмотрен пример применения метода АНС, построенный на данных ретроспективного опроса EES1.

ОПРЕДЕЛЕНИЕ МЕТОДА Дадим формальное определение: Анализ наступления события (АНС) (Event History Analysis) — изучение зависимости риска наступления (или ненаступления) события от продолжительности пребывания объекта в группе риска, а также от ряда других характеристик объекта и внешних факторов, влияющих на этот риск.

Хотя из названия метода ясно, что изучается наступление некоторого события, опишем подробнее контекст, в котором применяется метод АНС. Ряд объектов (или респондентов) находится некоторое достаточно длительное время под наблюдением исследователя. Все они без исключения из так на Обследование «Образование и занятость» (EES) было проведено Независимым институтом социальной политики (Москва) при финансовой поддержке Научного общества Макса Планка (Германия) весной 2005 г. Концепция и инструментарий обследования были адаптированы к российским условиям Независимым институтом социальной политики с участием Независимой исследовательской группы «Демоскоп» и Института демографических исследований им. Макса Планка (Росток, Германия).



НОВОЕ В МЕТОДАХ А.Я. Бурдяк | Применение метода «Анализ наступления события (Event History Analysis)»… зываемой группы риска, а это означает, что в любой момент с каждым из Объектов может произойти некоторое Событие, при наступлении которого Объект навсегда выбывает из группы риска. (Данное предположение отражает специфику раннего применения метода, разработанного для исследования эффективности лекарственных препаратов при лечении смертельных недугов.) Группа риска является целевой группой нашего исследования. Хорошей иллюстрацией применения метода в технике служит анализ срока службы лампочек накаливания: Объект (лампочка накаливания) находится в группе риска перегореть, и Событие (перегорание лампочки) наступает неизбежно, однократно и безвозвратно.

В пакете SPSS реализованы четыре инструмента для проведения анализа наступления событий: табличный метод (Life Tables), метод Каплана–Мейера (Kaplan–Meier Estimator), регрессия Кокса (Cox Regression) и регрессия Кокса с зависящими от времени объясняющими переменными (Cox Regression with Time Dependent Covariates). В данной работе рассматривается применение метода регрессии Кокса, которую еще называют моделью пропорциональных рисков (proportional hazard regression model Cox (1972), Марковские процессы (1960-е гг.)).

Несколько слов о теоретической основе метода. Регрессия Кокса, или модель пропорциональных рисков, — построение риска наступления события как функции, зависящей от времени, и оценка влияния каждой из независимых переменных на этот риск. Риск наступления события — функция от времени — измеряет правдоподобие наступления события в самом ближайшем будущем для тех, кто еще находится в группе риска. Риск наступления события равен предельному значению условной вероятности наступления события во временном промежутке [t, t + dt] для объектов, еще оставшихся в группе риска на момент времени t, деленному на длину временного интервала dt. Риск — не вероятность, и он может быть больше единицы.

Базовые предположения метода АНС следующие:

(П1) линейность. Все объясняющие переменные влияют линейно на логарифм функции риска наступления События;

(П2) независимость объясняющих переменных. Все объясняющие переменные независимы. В случае присутствия взаимного влияния некоторых регрессоров, в модель должны быть дополнительно включены функции их взаимодействия;

(П3) риски пропорциональны. Риски наступления События для любых двух респондентов (или других объектов из группы риска) пропорциональны, и коэффициент пропорциональности не зависит от времени.

На основании предположений (П1)–(П3) выбрана функциональная форма модели: регрессия Кокса предполагает, что риск наступления события для i-того индивида имеет вид:

hi (t) = h0 (t) exp(1 X +2 X +... + X ) (1) i1 i 2 p ip или ln hi (t) = ln h0 (t) +1X +2 X +... + X, (2) i1 i 2 p ip где h0(t) — «базовый» риск, общий для всех индивидов;

X1, …, X — независимые переменные, регрессоры;

p 1, …, p — соответствующие коэффициенты.

НОВОЕ В МЕТОДАХ SPERO | №6 Весна-Лето Базовый риск h0(t) — риск наступления события для объекта из референтной группы (для которого все независимые переменные X1, …, X p равны нулю). Коэффициенты 1, …, p отражают влияние каждой из независимых переменных (регрессоров) на функцию риска: при увеличении Xj на единицу и фиксированных значениях остальных регрессоров, риск наступления события возрастает в exp(j) раз. Необходимо подчеркнуть, что функциональная форма регрессии Кокса (1) отражает базовое предположение модели о пропорциональности рисков (П3): отношение рисков наступления события для любых двух индивидов i и j остается неизменным со временем:

exp(1 X +2X +...+ X ) hi(t ) i1 i 2 p ip =, (3) hj (t ) exp(1 X +2X +...+ X ) j 1 j 2 p jp то есть риски пропорциональны.

Инструмент регрессия Кокса не предполагает знания или оценок функций распределения переменных-участников модели.

По форме модель пропорциональных рисков похожа на логистическую регрессию, их реализации в пакете SPSS почти идентичны, обе они оцениваются методом максимального правдоподобия.

Метод АНС держится на трех китах: Объекты, События и Время. На языке социологических исследований это Люди (со всеми их характеристиками), События (вернее, одно на всех событие, вероятность наступления которого в жизни каждого человека мы изучаем) и Время (срок от момента попадания в группу риска до момента наступления события). Время — основа метода, оно должно быть определено точно и четко, может измеряться одной из стандартных хронометрических единиц (секундами, днями, месяцами, годами), единственной выбранной для проведения конкретного анализа.

Для применения метода АНС исследователь обязательно должен:





1) отобрать целевую группу (группу риска) Объектов для наблюдения;

2) узнать о каждом Объекте из целевой группы продолжительность нахождения в группе риска и исход наблюдения: либо наступление События, либо ненаступление События вплоть до завершения наблюдения;

3) выделить и собрать информацию о ряде других характеристик и свойств, предположительно влияющих на скорость или риск наступления События в биографии Объекта. Они могут быть постоянными или меняющимися во время наблюдения за Объектом.

Главная задача — изучить, как меняется риск наступления События в зависимости от того, как долго Объект уже находится в группе риска, а также определить насколько важными являются другие его характеристики и как каждая из них влияет на риск наступления события. В социологии наиболее часто используемыми характеристиками являются пол, возраст, регион проживания, состав семьи и пр.

Широта выбора объясняющих переменных ограничена только возможностями сбора достоверной объективной информации: например, при изучении формирования предпочтений или склонностей человека важными факторами являются аналогичные характеристики его родителей, культурные традиции, другие особенности уклада жизни;

для исследования надежности аппаратуры (ожидаемый срок службы) необходимо учесть сроки и условия предыдущей эксплуатации и т.п. Выбор в руках исследователя, он зависит от целей и задач проекта, НОВОЕ В МЕТОДАХ А.Я. Бурдяк | Применение метода «Анализ наступления события (Event History Analysis)»… от возможностей и ограничений имеющихся данных и, самое важное, от хорошей интерпретируемости предполагаемых результатов.

ПРИМЕР ПРИМЕНЕНИЯ МЕТОДА АНС Перейдем к описанию примера применения метода АНС с помощью регрессии Кокса в пакете SPSS. Изучается длительность поиска работы молодыми специалистами на базе данных обследования EES (2005 г.), охватывающего 6455 респондентов2. Объектами нашего исследования являются люди в возрасте старше 18 лет, 1948–1988 годов рождения (год рождения — переменная ybrn). В данном случае под Событием мы понимаем устройство респондента на работу. Целевую группу составляют только те респонденты, для которых в возрасте 16 лет обучение еще являлось основным занятием, затем они закончили обучение и через какое-то время основным их занятием стала работа. Таким образом, из анализа исключаются 642 респондента массива EES, которые уже не учились в 16-летнем возрасте, в группе риска остается 5813 человек, на наблюдении за которыми и строится анализ. Группа риска состоит из выпускников учебных заведений, которые не намерены больше учиться, а хотят работать. В данном случае Событие — устройство на работу: как только молодой специалист трудоустроился, он выбывает из группы риска. В случае «блуждания» Объекта между образованием и трудом, мы обязательно должны оговорить которое именно из его многочисленных трудоустройств мы будем учитывать: первое, последнее или первое после получения высшего образования.

Так как метод основан на предположении о независимости респондентов друг от друга, повторное появление одного и того же объекта в группе риска НЕ ДОПУСКАЕТСЯ. Кроме информации о точном времени наступления События (или ненаступлении) в жизни респондента до момента окончания наблюдения, мы обладаем знанием ряда характеристик о каждом Объекте, которые могут влиять на скорость наступления события. Эти характеристики могут быть как постоянными (пол, цвет кожи), так и меняться за время нашего наблюдения за Объектом (регион проживания, уровень образования, количество детей).

Как только респондент завершает образование, у него появляется шанс устроиться на работу, что в терминологии метода означает, что он попадает в группу риска быть подвергнутым Событию, и в этот момент мы включаем за ним наблюдение (включается счетчик времени, переменная time = 0 месяцев). В момент, когда респондент приступает к работе, наступает Событие:

переменной status присваивается значение 1, сигнализирующее о наступлении события, счетчик времени останавливается, time равен количеству месяцев, прошедших с момента завершения обучения (когда был time = 0). Если на момент опроса выпускник так и не приступил к работе, счетчик времени тоже останавливается, а переменной status присваивается значение 0. В этом случае time равен количеству месяцев, прошедших с момента завершения обучения (когда был time = 0) до момента окончания наблюдения (момента опроса). Месяц в данном случае является наиболее адекватной единицей измерения времени. Конечно, итоговая картина была бы четче, если бы время поиска работы выражалось в неделях или днях, но имеющиеся в нашем распоряжении данные не позволяют достичь такого совершенства.

Oбследование EES проводилось на базе выборки обследования «Родители и дети, мужчины и женщины в семье и обществе» (2004 г.), охватило население в возрасте 19-55 лет из 32 регионов России и репрезентирует население указанных возрастов на национальном уровне.

НОВОЕ В МЕТОДАХ SPERO | №6 Весна-Лето Таким образом, мы сформулировали задачу и готовы применять метод АНС:

• Событие — трудоустройство молодых специалистов;

• Время — количество месяцев от окончания обучения до начала работы;

• Группа риска — те, кто учился после 16 лет (6455 – 642 = 5813 респондентов);

• Объясняющие переменные — возраст на момент окончания учебы, пол, год рождения.

Pages:     || 2 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.