WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     || 2 |
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ Государственное образовательное учреждение «Оренбургский государственный университет» Кафедра математических методов и моделей в экономике А.Г. РЕННЕР, Г.Г. АРАЛБАЕВА, О.А. ЗИНОВЬЕВА ДИСПЕРСИОННЫЙ АНАЛИЗ МЕТОДИЧЕСКИЕ УКАЗАНИЯ К ЛАБОРАТОРНОМУ ПРАКТИКУМУ Рекомендовано к изданию Редакционно-издательским советом государственного образовательного учреждения «Оренбургский государственный университет» Оренбург 2002 ББК 22.172я7 Р-39 УДК 519.233.5(076.5) Введение Дисперсионный анализ предназначен для проверки наличия зависимости нормально распределенной результативной случайной величины Y от нескольких факторов (факторных величин), а именно для выявления причинноследственных связи между вариацией факторов и вариацией результативных признаков. Среди факторов будем различать случайные и неслучайные величины, измеряемые в любой из шкал: интервальной, порядковой или номинальной. Суть дисперсионного анализа состоит в разложении дисперсии признака на составляющие, обусловленные влиянием конкретных факторов, и проверке гипотез о значимости их влияния.

Модели дисперсионного анализа будем классифицировать:

1) в зависимости от числа факторов на однофакторные, двухфакторные и т.д.;

2) по природе факторов на детерминированные (М1), случайные (М2) и смешанные, в зависимости от того какими являются уровни факторов.

2 1 Описание лабораторной работы Лабораторная работа №3 включает в себя две части – одна посвящена моделям однофакторного анализа, а другая – двухфакторного анализа.

Данная лабораторная работа включает следующие этапы:

- постановку задачи;

- изучение порядка выполнения работы в диалоговой системе STADIA;

- выполнение индивидуальных заданий в системе STADIA;

- подготовку письменного отчета;

- защиту лабораторной работы.

3 2 Постановка задачи однофакторного анализа По данным индивидуального задания проверить:

- нулевую гипотезу об отсутствии влияния фактора (уровней фактора) на результативный признак;

если нулевая гипотеза отвергнута:

- проверить гипотезу о равенстве средних двух выбранных уровней;

- проверить гипотезу относительно равенства общей средней заданному номиналу.

Задание 0 варианта.

Для проверки влияния методики обучения производственным навыкам на качество подготовки отбираются случайным образом из выпускников ПТУ четыре группы учеников, которые после окончания обучения показали следующие производственные результаты (Таблица 1).

Таблица Группа Число Выработка, шт./день (методика) учеников 1 60 80 75 80 85 70 2 75 66 85 80 70 80 90 3 60 80 65 60 86 75 4 95 85 100 80 Предполагая, что фактор методики обучения имеет случайные уровни1, а производственные результаты есть случайная величина, подчиненная нормальному закону распределения, требуется: а) на уровне значимости 0,01 проверить существенность влияния методики обучения на производственные результаты учеников; б) сравнить при =0,05 средние производственные результаты при второй и третьей методике.

В случае однофакторного эксперимента, проводимого всегда по схеме с повторными измерениями, а также в случае двухфакторного неповторяемого эксперимента, процедуры и результаты анализа для моделей со случайными и фиксированными уровнями факторов совпадают (следует только помнить о различии в проверяемых гипотезах).

3 Порядок работы (однофакторный анализ) Запускаем пакет STADIA. В электронную таблицу вводим данные индивидуального задания по столбцам, как это показано на рисунке 1.

Рисунок 1- Электронная таблица с данными для однофакторного анализа Замечание. Процедуры однофакторного анализа пакета STADIA требуют, чтобы данные, отвечающие различным способам обработки (уровням фактора) находились в отдельных переменных. При этом в файле данных недопустимо наличие посторонних переменных. Отсюда следует, что если мы хотим провести факторный анализ только для части способов обработки или объединить несколько способов обработки в один, следует завести новый файл данных и осуществить в нем требуемые преобразования.

В меню Статистические методы выбираем пункт В=Однофакторный. На экране появится запрос Рисунок 2 - Запрос выбора метода однофакторного анализа В нашем примере распределение признака является нормальным, поэтому воспользуемся параметрическим методом, т.е. необходимо нажать соответствующую кнопку 1=параметрический.

При этом программа выдает результаты расчетов. Сначала выводится базовая таблица дисперсионного анализа и значения оценок параметров модели (рисунке 3) Рисунок 3 - Базовая таблица дисперсионного анализа и оценки параметров модели Назначение базовой таблицы дисперсионного анализа проверить нулевую гипотезу Н0: 2 = 0 об отсутствии значимого влияния уровней факторов на исследуемый отклик, или другими словами, об отсутствии эффектов обработки (рассматривается модель М2, когда j – случайные величины. Для проверки гипотезы программой были вычислены суммы квадратов отклонений: факторная, остаточная, общая - Qф = 918,Qост = 1670,Qобщ = 2590, а также несмещенные оценки факторной, остаточной и общей дисперсий:

2 2 € € € S = 306,S = 87.8,S =118.

ф ост общ Если влияние фактора отсутствует, то соотношение факторной и оста€S ф точной дисперсий используют для расчета статистики Fнабл =, распреде€S ост ленную по закону Фишера-Снедекора с v1=m-1 v2=N-m степенями свободы.

Программа выдала следующее расчетное значение статистики:

Fнабл = = 3.48.

87.Очевидно, что Fнабл > F, т.к. отвергнута гипотеза Н0 и принята гипотеза Н1 и с вероятностью ошибки можно утверждать, что влияние рассматриваемого фактора на результативный признак существенно.



Раздел выдачи результатов Параметры модели (рисунок 3) включает дополнительную информацию: оценку общего среднего значения и оценки отклонений от среднего для каждого уровня фактора в строках Эффект1, Эффект2 и т.д. Для каждого из этих отклонений указан размах доверительного интервала при заданном уровне значимости.

Так как нулевая гипотеза при решении первой задачи была отвергнута, решим следующую задачу: проверим нулевую гипотезу о равенстве двух aj = aj. При средних выбранных уровней, например, второго и третьего: Н0: ' проверке будем использовать статистику F, распределенную по закону Фишера-Снедекора (y j - y j' )n n j j' Fнабл =.

Qост n + n j j' N - m с числами степеней свободы 1=1 и 2=N-m.. Определим значение Fнабл с использование результатов расчетов, представленных на рисунке 3:

(0.522 - (-6.48))2 7 * Fнабл = * = 1.99, 7 + 23 - т.к. m=2, nj = 7;nj = 6.

' По таблице распределения Фишера находим критическое значение статистики Fкр=4,28. Поскольку Fнабл< Fкр, то нет оснований отвергать нулевую гипотезу о равенстве средних на втором и третьем уровне фактора.

Решим третью часть задачи: проверим гипотезу относительно равенства общей средней заданному номиналу. Допустим, а0=80. Для решения задачи выдвигается нулевая гипотеза Н0: а=а0. В случае модели М1 для проверки гипотезы рассчитывается статистика N(y** - a0 )Fнабл =, имеющая F - распределение с v1=1 и v2=N-m степенями Qфакт N - m 23(77.5 - 80)свободы. Определим статистику: Fнабл = = 1.64. По таблице рас23 - пределения Фишера Fкр=4.28. Так как Fнабл< Fкр, то нет оснований отвергать нулевую гипотезу о равенстве общей средней заданному номиналу с вероятностью =0.05.

4 Постановка задачи двухфакторного дисперсионного анализа По данным индивидуального задания:

- проверить нулевую гипотезу об отсутствии эффектов влияния первого фактора на результативный признак;

- проверить нулевую гипотезу об отсутствии влияния второго фактора на результативный признак;

- проверить нулевую гипотезу об отсутствии совместного влияния факторов на результативный признак.

Задание 0 варианта.

Пусть экспериментально проверяется влияние на износоустойчивость детали таких факторов, как материал (два вида) и технология изготовления (три метода). Данные экспериментов (число месяцев работы детали) приведены в таблице 2:

Таблица Материал Технология (фактор А) Сумма по Средняя (фактор В) 1 2 3 строке 1 10; 8; 7; 10 8; 12; 14; 15; 8; 10; 124 10,12 2 12; 8; 8; 7 12; 13; 11; 13; 15; 12; 135 11,14 Сумма по 70 96 93 259 столбцу Средняя 8,75 12,00 11,63 - Предполагается, что уровни факторов А и В фиксированные, а число месяцев работы детали есть случайная величина, распределенная по нормальному закону распределения. Проверить при =0,05 существенность влияния на число месяцев работы детали: а) материала; б) методики изготовления; в) взаимодействия факторов (АВ).

5 Порядок работы (двухфакторный анализ) Запускаем пакет STADIA. В электронную таблицу вводим данные индивидуального задания по столбцам, как это показано на рисунке 6.

Замечание 1. При эксперименте без повторных измерений исходные данные должны представлять собой матрицу размером nm, в которой столбцы отвечают различным уровням первого фактора j=1,…,m, строки отвечают различным уровням второго фактора i=1,..,n, а каждая ячейка содержит один отклик, измеренный при соответствующем сочетании уровней исследуемых факторов.

2. При эксперименте с повторными измерениями исходные данные должны представлять собой псевдоматрицу (не обязательно одинаковой длины столбцов), в которой переменные (i=1,…,nm) отвечают различным уровням исследуемых факторов в порядке изменения значений первого фактора: все уровни первого фактора для первого уровня второго фактора, все уровни первого фактора для второго уровня второго фактора и т.д., а каждая переменная содержит Ji откликов (Ji>1), измеренных при данном сочетании значений факторов.

Рисунок 6 - Ввод данных в электронную таблицу(двухфакторный анализ) В меню Статистические методы выберите пункт С=Двухфакторный. На экране появится запрос (Рисунок 7), в котором необходимо выбрать нужный метод двухфакторного анализа.

Рисунок 7 - Запрос выбора метода двухфакторного анализа В нашем случае модель является повторяемой и с фиксированными эффектами, поэтому следует щелкнуть мышью кнопку 2=фиксиров.эффекты.

Выдача включает дисперсионную таблицу со столбцами: сумма квадратов, число степеней свободы, средняя сумма квадратов, сила влияния фактора (по Снедекору), а строки содержат значения для первого и для второго факторов, для эффекта межфакторного взаимодействия, а также остаточные и общие параметры.

Рисунок 8 - Результат двухфакторного дисперсионного анализа.

Далее для каждого факторного эффекта вычисляется статистика Фишера F с уровнем значимости Р. Если Р>0.05, нулевая гипотеза об отсутствии соответствующего факторного эффекта может быть принята.

Ниже таблицы дисперсионного анализа в окне результатов находятся оценки влияния для уровней каждого из двух факторов. Здесь приводятся оценки общего среднего (строка Среднее), оценки величин i (в строках Эффект 1-1 – Эффект 1-3) и i (в строках Эффект 2-1 – Эффект 2-2). Все промежуточные расчеты можно представить в таблице 3.

Таблица Fнабл Смешанная Число Несмещенные Сумма А слу- В слуВариация степеней квадратов оценки дисперсии М1 Мчайная чайная свободы QA А QA m-1 I I/IV I/III I/IV I/III m - QB B QB l-1 II II/IV II/III II/III II/IV l - QAB III AB QAB (m-1)(l-1) III/IV III/IV III/IV III/IV (m - 1)(l - 1) Qост ОстаQост ml(n-1) IV точная ml(n-1) где М1 – модель с фиксированными уровнями факторов, М2 – модель со случайными уровнями факторов, m – число уровней фактора А, l – число уровней фактора В, QА, QВ, QАВ, Qост – суммы квадратов отклонений.





В задаче исследуется влияние на износоустойчивость детали двух факторов: материал и технология изготовления. Изучаемые уровни факторов можно считать случайными, поэтому сформулируем нулевые гипотезы следующим образом:

Н0: 2=0; Н0: 2=0, т.е. отсутствует влияние уровней факторов на изменения результативного признака.

Результаты, представленные на рисунке 8, включают следующие компоненты дисперсий:

Qф1=0.375 – представляет собой сумму квадратов разностей между средними по строкам и общим средним и характеризует изменение признака по фактору А;

Qф2=35.6 – представляет собой сумму квадратов разностей между средними по столбцам и общим средним и характеризует изменение признака по фактору В;

Qмежфак=22.8 – (взаимодействие) объясняется наличием нескольких наблюдений в ячейке;

Qост=85.3 – характеризует влияние прочих случайных факторов (кроме факторов А и В и их взаимодействия);

Qобщ=144 – полная или общая сумма квадратов отклонений отдельных наблюдений от общей средней.

Далее представлены степени свободы для каждой из составляющей компоненты дисперсии, оценки среднеквадратических отклонений по каждой компоненте.

Отчет также содержит результаты проверки нулевых гипотез об отсутствии влияния: первого фактора на результативный признак; второго фактора на результативный признак и межфакторного влияния на результативный признак. В результате можно видеть, что первый фактор не оказывает влияние на результативный признак, т.к. значимость (0.936) больше заданного уровня 0.05; FнаблА=0.375/4.74=0.0792; второй фактор оказывает влияние на результативный признак, т.к. значимость (0.0423) меньше заданного 0.05;

FнаблВ=17.8/4.74=3.76; межфакторное влияние также не подтвердилось, т.к.

значимость (0.117) больше заданного уровня. Следовательно, нулевая гипотеза о равенстве средних для фактора А (технология изготовления) не отвергается, а нулевая гипотеза о равенстве средних для фактора В (материал) отвергается.

6 Содержание письменного отчета Отчет должен быть оформлен на листах формата А4 с титульным листом и содержать следующее:

1) постановку задач с вариантами заданий;

2) краткое изложение теории дисперсионного анализа;

3) результаты компьютерной обработки данных;

4) анализ полученных результатов по однофакторному и двухфакторному комплексу;

5) выводы по полученным результатам.

7 Вопросы к защите 7.1 В чем заключается основная идея дисперсионного анализа 7.2 Как оценивается межгрупповая вариация 7.3 Как оценивается внутригрупповая вариация 7.4 На какие компоненты разлагается общая дисперсия при однофакторном анализе 7.5 На какие компоненты разлагается дисперсия при двухфакторном анализе 7.6 Что характеризует остаточная дисперсия 7.7 Приведите процедуру проверки нулевой гипотезы о влиянии фактора на результативный признак при однофакторном дисперсионном анализе.

7.8 Приведите процедуру проверки нулевой гипотезы о влиянии факторов на результативный признак при двухфакторном дисперсионном анализе.

Список использованных источников 1. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. –М.: ЮНИТИ, 1998.-1022с.

2. Колемаев В.А., Староверов О.В., Турундаевский В.Б. Теория вероятностей и математическая статистика. -М.: Высшая школа, 1991,-.

3. Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютере/ Под ред. В.Э. Фигурнова –М.: ИНФРА –М, 1998.-528с.

Приложение А (обязательное) Варианты заданий к однофакторному анализу Задание Предполагая, что фактор имеет случайные уровни, а значения результативного признака распределены нормально, требуется:

а) проверить при =0,05 существенность влияния фактора на результативный признак;

б) с надежностью =0,99 найти интервальную оценку остаточной дисперсии 2;

€S в) найти значение несмещенной оценки дисперсии, обусловленной случайными уровнями фактора.

Предполагая, что фактор имеет фиксированные уровни, а значения результативного признака распределены нормально, требуется:

а) проверить при =0,01 существенность влияния фактора на результативный признак;

б) проверить при =0,05 существенность влияния фактора на втором и третьем уровнях на результативный признак;

в) проверить при =0,05 гипотезу относительно равенства общей средней заданному номиналу.

Задача При исследовании влияния стажа работы на производительность труда (количество деталей в день) в одном из цехов завода получен следующий однофакторный дисперсионный комплекс (таблица А1):

Таблица АНомер на- Стаж работы рабочих (лет) блюдения До 5 5-10 10-15 15-Вариант 1 155 154 153 2 153 158 162 3 149 157 164 4 150 161 5 Вариант 1 147 149 155 2 149 150 149 3 153 152 156 4 148 5 Вариант 1 155 159 158 2 158 161 166 3 156 164 163 4 154 158 165 5 Вариант 1 172 175 177 2 170 178 183 3 169 171 181 4 169 180 5 Задача В процессе исследования влияния цены за единицу продукции на объем продаж (шт.) в месяц были получены следующие результаты (таблица А2):

Pages:     || 2 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.