WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     || 2 |
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ ВОРОНЕЖСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Математические методы в зоологии Учебно-методическое пособие по специальности 011600 – «Биология» Воронеж 2003 2 Утверждено научно-методическим советом биолого-почвенного факультета 27 октября 2003 г., протокол № 17.

Составитель Пантелеева Н.Ю.

Учебно-методическое пособие подготовлено на кафедре экологии и систематики беспозвоночных животных биолого-почвенного факультета Воронежского государственного университета.

Рекомендуется для студентов 3 курса биологического отделения дневной формы обучения.

3 Содержание Введение……………………………………………………………………..4 Тема 1. Вариационный ряд Занятие 1. Параметры вариационного ряда…………………………….…5 Занятие 2. Типы распределения признаков………………………….…….5 Тема 2. Достоверность исследований Занятие 3. Методы определения достоверности исследований………….7 Тема 3. Методы обработки большой выборки Занятие 4. Большая выборка и классирование признаков………………..8 Тема 4. Корреляционный анализ Занятие 5. Основы корреляционного анализа…………………………….9 Тема 5. Основы регрессионного анализа Занятие 6. Метод регрессионного анализа и условия его применения в зоологических исследованиях…………………...…………….12 Тема 6. Дисперсионный анализ Занятие 7. Основы однофакторного дисперсионного анализа……….…13 Занятие 8. Дисперсионный однофакторный анализ для количественных признаков……………………………………………………….14 Занятие 9. Двухфакторный дисперсионный анализ количественных признаков……………………………………………………….15 Тема 7. Индексы общности и сравнения фаунистических данных Занятие 10. Индексы сравнения фаунистических комплексов………….16 Занятие 11. Индексы сравнения фаунистических комплексов с учетом количественных параметров…………………………………..19 Тема 8. Основы кластерного анализа Занятие 12. Использование политетического метода объединительного иерарахического неперекрывающегося кластерного анализа при обработке фаунистических данных…………………….. Введение В зоологических работах большое место занимают вопросы статистической обработки материала, которые включают как анализ опытных данных, так и оценку результатов исследований.

В России и за рубежом издан целый ряд учебников, пособий по математической статистике но большинство из них доступно лишь для узких, специалистов. В определенной меренегативной чертой является то, что они не указывают корректность применения тех или иных математических методов для обработки результатов наблюдений и не дают биологической трактовки многих статистических параметров в том объеме, который требуется для объективизации биологических данных.

Настоящее пособие рассчитано на студентов и аспирантов, занимающихся систематикой, фауной, экологией и другими направлениями в зоологии. В пособии приводятся все основные методы обработки зоологических данных и на примерах рассматривается применение элементов вариационной статистики, корреляционного, регрессионного, дисперсионного, многофакторного и кластерного анализов.

Тема 1. Вариационный ряд Занятие 1. Параметры вариационного ряда Вариационным рядом называется ряд числовых параметров – вариант (V), характеризующих признаки из одной выборки.

Ранжировка вариант представляет собой выстраивание от максимальной до минимальной величины (нисходящий) или наоборот (восходящий) ряды.

Основные выборочные показатели:

V Средняя арифметическая – x = ;

n (V–x)Среднееквадратичное отклонение () – = ;

n Простое отклонение (a) – a = V–x ;

(V–x)Варианса ( 2) - 2 = --- ;

n Коэффициент вариации (CV) – CV = 100%.

x Занятие 2. Типы распределения признаков 1. Нормальное распределение – распределение признаков, когда средние параметры выборки имеют наибольшую частоту встречаемости.

Показатели распределения:

(V–x)Асимметрия – Аs = ----;

n (V–x)Эксцесс – Ex = --- - 3.

n 2. Биноминальное распределение – распределение признаков, когда два средних параметра выборки имеют наибольшую частоту встречаемости.

3. Случайное распределение (распределение Пуассона) – распределение признаков, когда минимальное или максимальное значение вариационного ряда имеет наибольшую частоту встречаемости.

Статистические ошибки – допустимые для определенного уровня точности исследований отклонения переменных вариант.

CV m x = ; m = ; m CV =.

n 2 n 2 n Нормированное отклонение – объективная величина, дающая возможность сравнивать вариационные ряды с разными единицами исчисления.

V – x T M = ---;

Выскакивающие значение в вариационном ряду – T - V – x T = --- › › Tst; если T › Tst – артефакт отбрасывается.

Задание 1.

Имеется два вариационных ряда по признакам, свойственным одному объекту исследований:

1. V: 4.8, 4.9, 5.1, 5.6, 5.7, 5.9, 6.0.

р: 3, 3, 4, 18, 10, 6, 2. V: 12.7, 10.8, 9.4, 10.2, 11.4, 10.6, 10.2.

р: 2, 10, 3, 4, 6, 18, Оба ряда именованные, с разными единицами измерения. Сравнимы ли эти ряды по типу распределения и степени вариабельности признаков Задание 2.

Какой из признаков может быть применен в диагностике вида: А – размеры тела (мм); В – вес (г):

А: V: 7 8 11 12 14 17 р: 18 24 12 9 7 3 В: V: 7.5 7.6 7.7 7.8 7.9 8.0 8. р: 21 16 12 10 7 4 Определите тип распределения признаков в обоих случаях.

Задание 3.

Сравниваются два признака: А – длина крыла у Syrphus corelli; В – длина усика у того же вида. Какой признак может быть применен в систематике Каков тип распределения признаков А : V: 2.4 2.5 2.6 2.7 2.8 2.9 3. р: 17 10 8 6 4 2 В: V: 0.7 0.8 0.9 1.0 1.1 1. р: 4 6 12 17 6 Тема 2. Достоверность исследований Занятие 3. Методы определения достоверности исследований Достоверность исследований в вариационной статистике определяется чаще всего следующим образом:



1. Критерий Стьюдента – t = ;

m 2 2. Критерий Фишера – F = ; если F › F st при Р = 0.01-0.05, то различие 2 между рядами достоверно; если F ‹ F st, то это один вариационный ряд.

3. Хи-квадрат (2) – критерий соответствия или согласия Пирсона (V–А) = ; где – V – фактическое, А –теоретическое число.

А Нулевая гипотеза – гипотеза, подразумевающая, что различий между двумя рядами нет или имеется соответствие установленным биологическим закономерностям. В зависимости от уровня достоверности полученный сравнивается с табличным значением, и если 2 › 2st, то нулевая гипотеза отбрасывается.

Число степеней свободы определяется возможностями вариационного ряда и количеством операций, производящихся с ним. Таким образом, df1= n -1;

df2= N - r.

Задание 1.

Для трех видов жуков определены показатели веса 1. V: 4.8, 4.9, 5.2, 5.7, 6.1, 6.4, 6. р: 2 3 5 7 4 1 2. V: 5.1, 5.7, 6.0, 6.2, 6.4, 6.8, 7. р: 3 4 7 8 12 16 21.

3. V: 12.7, 12.8, 13.0, 13.4, 13.5, 13.7, 13. р: 3 7 8 10 12 15 17.

Какой из видов отличается наибольшей вариабельностью признаков Подтвердите достоверность выводов.

Задание 2.

Во время учета жужелиц на полях в окрестностях г. Воронежа в 19981999 гг. было собрано 112 самок и 70 самцов, а в Воронежском госзаповеднике –174 самки и 130 самцов.

Нарушена ли популяционная характеристика в одном из обследованных пунктов Подтвердите достоверность выводов Задание 3.

Сколько популяций махаона обитает на севереВоронежа области, если известна выборка за 1988-1991 гг.:

Нижнедевицкий район: 7, 9, 3, 12, 4, 5.

Новоусманский район: 4, 12, 10, 6, 3, 3.

Верхнехавский район: 3, 2, 2, 5, 3, 4.

Насколько достоверно заключение Подтвердите достоверность выводов.

Тема 3. Методы обработки большой выборки Занятие 4. Большая выборка и классирование признаков В биологических исследованиях приходится нередко сталкиваться с большими массивами данных, т.е. оперировать большой выборкой.

К такого рода выборкам относятся вариационные ряды, насчитывающие более 30 вариант. В этом случае удобнее работать с классированным материалом, т.е. разбитым на классы.

Пример разбивки на классы со средней по классу (Mo), частотами встречаемости (fx), простыми отклонениями от условно среднего класса (a) приведен в таблице 1.

Интервал класса (i) подразумевает все значения вариант входящие в, группу признаков от min до max в пределах одного класса = 0.4, т.е. крайние варианты отличаются от средней арифметической в 2.24 раза.

Таблица 1.

Классы Mo fx a pa pa7.1-7.5 7.3 1 -4 -4 7.6-8.0 7.8 3 -3 -9 8.1-8.5 8.3 6 -2 -12 8.6-9.0 8.8 13 -1 -13 9.1-9.5 9.3 17 Усл. ср. класс: А=9.9.6-10.0 9.8 15 +1 +15 10.1-10.5 10.3 4 +2 +8 10.6-11.0 10.8 0 +3 0 11.1-11.5 11.3 2 +4 +8 11.6-12.0 11.8 2 +5 +10 Всего 63 +3 ТЕМА 4. Корреляционный анализ Занятие 5. Основы корреляционного анализа Корреляционный анализ позволяет установить зависимость между вариациями двух или большего количества признаков и определить, изменяются ли эти признаки самостоятельно или зависимо друг от друга. Этот анализ дает возможность определить количественно выраженную связь между переменными и определить ее достоверность. Главным показателем корреляционного анализа является коэффициенткорреляции – r. Обязательным условием корреляционного анализа является то, что изменения признаков должны быть зависимыми. Эта зависимость может быть временной, пространственной или носить любой другой характер.

Корреляция бывает:

а) прямая (+r) – когда с увеличением одного параметра другой тоже увеличивается;

б) обратная (-r) – когда с увеличением одного параметра другой уменьшается;

в) прямолинейная – при равных изменениях одного признака другой изменяется на равные доли;

г) криволинейная – при равных изменениях одного признака другой изменяется на неравные доли. Единицы измерения признаков могут быть разными.

Полная положительная корреляция – r = +1.

Полная отрицательная корреляция – r = -1.

В природе полной корреляции практически не наблюдается.

Обозначения корреляции при значениях коэффициента корреляции:

r = 0.7 – 0.9 – сильная корреляция;

r = 0.5 – 0.69 – средняя корреляция;

r = 0.3 – 0.49 – умеренная корреляция;

r ‹ 0.3 – слабая корреляция. В биологических исследованиях не учитывается корреляция с коэффициентом ‹ 0.2.

Пример расчета коэффициента корреляции. Требуется установить взаимосвязь между количеством гемоглобина и эритроцитов в определенном количестве анализов крови. Какова теснота связи и достоверность проведенных исследований В таблице2 приведены данные по количеству гемоглобина (%) – х; количеству эритроцитов – у.

Следующий шаг в решении этой задачи – построение первичной матрицы, для чего исходные данные классируются по каждому из признаков, а внутри матрицы разносятся методом конверта (табл.3).

pxy ax a y = (1х5х-5)+(1х-4х-5)+(1х-3х-3)+(1х-2х-3)+(3х-1х-1)+ 4х1х1)+(4х2х1)+ (2х1х2)+(2х2х2) = 87.

Таблица 2.

Количество гемоглобина (%) и количество эритроцитов в репрезентативной выборке пациентов.

Х у х у Х у х У 0.8 22 3.30 82 3.14 83 3.82 1.71 45 4.10 81 3.21 73 4.36 2.63 61 3.29 82 3.28 82 2.60 3.46 77 3.19 66 3.63 78 1.30 3.32 80 2.80 72 3.28 79 2.80 3.11 82 3.10 71 3.66 84 2.87 3.71 97 3.81 87 3.90 75 4.20 4.22 96 4.47 90 4.33 82 3.68 3.50 92 3.59 76 3.80 79 3.40 ра2 ра = - ( )2; x = 1.6; y= 1. n n рx ax p y ay раxа y - n r = ; r = 0.92.





n x y 1 – rmr = ;

n – В том случае, если взаимосвязь между факторами выражается не линейной, а другой зависимостью, то рассчитывается не коэффициент корреляции, корреляционное отношение.

x/y2 y/x x/y = ; y/x = ;

x y Критерий достоверности определяется в основном по критерию Стьюдента:

m r 1. tr = ; при n › 100;

r r 2. tr = n – 2; при n ‹ 100.

1- r Таблица 3.

Первичная матрица спопарным распределением частот встречаемости признаков 0.6 1.1 1.6 2.1 2.6 3.1 3.6 4.1 py pxy ax - - - - - - - - p y ay py 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 ay А -5 -4 -3 -2 -1 0 +1 +21-30 - 1 1 2 -10 50 -31-40 - 0 0 0 41-50 - 1 1 2 -6 18 -51-60 - 0 0 0 61-70 - 3 1 4 -4 4 -71-80 0 1 4 5 10 0 0 81-90 1 6 4 4 14 14 14 91-100 2 2 2 4 8 16 рx 1 1 1 1 4 11 11 6 36 +2 102 +рx ax -5 -4 -3 -2 -4 0 11 12 +рx ax2 25 16 9 4 4 0 11 24 рx y ay -5 -4 -3 -2 -3 5 8 8 +Множественная корреляция показывает совокупное влияние группы признаков на изучаемый признак.

r АВ 2 + r АС2 - r АВ r АС r ВС r А.ВС= ;

1 - r ВСЕсли r А.ВС ‹ 0.3, то один из факторов нужно убрать.

Задание 1. Какова взаимосвязь между влажностью (%) и численностью злаковых мух, обитающих на пойменных лугах р.Усманка Достоверны ли Ваши выводы Н (%): 72 74 74 76 76 76 78 78 78 80 82 n(экз.): 12 13 18 11 19 17 21 18 16 12 15 Задание 2. Какова взаимосвязь между температурой (оС) и относительной влажностью (%) в условиях мезофильных биотопов Достоверность выводов Т (оС): 16.2 16.8 16.9 17.2 17.6 18.2 18.4 18.6 19.0 19.4 19.6 19.Н (%): 70 72 70 72 74 76 74 72 78 76 78 74.

Тема 5. Основы регрессионного анализа Занятие 6. Метод регрессионного анализа и условия его применения в зоологии Коэффициент корреляции показывает степень связи и ее направление, но не может показать закономерность, по которой одна величина изменяется относительно другой.

Регрессионный анализ дает возможность показать, насколько изменяется одна величина при изменении другой на единицу измерения, т.е.

устанавливает закономерность сопряженного изменения двух признаков.

Главный показатель регрессионного анализа – коэффициентрегрессии - R x/y:

x y R x/y= r ; R y/x = r.

y x При графическом изображении регрессионной кривой R x/y соответствует tg угла наклона регрессионной кривой.

Уравнение регрессионной кривой для линейной зависимости:

y – ў = b(x – x), где ў и x – средние по ряду.

Уравнение регрессионной кривой для нелинейной зависимости:

y – ў = f (x – x), где функциональная зависимость может быть любой – log, ex, cos, df и др.

Регрессия в биологии используется:

1) при установлении зависимости между двумя переменными факторами;

2) для анализа материала, включающего эксперимент и его экстраполяцию на природные условия;

3) для анализа качественных факторов, которые выражаются в долях:

P P х 100% P (1- P) M = ; M = ; = P (1- P); mр= ;

n n n P – доля признака; n – общая выборка.

Задание 1. Какова взаимосвязь между изменениями температуры и численностью двукрылых мезофильных биотопов в пределах выборки и как она будет меняться, если tоC упадетдо 10оC T(оC): 16.2 16.8 17.2 17.4 17.8 18.0 18.2 18.4 18.6 18.8 19.0 19.n (экз.): 10 12 12 16 24 27 25 23 21 24 18 Тема 6. Дисперсионный анализ Занятие 7. Основы однофакторного дисперсионного анализа Дисперсионный анализ:

- позволяет установить закономерности пространственного и временного распределения факторов во всей их динамике и разнообразии;

- независит от величины выборки;

- признаки в дисперсионном анализе могут быть количественные и качественные, могут быть вероятностные (случайная дисперсия).

Дисперсионный анализ позволяет выявить статистическое влияние одного или многих факторов на результативный признак путем их относительной роли в общей изменчивости изучаемого признака.

В основе дисперсионного анализа лежит представление об общей вариации признаков, которую можно разложить на составные части, отражающие влияние конкретных факторов учтенных и неисследованных, т.е.

провести сравнение вариабельности изучаемого фактора по отношению к случайному.

Дисперсия может быть определена как сумма квадратов отклонений отдельных вариантот средней арифметической всего комплекса.

M – средняя арифметическая по всему вариационному ряду;

Mx – средняя арифметическая частная ( по фактору);

M z – средняя арифметическая случайных факторов.

M = Mx i … n + M z;

Cy = (V- M)2 = Dy2 = y2; где: Cy - общая дисперсия;

Cx = nx(Mx - M)2 = nx Dx 2 = x2 ; где: Cx – частная (факториальная) дисперсия;

Cz = (V- Mx)2 = Dz 2 = z2 ; где: Cz – случайная дисперсия.

Cy = Cx + Cz.

df – число степеней свободы - определяется числом условий вариационного ряда. Для факториальной дисперсии df равно числу классов: df= r –1; df 2= N-r.

Cx Cz x2 = ---------; z2 = --------;

r - 1 N – r где r - число классов; N - весь комплекс.

Cx Cy x2 = ----- ; z 2 = ----- ; x2 + z 2 =1.

Cy Cz Достоверность в этом случае определяется по критерию Фишера (F):

xF = ------; Если F › Fst, то полученные данные достоверны.

zЗанятие 8. Дисперсионный однофакторный анализ для количественных факторов При однофакторном дисперсионном учитывается действие на изучаемый комплексодного признака (фактора А).

Pages:     || 2 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.