среда, 13 ноября 2024 г.

КОЛИЧЕСТВЕННЫЕ (СТАТИСТИЧЕСКИЕ) МЕТОДЫ в экологии растений и в геоботанике

 

Геоботанические исследования уже давно перестали быть только описательными. Чтобы избежать субъективности в оценке существующих связей в строении растительного покрова, для сравнения фитоценозов друг с другом и подтверждения выявляемых закономерностей проводится массовый сбор статистического материала, который в дальнейшем сопровождается количественной обработкой полученных данных. Ниже представлены алгоритмы вычислений, многократно апробированных, доступных и понятных в интерпретации количественных методов, применяемых геоботаниками.

 Процесс применения количественных методов включает в себя следующие этапы:

  • — четкую формулировку целей и задач, подбор методов их реализации и планирование исследования;
  • — сбор статистических данных;
  • — статистическую обработку собранных данных;
  • — оценку полученных результатов.

Обратим особое внимание на сбор статистических данных. Геоботаники при сборе материалов прибегают к методу выборочного исследования, когда результаты, полученные лишь для небольшой группы объектов — выборки, экстраполируются на всю генеральную совокупность (все объекты). Задача статистической обработки состоит в том, чтобы на основании исследования выборки сделать правильные выводы относительно всей генеральной совокупности. При этом выборка должна соответствовать ряду условий. Прежде всего необходимо, чтобы выборка была достаточного объема и была репрезентативной, т.е. в ней должны быть представлены разные варианты генеральной совокупности с сохранением количественных соотношений между ними. Например, при характеристике растительности каждый ее элемент должен быть представлен числом описаний, пропорциональным той площади, которую он занимает в природе в рамках масштаба исследования. Следующее требование: совокупность, из которой берется выборка, должна быть качественно однородной. Необходимо, чтобы эта совокупность представляла собой что-то определенное: один фитоценоз, одну ассоциацию, один массив леса.

Что касается оценки полученных результатов, то каждый результат должен сопровождаться эколого-биологической трактовкой. Для этого необходимо как можно больше знать о биологической сущности исследуемых объектов и иметь четкое представление о том, что может дать применяемый количественный метод.

В ходе работы стоит придерживаться следующих правил: 1) прежде чем собирать материал, следует продумать методы его обработки; 2) необходимо разделять понятия «правильность» и «точность» измерений. Ни одно измерение не может быть сделано абсолютно точно (в геоботанических исследованиях это и не нужно).

Полезно помнить, что о точности результатов судят по их относительной ошибке; точность вычислений следует сообразовывать с точностью исходных данных, а последние — с практической необходимостью; надо избегать написания лишних знаков после запятой; важно проводить регулярные проверки при вводе данных и проведении вычислений.

ОСНОВНЫЕ СТАТИСТИЧЕСКИЕ ПОКАЗАТЕЛИ

Основные (обобщающие) статистические показатели (или центральные тенденции) дают возможность получить точные и лаконичные количественные характеристики ряда данных. К ним относятся различные средние величины: средняя арифметическая, мода, медиана и др.

Наиболее употребительный обобщающий показатель — средняя арифметическая  ), иногда ее обозначают М:

где Xi — отдельная варианта (конкретное значение признака для /-го описания или индивида), п — объем выборки (число вариант).

Допустим, вид отмечен в 10 описаниях с проективным покрытием в 1% и в двух описаниях с покрытием 50%. Тогда взвешенная средняя с учетом частот встречаемости: (1 • 10 + 50-2): 12 = 9.16.

При нормальном распределении параметров можно оценить достоверность различия средних арифметических двух выборок. Напомним, что для нормального распределения характерна симметричная колоколообразная двускатная кривая распределения частот (рис. 25, 7), в отличие от других типов распределений (рис. 25, 1-6).

Примеры кривых теоретического случайного распределения

Рис. 25. Примеры кривых теоретического случайного распределения:

1-6 — различные типы распределений; 7 — нормальное распределение. По оси абсцисс — значения признака; по оси ординат — частота встречаемости.

Хотя у геоботанических объектов достаточно редко встречается нормальное распределение параметров, исследователи обычно не проводят его проверку. На малых выборках определить характер распределений вообще невозможно. Впрочем, статистические методы могут быть использованы при любом типе распределения и при малых выборках. Надежность результатов в этом случае подтверждается повторяемостью результатов в других выборках из той же генеральной совокупности.

Иногда при геоботанических исследованиях в качестве обобщающих показателей используются мода и медиана. Мода (Мо) — наиболее часто встречающееся (типичное) значение изучаемого признака. Например, мода набора чисел 1,2,2,3,3, 3, 3, 4, 4, 5, 5, 6, 7 и 10 — это 3. Эта разновидность средней отличается независимостью от крайних значений выборки. Мода может быть не одна или вообще отсутствовать. Наиболее простой способ определения моды — графический: на кривых распределения ей соответствует «пик частоты» встречаемости. Многовершинность кривой свидетельствует о неоднородности выборки и наличии неких группировок в ее пределах в результате: смешения разных возрастных групп, неравномерности распределения в пространстве и т. д. Следует также учитывать, что предлагаемый способ для нахождения моды весьма приближенный и что для малых выборок мода не определяется.

Медиана (Me) — это число в середине ранжированного (расположенного в порядке увеличения) набора чисел: половина чисел имеют значения большие, чем медиана, а половина чисел — меньшие. При нечетном количестве элементов выборки медиана соответствует центральному числу, при четном — среднему от суммы двух центральных чисел. Например, медианой для ряда 2, 4, 5, 7, 8 будет 5; для ряда 2, 3, 3, 5, 7, 10 — 4. При нормальном распределении набора чисел все три значения обобщающих показателей (средней арифметической, моды и медианы) будут совпадать, при несимметричном — они могут быть разными.

Уровень варьирования (рассеивания) данных относительно средней оценивается с учетом лимитов, размаха вариации, стандартного отклонения, дисперсии и коэффициента вариации.

Первым и простейшим показателем степени варьирования служит оценка предельных значений признака — лимитов (Нт): минимальных (хмин.) и максимальных (Хмакс.) обнаруженных значений. Разница между предельными значениями обозначается как размах вариации (R):

Чем больше размах вариации, тем выше уровень варьирования. Но, к сожалению, этот показатель учитывает только крайние значения, а они могут достаточно сильно отличаться от среднего значения, причем иногда достаточно случайным образом.

Для оценки варьирования всей выборки используются показатели, учитывающие отклонение каждого варианта от среднего значения.

Среднеквадратическое, или стандартное отклонение (о) — мера отклонения отдельных данных от выборочной средней арифметической в абсолютных единицах:


Дисперсия (о2) — мера рассеяния значений относительно средней арифметической .

Соответственно, чем больше дисперсия, или стандартное отклонение, тем сильнее отличаются отдельные данные от среднего значения и тем больше изменчивость признака.

При нормальном распределении параметров в диапазон х±а попадает около 68% наблюдений, а 99.7% всех наблюдений (т. е. практически вся выборка) укладывается в пределах х±Ъо.

Коэффициент вариации (V) — это относительный показатель изменчивости, равный отношению среднеквадратического отклонения к средней арифметической данной выборки. Он выражается в долях от единицы или в процентах:

где о — стандартное отклонение, х — среднее арифметическое.

Использование коэффициента вариации удобно, так как позволяет сравнивать между собой разные выборки, оценивая степень их варьирования. При нормальном распределении параметров х - 3 (7V = 33%.

Приведем пример расчетов основных статистических показателей для сравнения двух выборок, при этом необходимо оговориться, что для простоты расчетов учтена только часть объема выборки, всего 10 элементов.

Пример. Сравнение основных статистических показателей проективного покрытия брусники в сосняке и ельнике чернично-зеленомошных (табл. 12). Варианты по проективному покрытию брусники в сосняке (1): 15, 10, 10, 5, 10, 10, 10, 15, 5, 10;

в ельнике (2): 0, 0, 10, 10, 5, 5, 5, 10, 10, 10.

Таблица 12. Статистические показатели для проективного покрытия брусники в двух растительных сообществах

Сообщество

Показатели

X±Sx

Ыт

Мо

Me

о

V, %

Сосняк

10± 1.1

5-15

10

10

3.3

33

Ельник

6.5 ± 1.3

0-10

10

7.5

4.1

63

Сначала вычислим средние арифметические для обеих выборок:

Затем определим лимиты, моду и медиану (последнюю рассчитываем, ранжируя в порядке увеличения значения проективных покрытий). В сосняке распределение покрытия брусники близко к нормальному, поскольку значения средней арифметической, моды и медианы совпадают. В ельнике значения этих обобщающих показателей различны.

Для оценки степени варьирования покрытия брусники подсчитаем дисперсию 2), среднеквадратическое отклонение (о) и коэффициент вариации (V): 

По всем трем показателям уровень варьирования проективного покрытия брусники выше в ельнике, чем в сосняке.

Используя значения а, рассчитаем ошибки средних арифметических:

Выясним, различаются ли средние арифметические двух выборок, используя критерий Стьюдента (f):