Статистические методы применяются при установлении взаимосвязей между заболеваемостью и условиями труда, загрязнением, образом жизни и др.
В медико-экологических исследованиях отмечаются корреляционные связи, т.е. такие связи, при которых каждому значению одного признака может соответствовать не одно единственное значение, а некоторое количество значений другого признака, варьирующих в определенных пределах.
Существуют различные способы определения размера, силы корреляционной связи в изучаемой совокупности. Выбор способа зависит от числа наблюдений и от характера корреляционной связи. При большом числе наблюдений корреляционную связь рассчитывают при помощи корреляционной решетки. При небольшом числе наблюдений (до 30 пар чисел) выбор способа зависит от характера связи. Существуют прямолинейная, криволинейная и множественная корреляции.
При измерении связи между изучаемыми явлениями определяют форму и тесноту связи. По форме корреляционная связь может быть прямой и обратной. При прямой связи с увеличением факториального признака увеличивается результативный признак и наоборот, при обратной связи с увеличением факториального признака уменьшается результативный признак.
Мерой измерения тесноты корреляционной связи служит коэффициент корреляции. Значения коэффициента корреляции колеблются в пределах от 0 до 1 (знак «+» – прямая связь; знак «-» -обратная связь) и отражает степень связи по шкале:
· от 0 до 0,29 – слаба связь между явлениями;
· от 0,3 до 0,69 – средняя связь между явлениями;
· от 0,7 до 1,00 – сильная связь между явлениями.
Наиболее известен коэффициент корреляции Пирсона:
,
где Хi – конкретные значения одного признака, Уi – конкретные значения второго признака. ХСр , УСр – средние значения признаков; n – число пар наблюдений.
Оценка достоверности выборочных коэффициентов корреляции производится с помощью вычислений их ошибок или по специальной таблице.
При числе парных наблюдений n > 100 ошибка коэффициента корреляции определяется как
.
Коэффициент корреляции считается достоверным, если он превышает свою ошибку в 3 и более раза.
При числе парных наблюдений n < 100 ошибка коэффициента корреляции определяется следующим образом:
,
а ошибка достоверности производится с помощью t-критерия:
.
Полученную величину сравнивают с табличными значениями t0,5, t0,1 или t0,01 при числе степеней свободы n = n – 2. Если полученное значение t > t0,5 (t0,1; t0,01), коэффициент корреляции считается достоверным с вероятностью 95 %, (99; 99,95 %).
Коэффициенты корреляции позволяют измерить степень связи между признаками (явлениями), определить ее направление и форму. Представление же о том, как может в среднем измениться один варьирующий признак при изменении другого, связанного с ним признака, может дать только регрессионный анализ.
Коэффициент регрессии вычисляется по формуле
,
где КР – коэффициент регрессии; Rх/у – коэффициент корреляции; σу, σх – средние квадратические отклонения признаков.