Исследуя явления в самых различных областях, статистика сталкивается с зависимостями как между количественными, так и качественными показателями, признаками. Ее задача – обнаружить (выявить) такие зависимости и дать их количественную характеристику.
Среди взаимосвязанных признаков одни могут рассматриваться как определенные факторы, влияющие на изменение других – факторные признаки, а вторые – как следствие, результат влияния первых – результативные признаки.
Различают два вида взаимосвязи между отдельными признаками: функциональную и стохастическую (статистическую), частным случаем которой является корреляционная связь.
Связь между двумя переменными х и у называется функциональной, если определенному значению переменной х строго соответствует одно или несколько значений другой переменной у, и с изменением значения х значение у меняется строго определенно. Такие связи обычно встречаются в точных науках. Например, площадь квадрата равняется квадрату его сторон, т.е. S = a2. При увеличении стороны квадрата в 2 раза, его площадь увеличится в 4 раза. Такая связь проявляется постоянно для каждого единичного случая (квадрата) и носит название жестко детерминированной связи.
Там, где взаимодействует множество факторов, в том числе и случайных, выявить зависимости, рассматривая единичный случай, невозможно.
Предметом изучения статистики являются в основном стохастические и корреляционные связи. Слово «корреляция» (от английского correlation) означает соотношение, соответствие.
Связь, проявляющаяся при большом числе наблюдений в виде определенной зависимости между средним значением результативного признака и признаками-факторами, называется корреляционной. Если рассматривается связь средней величины результативного показателя у с одним признаком-фактором х, то корреляция называется парной, а если факторных признаков два и более (х1, х2,…, хп) – множественной.
По характеру изменений х и у в парной корреляции различают прямую и обратную связь.
При прямой зависимости значения обоих признаков изменяются в одном направлении, т.е. с увеличением значений х увеличивается и значение у и наоборот.
При обратной зависимости значения факторного и результативного признаков изменяются в разных направлениях.
Изучение корреляционных связей сводится в основном к решению следующих задач:
· выявление наличия (или отсутствия) корреляционной связи между изучаемыми признаками. Это решается на основе параллельного сопоставления значений х и у у п единиц совокупности, а также с помощью группировок и путем построения и анализа специальных корреляционных таблиц;
· измерение тесноты между двумя (и более) признаками с помощью специальных коэффициентов. Эта часть исследования называется корреляционным анализом;
· определение уравнения регрессии – математической модели, в которой среднее значение результативного признака у рассматривается как функция одной или нескольких переменных – факторных признаков. Эта часть исследования именуется регрессионным анализом.
Таким образом, общий термин «корреляционно-регрессионный анализ» подразумевает всестороннее исследование корреляционных связей.