Линейная зависимость – наиболее часто используемая форма связи между двумя коррелируемыми признаками и выражается при парной корреляции уравнением прямой:
.
Гипотеза именно о линейной зависимости между х и у выдвигается в том случае, если результативный и факторный признаки возрастают (или убывают) одинаково, примерно в арифметической прогрессии.
Параметры а0 и а1 отыскиваются, решив систему нормальных уравнений МНК для линейного уравнения регрессии:
.
Для решения этой системы применяется способ определителей 2-го порядка:
;
.
Параметр а1, т.е. коэффициент при х в уравнении линейной регрессии, называется коэффициентом регрессии. Он показывает, насколько (в абсолютном выражении) изменяется значение результативного признака у при изменении факторного признака х на единицу.
Рассмотрим расчет параметров уравнения регрессии между стоимостью основных фондов х и валовым выпуском продукции у.
Исходные данные и расчет необходимых сумм показан в табл. 8.1.
Таблица 8.1
Расчетная таблица для определения параметров уравнения регрессии
Номер п/п |
Основные фонды, млн. р., х |
Валовой выпуск продукции, млн. р., у |
х2 |
ху |
1 2 3 4 5 6 7 8 9 10 |
12 16 25 38 43 55 60 80 91 100 |
28 40 38 65 80 101 95 125 183 245 |
144 256 625 1444 1849 3025 3600 6400 8281 10000 |
336 640 950 2470 3440 5555 5700 10000 16653 24500 |
∑ |
520 |
1000 |
35624 |
70244 |
Предположим, что зависимость между х и у линейная, т.е. .
Параметры а0 и а1 этого уравнения найдем, решив систему нормальных уравнений, подставив в нее необходимые суммы, рассчитанные в табл. 8.1.
Получаем:
.
Определяем значение а1 и а0 по формулам:
,
отсюда искомое уравнение регрессии у по х будет:
.
Коэффициент регрессии а1 = 2,12, он показывает, что при увеличении стоимости основных фондов предприятий на 1 млн. р., валовой выпуск продукции увеличится на 2,12 млн. р.
Прежде чем проводить дальнейший анализ, необходимо оценить точность уравнения регрессии. Для этого вычисляются значения t – критерия Стьюдента.
Для проверки типичности параметров уравнения регрессии рассчитывается фактическое значение t – критерия по формулам:
для параметра а0 ;
для параметра а1 .
Остаточная дисперсия исчисляется по формуле
,
где — выровненные значения ух.
.
Значения фактических и сравниваются с критическим tк, который получают по таблицам Стьюдента с учетом принятого уровня значимости и ,
;
где п – число наблюдений,
к – число параметров уравнения.
Если , то вычисленные параметры уравнения признаются типичными.