8.3. Парная линейная регрессия

Линейная зависимость – наиболее часто используемая форма связи между двумя коррелируемыми признаками и выражается при парной корреляции уравнением прямой:

.

Гипотеза именно о линейной зависимости между х и у выдвигается в том случае, если результативный и факторный признаки возрастают (или убывают) одинаково, примерно в арифметической прогрессии.

Параметры а0 и а1 отыскиваются, решив систему нормальных уравнений МНК для линейного уравнения регрессии:

.

Для решения этой системы применяется способ определителей 2-го порядка:

;

.

Параметр а1, т.е. коэффициент при х в уравнении линейной регрессии, называется коэффициентом регрессии. Он показывает, насколько (в абсолютном выражении) изменяется значение результативного признака у при изменении факторного признака х на единицу.

Рассмотрим расчет параметров уравнения регрессии между стоимостью основных фондов х и валовым выпуском продукции у.

Исходные данные и расчет необходимых сумм показан в табл. 8.1.

Таблица 8.1

Расчетная  таблица для определения параметров уравнения регрессии

Номер п/п

Основные фонды, млн. р., х

Валовой выпуск продукции, млн. р., у

х2

ху

1

2

3

4

5

6

7

8

9

10

12

16

25

38

43

55

60

80

91

100

28

40

38

65

80

101

95

125

183

245

144

256

625

1444

1849

3025

3600

6400

8281

10000

336

640

950

2470

3440

5555

5700

10000

16653

24500

520

1000

35624

70244

Предположим, что зависимость между х и у линейная, т.е.


.

Параметры а0 и а1 этого уравнения найдем, решив систему нормальных уравнений, подставив в нее необходимые суммы, рассчитанные в табл. 8.1.

Получаем:

.

Определяем значение а1 и а0 по формулам:

,

отсюда искомое уравнение регрессии у по х будет:

.

Коэффициент регрессии а1 = 2,12, он показывает, что при увеличении стоимости основных фондов предприятий на 1 млн. р., валовой выпуск продукции увеличится на 2,12 млн. р.

Прежде чем проводить дальнейший анализ, необходимо оценить точность уравнения регрессии. Для этого вычисляются значения t – критерия Стьюдента.

Для проверки типичности параметров уравнения регрессии рассчитывается фактическое значение t – критерия по формулам:

для параметра а0    ;

для параметра а1    .

Остаточная дисперсия   исчисляется по формуле

,

где  — выровненные значения ух.

.

Значения фактических и сравниваются с критическим tк, который получают по таблицам Стьюдента с учетом принятого уровня значимости  и ,

;

где п – число наблюдений,

       к – число параметров уравнения.

Если , то вычисленные параметры уравнения признаются типичными.