Прогноз заработной платы

Задание № 1

Вариант № 1

По данным таблицы 1.1 требуется:

1. Для характеристики зависимости рассчитать параметры следующих функций:

а) линейной;

б) степенной;

в) показательной;

г) равносторонней гиперболы.

. Оценить каждую модель через среднюю ошибку аппроксимации и F-критерий Фишера.

Таблица 1.1

Номер региона

Расходы на покупку продовольственных товаров в общих расходах, %, Y

Среднедневная заработная плата одного работающего, руб., X

1

2

3

1

49,1

61,1

2

48,6

60,8

3

50,1

60,18

4

52,2

59,2

5

53,6

58,1

6

58,1

55,2

7

69,1

49,1

Решение:

а)

В соответствии с методом наименьших квадратов уравнение линейной регрессии имеет вид:

,

где

- параметры уравнения парной линейной регрессии.

При этом

-

эмпирический корреляционный момент случайных величин

среднее квадратическое отклонение случайной величины ,

дисперсия случайной величины ,

выборочное среднее значение случайной величины ,

выборочное среднее значение случайной величины ,

- выборочное среднее значение случайной величины ,

- выборочное среднее значение случайной величины ,

- объем выборки.

В нашем случае . Вычислим все необходимые суммы. Результаты расчетов представим в виде таблицы:

Таблица 1.2

Номер региона

1

2

3

4

5

6

1

61,1

49,1

3000,01

3733,21

2410,81

1

2

3

4

5

6

2

60,8

48,6

2954,88

3696,64

2361,96

3

60,18

50,1

3015,018

3621,6324

2510,01

4

59,2

52,2

3090,24

3504,64

2724,84

5

58,1

53,6

3114,16

3375,61

2872,96

6

55,2

58,1

3207,12

3047,04

3375,61

7

49,1

69,1

3392,81

2410,81

4774,81

Итого403,68380,821774,23823389,582421031

Среднее 57,668654,43110,60543341,36893004,4286

Получаем:

Тогда

Параметры линейного регрессионного уравнения:

Следовательно, уравнение линейной регрессии имеет вид:

Значит с увеличением на 1 уменьшается в среднем на 1,691.

Таким образом, с увеличением среднедневной заработной платы работающего на 1 руб. доля расходов на покупку продовольственных товаров (в общих расходах) снижается в среднем на 1,691 %.

Найдем линейный коэффициент парной корреляции , являющийся мерой тесноты связи между переменными и . Для этого воспользуемся формулой:

где

Итак,

Значит линейный коэффициент парной корреляции:

Коэффициент корреляции характеризует зависимость от и меняется от -1 до 1.

По коэффициенту корреляции можно сделать вывод, что линейная связь между и обратная (так как ) и весьма сильная, так как

Коэффициент детерминации позволяет сделать вывод о том, что линейное уравнение вполне адекватно описывает зависимость между и (вариация на 99,7 % объясняется влиянием показателя ).

Точность модели характеризуется величиной отклонения расчетных значений от фактических. Средняя относительная ошибка аппроксимации - среднее отклонение расчетных значений от фактических, определяется по формуле:

где

n - объем выборки,

значение регрессионной функции.

Составим расчетную таблицу:

Таблица 1.3

Номер региона

1

2

3

4

5

6

7

1

61,1

49,1

48,5799

0,5201

0,010592668

0,010592668

2

60,8

48,6

49,0872

-0,4872

-0,01002469

0,01002469

3

60,18

50,1

50,13562

-0,03562

-0,00071098

0,00071098

4

59,2

52,2

51,7928

0,4072

0,007800766

0,007800766

5

58,1

53,6

53,6529

-0,0529

-0,00098694

0,00098694

6

55,2

58,1

58,5568

-0,4568

-0,00786231

0,00786231

7

49,1

69,1

68,8719

0,2281

0,003301013

0,003301013

Итого403,68380,8380,677120,122880,0021095310,041279363

В нашем случае

Таким образом, в среднем расчетные значения линейной модели

отклоняются от фактических на 0,59 %.

Проверим значимость с доверительной вероятностью (то есть на уровне значимости ) с помощью критерия Фишера.

Наблюдаемое (фактическое) значение критерия Фишера определяется как

Критическое значение критерия Фишера определяется как

по таблице критических точек распределения Фишера - Снедекора, где

число степеней свободы большей дисперсии,

число степеней свободы меньшей дисперсии

( число факторных переменных, определяющих модель).

При гипотеза об отсутствии линейной связи (то есть о том, что ) отклоняется, и соответственно коэффициент парной корреляции является значимым.

При гипотеза об отсутствии связи линейной верна, и соответственно коэффициент парной корреляции является незначимым.

В нашем случае

Оказалось, что , следовательно, гипотеза об отсутствии линейной связи неверна, и соответственно коэффициент парной корреляции

является значимым.

Таким образом, найденное линейное уравнение в целом довольно точно описывает зависимость между среднедневной заработной платой работающего и долей расходов на покупку продовольственных товаров (в общих расходах).

б)

Найдем уравнение степенной регрессии:

Прологарифмируем обе части уравнения

После замены переменных получим линейную модель , то есть .

В соответствии с методом наименьших квадратов параметры уравнения линейной регрессии определим по формулам:

Вычислим все необходимые суммы. Результаты расчетов представим в виде таблицы:

Таблица 1.4

Номер региона

1

2

3

4

5

6

7

1

61,1

49,1

4,112511866

3,893859035

16,01354149

16,91275385

2

60,8

48,6

4,107589789

3,883623531

15,95233236

16,87229387

3

60,18

50,1

4,097340071

3,914021008

16,03707512

16,78819566

4

59,2

52,2

4,080921542

3,955082495

16,14038135

16,65392063

5

58,1

53,6

4,062165664

3,981549068

16,17371191

16,50118988

6

55,2

58,1

4,010962953

4,062165664

16,29319599

16,08782381

7

49,1

69,1

3,893859035

4,235554731

16,49265306

15,16213818

Итого403,68380,828,3653509227,92585553113,1028913114,9783159