n=»left»>1,093696
0,279662 |
-222,699 |
753,318 |
|||||
X2 |
357,9673 |
277,3733 |
1,290562 |
0,203169 |
-200,036 |
915,9704 |
|
X3 |
27,49624 |
8,026555 |
3,42566 |
0,001283 |
11,3489 |
43,64359 |
|
X4 |
12,57987 |
2,321953 |
5,417796 |
2,02E-06 |
7,908701 |
17,25104 |
|
X5 |
-0,29175 |
0,59462 |
-0,49064 |
0,625961 |
-1,48797 |
0,904474 |
|
Уравнение регрессии имеет вид:
Коэффициенты регрессии для первой, второй и пятой характеристик незначительны, а все остальное — значимо. В целом уравнение регрессии значимо, т.к. имеет наблюдаемое и критическое значение F-статистики 24,71426 и 2,412837 соответственно.
Исключим из рассмотрения пятый признак, т.к. он имеет наименьшую t-статистику.
Получим:
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
-15084,2 |
3040,095 |
-4,96175 |
9,18E-06 |
-21196,7 |
-8971,68 |
|
X1 |
213,9397 |
217,0855 |
0,985509 |
0,329316 |
-222,54 |
650,4193 |
|
X2 |
266,6284 |
203,9884 |
1,307076 |
0,197414 |
-143,518 |
676,7745 |
|
X3 |
27,6052 |
7,959771 |
3,468089 |
0,001116 |
11,601 |
43,60939 |
|
X4 |
11,86272 |
1,789851 |
6,62777 |
2,74E-08 |
8,263982 |
15,46145 |
|
Третий и четвертый коэффициенты остались значимыми, свободный коэффициент также значим, а коэффициенты первого и второго знаков незначимы. Поэтому сейчас мы исключим первую характеристику и проведем регрессионный анализ.
Получим следующие результаты:
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
-14834,1 |
3028,593 |
-4,89801 |
1,1E-05 |
-20920,3 |
-8747,9 |
|
X2 |
331,7044 |
192,9483 |
1,719136 |
0,091902 |
-56,0397 |
719,4485 |
|
X3 |
29,49835 |
7,722222 |
3,81993 |
0,000376 |
13,97996 |
45,01674 |
|
X4 |
11,76564 |
1,786613 |
6,585444 |
2,91E-08 |
8,175308 |
15,35598 |
|
Здесь, как и в предыдущем случае, значимы третий, четвертый и свободный коэффициенты, а второй остается незначительным. Поэтому исключим его и проведем регрессию для двух переменных.
Получим следующие данные:
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
-17484,6 |
2657,276 |
-6,57989 |
2,73E-08 |
-22821,9 |
-12147,3 |
|
X3 |
30,01782 |
7,865748 |
3,81627 |
0,000374 |
14,219 |
45,81664 |
|
X4 |
13,83999 |
1,343108 |
10,30445 |
5,8E-14 |
11,14228 |
16,5377 |
|
Уравнение регрессии имеет вид: . Все его коэффициенты значимы. Уравнение в целом также имеет значение, наблюдаемое значение статистики F составляет 58,44392, критическое значение — 3,18261.
Анализ показателей, представленных в следующей таблице, позволяет определить, что мы получили неплохую модель:
Регрессионная статистика |
||
Множественный R |
0,836898 |
|
R-квадрат |
0,700398 |
|
Нормированный R-квадрат |
0,688413 |
|
Стандартная ошибка |
2492,499 |
|
Наблюдения |
53 |
|
Таким образом, мы выяснили, что номинальная заработная плата напрямую зависит от обеспеченности поликлиниками и стоимости минимального набора продуктов питания.
- Для второй группы.
Рассмотрим матрицу корреляции:
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
||
Y |
1 |
||||||
X1 |
0,048861 |
1 |
|||||
X2 |
0,052009 |
-0,02928 |
1 |
||||
X3 |
-0,11771 |
-0,17614 |
-0,08315 |
1 |
|||
X4 |
0,129811 |
-0,32717 |
-0,06329 |
0,705394 |
1 |
||
X5 |
0,558342 |
0,290804 |
0,102868 |
-0,04154 |
0,277456 |
1 |
|
Результативный признак имеет слабую связь с признаками. Наибольшая из них — с пятым признаком.
Оценим значимость коэффициентов регрессии:
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
14441,35 |
5084,58 |
2,840225 |
0,008833 |
3969,462 |
24913,24 |
|
X1 |
-513,815 |
687,7936 |
-0,74705 |
0,462004 |
-1930,35 |
902,7228 |
|
X2 |
-2,91524 |
20,02414 |
-0,14559 |
0,885415 |
-44,1557 |
38,32524 |
|
X3 |
-10,287 |
21,92031 |
-0,46929 |
0,642928 |
-55,4327 |
34,85871 |
|
X4 |
-0,02463 |
2,949582 |
-0,00835 |
0,993404 |
-6,09941 |
6,05015 |
|
X5 |
5,597088 |
1,944358 |
2,87863 |
0,008067 |
1,592607 |
9,601569 |
|
Значимы только пятый и свободный коэффициент, а все остальное не имеет значения. Критическое значение F-статистики для этой модели (2,602987) больше наблюдаемого значения (2,575728), откуда следует, что уравнение статистически незначимо.
Удалим из рассмотрения регрессор, имеющий наименьшую t-статистику (X 4 ) и проведем регрессию снова:
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
14438,93 |
4977,712 |
2,900715 |
0,007479 |
4207,092 |
24670,76 |
|
X1 |
-511,011 |
588,6295 |
-0,86814 |
0,393262 |
-1720,96 |
698,9338 |
|
X2 |
-2,8975 |
19,52441 |
-0,1484 |
0,883169 |
-43,0305 |
37,23549 |
|
X3 |
-10,4257 |
14,03353 |
-0,74291 |
0,464196 |
-39,272 |
18,42068 |
|
X5 |
5,587821 |
1,565489 |
3,569378 |
0,001422 |
2,369913 |
8,805729 |
|
Пятый и свободный коэффициенты остались значимыми, все остальные также были незначительными. Поэтому удалим второй признак и снова проведем регрессию:
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
14326,41 |
4829,714 |
2,966306 |
0,006239 |
4416,656 |
24236,17 |
|
X1 |
-504,267 |
576,1458 |
-0,87524 |
0,389162 |
-1686,42 |
677,8865 |
|
X3 |
-10,2349 |
13,71914 |
-0,74603 |
0,462094 |
-38,3843 |
17,91441 |
|
X5 |
5,560437 |
1,526162 |
3,643413 |
0,001128 |
2,429012 |
8,691862 |
|
Как и в предыдущих случаях, значимыми коэффициентами являются пятый и свободный, первый и третий коэффициенты остаются незначимыми. Удалим третий признак:
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
11011,04 |
1876,269 |
5,868584 |
2,61E-06 |
7167,678 |
14854,4 |
|
X1 |
-430,5 |
563,085 |
-0,76454 |
0,450943 |
-1583,93 |
722,9276 |
|
X5 |
5,548735 |
1,513949 |
3,665075 |
0,001024 |
2,447552 |
8,649918 |
|
Получили аналогичные с предыдущими результаты. Удалим первый признак и построим парную регрессию:
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
9889,118 |
1160,771 |
8,519443 |
2,19E-09 |
7515,076 |
12263,16 |
|
X5 |
5,212138 |
1,438106 |
3,624308 |
0,001098 |
2,270881 |
8,153395 |
|
Получили уравнение регрессии — — у которого все коэффициенты значимы, и само уравнение также является значимым, поскольку наблюдаемое значение (13,13561) больше критического (4,182964).
Таким образом, установлено, что для регионов второй группы характерна прямая зависимость номинальной заработной платы от объема инвестиций в основной капитал.
Сравним полученные результаты с результатами регрессионного анализа по исходным характеристикам, где была получена зависимость от операций и вложений в основной капитал. Первая группа регионов также имеет зависимость от заработной платы от предоставления поликлиник, но также от стоимости питания и не зависит от вложений в основной капитал. А в регионах второй группы зарплата зависит только от вложений в основной капитал и не зависит от количества поликлиник.
ЗАКЛЮЧЕНИЕ
В ходе этой работы все поставленные задачи были выполнены. А именно, с помощью статистических и эконометрических методов была изучена совокупность показателей по пяти признакам, собранных по 84 регионам РФ.
Так, с помощью регрессионного анализа были построены линейная и нелинейная (логарифмическая) модели, которые показали прямую зависимость номинальной заработной платы от обеспеченности амбулаторно-поликлиническими учреждениями и объема инвестиций в основной капитал.
В результате компонентного анализа были выделены 3 главные компоненты, которые объясняют 80,2% совокупной дисперсии и включают в себя следующие признаки:
Первая составляющая включает в себя предоставление поликлиник, стоимость минимального набора продуктов питания в субъектах Российской Федерации и объем инвестиций в основной капитал.
Вторая компонента включает ввод в действие жилых домов.
Третий компонент — выбросы загрязняющих веществ в атмосферу от стационарных источников.
Факторный анализ позволил выделить 2 фактора, объясняющих 60,4% общей дисперсии признака. Эти факторы включают в себя следующие компоненты.
первый фактор включает стоимость минимального набора продуктов питания и обеспеченность амбулаторно-поликлиническими учреждениями. Второй фактор — это объем инвестиций в основной капитал и ввод жилых домов.
Все методы кластерного анализа дали точно такие же результаты разбиения. Т.е. обучающая выборка из 20 регионов была разбита на 2 группы, в одну из которых входят 19 регионов, а другую образует 1 регион — Ненецкий АО. Согласно проверке гипотезы, математические ожидания ввода в действие жилых домов, выбросов в атмосферу загрязняющих веществ, стоимости минимального набора продуктов питания и объема инвестиций в основной капитал в двух кластерах различны, а математическое ожидание обеспеченности амбулаторно-поликлиническими учреждениями одинаковое в первом и во втором кластерах.
В результате дискриминантного анализа была построена функция, позволяющая отнести объект к одному из двух кластеров и все регионы разбиты на 2 группы. Таким образом, в первую группу вошли 53 региона, а во вторую — 31 регион.
Для основных компонентов, факторов и каждого кластера был проведен регрессионный анализ, который позволил определить зависимость номинальной заработной платы от соответствующих характеристик. Результаты аналогичны регрессионному анализу исходных характеристик с небольшими отличиями.
СПИСОК ЛИТЕРАТУРЫ
1. Айвазян С.А., Мхитарян В.В. Прикладная статистика и основы эконометрики. — М.: ЮНИТИ, 1998. — 1006 с.
2. Бородич С.А. Вводный курс эконометрики: Учебное пособие — Мн.: БГУ, 2000. — 354 с.
3. Доугерти Кристофер. Введение в эконометрику. Пер. с англ. — М.: ИНФРА-М, 1999. — XIV, 402 с.
4. Иллюстрированный самоучитель по SPSS.
5. Кремер Н.Ш., Путко Б. А. Эконометрика: Учебник для вузов/ Под ред. проф. Н. Ш. Кремера. — М.: ЮНИТИ-ДАНА, 2005. — 311 с.
6. Эконометрика: Учебник/ Под ред. И. И. Елисеевой. — М.: Финансы и статистика, 2004. — 344 с.
7. Электронный учебник программы «Statistica».
8. Соловьев В.И., Калинина В.Н. Компьютерный практикум по прикладной статистике. Учебное пособие для вузов. — М.: РИПО ИГУМО, 2005. — 104 с.
9. Учебник по дисциплине «Эконометрика»/ Н.П. Тихомиров, Е.Ю. Дорохина. — М.: Изд-во Рос. экон. акад., 2002. — 640 с.
10. Шалабанов А.К., Роганов Д.А. Эконометрика. — Казань. — 2004. 198 с.
……….. Страницы: | 2 | 3 | 4 | [5] |