Многомерные статистические методы и эконометрика

n=»left»>1,093696

0,279662

-222,699

753,318

X2

357,9673

277,3733

1,290562

0,203169

-200,036

915,9704

X3

27,49624

8,026555

3,42566

0,001283

11,3489

43,64359

X4

12,57987

2,321953

5,417796

2,02E-06

7,908701

17,25104

X5

-0,29175

0,59462

-0,49064

0,625961

-1,48797

0,904474

Уравнение регрессии имеет вид:

Коэффициенты регрессии для первой, второй и пятой характеристик незначительны, а все остальное — значимо. В целом уравнение регрессии значимо, т.к. имеет наблюдаемое и критическое значение F-статистики 24,71426 и 2,412837 соответственно.

Исключим из рассмотрения пятый признак, т.к. он имеет наименьшую t-статистику.

Получим:

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

-15084,2

3040,095

-4,96175

9,18E-06

-21196,7

-8971,68

X1

213,9397

217,0855

0,985509

0,329316

-222,54

650,4193

X2

266,6284

203,9884

1,307076

0,197414

-143,518

676,7745

X3

27,6052

7,959771

3,468089

0,001116

11,601

43,60939

X4

11,86272

1,789851

6,62777

2,74E-08

8,263982

15,46145

Третий и четвертый коэффициенты остались значимыми, свободный коэффициент также значим, а коэффициенты первого и второго знаков незначимы. Поэтому сейчас мы исключим первую характеристику и проведем регрессионный анализ.

Получим следующие результаты:

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

-14834,1

3028,593

-4,89801

1,1E-05

-20920,3

-8747,9

X2

331,7044

192,9483

1,719136

0,091902

-56,0397

719,4485

X3

29,49835

7,722222

3,81993

0,000376

13,97996

45,01674

X4

11,76564

1,786613

6,585444

2,91E-08

8,175308

15,35598

Здесь, как и в предыдущем случае, значимы третий, четвертый и свободный коэффициенты, а второй остается незначительным. Поэтому исключим его и проведем регрессию для двух переменных.

Получим следующие данные:

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

-17484,6

2657,276

-6,57989

2,73E-08

-22821,9

-12147,3

X3

30,01782

7,865748

3,81627

0,000374

14,219

45,81664

X4

13,83999

1,343108

10,30445

5,8E-14

11,14228

16,5377

Уравнение регрессии имеет вид: . Все его коэффициенты значимы. Уравнение в целом также имеет значение, наблюдаемое значение статистики F составляет 58,44392, критическое значение — 3,18261.

Анализ показателей, представленных в следующей таблице, позволяет определить, что мы получили неплохую модель:

Регрессионная статистика

Множественный R

0,836898

R-квадрат

0,700398

Нормированный R-квадрат

0,688413

Стандартная ошибка

2492,499

Наблюдения

53

Таким образом, мы выяснили, что номинальная заработная плата напрямую зависит от обеспеченности поликлиниками и стоимости минимального набора продуктов питания.

  • Для второй группы.

Рассмотрим матрицу корреляции:

Y

X1

X2

X3

X4

X5

Y

1

X1

0,048861

1

X2

0,052009

-0,02928

1

X3

-0,11771

-0,17614

-0,08315

1

X4

0,129811

-0,32717

-0,06329

0,705394

1

X5

0,558342

0,290804

0,102868

-0,04154

0,277456

1

Результативный признак имеет слабую связь с признаками. Наибольшая из них — с пятым признаком.

Оценим значимость коэффициентов регрессии:

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

14441,35

5084,58

2,840225

0,008833

3969,462

24913,24

X1

-513,815

687,7936

-0,74705

0,462004

-1930,35

902,7228

X2

-2,91524

20,02414

-0,14559

0,885415

-44,1557

38,32524

X3

-10,287

21,92031

-0,46929

0,642928

-55,4327

34,85871

X4

-0,02463

2,949582

-0,00835

0,993404

-6,09941

6,05015

X5

5,597088

1,944358

2,87863

0,008067

1,592607

9,601569

Значимы только пятый и свободный коэффициент, а все остальное не имеет значения. Критическое значение F-статистики для этой модели (2,602987) больше наблюдаемого значения (2,575728), откуда следует, что уравнение статистически незначимо.

Удалим из рассмотрения регрессор, имеющий наименьшую t-статистику (X 4 ) и проведем регрессию снова:

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

14438,93

4977,712

2,900715

0,007479

4207,092

24670,76

X1

-511,011

588,6295

-0,86814

0,393262

-1720,96

698,9338

X2

-2,8975

19,52441

-0,1484

0,883169

-43,0305

37,23549

X3

-10,4257

14,03353

-0,74291

0,464196

-39,272

18,42068

X5

5,587821

1,565489

3,569378

0,001422

2,369913

8,805729

Пятый и свободный коэффициенты остались значимыми, все остальные также были незначительными. Поэтому удалим второй признак и снова проведем регрессию:

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

14326,41

4829,714

2,966306

0,006239

4416,656

24236,17

X1

-504,267

576,1458

-0,87524

0,389162

-1686,42

677,8865

X3

-10,2349

13,71914

-0,74603

0,462094

-38,3843

17,91441

X5

5,560437

1,526162

3,643413

0,001128

2,429012

8,691862

Как и в предыдущих случаях, значимыми коэффициентами являются пятый и свободный, первый и третий коэффициенты остаются незначимыми. Удалим третий признак:

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

11011,04

1876,269

5,868584

2,61E-06

7167,678

14854,4

X1

-430,5

563,085

-0,76454

0,450943

-1583,93

722,9276

X5

5,548735

1,513949

3,665075

0,001024

2,447552

8,649918

Получили аналогичные с предыдущими результаты. Удалим первый признак и построим парную регрессию:

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

9889,118

1160,771

8,519443

2,19E-09

7515,076

12263,16

X5

5,212138

1,438106

3,624308

0,001098

2,270881

8,153395

Получили уравнение регрессии — — у которого все коэффициенты значимы, и само уравнение также является значимым, поскольку наблюдаемое значение (13,13561) больше критического (4,182964).

Таким образом, установлено, что для регионов второй группы характерна прямая зависимость номинальной заработной платы от объема инвестиций в основной капитал.

Сравним полученные результаты с результатами регрессионного анализа по исходным характеристикам, где была получена зависимость от операций и вложений в основной капитал. Первая группа регионов также имеет зависимость от заработной платы от предоставления поликлиник, но также от стоимости питания и не зависит от вложений в основной капитал. А в регионах второй группы зарплата зависит только от вложений в основной капитал и не зависит от количества поликлиник.

ЗАКЛЮЧЕНИЕ

В ходе этой работы все поставленные задачи были выполнены. А именно, с помощью статистических и эконометрических методов была изучена совокупность показателей по пяти признакам, собранных по 84 регионам РФ.

Так, с помощью регрессионного анализа были построены линейная и нелинейная (логарифмическая) модели, которые показали прямую зависимость номинальной заработной платы от обеспеченности амбулаторно-поликлиническими учреждениями и объема инвестиций в основной капитал.

В результате компонентного анализа были выделены 3 главные компоненты, которые объясняют 80,2% совокупной дисперсии и включают в себя следующие признаки:

Первая составляющая включает в себя предоставление поликлиник, стоимость минимального набора продуктов питания в субъектах Российской Федерации и объем инвестиций в основной капитал.

Вторая компонента включает ввод в действие жилых домов.

Третий компонент — выбросы загрязняющих веществ в атмосферу от стационарных источников.

Факторный анализ позволил выделить 2 фактора, объясняющих 60,4% общей дисперсии признака. Эти факторы включают в себя следующие компоненты.

первый фактор включает стоимость минимального набора продуктов питания и обеспеченность амбулаторно-поликлиническими учреждениями. Второй фактор — это объем инвестиций в основной капитал и ввод жилых домов.

Все методы кластерного анализа дали точно такие же результаты разбиения. Т.е. обучающая выборка из 20 регионов была разбита на 2 группы, в одну из которых входят 19 регионов, а другую образует 1 регион — Ненецкий АО. Согласно проверке гипотезы, математические ожидания ввода в действие жилых домов, выбросов в атмосферу загрязняющих веществ, стоимости минимального набора продуктов питания и объема инвестиций в основной капитал в двух кластерах различны, а математическое ожидание обеспеченности амбулаторно-поликлиническими учреждениями одинаковое в первом и во втором кластерах.

В результате дискриминантного анализа была построена функция, позволяющая отнести объект к одному из двух кластеров и все регионы разбиты на 2 группы. Таким образом, в первую группу вошли 53 региона, а во вторую — 31 регион.

Для основных компонентов, факторов и каждого кластера был проведен регрессионный анализ, который позволил определить зависимость номинальной заработной платы от соответствующих характеристик. Результаты аналогичны регрессионному анализу исходных характеристик с небольшими отличиями.

СПИСОК ЛИТЕРАТУРЫ

1. Айвазян С.А., Мхитарян В.В. Прикладная статистика и основы эконометрики. — М.: ЮНИТИ, 1998. — 1006 с.

2. Бородич С.А. Вводный курс эконометрики: Учебное пособие — Мн.: БГУ, 2000. — 354 с.

3. Доугерти Кристофер. Введение в эконометрику. Пер. с англ. — М.: ИНФРА-М, 1999. — XIV, 402 с.

4. Иллюстрированный самоучитель по SPSS.

5. Кремер Н.Ш., Путко Б. А. Эконометрика: Учебник для вузов/ Под ред. проф. Н. Ш. Кремера. — М.: ЮНИТИ-ДАНА, 2005. — 311 с.

6. Эконометрика: Учебник/ Под ред. И. И. Елисеевой. — М.: Финансы и статистика, 2004. — 344 с.

7. Электронный учебник программы «Statistica».

8. Соловьев В.И., Калинина В.Н. Компьютерный практикум по прикладной статистике. Учебное пособие для вузов. — М.: РИПО ИГУМО, 2005. — 104 с.

9. Учебник по дисциплине «Эконометрика»/ Н.П. Тихомиров, Е.Ю. Дорохина. — М.: Изд-во Рос. экон. акад., 2002. — 640 с.

10. Шалабанов А.К., Роганов Д.А. Эконометрика. — Казань. — 2004. 198 с.

……….. Страницы: | 2 | 3 | 4 | [5] |