Рефераты. Эконометрический анализ влияния экономических показателей на численность пользователей Интернета

    S.D. dependent var

19682933

S.E. of regression

2079463.

    Akaike info criterion

31.97751

Sum squared resid

5.45E+14

    Schwarz criterion

32.10854

Log likelihood

-2104.515

    F-statistic

2322.154

Durbin-Watson stat

2.087052

    Prob(F-statistic)

0.000000


 Видим, что незначительной переменной является ВВП, поэтому уберем его из регрессии. Все коэффициенты получились с ожидаемыми знаками, кроме величины сельского населения. Предполагалось, что это отрицательный фактор. Но так как его величина очень близка к 0, не будем обращать на это несовпадение внимания. К тому же его влияние незначительно.

Строим новую регрессию:


Dependent Variable: INTUSERS

Method: Least Squares

Date: 02/27/08   Time: 02:09

Sample(adjusted): 4 172

Included observations: 132

Excluded observations: 37 after adjusting endpoints

Variable

Coefficient

Std. Error

t-Statistic

Prob. 

C

-354918.2

249305.2

-1.423629

0.1570

GNI

618.1578

231.0229

2.675742

0.0084

PC

0.718812

0.014792

48.59489

0.0000

URBAN

0.090582

0.010473

8.649087

0.0000

RURAL

0.005475

0.005282

1.036557

0.3019

R-squared

0.989247

    Mean dependent var

5812423.

Adjusted R-squared

0.988909

    S.D. dependent var

19682933

S.E. of regression

2072923.

    Akaike info criterion

31.96396

Sum squared resid

5.46E+14

    Schwarz criterion

32.07316

Log likelihood

-2104.621

    F-statistic

2920.986

Durbin-Watson stat

2.087552

    Prob(F-statistic)

0.000000


Как видно из таблицы, показатель Adjusted R-squared увеличился с 0,988838 до 0,988909. Это значит, что регрессия улучшилась.

Кроме того, регрессор RURAL оказывает незначительное влияние на регрессант, поэтому его можно удалить и построить новую регрессию:


Dependent Variable: INTUSERS

Method: Least Squares

Date: 02/27/08   Time: 02:12

Sample(adjusted): 4 172

Included observations: 132

Excluded observations: 37 after adjusting endpoints

Variable

Coefficient

Std. Error

t-Statistic

Prob. 

C

-399859.8

245577.6

-1.628242

0.1059

GNI

630.0480

230.8051

2.729784

0.0072

PC

0.708903

0.011291

62.78241

0.0000

URBAN

0.100670

0.003869

26.01779

0.0000

R-squared

0.989156

    Mean dependent var

5812423.

Adjusted R-squared

0.988902

    S.D. dependent var

19682933

S.E. of regression

2073526.

    Akaike info criterion

31.95723

Sum squared resid

5.50E+14

    Schwarz criterion

32.04459

Log likelihood

-2105.177

    F-statistic

3892.026

Durbin-Watson stat

2.066310

    Prob(F-statistic)

0.000000


Adjusted R-squared незначительно, но уменьшился. А это значит, что модель стала хуже. Поэтому вернемся к предыдущей модели:


Estimation Command:

=====================

LS INTUSERS C  GNI PC  URBAN RURAL


Estimation Equation:

=====================

INTUSERS = C(1) + C(2)*GNI + C(3)*PC + C(4)*URBAN + C(5)*RURAL


Substituted Coefficients:

=====================

INTUSERS = -354918.2484 + 618.1577906*GNI + 0.7188117239*PC + 0.09058209539*URBAN + 0.005474726438*RURAL

Согласно статистике Durbin-Watson stat ( =2.087552, статистика близка к 2) автокорреляция в модели отсутствует.

Выполним тест на гетероскедастичность:


White Heteroskedasticity Test:

F-statistic

7.466570

    Probability

0.000000

Obs*R-squared

43.14884

    Probability

0.000001






Test Equation:

Dependent Variable: RESID^2

Method: Least Squares

Date: 02/27/08   Time: 02:18

Sample: 4 172

Included observations: 132

Excluded observations: 37

Variable

Coefficient

Std. Error

t-Statistic

Prob. 

C

-1.19E+12

1.87E+12

-0.639594

0.5236

GNI

2.10E+09

3.83E+09

0.548274

0.5845

GNI^2

-403321.1

1132324.

-0.356189

0.7223

PC

445574.9

228912.2

1.946488

0.0539

PC^2

-0.002393

0.000829

-2.885490

0.0046

RURAL

74276.26

84150.65

0.882658

0.3791

RURAL^2

-9.97E-05

0.000103

-0.965351

0.3363

URBAN

163878.1

87839.00

1.865665

0.0645

URBAN^2

-0.000216

0.000157

-1.372084

0.1725

R-squared

0.326885

    Mean dependent var

4.13E+12

Adjusted R-squared

0.283105

    S.D. dependent var

1.35E+13

S.E. of regression

1.14E+13

    Akaike info criterion

63.03441

Sum squared resid

1.60E+28

    Schwarz criterion

63.23096

Log likelihood

-4151.271

    F-statistic

7.466570

Durbin-Watson stat

1.436753

    Prob(F-statistic)

0.000000


В описываемой модели присутствует гетероскедастичность, т.к. вероятность ошибиться, отвергая гипотезу об отсутствии гетероскедастичности, практически ровна нулю. Но это можно объяснить тем, что  выборка большая по размеру и неоднородна по значениям. Если сократить объем данных, то получится избавиться от гетероскедастичности.

Проведем тест Вальда:

Здесь, в данном тесте нам нужно определить,  объясняют ли выбранные нами регрессоры регрессант лучше, чем константа. В тесте Вальда предположим все коэффициенты равными 0, т.е. C(1)=0, C(2)=0, C(3)=0, C(4)=0, C(5)=0. Получим, что:


Wald Test:

Equation: Untitled

Null Hypothesis:

C(1)=0


C(2)=0


C(3)=0


C(4)=0


C(5)=0

F-statistic

2544.353


Probability

0.000000

Chi-square

12721.76


Probability

0.000000


В результате данного теста, мы получили, что Probability равный 0.000000, т.е. вероятность ошибиться, отклонив гипотезу, что все коэффициенты объясняют регрессию хуже, чем константа ровна нулю, значит, объясняющие переменные хорошо объясняют зависимую.


Выводы:


1.                 Полученная модель позволяет дать ответ на вопрос о зависимости численности Интернет пользователей от экономических показателей;

2.                  Согласно этой модели, наибольшее влияние на число пользователей оказывают национальный доход на душу населения, степень урбанизации населения и количество персональных компьютеров;

3.                 Хотя выявлены определенные закономерности, определяющие численность пользователей Интернет, разброс  значений достаточно большой. На это указывает достаточно большая величина стандартного отклонения. Это обусловлено тем, что каждая страна уникальна. Население одной может  при высоком доходе совсем не тратить средства на электронные устройства и, соответственно, общение через Интернет, а люди другой – наоборот, покупают всевозможные новинки и жить не могут, если они не на пике популярности технологий. Всех этих факторов учесть невозможно,  но это и  не было моей задачей. Я искала общие закономерности, и мне их удалось найти. Это главное достижение моей работы.


Страницы: 1, 2



2012 © Все права защищены
При использовании материалов активная ссылка на источник обязательна.