Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade...

29
Análise da Regressão múltipla: MQO Assintótico Capítulo 5 do Wooldridge Capítulo 5 do Wooldridge

Transcript of Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade...

Page 1: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Análise da Regressão múltipla: MQO Assintótico

Capítulo 5 do WooldridgeCapítulo 5 do Wooldridge

Page 2: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Análise da Regressão múltipla: MQO Assintótico

y = β + β x + β x + . . . β x + uy = β0 + β1x1 + β2x2 + . . . βkxk + u

3. Propriedades assintóticasAntes, propriedades sobre amostras finitas de tamanho n

Page 3: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Inferência em grandes amostras

Lembre-se que sob as hipóteses do MLC, as distribuições amostrais são normais, o que nos permite derivar as distribuições t e F nos testes de hipóteses.

3

testes de hipóteses.Essa normalidade exata vem da hipótese de os erros terem distribuição normal.Essa hipótese de erros normais implica que a distribuição de y, dados x’s, também é normal.

Page 4: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Inferência em grandes amostras (cont.)

Observamos y e podemos identificar que existem muitos exemplos em que a normalidade não é verdadeira.Uma variável aleatória y que tenha distribuição normal deverá ter distribuição

4

distribuição normal deverá ter distribuição simétrica em torno de sua média.Qualquer variável assimétrica, como salários, detenções, poupança etc. não podem ser normais pois a normal é simétrica.

Page 5: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Inferência em grandes amostras (cont.)

Exemplo: Modelo que explica a taxa de participação nos planos de pensão dos EUA.

5

Variável dependente y: prateAnálise da variável dependente no gretl- Histograma - Estatísticas descritivas

Page 6: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Ver: estatísticas descritivas

Estatísticas Descritivas, usando as observações 1 - 1534para a variável 'prate' (1534 observações

válidas)

Média 87,363

6

Média 87,363 Mediana 95,700 Mínimo 3,0000 Máximo 100,00 Desvio padrão 16,717 C.V. 0,19135 Enviesamento -1,5196 Curtose Ex. 2,2584

Page 7: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Histograma de prate (variável, gráfico de frequência simples)

0.4

0.5

Fre

qu

ën

cia

re

lati

va

7 0

0.1

0.2

0.3

0 20 40 60 80 100

Fre

qu

ën

cia

re

lati

va

prate

Page 8: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Histograma de prate (variável, gráfico de frequência simples)

0.1

0.12

0.14prate

N(87,363 16,717)Estatística de teste para normalidade:

Qui-quadrado(2) = 1159,437 p-valor = 0,00000

8 0

0.02

0.04

0.06

0.08

0 20 40 60 80 100 120 140

De

nsid

ad

e

Page 9: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Inferência em grandes amostras (cont.)

A normalidade não é necessária para que MQO seja BLUE; ela é necessária apenas para inferência.No exemplo demonstrado, devemos

9

No exemplo demonstrado, devemos abandonar as estatísticas t para determinar quais variáveis são estatisticamente significantes???NÃO!!!

Page 10: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Teorema do Limite Central

Baseado no teorema do limite central,

podemos mostrar que os estimadores de MQO

são assintoticamente normais.

Ou seja, para amostras grandes, eles seguem

10

Ou seja, para amostras grandes, eles seguem

uma distribuição normal aproximada.

A normalidade assintótica implica que

P(Z<z)→Φ(z) quando n →∞, ou seja, que

P(Z<z) ≈ Φ(z)

Page 11: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Teorema do Limite Central

O teorema central do limite diz que a

média amostral padronizada de qualquer

população com média µ e variância σ2 é

assintoticamente ~N(0,1), ou:

11

assintoticamente ~N(0,1), ou:

( )1,0~ N

n

YZ

aY

σµ−

=

Page 12: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Normalidade assintótica

( ) ( )( )

,,0Normal ~ˆ (i)

Markov,-Gauss de hipóteses as Sob

22j

a

jj an σββ −

12

( )

( ) ( ) ( )1,0Normal ~ˆˆ (iii)

de econsistentestimador um é ˆ (ii)

ˆplim onde

22

212

a

jjj

ijj

ep

rna

βββ

σσ

= ∑−

Page 13: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Normalidade assintótica(cont.)

Como a distribuição t se aproxima da normal, dizemos que:

( ) ( )~ˆˆ −a

tep βββ

13

( ) ( ) 1~ˆˆ−−− kn

a

jjj tep βββ

Observe que, enquanto não precisamos assumir normalidade se a amostra for grande, ainda precisamos da hipótese de homocedasticidade e de média

condicional zero.

Page 14: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Como é feita a inferência??Os testes t e a construção dos intervalos de confiança são realizados exatamente damesma forma anterior, quandoconsiderávamos as hipóteses do ModeloLinear Clássico.

14

Linear Clássico.

( ) ( ) 1~ˆˆ−−− kn

a

jjj tep βββ

Page 15: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Como decidir se o seu tamanho de amostra é suficiente??

Se o tamanho da amostra é grande (pelo menos1500 observações, p.e.), isto é suficiente parausarmos o Teorema do limite central.Alguns econometristas acham que n = 30 é um tamanho satisfatório.

15

tamanho satisfatório.A qualidade da aproximação também dependedos graus de liberdade.Com mais variáveis independentes no modelo, um tamanho da amostra maior é usualmentenecessário para usar a aproximação t.

Page 16: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Outra estatística: estatística do multiplicador de Lagrange (LM)

Uma vez que estamos usando grandes amostras e a normalidade assintótica para inferência, podemos utilizar mais que as estatísticas t e F.A estatística do multiplicador de Lagrange ou estatística LM é um teste alternativo para as

16

A estatística do multiplicador de Lagrange ou estatística LM é um teste alternativo para as restrições múltiplas de exclusão.Também chamada de estatística de escore.A estatística LM também é chamada de estatística nR2.

Page 17: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Estatística LM (cont)Suponha que tenhamos o modelo

y = β0 + β1x1 + β2x2 + . . . βkxk + u

A hipótese nula seja:

17

A hipótese nula seja:H0: βk-q+1 = 0, ... , βk = 0

q restrições de exclusão no modelo

A estatística LM existe apenas a estimação do modelo restrito

Page 18: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Estatística LM (cont)

~~...

~~110 qkqk uxxy ++++= −−βββ

18

regressão. desta é onde ,

) variáveisas todasm (i.e., ,...,, em ~de regressão a faça e ,~ resíduos, os pegue Agora,

22

21

uu

k

RnRLM

exxxu

u

=

Page 19: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Estatística LM (cont)

Se as variáveis omitidas tiverem realmente coeficientes populacionais iguais a zero, então o resíduo encontrado deve ser pelo menos não correlacionado com cada uma dessas variáveis

19

correlacionado com cada uma dessas variáveis excluídas.Ou seja, o deve estar próximo de zero.Como determinar quando a estatística é suficientemente grande para rejeitar a hipótese nula a um nível de significância escolhido?

2uR

Page 20: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Estatística LM (cont)

2

2

2~

q

q

q

a

de value-p o calcular apenas

ou , ãodistribuiç uma de ,c crítico valor

o escolher podemos então ;LM

χ

χ

χ

20

q de value-p o calcular apenas χ

Com uma amostra grande, o resultado dos testes F e LM devem ser similares.

Page 21: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Estatística LM: exemploModelo do crime (banco de dados: crime1.raw, dados de 2.725 homens nascidos em 1960 ou 1961 na Califórnia):

Variável dependente: narr86 – número de vezes que um homem foi preso

Variáveis independentes:- pcnv: proporção de prisões anteriores que levaram à

21

- pcnv: proporção de prisões anteriores que levaram à condenação.

- avgsen: sentença média cumprida de condenaçõespassadas.

- tottime: tempo total que o homem passou na prisão em1986 desde que atingiu a idade de 18 anos.

- Ptime86: meses passados na prisão em 1986.- qemp86: número de trimestres, em 1986, durante os quaiso homem esteve legalmente empregado.

Page 22: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Estatística LM: exemploTeste: Testar a hipótese nula de que avgsen e tottime não possuem efeito sobre narr86, dado que todos demais fatores foram controlados.

Ho: β2=β3=0

22

Ho: β2=β3=0

Passo 1: estimar a regressão sem estas variáveis.

Passo 2: regredir os resíduos desta regressão em todas variáveis independentes.

Page 23: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Modelo irrestrito

uqemptime

tottimeavgsenpcnvnarr

+++

++++=

86.86.

...86

54

3210

ββ

ββββ

Modelo 1: Estimativas OLS usando as 2725 observações 1-2725

Variável dependente: narr86

Variável Coeficiente Erro Padrão estatística-t p-valor

const 0,706061 0,0331524 21,2974 <0,00001 ***

pcnv -0,151225 0,040855 -3,7015 0,00022 ***

23

avgsen -0,00704866 0,0124122 -0,5679 0,57016

tottime 0,0120953 0,00957684 1,2630 0,20671

ptime86 -0,0392585 0,00891659 -4,4029 0,00001 ***

qemp86 -0,103091 0,0103972 -9,9152 <0,00001 ***

Média da variável dependente = 0,404404

Desvio padrão da variável dependente = 0,859077

Soma dos resíduos quadrados = 1924,39

Erro padrão dos resíduos = 0,841284

R2 não-ajustado = 0,0427554

R2 ajustado = 0,0409951

Estatística-F (5, 2719) = 24,2889 (p-valor < 0,00001)

Page 24: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Modelo restrito (passo 1)uqemptimepcnvnarr ++++= 86.86..86 5410 ββββ

Modelo 2: Estimativas OLS usando as 2725 observações 1-2725

Variável dependente: narr86

Variável Coeficiente Erro Padrão estatística-t p-valor

const 0,711772 0,0330066 21,5645 <0,00001 ***

pcnv -0,149927 0,0408653 -3,6688 0,00025 ***

24

pcnv -0,149927 0,0408653 -3,6688 0,00025 ***

ptime86 -0,0344199 0,008591 -4,0065 0,00006 ***

qemp86 -0,104113 0,0103877 -10,0227 <0,00001 ***

Média da variável dependente = 0,404404

Desvio padrão da variável dependente = 0,859077

Soma dos resíduos quadrados = 1927,27

Erro padrão dos resíduos = 0,841603

R2 não-ajustado = 0,0413233

R2 ajustado = 0,0402663

Estatística-F (3, 2721) = 39,0958 (p-valor < 0,00001)

Page 25: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Passo 2

uqemptime

tottimeavgsenpcnvuhat

+++

++++=

86.86.

...2

54

3210

ββ

ββββ

Modelo 3: Estimativas OLS usando as 2725 observações 1-2725

Variável dependente: uhat2

Variável Coeficiente Erro Padrão estatística-t p-valor

const -0,00571081 0,0331524 -0,1723 0,86325

pcnv -0,00129713 0,040855 -0,0317 0,97467

avgsen -0,00704866 0,0124122 -0,5679 0,57016

25

avgsen -0,00704866 0,0124122 -0,5679 0,57016

tottime 0,0120953 0,00957684 1,2630 0,20671

ptime86 -0,0048386 0,00891659 -0,5427 0,58741

qemp86 0,00102209 0,0103972 0,0983 0,92170

Média da variável dependente = 0

Desvio padrão da variável dependente = 0,84114

Soma dos resíduos quadrados = 1924,39

Erro padrão dos resíduos = 0,841284

R2 não-ajustado = 0,00149385

R2 ajustado = -0,000342319

Estatística-F (5, 2719) = 0,813569 (p-valor = 0,54)

Page 26: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Estatística LM

4,090,0015).(725.2LM

2

==

= unRLM

a

26

61,409,4

61,4%)10( críticovalor

~ 22

<=

=

LM

c

LMa

χ

Page 27: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Regra de rejeiçãoComparar LM com o valor crítico apropriado, c,

de uma distribuição qui-quadrado.

Se LM > c, a hipótese nula é rejeitada.

27

61,409,4 <=LM

Não podemos rejeitar a hipótese nula ao nível

de 10%!!!

Page 28: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

P-valor

Podemos rejeitar a hipótese nula ao nível

de 15% pois o p-valor é menor (12,9%).

0,1294,09)( 22 =>χP

28

2

Pode consultar o p-valor no gretl: localizador de

p-valor, coloque o grau de liberdade e o valor

que corresponde a estatística t)

Qui-quadrado(2): área à direita de 4,09 = 0,12938

(à esquerda: 0,87062)

Page 29: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros

Eficiência assintótica

Existem outros estimadores consistentes além do de MQO.No entanto, sob as hipóteses Gauss-Markov, os de MQO terão as menores

29

Markov, os de MQO terão as menores variâncias assintóticas. Dizemos que MQO são assintoticamente eficientes.