Hipóteses do Modelo de Regressão Linear Clássico · PDF...

Post on 31-Jan-2018

233 views 0 download

Transcript of Hipóteses do Modelo de Regressão Linear Clássico · PDF...

Hipóteses do Modelo de

Regressão Linear Clássico

Gervásio F. Santos

Universidade Federal da Bahia

Faculdade de Ciências Econômicas

Departamento de Economia

ECO 166 – Introdução à Econometria

Propriedades dos estimadores de MQO

• As estimativas de βj , com base na amostra de yj e xj, podem ser

utilizadas para fezer análises (ou inferências) sobre a popualção

• Um estimador de βj precisa ter algumas propriedades estatísticas

desejáveis:

Não viesado

Eficiente (variância mínima)

Consistente

• As hipóteses do modelo de regressão linear clássico garantem que

essas propriedades sejam mantidas

• A violação de alguma das hipótese acarretará na perda de algumas

dessas propriedades

• Neste caso, procedimentos ou métodos alternativos ao MQO podem

ser aplicadas para que as propriedades sejam mantidas

^

Propriedades estatísticas dos estimadores

de MQO

• Não viesado

• Eficiente (variância mínima)

• Consistente

jjE ββ )(^

)()( _

^^

jkqualquerj VarVar ββ

jjp ββ )lim(^

Hipóteses do MRLC

Dado o modelo: yi = β0 + β1x1i + ui

• HRLC1: Linearidade nos parâmetros:

yi = β0 + β1x1i + ui

• HRLC2: Amostragem aleatória

n observações de {(x1i , yi): i = 1, 2, ….., n}

• HRLC3: Média condicional zero

E(u/x1i) = 0

Hipóteses do MRLC

Dado o modelo: yi = β0 + β1x1i + ui

• HRLC4: Variância Amostral na variável independente

… na amostra, as variáveis xi, i=1,...,n não são todas iguais a uma mesma constante, logo x varia na população

Se HRLC1-HRLC4 -> estimadores não viesados

• HRLC5: Homocedasticidade:

Existem n observações de {(x1i, yi): i = 1, 2, ….., n}

• HRLC6: Normalidade

O erro populacional u é independente das variáveis explicativas e u~N(0, σ2)

Hipótese 1 do MRLC

Dado o modelo: yi = β0 + β1x1i + ui

• HRLC1: Linearidade nos parâmetros:

yi = β0 + β1x1i + ui

• Funções lineares nos parâmetros

yi = β0 + β1x1i + β2x2

2i (Quadrática)

yi = e{β1x1i + β2x2i} ( Exponencial)

yi = β0 + β1x1i + β2x2

2i + β3x3

3i + ui (Cúbica)

yi = β0 x1i β1x2i

β2ui (Cobb-Douglas)

yi = β0 x1i β1x2i

β2eui (Cobb-Douglas)

Yi = A[δKi-β + (1-δ)Li

-β]-1/β (não linear) (CES)

Hipótese 2 do MRLC

Dado o modelo: yi = β0 + β1x1i + ui

• HRLC2: Amostragem aleatória

n observações de {(x1i , yi): i = 1, 2, ….., n}

x, y e u são variáveis aleatórias

… em alguns casos a aleatoriedade da amostra é violada e

métodos alternativos de estimaçao (correção) precisam ser

aplicados

Hipótese 3 do MRLC

Dado o modelo: yi = β0 + β1x1i + ui

• HRLC3: Média condicional zero

E(u/x1i) = 0

… esta hipótese permite que os estimadores sejam não viesados

• x é considerado fixo em amostras repetidas….

...Escolhe-se n valores amostrais para cada variável x, que podem, inclusive, ser repetidos. Dados esses valores de x, escolhe-se uma amostra de y. O processo resulta em uma amostra aleatória de u. Utilizando os mesmos valores de x (são fixados), obtém-se uma outra amostra de y ….e assim por diante…

Hipótese 4 do MRLC

Dado o modelo: yi = β0 + β1x1i + ui

• HRLC4: Variância Amostral na variável independente

… na amostra, as variáveis x1i, i=1,...,n não são todas iguais a

uma mesma constante, logo x varia na população

.....Se x não variar o estimador βj não poderá ser calculado

n

i

i xx1

_

11 0)(

n

i

i

i

n

i

i

xx

yyxx

1

2_

11

__

1

1

1^

1

)(

))((

β

em termos de coeficientes populacionais e

dos erros

i

n

i

i

x

x

i

n

i

ixx

x

i

n

i

ii

n

i

ix

x

i

n

i

ii

n

i

i

n

i

i

x

i

n

i

ii

n

i

i

n

i

i

x

ii

n

i

i

x

i

n

i

i

n

i

i

i

n

i

i

udSQT

SQT

uxxSQTSQT

SQT

uxxxxxxSQT

SQT

uxxxxxxx

SQT

uxxxxxxx

SQT

uxxx

SQT

yxx

xx

yyxx

1

1

^

1

_

1

10^

1

_

1

__

1

10^

1

_

1

_

1

1

_

1

0^

1

_

1

1

_

1

0

_

10

^

1

10

_

1

_

1

1

2_

__

1^

1

1

)(

)()()(

)()()(

)()()(

))(()(

)(

))((

ββ

ββ

β

ββ

β

ββ

β

ββ

ββ

ββ

β

^

Teorema: inexistência de viés em MQO

• Sob as hipóteses 1 a 4:

1

^

1

1

1

^

1

1

1

^

1

1

1

1

1

^

1

)(

0.1

)(

)(1

)(

1)(

1)(

ββ

ββ

ββ

βββ

E

dSQT

E

uEdSQT

E

udSQT

EEudSQT

EE

n

i

i

x

i

n

i

i

x

i

n

i

i

x

i

n

i

i

x

?)(^

jjE ββ

E(ui/x1i)=E(ui)=0

Teorema: inexistência de viés em MQO

• Sob as hipóteses 1 a 4:

0

^

0

^

11

_

__^

110

^

0

__^

110

^

0

_^

1

__

10

^

0

_^

1

_^

0

)(

0)(__0)(_

)()()(

)(

ββ

ββ

ββββ

ββββ

ββββ

ββ

E

EeuEComo

uExEE

ux

xux

xy

?)( 0

^

0 ββ E

Exemplo 2.12 Efeito de um programa governamental de merenda escolar sobre a

porcentagem de alunos do primeiro ano do ensino médio aprovados em

um exame de matemática (MEAP93.RAW).

mate10 = β0 + β1prgalm + u

_cons 31.37569 1.035011 30.31 0.000 29.34061 33.41077 prgalm -.2940271 .0363079 -8.10 0.000 -.3654172 -.222637 mate10 Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 39871.1492 380 104.924077 Root MSE = 9.4701 Adj R-squared = 0.1453 Residual 33989.7372 379 89.682684 R-squared = 0.1475 Model 5881.41198 1 5881.41198 Prob > F = 0.0000 F( 1, 379) = 65.58 Source SS df MS Number of obs = 381

. reg mate10 prgalm

• Sinal não esperado para o parâmetro e provável correlação entre o termo de

erro e a variável prgalm

• Que outros fatores afetam a aprovação no exame de matemática? (Pense!)

Código Stata

Hipótese 5 do MRLC

Dado o modelo: yi = β0 + β1x1i + ui

• HRLC5: Homocedasticidade

Essa hipótese implica que o método MQO tenha certas propriedades de

eficiência a partir do suposto de que a variância do termo de erro é

constante.

Var(u/x) = [E(u2/x)] – [E(u/x)2]

Var(u/x) = E(u2/x)

Var(u/x) = E(u2)= σ2

• σ2 é a variância não condicional de u e também é chamada de

variância do erro.

• é o erro padrão. Se σ for grande, sigifica que a distribuição

dos fatores não observáveis que afetam y é dispersa

σσ 2

Hipótese 5 do MRLC

• Se a Var(u/x) = f(y/x) o termo de erro é considerado

heterocedástico (variância não constante)

• Ex.: função consumo (dependendo da renda)

23

45

67

0 .2 .4 .6 .8 1x

Fitted values y

Hipótese 5 do MRLC

Variância dos estimadores de MQO

x

x

x

n

i

i

x

i

n

i

i

x

i

n

i

i

x

i

n

i

i

x

i

n

i

i

x

SQTVar

SQTSQT

Var

uVarqueSendodSQT

Var

uVardSQT

Var

udVarSQT

Var

uEdSQT

Var

uEdSQT

2^

1

2

2^

1

22

2

1

2^

1

2

1

2^

1

1

2^

1

2

1

1

^

1

^

1

1

1

^

1

)(

1)(

)(____1

)(

)(1

)(

)(1

)(

)(1

)()(

)(1

σβ

σβ

σσβ

β

β

βββ

ββ

Hipótese 5 do MRLC

Variância dos estimadores de MQO

Análise

• Quando maior a variância do erro, maior a variância do

estimador

• Quanto maior a variação na variável explicativa, menor a

variância do estimador

xSQTVar

2^

1)(

σβ

x

n

i

i

SQT

n

x

Var

1

2

2

^

0 )(

σ

β

Estimativa da variância do erro σ

)2()2(

:

)_)2_(___(0.__0:

______,___

:__

_____,

______,_,)(

1

^

2^

2

1

^

1

^

^

1

^2

1

2

2

222

n

SQR

n

u

σ

σ

glnrestariamsóuxeu

restrçõesduassatisfazerprecisaupoisviesadoén

SQRMas

n

SQR

n

u

seriaaalternativUma

uconhecemosnãomasn

u

seriadevisesadonãoestimadorumLogouE

n

i

i

n

i

ii

n

i

i

i

n

i

i

i

n

i

i

_viesado_denãoEstimador_

Restrições

σ

σσ

Em termos de média

populacional

Em termos de média

Amostral

Exercício

Demonstrar o teorema 2.3

Estimação não-viesada de σ2.

Estimação não-viesada da

Substituindo

)(__)(^

1

^

1 ββ epeVar

2^2 __ σσ por

x

x

n

i

SQTep

SQTVardaEstimador

EPR

n

SQR

n

u

daEstimador

2^^

1

^

1

2^^

1

^

1

2^^

1

2^

2^2

)(_:_

)(_:__

:)_(

)2()2(:)_(__

σββ

σββ

σσ

σσ

adoro_do_estimErro_padrã

ordo_estimad_variâcia_

ssãoo_da_regreErro_padrã

do_errovariância_

.. O mesmo vale para

o estimador de β0

Nota: regressão pela origem

n

i

i

n

i

ii

n

i

ii

n

i

i

n

i

x

yx

parasolvendo

xyx

CPOeseguasatisfazerprecisaDerivando

xySQRu

somaeseguaimizardeveMQOmétodoO

xy

1

2

1~

1

~

1

1

~

1

~

1

1

2~

1

1

2^

~

1

_

:___Re

0)(

:_int_____

)(

:_int__min____

β

β

β

β

β

β