Hipóteses do Modelo de Regressão Linear Clássico · PDF...
Transcript of Hipóteses do Modelo de Regressão Linear Clássico · PDF...
Hipóteses do Modelo de
Regressão Linear Clássico
Gervásio F. Santos
Universidade Federal da Bahia
Faculdade de Ciências Econômicas
Departamento de Economia
ECO 166 – Introdução à Econometria
Propriedades dos estimadores de MQO
• As estimativas de βj , com base na amostra de yj e xj, podem ser
utilizadas para fezer análises (ou inferências) sobre a popualção
• Um estimador de βj precisa ter algumas propriedades estatísticas
desejáveis:
Não viesado
Eficiente (variância mínima)
Consistente
• As hipóteses do modelo de regressão linear clássico garantem que
essas propriedades sejam mantidas
• A violação de alguma das hipótese acarretará na perda de algumas
dessas propriedades
• Neste caso, procedimentos ou métodos alternativos ao MQO podem
ser aplicadas para que as propriedades sejam mantidas
^
jβ
Propriedades estatísticas dos estimadores
de MQO
• Não viesado
• Eficiente (variância mínima)
• Consistente
jjE ββ )(^
)()( _
^^
jkqualquerj VarVar ββ
jjp ββ )lim(^
Hipóteses do MRLC
Dado o modelo: yi = β0 + β1x1i + ui
• HRLC1: Linearidade nos parâmetros:
yi = β0 + β1x1i + ui
• HRLC2: Amostragem aleatória
n observações de {(x1i , yi): i = 1, 2, ….., n}
• HRLC3: Média condicional zero
E(u/x1i) = 0
Hipóteses do MRLC
Dado o modelo: yi = β0 + β1x1i + ui
• HRLC4: Variância Amostral na variável independente
… na amostra, as variáveis xi, i=1,...,n não são todas iguais a uma mesma constante, logo x varia na população
Se HRLC1-HRLC4 -> estimadores não viesados
• HRLC5: Homocedasticidade:
Existem n observações de {(x1i, yi): i = 1, 2, ….., n}
• HRLC6: Normalidade
O erro populacional u é independente das variáveis explicativas e u~N(0, σ2)
Hipótese 1 do MRLC
Dado o modelo: yi = β0 + β1x1i + ui
• HRLC1: Linearidade nos parâmetros:
yi = β0 + β1x1i + ui
• Funções lineares nos parâmetros
yi = β0 + β1x1i + β2x2
2i (Quadrática)
yi = e{β1x1i + β2x2i} ( Exponencial)
yi = β0 + β1x1i + β2x2
2i + β3x3
3i + ui (Cúbica)
yi = β0 x1i β1x2i
β2ui (Cobb-Douglas)
yi = β0 x1i β1x2i
β2eui (Cobb-Douglas)
Yi = A[δKi-β + (1-δ)Li
-β]-1/β (não linear) (CES)
Hipótese 2 do MRLC
Dado o modelo: yi = β0 + β1x1i + ui
• HRLC2: Amostragem aleatória
n observações de {(x1i , yi): i = 1, 2, ….., n}
x, y e u são variáveis aleatórias
… em alguns casos a aleatoriedade da amostra é violada e
métodos alternativos de estimaçao (correção) precisam ser
aplicados
Hipótese 3 do MRLC
Dado o modelo: yi = β0 + β1x1i + ui
• HRLC3: Média condicional zero
E(u/x1i) = 0
… esta hipótese permite que os estimadores sejam não viesados
• x é considerado fixo em amostras repetidas….
...Escolhe-se n valores amostrais para cada variável x, que podem, inclusive, ser repetidos. Dados esses valores de x, escolhe-se uma amostra de y. O processo resulta em uma amostra aleatória de u. Utilizando os mesmos valores de x (são fixados), obtém-se uma outra amostra de y ….e assim por diante…
Hipótese 4 do MRLC
Dado o modelo: yi = β0 + β1x1i + ui
• HRLC4: Variância Amostral na variável independente
… na amostra, as variáveis x1i, i=1,...,n não são todas iguais a
uma mesma constante, logo x varia na população
.....Se x não variar o estimador βj não poderá ser calculado
n
i
i xx1
_
11 0)(
n
i
i
i
n
i
i
xx
yyxx
1
2_
11
__
1
1
1^
1
)(
))((
β
em termos de coeficientes populacionais e
dos erros
i
n
i
i
x
x
i
n
i
ixx
x
i
n
i
ii
n
i
ix
x
i
n
i
ii
n
i
i
n
i
i
x
i
n
i
ii
n
i
i
n
i
i
x
ii
n
i
i
x
i
n
i
i
n
i
i
i
n
i
i
udSQT
SQT
uxxSQTSQT
SQT
uxxxxxxSQT
SQT
uxxxxxxx
SQT
uxxxxxxx
SQT
uxxx
SQT
yxx
xx
yyxx
1
1
^
1
_
1
10^
1
_
1
__
1
10^
1
_
1
_
1
1
_
1
0^
1
_
1
1
_
1
0
_
10
^
1
10
_
1
_
1
1
2_
__
1^
1
1
)(
)()()(
)()()(
)()()(
))(()(
)(
))((
ββ
ββ
β
ββ
β
ββ
β
ββ
ββ
ββ
β
^
jβ
Teorema: inexistência de viés em MQO
• Sob as hipóteses 1 a 4:
1
^
1
1
1
^
1
1
1
^
1
1
1
1
1
^
1
)(
0.1
)(
)(1
)(
1)(
1)(
ββ
ββ
ββ
βββ
E
dSQT
E
uEdSQT
E
udSQT
EEudSQT
EE
n
i
i
x
i
n
i
i
x
i
n
i
i
x
i
n
i
i
x
?)(^
jjE ββ
E(ui/x1i)=E(ui)=0
Teorema: inexistência de viés em MQO
• Sob as hipóteses 1 a 4:
0
^
0
^
11
_
__^
110
^
0
__^
110
^
0
_^
1
__
10
^
0
_^
1
_^
0
)(
0)(__0)(_
)()()(
)(
ββ
ββ
ββββ
ββββ
ββββ
ββ
E
EeuEComo
uExEE
ux
xux
xy
?)( 0
^
0 ββ E
Exemplo 2.12 Efeito de um programa governamental de merenda escolar sobre a
porcentagem de alunos do primeiro ano do ensino médio aprovados em
um exame de matemática (MEAP93.RAW).
mate10 = β0 + β1prgalm + u
_cons 31.37569 1.035011 30.31 0.000 29.34061 33.41077 prgalm -.2940271 .0363079 -8.10 0.000 -.3654172 -.222637 mate10 Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 39871.1492 380 104.924077 Root MSE = 9.4701 Adj R-squared = 0.1453 Residual 33989.7372 379 89.682684 R-squared = 0.1475 Model 5881.41198 1 5881.41198 Prob > F = 0.0000 F( 1, 379) = 65.58 Source SS df MS Number of obs = 381
. reg mate10 prgalm
• Sinal não esperado para o parâmetro e provável correlação entre o termo de
erro e a variável prgalm
• Que outros fatores afetam a aprovação no exame de matemática? (Pense!)
Código Stata
Hipótese 5 do MRLC
Dado o modelo: yi = β0 + β1x1i + ui
• HRLC5: Homocedasticidade
Essa hipótese implica que o método MQO tenha certas propriedades de
eficiência a partir do suposto de que a variância do termo de erro é
constante.
Var(u/x) = [E(u2/x)] – [E(u/x)2]
Var(u/x) = E(u2/x)
Var(u/x) = E(u2)= σ2
• σ2 é a variância não condicional de u e também é chamada de
variância do erro.
• é o erro padrão. Se σ for grande, sigifica que a distribuição
dos fatores não observáveis que afetam y é dispersa
σσ 2
Hipótese 5 do MRLC
• Se a Var(u/x) = f(y/x) o termo de erro é considerado
heterocedástico (variância não constante)
• Ex.: função consumo (dependendo da renda)
23
45
67
0 .2 .4 .6 .8 1x
Fitted values y
Hipótese 5 do MRLC
Variância dos estimadores de MQO
x
x
x
n
i
i
x
i
n
i
i
x
i
n
i
i
x
i
n
i
i
x
i
n
i
i
x
SQTVar
SQTSQT
Var
uVarqueSendodSQT
Var
uVardSQT
Var
udVarSQT
Var
uEdSQT
Var
uEdSQT
2^
1
2
2^
1
22
2
1
2^
1
2
1
2^
1
1
2^
1
2
1
1
^
1
^
1
1
1
^
1
)(
1)(
)(____1
)(
)(1
)(
)(1
)(
)(1
)()(
)(1
σβ
σβ
σσβ
β
β
βββ
ββ
Hipótese 5 do MRLC
Variância dos estimadores de MQO
Análise
• Quando maior a variância do erro, maior a variância do
estimador
• Quanto maior a variação na variável explicativa, menor a
variância do estimador
xSQTVar
2^
1)(
σβ
x
n
i
i
SQT
n
x
Var
1
2
2
^
0 )(
σ
β
Estimativa da variância do erro σ
)2()2(
:
)_)2_(___(0.__0:
______,___
:__
_____,
______,_,)(
1
^
2^
2
1
^
1
^
^
1
^2
1
2
2
222
n
SQR
n
u
σ
σ
glnrestariamsóuxeu
restrçõesduassatisfazerprecisaupoisviesadoén
SQRMas
n
SQR
n
u
seriaaalternativUma
uconhecemosnãomasn
u
seriadevisesadonãoestimadorumLogouE
n
i
i
n
i
ii
n
i
i
i
n
i
i
i
n
i
i
_viesado_denãoEstimador_
Restrições
σ
σσ
Em termos de média
populacional
Em termos de média
Amostral
Exercício
Demonstrar o teorema 2.3
Estimação não-viesada de σ2.
Estimação não-viesada da
Substituindo
)(__)(^
1
^
1 ββ epeVar
2^2 __ σσ por
x
x
n
i
SQTep
SQTVardaEstimador
EPR
n
SQR
n
u
daEstimador
2^^
1
^
1
2^^
1
^
1
2^^
1
2^
2^2
)(_:_
)(_:__
:)_(
)2()2(:)_(__
σββ
σββ
σσ
σσ
adoro_do_estimErro_padrã
ordo_estimad_variâcia_
ssãoo_da_regreErro_padrã
do_errovariância_
.. O mesmo vale para
o estimador de β0
Nota: regressão pela origem
n
i
i
n
i
ii
n
i
ii
n
i
i
n
i
x
yx
parasolvendo
xyx
CPOeseguasatisfazerprecisaDerivando
xySQRu
somaeseguaimizardeveMQOmétodoO
xy
1
2
1~
1
~
1
1
~
1
~
1
1
2~
1
1
2^
~
1
_
:___Re
0)(
:_int_____
)(
:_int__min____
β
β
β
β
β
β