Painel verdadeiro vs. Cross section empilhada · PDF file28/11/2010 2 Diferenças em...

4

Click here to load reader

Transcript of Painel verdadeiro vs. Cross section empilhada · PDF file28/11/2010 2 Diferenças em...

Page 1: Painel verdadeiro vs. Cross section empilhada · PDF file28/11/2010 2 Diferenças em Diferenças Ideal para a análise de impacto: avaliador ter as informações sobre os grupos de

28/11/2010

1

1

Métodos de dados em painel

yit = β0 + β1xit1 + . . . βkxitk + uit

2

Painel verdadeiro vs. Cross section empilhada

Painel: dimensão cross section e temporal

Painel: a mesma unidade sendo seguida aolongo do tempo

Dados empilhados: não é a mesma unidadeseguida.

3

Empilhamento

Aumentar o tamanho da amostra

Investigar o efeito do tempo

Investigar se as relações mudaram ao longodo tempo

4

Diferenças em Diferenças

Seleção aleatória do grupo de tratamento e do grupo de controle – dado é experimental.Podemos simplesmente comparar a mudança dos resultados entre tratamento e controle para estimar o efeito do tratamento.Do tempo 1,2, grupos A, B (y2,B – y2,A) -(y1,B – y1,A), ou (y2,B – y1,B) - (y2,A – y1,A), é a diferença em diferença.

5

Diferenças em Diferenças (cont)

Estrutura da regressão pode calcular esteefeito:

Considere o modelo:

yit = β0 + β1treatmentit + β2afterit + β3treatmentit*afterit + uit

β3 medirá o efeito diferenças em diferenças

Diferenças em DiferençasQuando:

� a separação entre os grupos de tratamento e controle não foi aleatória; e

� quando temos grupos de tratamento e controle muito diferentes, principalmente com relação a características que não são observáveis.

6

Page 2: Painel verdadeiro vs. Cross section empilhada · PDF file28/11/2010 2 Diferenças em Diferenças Ideal para a análise de impacto: avaliador ter as informações sobre os grupos de

28/11/2010

2

Diferenças em Diferenças

�Ideal para a análise de impacto: avaliador ter as informações sobre os grupos de tratamento e de controle em dois períodos de tempo, ou seja, no período anterior ao programa social e no período posterior ao programa social.

7 8

Diferenças em diferenças (cont)

Como a seleção não é aleatória devemosaplicar o método de regressão de forma a controlar por características observáveis.Variáveis de controle adicionais (x’s) podem ser adicionadas para controlar as diferenças existentes entre os grupos de controle e tratamento.

9

Dados de painel em dois períodos

MQO agrupado: empilhamento

O dado de painel pode ser usado parareduzir algum viés de variável omitida.

Se consideramos que a variável omitida é fixa ao longo do tempo, o modelo terá um erro composto.

10

Efeitos fixos não observadosSuponha que o modelo populacional é yit =

β0 + δ0d2t + β1xit1 +…+ βkxitk + ai + uit

Adicionamos um componente do erroconstante ao longo do tempo, υit = ai + uit

Se ai é correlacionado com osx’s, MQO será viesado, tendo em vista que é parte do termo de erro.Com dados em painel, podemos eliminareste efeito fixo tirando as primeirasdiferenças.

11

Primeiras diferenças

Subtrair um período do outro∆yi = δ0 + β1∆xi1 +…+ βk∆xik + ∆ui

Modelo onde não há correlação entre x’s e o termo de erro – exogeneidade estrita.

12

Diferenciando múltiplos períodos

Diferenciar períodos adjacentes.

Se 3 periodos, subtrair período 1 do periodo2, periodo 2 do periodo 3 e terá 2 observações por individuo.

Estimação usando MQO, assumindo que∆uit não são correlacionados ao longo do tempo.

Page 3: Painel verdadeiro vs. Cross section empilhada · PDF file28/11/2010 2 Diferenças em Diferenças Ideal para a análise de impacto: avaliador ter as informações sobre os grupos de

28/11/2010

3

Exemplo no gretl

Os dados de 1980 e 1990 incluem preços de aluguéis e outras variáveis de cidades universitárias. A idéia é ver se uma forte presença de estudantes afeta os valores dos aluguéis. O modelo de efeitos não observados é:

onde pop é a população da cidade, rendfam é a renda média e pctestu é a população estudantil como uma porcentagem da população da cidade (durante o ano letivo).

13 14

Modelo 1:Mínimos Quadrados (OLS), usando as observações 1-128 Variável dependente: l_rent

Coeficiente Erro Padrão razão-t p-valor

const -0,568806 0,534881 -1,0634 0,28967 l_pop 0,0406863 0,0225154 1,8070 0,07320 * l_avginc 0,571446 0,053098 10,7621 <0,00001 *** Dyear_2 0,262227 0,0347632 7,5432 <0,00001 *** pctestu 0,00504356 0,00101918 4,9486 <0,00001 ***

Média var. dependente 5,746195 D.P. var. dependente 0,332707 Soma resíd. quadrados 1,950122 E.P. da regressão 0,125915 R-quadrado 0,861282 R-quadrado ajustado 0,856770 F(4, 123) 190,9220 P-valor(F) 9,41e-52

No gretl: estrutura de dados: seções cruzadas empilhadas 64, 2 períodos de tempo.

15

Modelo 4: Mínimos Quadrados de amostragem ("Pooled OLS"), usando 64 observações Incluídas 64 unidades de seção-cruzada

Comprimento da série temporal = 1 Variável dependente: d_l_rent

Coeficiente Erro Padrão razão-t p-valor

const 0,385521 0,0368245 10,4692 <0,00001 *** d_pctestu 0,0112033 0,00413194 2,7114 0,00873 *** d_l_pop 0,0722457 0,0883426 0,8178 0,41671 d_l_avginc 0,30996 0,0664771 4,6627 0,00002 ***

Média var. dependente 0,559677 D.P. var. dependente 0,106838 Soma resíd. quadrados 0,487362 E.P. da regressão 0,090126 R-quadrado 0,322262 R-quadrado ajustado 0,288375 F(3, 60) 9,509920 P-valor(F) 0,000031

16

Estimação de efeitos fixos

Quando existe um efeito fixo não observado, umaalternativa também é proceder a estimação por efeito fixo.Considere o modeloyit = β1xit1 +…+ βkxitk + ai + uit

A média do ai seráai, se subtraímos a média ao longo do tempo, ai será eliminado.A partir das diferenças dos valores individuais de cadavariável com relação aos valores médios, o termo ai é eliminado, resultando no estimador de efeitos fixos.As estimativas dos parâmetros são consistentes e eficientes.

17

Estimação de efeitos fixos (cont)

Cálculo do grau de liberdade: N(T –1) – kpor conta do cálculo das médias.

O método é igual a incluir um interceptopara cada unidade individual.

18

Primeiras diferenças versus Efeitos fixos

Métodos iguais quando T = 2Para T > 2, os dois métodos são diferentesEstimação de efeitos fixos é mais comum –facilidade de computar.Efeito fixo é implementado em painéis nãobalanceados.

Page 4: Painel verdadeiro vs. Cross section empilhada · PDF file28/11/2010 2 Diferenças em Diferenças Ideal para a análise de impacto: avaliador ter as informações sobre os grupos de

28/11/2010

4

19

Efeitos aleatórios

yit = β0 + β1xit1 + . . . βkxitk + ai + uit

Assumimos queai é correlacionado com osx’s, e se não fosse?

A eliminação do ai geraria estimadoresineficientes.

Modelo de efeitos aleatórios: o efeito nãoobservado não é correlacionado com os x´s:

0),cov( =iitj ax

20

Efeitos aleatórios (cont.)

MQO agrupado: erros padrão serão erradospelo problema de correlação serial entre ostermos de erro.

O termo ai é o erro de composição em cadaperíodo de tempo, logo, os vit sãoserialmente correlacionados ao longo do tempo.

22

2

),(ua

aisit vvcorr

σσσσσσσσσσσσ+

=

21

Efeitos aleatórios (cont.)

Transformar o modelo e aplicar MQGSoma ponderada do MQO e dos efeitos fixos –usa dados quase reduzidos em cada variável.

( )[ ]( ) ( )

( ) ( )iitikitkk

iitiit

auu

xx

xxyy

T

ννβλβλβλ

σσσλ

−+−++−+−=−

+−=...1

1

1110

21222

22

Efeitos aleatórios (cont.)

Se λ = 1, estimador de efeitos fixosSe λ = 0, MQOQuanto maior a variancia do termo nãoobservado, mais próximo estou do EF e vice-versa.

Exemplos

23

Modelo 2: Efeitos-fixos, usando 128 observações Incluídas 64 unidades de seção-cruzada

Comprimento da série temporal = 2 Variável dependente: l_rent

Coeficiente Erro Padrão razão-t p-valor

const 1,40938 1,16724 1,2075 0,23200 pctestu 0,0112033 0,00413194 2,7114 0,00873 *** l_pop 0,0722457 0,0883426 0,8178 0,41671 l_avginc 0,30996 0,0664771 4,6627 0,00002 *** Dyear_2 0,385521 0,0368245 10,4692 <0,00001 ***