Econometria II Revisao

Post on 17-Jan-2016

21 views 0 download

description

Revisao de econometria II

Transcript of Econometria II Revisao

Modelo de Duração: Riscos

Proporcionais de Cox

Maria Dolores Montoya Diaz

dolores@pq.cnpq.br

Inclusão de Variáveis Explicativas

� Assim:

� É a função de risco (hazard rate)� A função Φ pode, por exemplo, ser especificada

como exponencial:

),,(),( tXXt βφβλ =

como exponencial:

� Modelo de Cox: particiona a função risco, de tal forma que os parâmetros β das covariáveis podem ser estimados sem que se imponha uma restrição sobre a função de risco “básica”.

dolores@pq.cnpq.br

ββλ XeXt =),(

Modelo de Cox

� Tem-se:

� onde λ0 é a função de risco básica.

� Pode-se dizer que esta função corresponde ao risco para um indivíduo que apresenta as características médias dentro da amostra:

),()()( 0 βφλλ XtXt ×=

amostra:

� De qualquer modo, é necessário estimar:

� Conveniente por não gerar valores negativos que seriam incompatíveis com a noção de risco.

� Coeficientes β representam o efeito constante e proporcional a X sobre a probabilidade condicional do indivíduo apresentar a falha

dolores@pq.cnpq.br

ββφ XeX =),(

Coeficientes

� Então:

ββφλ=

∂∂=

∂∂

X

X

X

Xt ),(ln)(ln

� Limitação:� É necessário assumir que os riscos sejam proporcionais =

as diferenças entre os indivíduos dependem somente da relação entre os valores apresentados pelas covariáveis em cada momento do tempo e não são influenciados pela passagem do tempo (maior ou menor demora na ocorrência de falha)

dolores@pq.cnpq.br

STATA:

� stcox prod

� stcox prod, nohr

� stcox prod, basehc(hazard_base) basechazard(hazard_cumulat) basesurv(survival)

dolores@pq.cnpq.br

Modelos de Escolha Binária (Variável Dependente é Dummy):

LOGIT e PROBIT

dolores@pq.cnpq.br

Maria Dolores Montoya Diaz

Modelos LOGIT/PROBIT - Introdução

� Modelos de Regressão são adequados quando Y é contínua - valor de arrecadação, consumo, demanda, exportações, etc

� Porém, há situações em que se pretende modelar a decisão de pagar ou não dívidas contraídas,

dolores@pq.cnpq.br

a decisão de pagar ou não dívidas contraídas, comprar um objeto, votar em determinado candidato

Modelos LOGIT/PROBIT - Definição (1)

� Modelo:

Y* = a + b X + uonde

Y* = variável latente não observável

dolores@pq.cnpq.br

Y* = variável latente não observável

X = matriz de características dos indivíduos/empresas

Modelos LOGIT/PROBIT - Definição(2)

� Porém, observa-se na realidade:

>=

=0Y se dívidas, suas tecorretamen paga 1 *

Y

dolores@pq.cnpq.br

==

contrário caso 0

0Y se dívidas, suas tecorretamen paga 1iY

Modelos LOGIT/PROBIT - Definição(3)

� Então:Prob(Y=1) = Prob{ u> - (a + b X) }Prob(Y=1) = 1 - F{- (a + b X) }onde F é a função cumulativa de probabilidade

Obs: se a distribuição for simétrica como a Normal

dolores@pq.cnpq.br

Obs: se a distribuição for simétrica como a Normal e a Logística 1 - F( - z) = F(z)

Modelos LOGIT/PROBIT - Comparação com

MQO (1)

� Nestes casos:

� Modela-se a Probabilidade do indivíduo/empresa pagar, comprar, votar, etc. (tomar a decisão definida como 1)

bX)F(a1)i

Prob(Y +==

dolores@pq.cnpq.br

� Método de Mínimos Quadrados é inadequado

Modelos LOGIT/PROBIT - Comparação com

MQO (2)

� Verificar que:� Modelo Regressão

Yi = a + b Xi + ui

� Modelo com Dependente Binária:

dolores@pq.cnpq.br

� Modelo com Dependente Binária:

onde F é a distribuição cumulativa de probab.

bX)F(a1)i

Prob(Y +==

Modelos LOGIT/PROBIT - Interpretação dos

Resultados

� Comumente, trabalha-se com a probabilidade estimada = Prôb(Y=1)

� Efeitos marginais:

bbXafP

)(ˆ

×+=∂

dolores@pq.cnpq.br

� onde f é a função densidade de probabilidade

bbXafX

P )( ×+=

∂∂

Escolha Ordenada

� O modelo de escolha binária é adequado para modelar uma variável que pode assumir apenas dois valores: 0 e 1

� Porém, existem situações em que o objetivo é explicar uma variável dividida em várias categorias

� Exemplos:

dolores@pq.cnpq.br14

� Pesquisas de opinião sobre qualidade de atendimento: � 1) Péssimo, 2) Regular, 3) Bom, 4) Excelente

� Auto-avaliação do estado da saúde� 1) Muito Bom, 2) Bom, 3) Regular, 4) Ruim, 5) Muito ruim

Escolha Ordenada

� Nestes casos, os valores associados a cada categoria (1 a 4, no primeiro exemplo ou 1 a 5 no segundo exemplo) podem ser vistos como resultantes de uma variável contínua, não observada como índice de saúde, satisfação, etc.

� O modelo de regressão não pode ser utilizado pois os

dolores@pq.cnpq.br15

� O modelo de regressão não pode ser utilizado pois os valores da variável dependente refletem a ordenação/ranking, porém, a diferença entre a opção 1 e 2 não pode ser tratada igualmente à diferença entre 2 e 3, e assim sucessivamente

Escolha Ordenada

� A idéia será modelar Y* não-observável (a semelhança do que foi feito no caso do modelo de escolha binária)

� Ordered-probit e Ordered-logit (extensão dos modelos Probit e Logit, respectivamente)

dolores@pq.cnpq.br16

� Y é a variável observada e Y* a variável latente

� Assim:Y* = a + b X + u

onde

Y* = variável latente não observável

X = matriz de características dos indivíduos/empresas

Variável Observada

� Porém, observa-se na realidade:

≤≤

≤≤

= 32

21

1

* 2

* 1

* 0

αα

αα

α

Yse

Yse

Yse

iY

dolores@pq.cnpq.br17

� Se, por exemplo, a variável observada puder assumir 5

valores distintos, existirão 4 pontos de corte α

>

≤≤

4

43

* 4

* 3

α

αα

Yse

Yse

i

Modelo

� Os pontos α correspondem aos limites que fazem com que os indivíduos se movam de uma categoria reportada para outra

� Assim como no caso dos modelos de escolha binária, os coeficientes dos modelos de escolha ordenada possuem

dolores@pq.cnpq.br18

coeficientes dos modelos de escolha ordenada possuem importância limitada

� É necessário estimar os efeitos marginais� Representa o impacto de variações na variável explicativa (x)

sobre a probabilidade de escolha em cada uma das opções.

Exemplos

� Escolha da forma de aplicação dos recursos do fundo de pensão

� Autoavaliação do Estado de Saúde

dolores@pq.cnpq.br19

Modelo de Contagem

� O modelo de contagem aplica-se a situações em que a variável explicada representa uma contagem de eventos

� Exemplos comuns na área de economia da saúde são medidas de utilização de serviços de saúde, tais como, número de visitas ao médico ou serviço de saúde realizadas em determinado período de tempo, número de realizadas em determinado período de tempo, número de internações, número de acidentes automobilísticos ou do trabalho, número de cigarros fumados, etc.

� A variável dependente é composta por números inteiros não-negativos

� A distribuição de valores é normalmente assimétrica, com grande quantidade de zeros

20 dolores@pq.cnpq.br

Modelo

� O modelo básico para dados de contagem assume que a probabilidade de ocorrência de um evento (λ) durante um determinado período de tempo é constante e proporcional à duração do tempo� λ é conhecido como a intensidade do processo

� Para construir um modelo econométrico onde a variável � Para construir um modelo econométrico onde a variável y seja dependente de um conjunto de variáveis explicativas x, usualmente assume-se que λ = exp (xβ)� A definição da intensidade do processo informa que a média de y, dado

x, é uma função exponencial de um índice linear das variáveis explicativas

� A função exponencial garante que a intensidade do processo, que pode ser interpretada como o número médio de eventos, dado x, seja sempre positiva.

21 dolores@pq.cnpq.br

Regressão de Poisson:

� Uma propriedade básica do modelo de Poisson é a, de equi-dispersion.� Isto significa que a média de y, dado x, é igual à variância de y, dado x.

� Para que a regressão de Poisson seja apropriada, esta hipótese deve estar refletida nos dados

� Na prática, entretanto, a distribuição de muitas variáveis de interesse da economia da saúde, como as medidas de utilização de serviços, economia da saúde, como as medidas de utilização de serviços, apresentam over-dispersion.

� Over-dispersion: a média da variável y é menor do que a sua variância.

� Estimador consistente de σ2 quando σ2 ≠ 1:

� Para corrigir os erros-padrao: multiplicá-los por

� Desdobramentos recentes dos modelos de contagem tratam da incorporação destas características – Negative Binomial (negbin), por ex.

22 dolores@pq.cnpq.br

∑=

−−−=n

iiyukn i

1

212 ˆ/ˆ)1(σ2σ

Interpretação dos coeficientes

� É preciso lembrar que os coeficientes relacionam-se à intensidade do processo, que é uma função não-linear dos valores de x

� Assim, os valores de β não estão mensurados na unidade de medida da variável y

Portanto, as inferências acerca dos impactos de uma � Portanto, as inferências acerca dos impactos de uma particular variável explicativa sobre y (número de visitas, internações, por exemplo) exige algumas transformações

� Efeitos Marginais

23 dolores@pq.cnpq.br

Exemplos

� Número de cigarros fumados diariamente

� Número de visitas a consultório médico

24 dolores@pq.cnpq.br