Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM-...

22
Cap. 2 ___ ___ 7 ___ Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAIS 2.1 MODELOS PARA SÉRIES TEMPORAIS Consideremos uma série temporal, x t ( 29 t n = 1,..., . A série segue um modelo autore- gressivo de médias móveis ARMA(p,q) com ( 29 Ex t = μ se ( 29 ( 29 ( 29 x x x e e e t t p t p t t q t q - - - - - - = + + + - - - - μ φ μ φ μ θ θ 1 1 1 1 , (2.1.1) onde os e t 's são variáveis aleatórias independentes identicamente distribuídas ( 29 N 0 2 , σ . Os parâmetros desconhecidos são então ( 29 φ = φ φ 1 ,..., p , ( 29 θ = θ θ 1 ,..., q , μ e σ . O lado esquerdo de (2.1.1) é a chamada parte autoregressiva, pois x t depende dos seus valores anteriores (desfasados) x x t t p - - 1 ,..., . O lado direito é a parte de médias móveis, pois o ruído actual no período t é uma combinação linear dos e e e t t t q , ,..., - - 1 originais, os quais não podem ser observados directamente. O modelo geral ARMA(p,q) é, no entanto, de difícil tratamento numérico por causa da parte de médias móveis. Afortunadamente, o modelo AR(p), de muito mais fácil tratamento, dado que apenas contem a parte autoregressiva, constitui muitas vezes uma boa aproximação do modelo ARMA, se estivermos dispostos a considerar um valor para p mais elevado. Obtemos o modelo AR(p) considerando q = 0

Transcript of Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM-...

Page 1: Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAISltodi.est.ips.pt/jpalma/documentos/tese/cap2.pdfCap. 2 ___ ___ 10 ___ Habitualmente apenas é exigido um operador de diferenciação,

Cap. 2 ___

___ 7 ___

Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM-PORAIS

2.1 MODELOS PARA SÉRIES TEMPORAIS

Consideremos uma série temporal, xt ( )t n= 1, ... , . A série segue um modelo autore-

gressivo de médias móveis ARMA(p,q) com ( )E xt = µ se

( ) ( ) ( )x x x e e et t p t p t t q t q− − − − − − = + + +− − − −µ φ µ φ µ θ θ1 1 1 1/ / , (2.1.1)

onde os et 's são variáveis aleatórias independentes identicamente distribuídas ( )N 0 2,σ .

Os parâmetros desconhecidos são então

( )φ =′

φ φ1 , ... , p , ( )θ =′

θ θ1 , ... , q , µ e σ .

O lado esquerdo de (2.1.1) é a chamada parte autoregressiva, pois xt depende dos seus

valores anteriores (desfasados) x xt t p− −1,..., . O lado direito é a parte de médias móveis,

pois o ruído actual no período t é uma combinação linear dos e e et t t q, ,...,− −1 originais,

os quais não podem ser observados directamente.

O modelo geral ARMA(p,q) é, no entanto, de difícil tratamento numérico por causa

da parte de médias móveis. Afortunadamente, o modelo AR(p), de muito mais fácil

tratamento, dado que apenas contem a parte autoregressiva, constitui muitas vezes uma

boa aproximação do modelo ARMA, se estivermos dispostos a considerar um valor para

p mais elevado. Obtemos o modelo AR(p) considerando q = 0

Page 2: Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAISltodi.est.ips.pt/jpalma/documentos/tese/cap2.pdfCap. 2 ___ ___ 10 ___ Habitualmente apenas é exigido um operador de diferenciação,

Cap. 2 ___

___ 8 ___

( ) ( )x x x et t p t p t= + − + + − +− −µ φ µ φ µ1 1 / , (2.1.2)

o qual pode ainda ser representado como

x x x et t p t p t= + + + +− −φ φ γ1 1 Λ , (2.1.3)

em que o intercepto ( )γ µ φ φ= − − −1 1 / p . Um exemplo simples, mas frequente é o

modelo AR(1)

x x et t t= + +−φ γ1 . (2.1.4)

Estes modelos podem ser representados de um outro modo, recorrendo ao operador

de diferença, B, definido por B x xkt t k= − . Assim o modelo ARMA(p,q) (2.1.1) pode ser

representado por

( )( ) ( )φ µ θB x B et t− = , (2.1.5)

onde φ φ φ φ( )B B B Bpp= − − − −1 1 2

2 Λ e θ θ θ θ( )B B B Bqq= − − − −1 1 2

2 Λ são dois po-

linómios em B de graus, respectivamente p e q . Considerando que os polinómios têm

raízes fora do circulo unitário, o que assegura que o modelo é estacionário e invertível,

pode-se expressar (2.1.5) em termos de representação de médias móveis,

( )( )xB

Bet t= +µ

θφ

(2.1.6)

( )= + + + +µ ψ ψ1 1 22B B et/ ,

saindo os coeficientes ψ j , j = 1 2, ,... da relação,

Page 3: Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAISltodi.est.ips.pt/jpalma/documentos/tese/cap2.pdfCap. 2 ___ ___ 10 ___ Habitualmente apenas é exigido um operador de diferenciação,

Cap. 2 ___

___ 9 ___

( ) ( )( )1 1 11 1 1 22− − − = − − − + + +θ θ φ φ ψ ψB B B B B Bq

qp

p/ / / .

Em termos de uma representação autoregressiva (omitindo o termo constante por

conveniência de notação), (2.1.5) pode-se expressar como

( )( )

φθ

B

Bx et t= (2.1.7)

( )1 1 22+ + + =π πB B x et t/ ,

saindo os coeficientes π j , j = 1 2, ,... da relação,

( )( ) ( )1 1 11 22

1 1+ + + − − − = − − −π π θ θ φ φB B B B B Bqq

pp

/ / / .

Por causa da invertibilidade de ( )θ B , estes coeficientes decaem e tornam-se pratica-

mente 0 para algum desfasamento p* . Deste modo o modelo ARMA(p,q) pode ser

aproximado por um AR(p* )

x x et i t ii

p

t= +−=∑π

1

*

, (2.1.8)

habitualmente considera-se p p q* = + .

Se a série xt não é estacionária, então a parte autoregressiva do modelo ARMA(p,q)

deverá incluir um operador que induza a estacionaridade, ou seja, o operador de

diferenciação (ou produtos desse operador) da forma ( )1− B . Deste modo, em vez da

modelização de xt , consideramos

( )1 1− = − −B x x xt t t .

Page 4: Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAISltodi.est.ips.pt/jpalma/documentos/tese/cap2.pdfCap. 2 ___ ___ 10 ___ Habitualmente apenas é exigido um operador de diferenciação,

Cap. 2 ___

___ 10 ___

Habitualmente apenas é exigido um operador de diferenciação, no entanto, poderá

ser necessário repetir o operador, digamos d vezes. Temos então, os modelos mistos

autoregressivos e de médias móveis integrados ARIMA(p,d,q)

( )( ) ( )φ θB B x B edt t1− = , (2.1.9)

essencialmente (2.1.9) diz que a d -ésima diferença ( )1− B xdt é estacionária e pode ser

representada por um modelo ARMA(p,q).

O método dos mínimos quadrados (MQ) é geralmente utilizado para estimar o vector

de parâmetros ( )β ,=′

µ φ φ θ θ, , ... , , . .. ,1 1p q . Obtemos o estimador dos MQ, ∃β , pela

minimização da soma do quadrado dos resíduos

( )rtt p

n2

1

β= +∑ . (2.1.10)

Em processos AR(p) o método dos MQ conduz-nos a um problema de estimação

linear. Assim, dada uma colecção de observações z z zn1 2, ,..., e considerando que zt

segue um modelo AR(p) com média nula, pode-se representar o processo como

z et t t= +′x φ

com ( )x t t t t pz z z=′

− − −1 2, , ... , e ( )φ =′

φ φ1 , ... , p . Considerando as n observações,

temos ( )n p− equações

Z X e= +φ , (2.1.11)

onde ( )Z =′

+z zp n1 , ... , , ( )e=′

+e ep n1 , ... , e

Page 5: Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAISltodi.est.ips.pt/jpalma/documentos/tese/cap2.pdfCap. 2 ___ ___ 10 ___ Habitualmente apenas é exigido um operador de diferenciação,

Cap. 2 ___

___ 11 ___

X

x

x

x

=

=

+

− − −

+′

+′

z z z

z z z

z z z

p p

p p

n n n p

p

p

n

1 1

1 2

1 2

1

2

...

...

...

0 0 / 0 0.

Então o estimador dos mínimos quadrados condicional a z zp1,..., de φ é definido pela

solução ∃φ que minimiza

( )rtt p

n2

1

φ= +∑ ,

em que ( )r zt t tφ φ= − ′x e pode ser representado numa forma explicita

( )�φ = ′ ′−X X X Z1 , (2.1.12)

O estimador dos MQ, ∃φ , é assintóticamente normal e eficiente quando a distribuição

do ruído et é Gaussiana, o mesmo é verdade para o estimador de escala do ruído, �σ ,

obtido de modo similar a partir da minimização da soma do quadrado dos resíduos.

Em contraste com os modelos AR, a estimação dos parâmetros dos modelos MA e

ARMA é sempre um problema não linear em que os estimadores não assumem uma

forma explicita. Suponha-se que zt são observações correspondentes a um processo

ARMA(p,q). Então temos

( ) ( )φ θB z B et t= , (2.1.13)

Neste caso, o estimador dos mínimos quadrados, ( )� �, �β φ θ= , condicional a z zp1,..., e

a e e ep p p q= = = =− − +1 1 0Λ minimiza (2.1.10) onde os resíduos ( )rt β são definidos por

( ) ( ) ( )r B B zt tβ = −θ φ1 (2.1.14)

Page 6: Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAISltodi.est.ips.pt/jpalma/documentos/tese/cap2.pdfCap. 2 ___ ___ 10 ___ Habitualmente apenas é exigido um operador de diferenciação,

Cap. 2 ___

___ 12 ___

Escrevemos rt em vez de ( )rt β quando isso não cause confusão. Os resíduos podem ser

calculados por recorrência

r z z zt t t p t p= − − − +− −φ φ1 1 Λ

+ + +− −θ θ1 1r rt q t qΛ , (2.1.15)

para t p≥ +1, com as condições inicias r r rp p p q= = = =− − +1 1 0Λ .

Se considerarmos

( ) ( ) ( )ar

B B z B rt jt

j

jt t j−

− −−= = − = −β

∂∂φ

θ φ1 1 ,

( ) ( ) ( ) ( )br

B B B z B rt jt

j

jt t j−

− −−= = =β

∂∂θ

θ φ θ2 1

( ) ( ) ( ) ( ) ( )[ ]d t t t p t t qa a b bβ β β β β=′

− − − −1 1, ... , , , ... , , (2.1.16)

a solução ∃β de (2.1.10) satisfaz o vector equação

( )rt tt p

n

d β= +∑ =

1

0. (2.1.17)

2.2 MODELOS GERADORES DE OUTLIERS

Frequentemente nas séries temporais são encontradas observações que surgem como

discordantes face às restantes. Algumas, podem-se dever a erros grosseiros de medição,

outras podem resultar da influência de intervenções exógenas, por exemplo, greves,

alterações súbitas na estrutura dos mercados, alterações inesperadas em certas condições

de um sistema físico ou outras. Como resultado algumas observações surgem como

discordantes e são designadas como outliers.

Page 7: Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAISltodi.est.ips.pt/jpalma/documentos/tese/cap2.pdfCap. 2 ___ ___ 10 ___ Habitualmente apenas é exigido um operador de diferenciação,

Cap. 2 ___

___ 13 ___

A primeira questão que se coloca ao estudar os outliers prende-se pois com a sua

classificação. Fox (1972) introduziu os conceitos de outlier do tipo I e tipo II, vulgari-

zados na literatura, respectivamente como aditivos e inovadores. O primeiro tipo de

outlier corresponde à situação em que ocorre um erro grosseiro de medição ou gravação

afectando uma única observação. No caso de um IO, verifica-se um choque num

determinado período, apresentando-se o ruído como discordante. Nesta situação o efeito

do outlier propaga-se a múltiplas observações. Os AO parecem, no entanto, constituir

os outliers mais frequentes, por exemplo, Kleiner, Martin e Thompson (1979)

escreveram "our experience indicates that, although AO outliers are much more

frequent, IO type outliers occasionally occur". Numa perspectiva recente, veja-se por

exemplo Chen e Liu (1993a, 1993b), são também englobados na categoria de outliers as

alterações da estrutura da série, nomeadamente, alterações de nível: permanentes (LS) e

transitórias (TC).

Uma outra questão prende-se com o tipo de modelo gerador dos outliers a consi-

derar. Denby e Martin (1979) e Bustos e Yohai (1986), entre outros, consideraram os

AO e IO como contaminantes gerados por uma dada distribuição de probabilidades,

propondo modelos para os outliers em relação com o modelo de contaminação por

mistura (veja-se Barnett, 1994).

Fox (1972) propôs modelos paramétricos em relação com o modelo conhecido na

literatura como deslizamento da média. Chang Tiao e Chen (1988), Tsay (1988) Chen e

Liu (1993a) adoptando a formulação de Fox (1972) consideraram os outliers como

casos particulares do modelo geral de intervenção de Box e Tiao (1975).

2.2.1 Modelo de contaminação por mistura

Os dois modelos considerados por Denby e Martin (1979) e por Bustos e Yohai (1986)

para os dois tipos diferentes de outliers são:

Page 8: Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAISltodi.est.ips.pt/jpalma/documentos/tese/cap2.pdfCap. 2 ___ ___ 10 ___ Habitualmente apenas é exigido um operador de diferenciação,

Cap. 2 ___

___ 14 ___

Modelo IO

Dizemos que zt é uma série temporal ARMA(p,q) de acordo com o modelo IO se zt

satisfaz (2.1.5) mas os et `s têm uma distribuição F com cauda pesada aproximadamente

normal - por exemplo F é uma normal contaminada, dada por

( ) ( )F N G= − +1 0 2ε σ ε, , (2.2.1)

onde ε é parâmetro de mistura e G é uma distribuição arbitrária com uma dispersão

superior a σ [por exemplo, ( )G N= 0 2,τ com τ σ2 2≥ ]. Isto significa que os ruídos et ,

com probabilidade 1− ε , são provenientes de uma ( )N 0 2,σ e com probabilidade ε de

uma distribuição arbitrária G com uma dispersão superior. As observações cujos et `s

são provenientes de G podem ser considerados outliers. Neste caso as observações zt

seguem um processo ARMA(p,q).

Modelo AO

Em presença deste tipo de outliers a série observada zt , não é ela mesmo um processo

ARMA. Em vez disso, temos

z x vt t t= + , (2.2.2)

onde xt é um processo ARMA satisfazendo (2.1.5) com ( )e Nt ∼ 0 2,σ e vt é uma se-

quência de variáveis independentes da sequência xt . As variáveis vt têm distribuição H ,

dada por

( )H G= − +1 0ε δ ε , (2.2.3)

Page 9: Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAISltodi.est.ips.pt/jpalma/documentos/tese/cap2.pdfCap. 2 ___ ___ 10 ___ Habitualmente apenas é exigido um operador de diferenciação,

Cap. 2 ___

___ 15 ___

onde δ0 é uma distribuição degenerada na origem e G é uma distribuição arbitrária.

Deste modo, o processo xt ARMA(p,q) é ele próprio observado com probabilidade

1− ε , e com probabilidade ε a observação é um processo xt [ARMA(p,q)] com adição

de um erro com distribuição G.

Então no modelo IO, ruídos ocasionais et têm variância maior que os restantes e

podem aparecer como outliers. No modelo AO uma componente aleatória adicional

sobrepõe-se ocasionalmente ao processo subjacente exibindo a observação um com-

portamento de outlier.

2.2.2 Modelo paramétrico

Quando numa série temporal, estão presentes outliers, o processo xt ARMA(p,q) sofre

uma perturbação. Neste caso, assume-se que a série observada zt , segue um modelo

paramétrico do tipo

( )z f t xt t= + , (2.2.4)

onde ( )f t é uma função representando a intervenção exógena, tal como os outliers.

Assume-se que ( )f t é da forma

( )( )( )f tB

B tT= ω

ωβ

ξ ( ) , (2.2.5)

onde ξtT( ) = 1 para t T=

= 0 t T≠

é uma variável indicadora do período T em que ocorre a perturbação,

ω ω ω δ( ) ... .B B Bss= − − − =1 0 81 e ( )β β βB B Br

r= − − −1 1 ... são polinómios, respecti-

vamente, de grau s e r , ω é uma constante representando o impacto inicial da pertur-

Page 10: Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAISltodi.est.ips.pt/jpalma/documentos/tese/cap2.pdfCap. 2 ___ ___ 10 ___ Habitualmente apenas é exigido um operador de diferenciação,

Cap. 2 ___

___ 16 ___

bação e a razão ( ) ( )ω βB B/ descreve o seu comportamento dinâmico. A função ( )f t

pertence ao modelo de intervenção de Box e Tiao (1975) e é uma forma geral podendo

ser especificada de modo a descrever múltiplas perturbações, nomeadamente os AO, IO,

LS e TC.

Considere-se que o processo xt ARMA(p,q) é ele próprio observado em t T≠ ,

contudo, nalgum instante de tempo T um outlier de um dos quatros tipos que se seguem

é observado:

Considerando na equação (2.2.5)

( )( )

ωβ

B

B= 1

a série observada zt será então dada por

(AO) z xt t tT= + ωξ( ). (2.2.6)

Este é o modelo para um outlier aditivo.

Considerando

( )( )

( )( )

ωβ

θφ

B

B

B

B=

temos o modelo para um outlier inovador:

(IO) ( )( )z xB

Bt t tT= +

θφ

ωξ ( ) . (2.2.7)

Estes modelos podem ser rescritos em termos de sequência inovadora et como se

segue:

Page 11: Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAISltodi.est.ips.pt/jpalma/documentos/tese/cap2.pdfCap. 2 ___ ___ 10 ___ Habitualmente apenas é exigido um operador de diferenciação,

Cap. 2 ___

___ 17 ___

(AO) ( )( )zB

Bet t t

T= +θφ

ωξ ( ) , (2.2.8)

e

(IO) ( )( ) { }zB

Bet t t

T= +θφ

ωξ ( ) . (2.2.9)

Então o caso AO pode ser considerado um modelo de erro grosseiro já que apenas o

nível da T-ésima observação é afectada. Repare-se que apenas a série observada zt sofre

o impacto do outlier não sendo afectado o processo subjacente ARMA(p,q). Geralmente

este outlier surge como resultado de um erro de medição ou de gravação. Por outro

lado, um IO representa um choque extraordinário no período T influenciando z zT T, ,...+1

através do sistema dinâmico ( ) ( )θ φB B/ , neste caso o outlier ocorre na série associado

a xt . Por exemplo, em processos de produção industrial isto corresponde a uma

perturbação no sistema subjacente. Os outliers IO, ao contrário dos AO, claramente

transmitem o seu efeito a observações posteriores.

Considerando o modelo (2.2.5) e fazendo

( )( ) ( )

ωβ

B

B B=

−1

1

temos então o modelo para uma alteração permanente de nível

(LS) ( )z xBt t t

T= +−1

1ωξ ( ) , (2.2.10)

O modelo declara que uma alteração de nível de magnitude ω ocorre no período t T= e

a alteração é permanente, pois z xt t= para t T< mas z xt t= + ω para t T≥ .

Considerando em (2.2.5)

( )( ) ( )

ωβ δ

B

B B=

−1

1 0 1< <δ

Page 12: Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAISltodi.est.ips.pt/jpalma/documentos/tese/cap2.pdfCap. 2 ___ ___ 10 ___ Habitualmente apenas é exigido um operador de diferenciação,

Cap. 2 ___

___ 18 ___

temos o modelo para uma alteração transitória de nível

(TC) ( )z xBt t t

T= +−1

1 δωξ ( ) . (2.2.11)

O modelo descreve uma perturbação que afecta zt para todos os t T≥ . Contudo, o

efeito declina exponencialmente a uma taxa δ com um impacto inicial ω . Como δ < 1, o

efeito eventualmente desaparece. Por esta razão, este modelo é designado como de

alteração transitória.

É de realçar que, excepto no caso dos IO, os efeitos dos outliers na série observada

são independentes do modelo subjacente. Por outro lado, os AO e LS são dois casos

limite de um TC, respectivamente com δ = 0 e δ = 1.

Exemplo 2.1

Para ilustrar o efeito de cada tipo de outlier, simulámos um processo AR(1) sujeito a

diferentes perturbações [veja-se Hudak e Liu (1992)]. Neste sentido, foram simuladas 65

observações a partir do modelo

x x et t t= +−0 6 1, , com σ = 1 0. .

A série é mostrada na figura 2.1.

Page 13: Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAISltodi.est.ips.pt/jpalma/documentos/tese/cap2.pdfCap. 2 ___ ___ 10 ___ Habitualmente apenas é exigido um operador de diferenciação,

Cap. 2 ___

___ 19 ___

Fig. 2.1 - Dados de um processo AR(1) simulado

Para ilustrar as suas consequências foram introduzidos diferentes tipos de outliers no

período T = 30 com um efeito ω = 5.

O gráfico da série contaminada (traço descontínuo) com um AO em conjunto com a

série sem outliers é mostrado na figura 2.2. Deste modo, os valores das observações

mantêm-se inalterados excepto o da observação T = 30.

Fig. 2.2 - AO em T = 30

De modo similar, foi introduzido um IO no período T = 30. A série resultante

conjuntamente com a original é mostrada na figura 2.3. Pode-se verificar que os valores

observados do período T = 30 a T = 38 situam-se todos acima dos correspondentes à

Page 14: Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAISltodi.est.ips.pt/jpalma/documentos/tese/cap2.pdfCap. 2 ___ ___ 10 ___ Habitualmente apenas é exigido um operador de diferenciação,

Cap. 2 ___

___ 20 ___

série original, o que confirma que os IO, ao contrário dos AO, transmitem o seu efeito a

observações posteriores.

Fig. 2.3 - IO em T = 30

No caso da alteração de nível (LS), a partir da figura 2.4, constatamos que após o

período T = 30 o nível médio da serie contaminada é superior ao da série original. Ex-

cepto neste aspecto as duas séries são idênticas.

Fig. 2.4 - LS em T = 30

Considerando uma alteração temporária de nível, em que δ é relativamente próximo

de 1, δ = 0 8. , o efeito do outlier é apenas visível num certo número de períodos (de

T = 30 até sensivelmente T = 47 ).

Page 15: Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAISltodi.est.ips.pt/jpalma/documentos/tese/cap2.pdfCap. 2 ___ ___ 10 ___ Habitualmente apenas é exigido um operador de diferenciação,

Cap. 2 ___

___ 21 ___

Fig. 2.5 - TC em T = 30

Geralmente, uma série temporal pode conter, digamos k outliers de tipos diferentes,

e temos então o seguinte modelo geral:

( )z x L Bt t j j tT

j

kj= +

=∑ω ξ ( )

1

, (2.2.12)

ou em termos de sequência inovadora

( )( )z L BB

Bet j j t

T

j

k

tj= +

=∑ω ξ

θφ

( ) ( )

1

, (2.2.13)

com:

( )( )L BB

Bj ( ) =θφ

para um IO,

( )L Bj = 1 para um AO,

( ) ( )L BBj =

−1

1 para um LS,

( ) ( )L BBj =

−1

1 δ para um TC, ( )0 1< <δ ,

em t Tj= .

Page 16: Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAISltodi.est.ips.pt/jpalma/documentos/tese/cap2.pdfCap. 2 ___ ___ 10 ___ Habitualmente apenas é exigido um operador de diferenciação,

Cap. 2 ___

___ 22 ___

No caso de se considerar que xt segue um modelo misto autoregressivo e de médias

móveis integrado (ARIMA) a formulação do modelo com outliers seria semelhante.

Assim o modelo (2.2.13) viria

( )( )

( ) ( )z L BB

B Bet j j t

T

j

k

d tj= +

−=∑ω ξ

θφ

( )

1 1, (2.2.14)

com:

( )( )

( ) ( )L BB

B Bj d=−

θφ1

para um IO,

( )L Bj = 1 para um AO,

( ) ( )L BBj =

−1

1 para um LS ,

( ) ( )L BBj =

−1

1 δ para um TC , ( )0 1< <δ ,

em t Tj= .

2.3 EFEITOS DA PRESENÇA DE OUTLIERS

A abordagem tradicional aos modelos ARMA assume que os resíduos são normalmente

distribuídos; consequentemente, a minimização da soma do quadrado dos resíduos

conduz a estimadores que são assintóticamente equivalentes aos estimadores de máxima

verosimilhança. No entanto a presença de outliers pode enviesar seriamente as

estimativas dos MQ dos parâmetros ARMA. Inclusive, pode traduzir-se numa especi-

ficação incorrecta do tipo de modelo subjacente à série, dado o enviesamento que a

presença dos outliers provoca nas estimativas das autocorrelações.

Consideremos um modelo AR(1) com um AO

z xt t tT= + ωξ( ); x x et t t= +−φ 1 . (2.3.1)

Page 17: Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAISltodi.est.ips.pt/jpalma/documentos/tese/cap2.pdfCap. 2 ___ ___ 10 ___ Habitualmente apenas é exigido um operador de diferenciação,

Cap. 2 ___

___ 23 ___

O parâmetro ω deverá ser relacionado com o desvio padrão de xt , σx .

No sentido de evidenciarmos os problemas causados pelos AO consideremos um

gráfico com os pontos zt versus zt −1. No caso do processo AR(1) temos ( )n−1 pares de

pontos. Se ω = 0 (ou seja, se não estiver presente nenhum outlier) os pares ( )z zt t−1 ,

dispersam-se desde a origem ao longo de uma linha com inclinação φ , o qual pode ser

estimado pelo método dos MQ.

Fig. 2.6 - Gráfico de zt versus zt −1 (i) sem outliers (ii) com um AO no períodoT

Um outlier aditivo no período T , zT , dá origem no gráfico a dois pontos discordantes,

nomeadamente ( )A z zT T= −1 , e ( )B z zT T= +, 1 . O primeiro é um outlier na variável res-

posta [veja-se Rousseeuw e Leroy (1987)] e está em média ω unidades afastado da linha

de regressão traduzindo-se pois num resíduo elevado

r z z x x eT T T T T T= − = + − = +− −φ ω φ ω1 1 , (2.3.2)

no entanto a sua influência sobre o estimador dos MQ é diminuta, não provocando uma

alteração significativa na inclinação da linha de regressão. O ponto ( )B z zT T= +, 1 ,

traduz-se também num resíduo discordante pois

( )r z z x x eT T T T T T+ + + += − = − + = −1 1 1 1φ φ ω φω , (2.3.3)

mas, mais importante, este par representa um ponto de alavanca ("leverage") elevado,

isto porque a variável regressora z xT T= + ω é discordante face às restantes, afectando

Page 18: Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAISltodi.est.ips.pt/jpalma/documentos/tese/cap2.pdfCap. 2 ___ ___ 10 ___ Habitualmente apenas é exigido um operador de diferenciação,

Cap. 2 ___

___ 24 ___

consideravelmente a estimativa de φ . Como consequência o coeficiente de inclinação

estimado ∃φ tenderá a aproximar-se de zero. Isto dá-nos uma explicação intuitiva da

razão porque os AO tem um efeito bastante negativo no estimador dos MQ.

Também no quadro de um AR(1), Guttman e Tiao (1978) estudaram as propriedades

do estimador dos MQ, ∃φ , sob o modelo AO. Concluíram que o enviesamento devido à

presença do outlier de efeito ω numa amostra de dimensão n é aproximadamente

( ) ( )− 12

n xφ ω σ , (2.3.4)

com ( )σ σ φx2 2 21= −/ . Este enviesamento pode ser bastante considerável. Por exemplo,

se n = 50, ( )ω σ x = 3 e φ = 0 5. , o enviesamento é de −0 09. e com φ = 0 9. é de −0 16. .

Ledolter (1987b), estudou o efeito de um AO nas estimativas dos parâmetros de um

processo ARMA, mas considerou como modelo gerador de outliers o modelo de

contaminação por mistura, visto anteriormente, no qual a frequência de outliers é pro-

porcional à dimensão da amostra. Neste caso o modelo ARMA com outliers AO é dado

por

z x vt t t= + , ( ) ( )φ θB x B et t= , (2.3.5)

onde os vt são variáveis aleatórias assumindo o valor nulo com probabilidade 1− ε e

seguem uma distribuição ( )N 0 2,τ com probabilidade ε . Além disso, assume-se que as

sequências vt e et são independentes. Este modelo constitui pois uma versão estocástica

do modelo paramétrico para outliers aditivos.

Num processo AR(1) a estimativa do parâmetro ∃φ coincide com a autocorrelação da

amostra de ordem um, ( )�ρ1 z . Por outro lado, sabe-se que a autocorrelação da amostra

( )�ρk z constitui uma estimativa consistente da autocorrelação teórica, ( )ρk z . A variância

e as autocovariâncias de zt são dadas por

Page 19: Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAISltodi.est.ips.pt/jpalma/documentos/tese/cap2.pdfCap. 2 ___ ___ 10 ___ Habitualmente apenas é exigido um operador de diferenciação,

Cap. 2 ___

___ 25 ___

( ) ( ) ( )E z E x vt t t x v2 2 2 2 2 2 21= + = + = − +σ σ σ φ ετ/ ,

( ) ( )( )E z z E x v x vt t k t t t k t kk

x− − −= + + = φ σ 2

( )= −φ σ φk 2 21/ k ≥ 1.

Então as autocorrelações são dadas por

( )ρφσ

σ σφ φ

σσ σ1

2

2 2

2

2 2z x

x v

v

x v

=+

= −+

( )= − +

φ φε τ σ

11

2

1

x

,

( ) ( )ρ φ ρkkz z= −1

1 k ≥ 1.

Isto demonstra que o enviesamento assintótico em ( )� �φ ρ= 1 z é dado por

( )( )E

x

�φ φ φε τ σ

− = − +

11

2

1

. (2.3.6)

Para exemplificar, considere-se φ = 0 5. , ε = 0 02. e ( )τ σ x = 3 0. . Neste caso o envie-

samento é de −0 076. .

A autocorrelação ρk z( ) também demonstra que a presença de um outlier aditivo

poderá traduzir-se numa especificação incorrecta do tipo de modelo subjacente à série.

Por exemplo, segundo Ledolter (1987b) o modelo AR(1) com um AO pode ser facil-

mente confundido com um modelo ARMA(1,1).

Page 20: Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAISltodi.est.ips.pt/jpalma/documentos/tese/cap2.pdfCap. 2 ___ ___ 10 ___ Habitualmente apenas é exigido um operador de diferenciação,

Cap. 2 ___

___ 26 ___

O mesmo principio pode ser usado para demonstrar que os AO podem afectar os

estimadores usuais dos parâmetros no modelo ARMA. As primeiras p q+ autocorre-

lações ρ ρ ρ1 2, ,..., p q+ no modelo ARMA(p,q), podem ser definidas como funções dos

parâmetros ARMA e, inversamente, os parâmetros podem-se exprimir em termos dessas

autocorrelações. Substituindo essas autocorrelações pelas estimativas da amostra temos

os estimadores dos momentos, os quais resultam da resolução das conhecidas equações

de Yule-Walker. Para os processos AR o método é relativamente simples, para

processos ARMA, as equações são não lineares nos parâmetros, dai a sua complexidade

de resolução.

Os estimadores dos momentos são estimadores consistentes dos parâmetros ARMA

na ausência de outliers. No entanto, Ledolter (1987b) concluiu que as equações de Yule-

Walker não providenciam estimadores consistentes em presença de um AO. Isto porque

a autocorrelação da amostra ( )�ρk z em modelos ARMA(p,q) com AO não constitui um

estimador consistente da autocorrelação teórica do processo ARMA sem outliers,

( )ρk x . Considere-se, como exemplo, o caso em que xt em (2.3.5) segue um modelo

MA(1) com variância ( )σ θ σx2 2 21= + e autocorrelação de ordem um

( ) ( )ρ θ θ121x = − +/ . Na presença de um AO, a autocorrelação de ordem um é dada por

( )ρσ ρσ σ

θθ

σσ σ1

21

2 2 2

2

2 21z

xx

x v

x

x v

=+

= −+

+

( ).

Por exemplo, com ε = 0 05. , ( )τ σ x = 3 0. e θ = 0 8. a autocorrelação sem e com outliers,

é respectivamente, ( )ρ1 0 4x = − . e ( )ρ1 0 336z = − . . Por outro lado, a estimativa de θ que

se obtém pelo método dos momentos é de ∃ .θ = 0 39, o que constitui um desvio

considerável do verdadeiro valor θ = 0 8. .

No caso da presença de um IO e considerando o gráfico de zt versus zt −1, o ponto

( )C z zT T= +, 1 surge como um outlier na direcção vertical.

Page 21: Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAISltodi.est.ips.pt/jpalma/documentos/tese/cap2.pdfCap. 2 ___ ___ 10 ___ Habitualmente apenas é exigido um operador de diferenciação,

Cap. 2 ___

___ 27 ___

Fig. 2.7 - Gráfico de zt versus zt −1, com um IO no períodoT

Posteriormente o IO resulta em pontos ( )z zt t−1 , que se aproximam da linha de regressão

original com inclinação φ . Deste modo, o IO traduz-se num outlier na variável resposta

e num certo número de "bons" pontos de alavanca, os quais têm inclusive a característica

de melhorarem a precisão da estimativa dos MQ, compensando o efeito do outlier.

Outra forma de ilustrar porque é que os outliers inovadores não afectam significati-

vamente os estimadores dos coeficientes ARMA é considerar como modelo IO, o mo-

delo de contaminação por mistura

( ) ( )( )φ θB z B e vt t t= +

no qual a distribuição do ruído e vt t+ tem uma cauda mais pesada que a normal. Whittle

(1962) e Box e Jenkins (1976) demonstraram que a distribuição assintótica dos es-

timadores dos MQ, ∃β , não depende da distribuição dos distúrbios. Demonstraram ainda

que a distribuição de ( )n �β β− converge para uma distribuição normal com matriz de

covariância que depende apenas dos parâmetros ARMA. Deste modo, os IO não

afectam significativamente os estimadores dos MQ.

Balke (1993) estudou o efeito nos estimadores dos MQ da presença de um outlier

por alteração de nível. Assim considerou um LS ocorrendo no período T +1 de efeito ω ,

gerado pelo modelo (2.2.10) em que a componente regular de zt segue um modelo

AR(1). Neste caso, o enviesamento dos estimadores dos MQ é dado por

Page 22: Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM- PORAISltodi.est.ips.pt/jpalma/documentos/tese/cap2.pdfCap. 2 ___ ___ 10 ___ Habitualmente apenas é exigido um operador de diferenciação,

Cap. 2 ___

___ 28 ___

( ) ( ) ( )E

n T T n�

/*2φ φ

φ ωσ

− =− −1 2 2

,

( ) ( )( )

( ) ( )E

n T T

n�

� �

σ σφ φ σ

φφ ω2 2

2 2

2

2 2

21

1− =

−−

+− −

, (2.3.7)

onde

( )( )

σσ

φω*2 =

−+

−2

2

2

21

n T T

n .

Exemplo 2.2

Considere-se os dados simulados do exemplo 2.1, em que um outlier foi introduzido no

período T = 30. Estimando os parâmetros obtemos os seguintes resultados

CASO ∃φ D.P. de ∃φ ∃σ

SEM OUTLIERS ,59319 ,10146 1,1226 AO ,50349 ,10888 1,3013 IO ,61922 ,09895 1,2837 LS ,95417 ,04175 1,4056 TC ,63450 ,09993 1,2978

Pode-se observar a influência que o outlier tem na estimação dos parâmetros. Assim,

dependendo do tipo de outlier, pode-se constatar diferentes efeitos ao nível das

estimativas de φ e σ . Repare-se que o IO tem a influência mais reduzida, como seria de

esperar.