Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM-...
Transcript of Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM-...
Cap. 2 ___
___ 7 ___
Capítulo 2 MODELOS E OUTLIERS EM SÉRIES TEM-PORAIS
2.1 MODELOS PARA SÉRIES TEMPORAIS
Consideremos uma série temporal, xt ( )t n= 1, ... , . A série segue um modelo autore-
gressivo de médias móveis ARMA(p,q) com ( )E xt = µ se
( ) ( ) ( )x x x e e et t p t p t t q t q− − − − − − = + + +− − − −µ φ µ φ µ θ θ1 1 1 1/ / , (2.1.1)
onde os et 's são variáveis aleatórias independentes identicamente distribuídas ( )N 0 2,σ .
Os parâmetros desconhecidos são então
( )φ =′
φ φ1 , ... , p , ( )θ =′
θ θ1 , ... , q , µ e σ .
O lado esquerdo de (2.1.1) é a chamada parte autoregressiva, pois xt depende dos seus
valores anteriores (desfasados) x xt t p− −1,..., . O lado direito é a parte de médias móveis,
pois o ruído actual no período t é uma combinação linear dos e e et t t q, ,...,− −1 originais,
os quais não podem ser observados directamente.
O modelo geral ARMA(p,q) é, no entanto, de difícil tratamento numérico por causa
da parte de médias móveis. Afortunadamente, o modelo AR(p), de muito mais fácil
tratamento, dado que apenas contem a parte autoregressiva, constitui muitas vezes uma
boa aproximação do modelo ARMA, se estivermos dispostos a considerar um valor para
p mais elevado. Obtemos o modelo AR(p) considerando q = 0
Cap. 2 ___
___ 8 ___
( ) ( )x x x et t p t p t= + − + + − +− −µ φ µ φ µ1 1 / , (2.1.2)
o qual pode ainda ser representado como
x x x et t p t p t= + + + +− −φ φ γ1 1 Λ , (2.1.3)
em que o intercepto ( )γ µ φ φ= − − −1 1 / p . Um exemplo simples, mas frequente é o
modelo AR(1)
x x et t t= + +−φ γ1 . (2.1.4)
Estes modelos podem ser representados de um outro modo, recorrendo ao operador
de diferença, B, definido por B x xkt t k= − . Assim o modelo ARMA(p,q) (2.1.1) pode ser
representado por
( )( ) ( )φ µ θB x B et t− = , (2.1.5)
onde φ φ φ φ( )B B B Bpp= − − − −1 1 2
2 Λ e θ θ θ θ( )B B B Bqq= − − − −1 1 2
2 Λ são dois po-
linómios em B de graus, respectivamente p e q . Considerando que os polinómios têm
raízes fora do circulo unitário, o que assegura que o modelo é estacionário e invertível,
pode-se expressar (2.1.5) em termos de representação de médias móveis,
( )( )xB
Bet t= +µ
θφ
(2.1.6)
( )= + + + +µ ψ ψ1 1 22B B et/ ,
saindo os coeficientes ψ j , j = 1 2, ,... da relação,
Cap. 2 ___
___ 9 ___
( ) ( )( )1 1 11 1 1 22− − − = − − − + + +θ θ φ φ ψ ψB B B B B Bq
qp
p/ / / .
Em termos de uma representação autoregressiva (omitindo o termo constante por
conveniência de notação), (2.1.5) pode-se expressar como
( )( )
φθ
B
Bx et t= (2.1.7)
( )1 1 22+ + + =π πB B x et t/ ,
saindo os coeficientes π j , j = 1 2, ,... da relação,
( )( ) ( )1 1 11 22
1 1+ + + − − − = − − −π π θ θ φ φB B B B B Bqq
pp
/ / / .
Por causa da invertibilidade de ( )θ B , estes coeficientes decaem e tornam-se pratica-
mente 0 para algum desfasamento p* . Deste modo o modelo ARMA(p,q) pode ser
aproximado por um AR(p* )
x x et i t ii
p
t= +−=∑π
1
*
, (2.1.8)
habitualmente considera-se p p q* = + .
Se a série xt não é estacionária, então a parte autoregressiva do modelo ARMA(p,q)
deverá incluir um operador que induza a estacionaridade, ou seja, o operador de
diferenciação (ou produtos desse operador) da forma ( )1− B . Deste modo, em vez da
modelização de xt , consideramos
( )1 1− = − −B x x xt t t .
Cap. 2 ___
___ 10 ___
Habitualmente apenas é exigido um operador de diferenciação, no entanto, poderá
ser necessário repetir o operador, digamos d vezes. Temos então, os modelos mistos
autoregressivos e de médias móveis integrados ARIMA(p,d,q)
( )( ) ( )φ θB B x B edt t1− = , (2.1.9)
essencialmente (2.1.9) diz que a d -ésima diferença ( )1− B xdt é estacionária e pode ser
representada por um modelo ARMA(p,q).
O método dos mínimos quadrados (MQ) é geralmente utilizado para estimar o vector
de parâmetros ( )β ,=′
µ φ φ θ θ, , ... , , . .. ,1 1p q . Obtemos o estimador dos MQ, ∃β , pela
minimização da soma do quadrado dos resíduos
( )rtt p
n2
1
β= +∑ . (2.1.10)
Em processos AR(p) o método dos MQ conduz-nos a um problema de estimação
linear. Assim, dada uma colecção de observações z z zn1 2, ,..., e considerando que zt
segue um modelo AR(p) com média nula, pode-se representar o processo como
z et t t= +′x φ
com ( )x t t t t pz z z=′
− − −1 2, , ... , e ( )φ =′
φ φ1 , ... , p . Considerando as n observações,
temos ( )n p− equações
Z X e= +φ , (2.1.11)
onde ( )Z =′
+z zp n1 , ... , , ( )e=′
+e ep n1 , ... , e
Cap. 2 ___
___ 11 ___
X
x
x
x
=
=
−
+
− − −
+′
+′
′
z z z
z z z
z z z
p p
p p
n n n p
p
p
n
1 1
1 2
1 2
1
2
...
...
...
0 0 / 0 0.
Então o estimador dos mínimos quadrados condicional a z zp1,..., de φ é definido pela
solução ∃φ que minimiza
( )rtt p
n2
1
φ= +∑ ,
em que ( )r zt t tφ φ= − ′x e pode ser representado numa forma explicita
( )�φ = ′ ′−X X X Z1 , (2.1.12)
O estimador dos MQ, ∃φ , é assintóticamente normal e eficiente quando a distribuição
do ruído et é Gaussiana, o mesmo é verdade para o estimador de escala do ruído, �σ ,
obtido de modo similar a partir da minimização da soma do quadrado dos resíduos.
Em contraste com os modelos AR, a estimação dos parâmetros dos modelos MA e
ARMA é sempre um problema não linear em que os estimadores não assumem uma
forma explicita. Suponha-se que zt são observações correspondentes a um processo
ARMA(p,q). Então temos
( ) ( )φ θB z B et t= , (2.1.13)
Neste caso, o estimador dos mínimos quadrados, ( )� �, �β φ θ= , condicional a z zp1,..., e
a e e ep p p q= = = =− − +1 1 0Λ minimiza (2.1.10) onde os resíduos ( )rt β são definidos por
( ) ( ) ( )r B B zt tβ = −θ φ1 (2.1.14)
Cap. 2 ___
___ 12 ___
Escrevemos rt em vez de ( )rt β quando isso não cause confusão. Os resíduos podem ser
calculados por recorrência
r z z zt t t p t p= − − − +− −φ φ1 1 Λ
+ + +− −θ θ1 1r rt q t qΛ , (2.1.15)
para t p≥ +1, com as condições inicias r r rp p p q= = = =− − +1 1 0Λ .
Se considerarmos
( ) ( ) ( )ar
B B z B rt jt
j
jt t j−
− −−= = − = −β
∂∂φ
θ φ1 1 ,
( ) ( ) ( ) ( )br
B B B z B rt jt
j
jt t j−
− −−= = =β
∂∂θ
θ φ θ2 1
( ) ( ) ( ) ( ) ( )[ ]d t t t p t t qa a b bβ β β β β=′
− − − −1 1, ... , , , ... , , (2.1.16)
a solução ∃β de (2.1.10) satisfaz o vector equação
( )rt tt p
n
d β= +∑ =
1
0. (2.1.17)
2.2 MODELOS GERADORES DE OUTLIERS
Frequentemente nas séries temporais são encontradas observações que surgem como
discordantes face às restantes. Algumas, podem-se dever a erros grosseiros de medição,
outras podem resultar da influência de intervenções exógenas, por exemplo, greves,
alterações súbitas na estrutura dos mercados, alterações inesperadas em certas condições
de um sistema físico ou outras. Como resultado algumas observações surgem como
discordantes e são designadas como outliers.
Cap. 2 ___
___ 13 ___
A primeira questão que se coloca ao estudar os outliers prende-se pois com a sua
classificação. Fox (1972) introduziu os conceitos de outlier do tipo I e tipo II, vulgari-
zados na literatura, respectivamente como aditivos e inovadores. O primeiro tipo de
outlier corresponde à situação em que ocorre um erro grosseiro de medição ou gravação
afectando uma única observação. No caso de um IO, verifica-se um choque num
determinado período, apresentando-se o ruído como discordante. Nesta situação o efeito
do outlier propaga-se a múltiplas observações. Os AO parecem, no entanto, constituir
os outliers mais frequentes, por exemplo, Kleiner, Martin e Thompson (1979)
escreveram "our experience indicates that, although AO outliers are much more
frequent, IO type outliers occasionally occur". Numa perspectiva recente, veja-se por
exemplo Chen e Liu (1993a, 1993b), são também englobados na categoria de outliers as
alterações da estrutura da série, nomeadamente, alterações de nível: permanentes (LS) e
transitórias (TC).
Uma outra questão prende-se com o tipo de modelo gerador dos outliers a consi-
derar. Denby e Martin (1979) e Bustos e Yohai (1986), entre outros, consideraram os
AO e IO como contaminantes gerados por uma dada distribuição de probabilidades,
propondo modelos para os outliers em relação com o modelo de contaminação por
mistura (veja-se Barnett, 1994).
Fox (1972) propôs modelos paramétricos em relação com o modelo conhecido na
literatura como deslizamento da média. Chang Tiao e Chen (1988), Tsay (1988) Chen e
Liu (1993a) adoptando a formulação de Fox (1972) consideraram os outliers como
casos particulares do modelo geral de intervenção de Box e Tiao (1975).
2.2.1 Modelo de contaminação por mistura
Os dois modelos considerados por Denby e Martin (1979) e por Bustos e Yohai (1986)
para os dois tipos diferentes de outliers são:
Cap. 2 ___
___ 14 ___
Modelo IO
Dizemos que zt é uma série temporal ARMA(p,q) de acordo com o modelo IO se zt
satisfaz (2.1.5) mas os et `s têm uma distribuição F com cauda pesada aproximadamente
normal - por exemplo F é uma normal contaminada, dada por
( ) ( )F N G= − +1 0 2ε σ ε, , (2.2.1)
onde ε é parâmetro de mistura e G é uma distribuição arbitrária com uma dispersão
superior a σ [por exemplo, ( )G N= 0 2,τ com τ σ2 2≥ ]. Isto significa que os ruídos et ,
com probabilidade 1− ε , são provenientes de uma ( )N 0 2,σ e com probabilidade ε de
uma distribuição arbitrária G com uma dispersão superior. As observações cujos et `s
são provenientes de G podem ser considerados outliers. Neste caso as observações zt
seguem um processo ARMA(p,q).
Modelo AO
Em presença deste tipo de outliers a série observada zt , não é ela mesmo um processo
ARMA. Em vez disso, temos
z x vt t t= + , (2.2.2)
onde xt é um processo ARMA satisfazendo (2.1.5) com ( )e Nt ∼ 0 2,σ e vt é uma se-
quência de variáveis independentes da sequência xt . As variáveis vt têm distribuição H ,
dada por
( )H G= − +1 0ε δ ε , (2.2.3)
Cap. 2 ___
___ 15 ___
onde δ0 é uma distribuição degenerada na origem e G é uma distribuição arbitrária.
Deste modo, o processo xt ARMA(p,q) é ele próprio observado com probabilidade
1− ε , e com probabilidade ε a observação é um processo xt [ARMA(p,q)] com adição
de um erro com distribuição G.
Então no modelo IO, ruídos ocasionais et têm variância maior que os restantes e
podem aparecer como outliers. No modelo AO uma componente aleatória adicional
sobrepõe-se ocasionalmente ao processo subjacente exibindo a observação um com-
portamento de outlier.
2.2.2 Modelo paramétrico
Quando numa série temporal, estão presentes outliers, o processo xt ARMA(p,q) sofre
uma perturbação. Neste caso, assume-se que a série observada zt , segue um modelo
paramétrico do tipo
( )z f t xt t= + , (2.2.4)
onde ( )f t é uma função representando a intervenção exógena, tal como os outliers.
Assume-se que ( )f t é da forma
( )( )( )f tB
B tT= ω
ωβ
ξ ( ) , (2.2.5)
onde ξtT( ) = 1 para t T=
= 0 t T≠
é uma variável indicadora do período T em que ocorre a perturbação,
ω ω ω δ( ) ... .B B Bss= − − − =1 0 81 e ( )β β βB B Br
r= − − −1 1 ... são polinómios, respecti-
vamente, de grau s e r , ω é uma constante representando o impacto inicial da pertur-
Cap. 2 ___
___ 16 ___
bação e a razão ( ) ( )ω βB B/ descreve o seu comportamento dinâmico. A função ( )f t
pertence ao modelo de intervenção de Box e Tiao (1975) e é uma forma geral podendo
ser especificada de modo a descrever múltiplas perturbações, nomeadamente os AO, IO,
LS e TC.
Considere-se que o processo xt ARMA(p,q) é ele próprio observado em t T≠ ,
contudo, nalgum instante de tempo T um outlier de um dos quatros tipos que se seguem
é observado:
Considerando na equação (2.2.5)
( )( )
ωβ
B
B= 1
a série observada zt será então dada por
(AO) z xt t tT= + ωξ( ). (2.2.6)
Este é o modelo para um outlier aditivo.
Considerando
( )( )
( )( )
ωβ
θφ
B
B
B
B=
temos o modelo para um outlier inovador:
(IO) ( )( )z xB
Bt t tT= +
θφ
ωξ ( ) . (2.2.7)
Estes modelos podem ser rescritos em termos de sequência inovadora et como se
segue:
Cap. 2 ___
___ 17 ___
(AO) ( )( )zB
Bet t t
T= +θφ
ωξ ( ) , (2.2.8)
e
(IO) ( )( ) { }zB
Bet t t
T= +θφ
ωξ ( ) . (2.2.9)
Então o caso AO pode ser considerado um modelo de erro grosseiro já que apenas o
nível da T-ésima observação é afectada. Repare-se que apenas a série observada zt sofre
o impacto do outlier não sendo afectado o processo subjacente ARMA(p,q). Geralmente
este outlier surge como resultado de um erro de medição ou de gravação. Por outro
lado, um IO representa um choque extraordinário no período T influenciando z zT T, ,...+1
através do sistema dinâmico ( ) ( )θ φB B/ , neste caso o outlier ocorre na série associado
a xt . Por exemplo, em processos de produção industrial isto corresponde a uma
perturbação no sistema subjacente. Os outliers IO, ao contrário dos AO, claramente
transmitem o seu efeito a observações posteriores.
Considerando o modelo (2.2.5) e fazendo
( )( ) ( )
ωβ
B
B B=
−1
1
temos então o modelo para uma alteração permanente de nível
(LS) ( )z xBt t t
T= +−1
1ωξ ( ) , (2.2.10)
O modelo declara que uma alteração de nível de magnitude ω ocorre no período t T= e
a alteração é permanente, pois z xt t= para t T< mas z xt t= + ω para t T≥ .
Considerando em (2.2.5)
( )( ) ( )
ωβ δ
B
B B=
−1
1 0 1< <δ
Cap. 2 ___
___ 18 ___
temos o modelo para uma alteração transitória de nível
(TC) ( )z xBt t t
T= +−1
1 δωξ ( ) . (2.2.11)
O modelo descreve uma perturbação que afecta zt para todos os t T≥ . Contudo, o
efeito declina exponencialmente a uma taxa δ com um impacto inicial ω . Como δ < 1, o
efeito eventualmente desaparece. Por esta razão, este modelo é designado como de
alteração transitória.
É de realçar que, excepto no caso dos IO, os efeitos dos outliers na série observada
são independentes do modelo subjacente. Por outro lado, os AO e LS são dois casos
limite de um TC, respectivamente com δ = 0 e δ = 1.
Exemplo 2.1
Para ilustrar o efeito de cada tipo de outlier, simulámos um processo AR(1) sujeito a
diferentes perturbações [veja-se Hudak e Liu (1992)]. Neste sentido, foram simuladas 65
observações a partir do modelo
x x et t t= +−0 6 1, , com σ = 1 0. .
A série é mostrada na figura 2.1.
Cap. 2 ___
___ 19 ___
Fig. 2.1 - Dados de um processo AR(1) simulado
Para ilustrar as suas consequências foram introduzidos diferentes tipos de outliers no
período T = 30 com um efeito ω = 5.
O gráfico da série contaminada (traço descontínuo) com um AO em conjunto com a
série sem outliers é mostrado na figura 2.2. Deste modo, os valores das observações
mantêm-se inalterados excepto o da observação T = 30.
Fig. 2.2 - AO em T = 30
De modo similar, foi introduzido um IO no período T = 30. A série resultante
conjuntamente com a original é mostrada na figura 2.3. Pode-se verificar que os valores
observados do período T = 30 a T = 38 situam-se todos acima dos correspondentes à
Cap. 2 ___
___ 20 ___
série original, o que confirma que os IO, ao contrário dos AO, transmitem o seu efeito a
observações posteriores.
Fig. 2.3 - IO em T = 30
No caso da alteração de nível (LS), a partir da figura 2.4, constatamos que após o
período T = 30 o nível médio da serie contaminada é superior ao da série original. Ex-
cepto neste aspecto as duas séries são idênticas.
Fig. 2.4 - LS em T = 30
Considerando uma alteração temporária de nível, em que δ é relativamente próximo
de 1, δ = 0 8. , o efeito do outlier é apenas visível num certo número de períodos (de
T = 30 até sensivelmente T = 47 ).
Cap. 2 ___
___ 21 ___
Fig. 2.5 - TC em T = 30
Geralmente, uma série temporal pode conter, digamos k outliers de tipos diferentes,
e temos então o seguinte modelo geral:
( )z x L Bt t j j tT
j
kj= +
=∑ω ξ ( )
1
, (2.2.12)
ou em termos de sequência inovadora
( )( )z L BB
Bet j j t
T
j
k
tj= +
=∑ω ξ
θφ
( ) ( )
1
, (2.2.13)
com:
( )( )L BB
Bj ( ) =θφ
para um IO,
( )L Bj = 1 para um AO,
( ) ( )L BBj =
−1
1 para um LS,
( ) ( )L BBj =
−1
1 δ para um TC, ( )0 1< <δ ,
em t Tj= .
Cap. 2 ___
___ 22 ___
No caso de se considerar que xt segue um modelo misto autoregressivo e de médias
móveis integrado (ARIMA) a formulação do modelo com outliers seria semelhante.
Assim o modelo (2.2.13) viria
( )( )
( ) ( )z L BB
B Bet j j t
T
j
k
d tj= +
−=∑ω ξ
θφ
( )
1 1, (2.2.14)
com:
( )( )
( ) ( )L BB
B Bj d=−
θφ1
para um IO,
( )L Bj = 1 para um AO,
( ) ( )L BBj =
−1
1 para um LS ,
( ) ( )L BBj =
−1
1 δ para um TC , ( )0 1< <δ ,
em t Tj= .
2.3 EFEITOS DA PRESENÇA DE OUTLIERS
A abordagem tradicional aos modelos ARMA assume que os resíduos são normalmente
distribuídos; consequentemente, a minimização da soma do quadrado dos resíduos
conduz a estimadores que são assintóticamente equivalentes aos estimadores de máxima
verosimilhança. No entanto a presença de outliers pode enviesar seriamente as
estimativas dos MQ dos parâmetros ARMA. Inclusive, pode traduzir-se numa especi-
ficação incorrecta do tipo de modelo subjacente à série, dado o enviesamento que a
presença dos outliers provoca nas estimativas das autocorrelações.
Consideremos um modelo AR(1) com um AO
z xt t tT= + ωξ( ); x x et t t= +−φ 1 . (2.3.1)
Cap. 2 ___
___ 23 ___
O parâmetro ω deverá ser relacionado com o desvio padrão de xt , σx .
No sentido de evidenciarmos os problemas causados pelos AO consideremos um
gráfico com os pontos zt versus zt −1. No caso do processo AR(1) temos ( )n−1 pares de
pontos. Se ω = 0 (ou seja, se não estiver presente nenhum outlier) os pares ( )z zt t−1 ,
dispersam-se desde a origem ao longo de uma linha com inclinação φ , o qual pode ser
estimado pelo método dos MQ.
Fig. 2.6 - Gráfico de zt versus zt −1 (i) sem outliers (ii) com um AO no períodoT
Um outlier aditivo no período T , zT , dá origem no gráfico a dois pontos discordantes,
nomeadamente ( )A z zT T= −1 , e ( )B z zT T= +, 1 . O primeiro é um outlier na variável res-
posta [veja-se Rousseeuw e Leroy (1987)] e está em média ω unidades afastado da linha
de regressão traduzindo-se pois num resíduo elevado
r z z x x eT T T T T T= − = + − = +− −φ ω φ ω1 1 , (2.3.2)
no entanto a sua influência sobre o estimador dos MQ é diminuta, não provocando uma
alteração significativa na inclinação da linha de regressão. O ponto ( )B z zT T= +, 1 ,
traduz-se também num resíduo discordante pois
( )r z z x x eT T T T T T+ + + += − = − + = −1 1 1 1φ φ ω φω , (2.3.3)
mas, mais importante, este par representa um ponto de alavanca ("leverage") elevado,
isto porque a variável regressora z xT T= + ω é discordante face às restantes, afectando
Cap. 2 ___
___ 24 ___
consideravelmente a estimativa de φ . Como consequência o coeficiente de inclinação
estimado ∃φ tenderá a aproximar-se de zero. Isto dá-nos uma explicação intuitiva da
razão porque os AO tem um efeito bastante negativo no estimador dos MQ.
Também no quadro de um AR(1), Guttman e Tiao (1978) estudaram as propriedades
do estimador dos MQ, ∃φ , sob o modelo AO. Concluíram que o enviesamento devido à
presença do outlier de efeito ω numa amostra de dimensão n é aproximadamente
( ) ( )− 12
n xφ ω σ , (2.3.4)
com ( )σ σ φx2 2 21= −/ . Este enviesamento pode ser bastante considerável. Por exemplo,
se n = 50, ( )ω σ x = 3 e φ = 0 5. , o enviesamento é de −0 09. e com φ = 0 9. é de −0 16. .
Ledolter (1987b), estudou o efeito de um AO nas estimativas dos parâmetros de um
processo ARMA, mas considerou como modelo gerador de outliers o modelo de
contaminação por mistura, visto anteriormente, no qual a frequência de outliers é pro-
porcional à dimensão da amostra. Neste caso o modelo ARMA com outliers AO é dado
por
z x vt t t= + , ( ) ( )φ θB x B et t= , (2.3.5)
onde os vt são variáveis aleatórias assumindo o valor nulo com probabilidade 1− ε e
seguem uma distribuição ( )N 0 2,τ com probabilidade ε . Além disso, assume-se que as
sequências vt e et são independentes. Este modelo constitui pois uma versão estocástica
do modelo paramétrico para outliers aditivos.
Num processo AR(1) a estimativa do parâmetro ∃φ coincide com a autocorrelação da
amostra de ordem um, ( )�ρ1 z . Por outro lado, sabe-se que a autocorrelação da amostra
( )�ρk z constitui uma estimativa consistente da autocorrelação teórica, ( )ρk z . A variância
e as autocovariâncias de zt são dadas por
Cap. 2 ___
___ 25 ___
( ) ( ) ( )E z E x vt t t x v2 2 2 2 2 2 21= + = + = − +σ σ σ φ ετ/ ,
( ) ( )( )E z z E x v x vt t k t t t k t kk
x− − −= + + = φ σ 2
( )= −φ σ φk 2 21/ k ≥ 1.
Então as autocorrelações são dadas por
( )ρφσ
σ σφ φ
σσ σ1
2
2 2
2
2 2z x
x v
v
x v
=+
= −+
( )= − +
−
φ φε τ σ
11
2
1
x
,
( ) ( )ρ φ ρkkz z= −1
1 k ≥ 1.
Isto demonstra que o enviesamento assintótico em ( )� �φ ρ= 1 z é dado por
( )( )E
x
�φ φ φε τ σ
− = − +
−
11
2
1
. (2.3.6)
Para exemplificar, considere-se φ = 0 5. , ε = 0 02. e ( )τ σ x = 3 0. . Neste caso o envie-
samento é de −0 076. .
A autocorrelação ρk z( ) também demonstra que a presença de um outlier aditivo
poderá traduzir-se numa especificação incorrecta do tipo de modelo subjacente à série.
Por exemplo, segundo Ledolter (1987b) o modelo AR(1) com um AO pode ser facil-
mente confundido com um modelo ARMA(1,1).
Cap. 2 ___
___ 26 ___
O mesmo principio pode ser usado para demonstrar que os AO podem afectar os
estimadores usuais dos parâmetros no modelo ARMA. As primeiras p q+ autocorre-
lações ρ ρ ρ1 2, ,..., p q+ no modelo ARMA(p,q), podem ser definidas como funções dos
parâmetros ARMA e, inversamente, os parâmetros podem-se exprimir em termos dessas
autocorrelações. Substituindo essas autocorrelações pelas estimativas da amostra temos
os estimadores dos momentos, os quais resultam da resolução das conhecidas equações
de Yule-Walker. Para os processos AR o método é relativamente simples, para
processos ARMA, as equações são não lineares nos parâmetros, dai a sua complexidade
de resolução.
Os estimadores dos momentos são estimadores consistentes dos parâmetros ARMA
na ausência de outliers. No entanto, Ledolter (1987b) concluiu que as equações de Yule-
Walker não providenciam estimadores consistentes em presença de um AO. Isto porque
a autocorrelação da amostra ( )�ρk z em modelos ARMA(p,q) com AO não constitui um
estimador consistente da autocorrelação teórica do processo ARMA sem outliers,
( )ρk x . Considere-se, como exemplo, o caso em que xt em (2.3.5) segue um modelo
MA(1) com variância ( )σ θ σx2 2 21= + e autocorrelação de ordem um
( ) ( )ρ θ θ121x = − +/ . Na presença de um AO, a autocorrelação de ordem um é dada por
( )ρσ ρσ σ
θθ
σσ σ1
21
2 2 2
2
2 21z
xx
x v
x
x v
=+
= −+
+
( ).
Por exemplo, com ε = 0 05. , ( )τ σ x = 3 0. e θ = 0 8. a autocorrelação sem e com outliers,
é respectivamente, ( )ρ1 0 4x = − . e ( )ρ1 0 336z = − . . Por outro lado, a estimativa de θ que
se obtém pelo método dos momentos é de ∃ .θ = 0 39, o que constitui um desvio
considerável do verdadeiro valor θ = 0 8. .
No caso da presença de um IO e considerando o gráfico de zt versus zt −1, o ponto
( )C z zT T= +, 1 surge como um outlier na direcção vertical.
Cap. 2 ___
___ 27 ___
Fig. 2.7 - Gráfico de zt versus zt −1, com um IO no períodoT
Posteriormente o IO resulta em pontos ( )z zt t−1 , que se aproximam da linha de regressão
original com inclinação φ . Deste modo, o IO traduz-se num outlier na variável resposta
e num certo número de "bons" pontos de alavanca, os quais têm inclusive a característica
de melhorarem a precisão da estimativa dos MQ, compensando o efeito do outlier.
Outra forma de ilustrar porque é que os outliers inovadores não afectam significati-
vamente os estimadores dos coeficientes ARMA é considerar como modelo IO, o mo-
delo de contaminação por mistura
( ) ( )( )φ θB z B e vt t t= +
no qual a distribuição do ruído e vt t+ tem uma cauda mais pesada que a normal. Whittle
(1962) e Box e Jenkins (1976) demonstraram que a distribuição assintótica dos es-
timadores dos MQ, ∃β , não depende da distribuição dos distúrbios. Demonstraram ainda
que a distribuição de ( )n �β β− converge para uma distribuição normal com matriz de
covariância que depende apenas dos parâmetros ARMA. Deste modo, os IO não
afectam significativamente os estimadores dos MQ.
Balke (1993) estudou o efeito nos estimadores dos MQ da presença de um outlier
por alteração de nível. Assim considerou um LS ocorrendo no período T +1 de efeito ω ,
gerado pelo modelo (2.2.10) em que a componente regular de zt segue um modelo
AR(1). Neste caso, o enviesamento dos estimadores dos MQ é dado por
Cap. 2 ___
___ 28 ___
( ) ( ) ( )E
n T T n�
/*2φ φ
φ ωσ
− =− −1 2 2
,
( ) ( )( )
( ) ( )E
n T T
n�
� �
σ σφ φ σ
φφ ω2 2
2 2
2
2 2
21
1− =
−−
+− −
, (2.3.7)
onde
( )( )
σσ
φω*2 =
−+
−2
2
2
21
n T T
n .
Exemplo 2.2
Considere-se os dados simulados do exemplo 2.1, em que um outlier foi introduzido no
período T = 30. Estimando os parâmetros obtemos os seguintes resultados
CASO ∃φ D.P. de ∃φ ∃σ
SEM OUTLIERS ,59319 ,10146 1,1226 AO ,50349 ,10888 1,3013 IO ,61922 ,09895 1,2837 LS ,95417 ,04175 1,4056 TC ,63450 ,09993 1,2978
Pode-se observar a influência que o outlier tem na estimação dos parâmetros. Assim,
dependendo do tipo de outlier, pode-se constatar diferentes efeitos ao nível das
estimativas de φ e σ . Repare-se que o IO tem a influência mais reduzida, como seria de
esperar.