Análisis clásico de series temporales - UMAwebpersonal.uma.es/~antonio/series.pdfEste tipo de...
Transcript of Análisis clásico de series temporales - UMAwebpersonal.uma.es/~antonio/series.pdfEste tipo de...
1
Análisis clásico de series temporales
Profesor: Antonio Caparrós Ruiz
2
Análisis clásico de series temporales
1. Introducción
Hasta ahora nos hemos ubicado en el campo de la Econometría causal, es decir, una
variable dependiente es explicada y predicha por su relación con k variables
explicativas:
Yt = β1 + β2*X2t + ...+ βk*Xkt + ut
Este tipo de análisis conlleva una serie de problemas:
1) La ausencia de una teoría que justifique las posibles variables explicativas que se
han de introducir en el modelo.
2) Las predicciones de la variable Y se basan en predicciones de las X’s.
Por estas razones surge el análisis clásico de series temporales que permite realizar
predicciones de la variable con la única información procedente del pasado de la
misma.
2. Componentes de una serie temporal
Una serie temporal puede descomponerse en las siguientes cuatro fluctuaciones:
a) Tendencia de larga duración o secular (Tt):
Recoge el movimiento de la variable a largo plazo, debido a cambios
demográficos, tecnológicos o institucionales.
Ejemplos de variables con tendencia
1) Gasto público en becas en España
050000
100000150000200000250000
300000350000400000450000500000
1992
1994
1996
1998
2000
2002
2004
2006
Niveles nouniversitariosNiveles universitarios
3
2) Paro registrado en España
0
500000
1000000
1500000
2000000
2500000
3000000
3500000
4000000
4500000
1996
M01
1996
M09
1997
M05
1998
M01
1998
M09
1999
M05
2000
M01
2000
M09
2001
M05
2002
M01
2002
M09
2003
M05
2004
M01
2004
M09
2005
M05
2006
M01
2006
M09
2007
M05
2008
M01
2008
M09
2009
M05
2010
M01
3) Número de matrimonios
0
50000
100000
150000
200000
250000
300000
1975
1977
1979
1981
1983
1985
1987
1989
1991
1993
1995
1997
1999
2001
2003
2005
2007
b) Movimiento oscilatorio o cíclico
Recoge las fluctuaciones originadas por el ciclo económico, que pueden durar
entre 4 y 8 años.
Ejemplo
Componente cíclico de los ocupados en el sector turístico
-4
-2
0
2
4
6
99 00 01 02 03 04 05 06 07
España Andalucía
4
c) Fluctuaciones estacionales (Et):
Son movimientos que se presentan con una periodicidad inferior al año, mes,
trimestre, cuatrimestre,...Y suelen ser repetitivas mostrando el efecto de la
climatología, la estructura productiva o festividades.
Ejemplo.
Serie de índice del comercio al por menor
020406080
100120140160180
1995
M01
1995
M11
1996
M09
1997
M07
1998
M05
1999
M03
2000
M01
2000
M11
2001
M09
2002
M07
2003
M05
2004
M03
2005
M01
2005
M11
2006
M09
2007
M07
2008
M05
d) Variaciones irregulares (It):
Muestra aquellos factores asociados al muy corto plazo y que quedan fuera del
control del analista. Dentro de este componente también denominado residual, se
encuentran aquellos factores inusuales, pero fácilmente reconocibles como una
catástrofe natural.
Ejemplo
Serie de licitaciones de los ayuntamientos de superficies industriales
0
200
400
600
800
1000
1200
1400
1600
1990
M01
1991
M02
1992
M03
1993
M04
1994
M05
1995
M06
1996
M07
1997
M08
1998
M09
1999
M10
2000
M11
2001
M12
2003
M01
2004
M02
2005
M03
2006
M04
2007
M05
2008
M06
2009
M07
5
Ejemplo de descomposición de una serie en componentes
1500000
2000000
2500000
3000000
3500000
4000000
4500000
1996 1998 2000 2002 2004 2006 2008 2010
PARO
1500000
2000000
2500000
3000000
3500000
4000000
4500000
1996 1998 2000 2002 2004 2006 2008 2010
TENDENCIA
-80000
-60000
-40000
-20000
0
20000
40000
60000
80000
1996 1998 2000 2002 2004 2006 2008 2010
IRREGULAR
-150000
-100000
-50000
0
50000
100000
150000
1996 1998 2000 2002 2004 2006 2008 2010
ESTACIONALIDAD
-300000
-200000
-100000
0
100000
200000
300000
1996 1998 2000 2002 2004 2006 2008 2010
CICLO
Dado que los componentes de una serie no se observan aisladamente, se necesita aplicar
hipótesis que representen el proceso generador de los datos:
1) Hipótesis aditiva: Yt = Tt + Ct + Et + It
1) Hipótesis multiplicativa: Yt = Tt * Ct * Et * It
2) Hipótesis mixta: Yt = Tt * Ct * Et + It
6
A nivel práctico hay que elegir entre uno u otro esquema. Hay que considerar que en la
hipótesis aditiva los cuatro componentes son independientes, por ejemplo, la existencia
de tendencia no condiciona el efecto de la estacionalidad; mientras que en la hipótesis
multiplicativa, los elementos están interrelacionados entre sí. Así, la estacionalidad se
agrega como un porcentaje de la tendencia y no como una cantidad independiente.
Para concretar si la serie temporal sigue un esquema aditivo o uno multiplicativo, se
debe analizar la amplitud del ciclo anual (componentes de la serie estacional). Si éste
aumenta a medida que lo hace la tendencia (las ondas se agrandan), el modelo es
multiplicativo. Si permanece constante es aditivo.
Ejemplo
3. Componente estacional: Desestacionalización
a) Evolución a medio y largo plazo de la variable
Si el objetivo es conocer la evolución de la serie sin estacionalidad, es decir, su
evolución a medio y a largo plazo, es necesario obtener su tasa de variación
interanual. Así, dado Yt = Tt * Ct * Et * It, con datos trimestrales, se calcula la
siguiente tasa: T1
4 = [(Yt – Yt-4) / Yt-4] *100=[(( Tt * Ct * Et * It)- ( Tt-4 * Ct-4 * Et-4 * It-4))/ ( Tt-4 * Ct-4 * Et-4 * It-4))*100]
Si se supone estacionalidad estable Et = Et-4, entonces:
T1
4 = [(Yt – Yt-4) / Yt-4] *100=[(( Tt * Ct * It)- ( Tt-4 * Ct-4 * It-4))/ ( Tt-4 * Ct-4 * It-4))*100]
Con esta tasa el efecto estacional queda excluido
7
b) Desestacionalización
b.1) Método de la razón a la media móvil
Con este método se obtienen unos coeficientes que sintetizan en un único valor la
estacionalidad para cada periodo temporal. Y a partir de ahí, poder obtener la serie
desestacionalizada, es decir, la serie sin el componente estacional.
El método supone que:
* La serie ha sido generada bajo una hipótesis multiplicativa:
Yt = Tt * Ct * Et * It
* La estacionalidad es estable, no varía para mismo periodos de diferentes años: Et=Et-4
o Et=Et-12.
3) La tendencia y el ciclo se obtienen de forma conjunta.
El objetivo del método es obtener una estimación de Et. Concretamente, el
procedimiento consta de las siguientes partes:
1) Estimación del componente tendencia-ciclo a través de la serie de medias móviles
centradas: MMct = Tt * Ct.
2) Primera estimación del componente estacional e irregular (Et*It). Para ello se divide
la serie original por MMct :
Et*It= Yt / MMct
A esta serie de valores se les denominan índices específicos o brutos de variación
estacional y constituyen una primera aproximación del componente estacional.
3) Primera estimación del componente estacional: E’j .
La diferencia entre los índices estacionales es debida a los factores irregulares. Estos se
eliminan tomando la media aritmética para cada una de las fracciones del año.
4) Normalización de los coeficientes: E’j.
La estacionalidad media en un esquema multiplicativo correponde a Et=1, para lograr
que los índices estacionales tengan como media 1 se normalizan, y se obtienen los
índices generales de variación estacional:
IGVEj = Ej/ ΣEj/m; j=1,...,m
8
La serie desestacionalizada es Ydt,j= Yt,j / IGVEj.
5) Los IGVEj fluctúan por debajo y por encima de 1.
Ejemplo con la serie de paro registrado: periodo 1996:01-2011:01
Sample: 1996M01 2011M01 Included observations: 181 Ratio to Moving Average Original Series: PARO Adjusted Series: PAROSA
Scaling Factors:
1 1.040337 2 1.043614 3 1.033282 4 1.013096 5 0.986780 6 0.970998 7 0.958699 8 0.967058 9 0.975154 10 0.993592 11 1.011023 12 1.011117
9
1500000
2000000
2500000
3000000
3500000
4000000
4500000
1996 1998 2000 2002 2004 2006 2008 2010
PARO
1600000
2000000
2400000
2800000
3200000
3600000
4000000
4400000
1996 1998 2000 2002 2004 2006 2008 2010
PAROSA
0.94
0.96
0.98
1.00
1.02
1.04
1.06
1996 1998 2000 2002 2004 2006 2008 2010
IGVE
* Interpretación de los IGVE: 1) (IGVEenero-1)*100 = (1.04-1)*100= 4%
La estacionalidad del mes de enero provoca que el paro registrado crezca un 4%
por encima de su valor medio anual.
2) (IGVEjulio-1)*100 = (0.95-1)*100= -5%
La estacionalidad del mes de julio provoca que el paro registrado caiga un 5%
por debajo de su valor medio anual.
b.2) Método de la diferencia a la media móvil
La hipótesis que subyacen tras este método son las siguientes:
1) La serie ha sido generada bajo una hipótesis aditiva:
Yt = Tt + Ct + Et + It
2) La estacionalidad es estable, no varía para mismo periodos de diferentes años: Et=Et-4
(t es un trimestre) o Et=Et-12 (t es un mes).
10
3) La tendencia y el ciclo se obtienen de forma conjunta.
El procedimiento consta de las siguientes partes:
1) Estimación del componente tendencia-ciclo a través de la serie de medias móviles
centradas: MMct = Tt + Ct.
2) Primera estimación del componente estacional e irregular (Et+It). Para ello se resta la
serie original por MMct :
Et+It= Yt - MMct
A esta serie de valores se les denominan índices específicos o brutos de variación
estacional y constituyen una primera aproximación del componente estacional.
3) Primera estimación del componente estacional: E’j.
Bajo la hipótesis de estacionalidad estable, la diferencia entre los índices específicos o
brutos de variación estacional es debida a los factores irregulares. Estos se eliminan
tomando la media aritmética para cada una de las fracciones del año.
4) Posteriormente se normalizan los coeficientes E’j, para que la media de todos los
índices valga 0, obteniéndose los IGVEj. Por ejemplo, si los datos son trimestrales:
IGVE1= E’1 - ∑
=
4
1
' 4/j
jE ; IGVE2= E’2 - ∑
=
4
1
' 4/j
jE ; IGVE3= E’3 - ∑
=
4
1
' 4/j
jE ; IGVE4= E’4 - ∑
=
4
1
' 4/j
jE
La serie desestacionalizada es Ydt,j= Yt,j - IGVEj.
5) Los IGVEj con la hipótesis aditiva fluctúan por encima y por debajo de 0.
Ejemplo con la serie de paro registrado: periodo 1996:01-2011:01
11
Sample: 1996M01 2011M01 Included observations: 181 Difference from Moving Average Original Series: PARO Adjusted Series: PAROSA
Scaling Factors:
1 90308.63 2 101056.4 3 80600.01 4 35253.60 5 -26940.19 6 -67270.17 7 -101920.2 8 -79824.11 9 -59737.38 10 -16859.27 11 22189.82 12 23142.91
-1000000
0
1000000
2000000
3000000
4000000
5000000
1996 1998 2000 2002 2004 2006 2008 2010
PAROSA PARO IGVE
IGVEenero= 90308. En el mes de enero, la estacionalidad provoca un aumento del paro
registrado de 90308 individuos con respecto a su valor medio anual.
IGVEjulio= -101920, en el mes de julio la estacionalidad provoca una caída del paro
registrado de 101920 individuos.
b.3) Método X11
Este método, al contrario que los dos anteriores, supone que el componente estacional
varía de forma estocástica a lo largo del tiempo. De forma que arroja un índice
estacional para cada periodo, además, permite introducir el efecto de las festividades
sobre la variable. Se puede aplicar tanto con una hipótesis aditiva como multiplicativa.
12
Ejemplo
94
96
98
100
102
104
106
1996 1998 2000 2002 2004 2006 2008 2010
INDICES
-150000
-100000
-50000
0
50000
100000
150000
1996 1998 2000 2002 2004 2006 2008 2010
INDICES2
13
c) Variables ficticias estacionales.
En este caso, las variables ficticias estacionales se incluyen en el modelo para recoger la
característica de la estacionalidad para ello se crean variables de la siguiente forma:
Dj,t⎩⎨⎧
contrariocasoentrimestreomesejemploporjperiodoelconecorrespondtsi
0),(1
Hay que recordar que para no incurrir en la trampa de las variables ficticias es necesario
crear una categoría de referencia. En definitiva, la formulación del modelo
econométrico sería la siguiente:
∑=
++=M
jttjjt uDY
2,1 ββ
Ejemplo Variable Ocupados : Indice de ocupación hotelera.
Dependent Variable: OCUPADOS Method: Least Squares Sample: 2002M01 2010M01 Included observations: 97
Variable Coefficient Std. Error t-Statistic Prob.
C 93.21111 0.908864 102.5578 0.0000 @SEAS(2) 1.201389 1.324886 0.906787 0.3671 @SEAS(3) 3.226389 1.324886 2.435220 0.0170 @SEAS(4) 6.163889 1.324886 4.652391 0.0000 @SEAS(5) 8.763889 1.324886 6.614824 0.0000 @SEAS(6) 10.18889 1.324886 7.690388 0.0000 @SEAS(7) 11.96389 1.324886 9.030126 0.0000 @SEAS(8) 11.58889 1.324886 8.747083 0.0000 @SEAS(9) 10.33889 1.324886 7.803606 0.0000 @SEAS(10) 7.338889 1.324886 5.539260 0.0000 @SEAS(11) 2.188889 1.324886 1.652134 0.1022 @SEAS(12) 1.513889 1.324886 1.142656 0.2564
Interpretación:
Por ejemplo, en el mes de agosto la estacionalidad provoca un incremento por término
medio del índice de ocupación de la hostelería de 11,58 unidades con respecto a enero.
14
Las variables ficticias correspondientes a los meses de febrero, noviembre y diciembre
no son significativas, lo que significa que no presentan un comportamiento estacional
diferente a la categoría de referencia que es enero.
4. Componente de tendencia-ciclo
4.1 Componente tendencia
* Análisis de regresión
A partir del análisis de regresión se pretende captar la tendencia de la variable. Consiste
en considerar una función matemática que relacione a la variable Ydt con el tiempo (si
los datos tienen una periodicidad inferior al año, la variable ha de estar
desestacionalizada):
Ydt = f(t) + ut
Este método supone que los parámetros que definen la tendencia no cambian en el
tiempo.
A continuación se presentan diversos modelos de tendencia:
a.1) Función lineal: Ydt = β1 + β2 t + ut, la variable t se puede construir dándole 1 al
primer periodo y así sucesivamente.
β2: Mide la variación absoluta que por término medio experimenta la variable Ydt al
transcurrir un periodo, ya que:
E(Yt-1) = β1 + β2 (t-1)
E(Yt) = β1 + β2 t
E(Yt) - E(Yt-1) = β2
* Predicción
t t’ Ydt IGVEj
.
2011.01
2011.02
2011.03
.
15
16
17
.
Yd2011.01
Yd2011.02
Yd2011.03
.
IGVE1
IGVE2
IGVE3
15
Predicción para 2011:04 de Yt:
- Hipótesis multiplicativa:
404.2011^
04.2011^
* IGVEYYd
=
donde: 182^
1
^04:2011
^ββ +=
d
Y
- Hipótesis aditiva:
404.2011^
04.2011^
IGVEYYd
+=
Ejemplo:
16
1) Primero se predice el componente de tendencia:
70.7974*826893.051003.18Pr 02:2011^
=+=eciosa
2) Posteriormente se le incorpora la estacionalidad, multiplicando o sumando
dependiendo de cómo sea la hipótesis planteada. En este caso, la hipótesis es
multiplicativa.
62.79*)74*826893.051003.18(Pr 202:2011^
=+= IGVEecio dolares
a.2) Función polinómica:
La expresión general es:
Ydt = β1 + β2 t + β3 t2+ ...+ βp+1 tp + ut
En la práctica uno de los valores para p más usuales es p=2, con lo que la expresión
resultante es:
Ydt = β1 + β2 t + β3 t2+ ut
Este tipo de función es apropiada para la representación gráfica de una serie que
presenta una tendencia curva, con una variación (crecimiento o decrecimiento), que
no es constante si no que es función del periodo considerado. Así, si se supone que
el modelo ya está estimado:
17
23
^
2
^
1
^^ttY t
d
βββ ++=
ttYt
3
^
2
^^
ββ +=∂∂
* Predicción:
Haciendo uso del ejemplo anterior:
- Hipótesis multiplicativa:
404:2011^
04:2011^
* IGVEYYd
=
donde 23
^2
^
1
^04.2011
^1818 βββ ++=
d
Y
- Hipótesis aditiva:
404.2011^
04.2011^
IGVEYYd
+=
Ejemplo
18
Predicción:
1) Primero se predice el componente de tendencia:
23.8174*001586.074*712716.089918.19Pr 202:2011
^=++=eciosa
2) Posteriormente se le incorpora la estacionalidad, multiplicando o sumando
dependiendo de cómo sea la hipótesis planteada, en este caso, hipótesis
multiplicativa.
23.81*)74*001586.074*712716.089918.9(1Pr 22
02:2011^
=++= IGVEeciosa dolares
a.3) Función exponencial
En ocasiones, el crecimiento de la variable no es moderado si no que parece seguir una
ley exponencial, con un ritmo de variación de fuerte crecimiento o caída. En este caso la
función de se adjunta es:
Ydt = e(β1 + β2t +ut)
Representación gráfica
0
1000
2000
3000
4000
5000
6000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
19
Para estimar la ecuación es necesario linealizarla:
ln Ydt = β1 + β2 t + ut
Interpretación de ^
2β :
100*100*^
2^
^
β=∂
d
dt
tY
Y
^
2β * 100 es la variación en términos porcentuales que se produce en la variable
dependiente cuando transcurre un periodo temporal. Para recuperar los valores ajustados
de la variable original:
)
2(^
2
2
^
1
^
Te
tdt
t
eY∑
++=
ββ
Ejemplo: Precio del barril Brendt (2002.01-2007.11).
10
20
30
40
50
60
70
80
90
100
2002 2003 2004 2005 2006 2007
BARRIL
0 0,2 0,4 0,6 0,8
1 1,2 1,4 1,6 1,8
2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
20
Dependent Variable: LNBARRISA Method: Least Squares Sample: 2002M01 2007M11 Included observations: 71
Variable Coefficient Std. Error t-Statistic Prob.
C 3.149329 0.028046 112.2913 0.0000 T 0.018201 0.000677 26.88314 0.0000
R-squared 0.912846 Mean dependent var 3.804561 Adjusted R-squared 0.911583 S.D. dependent var 0.393187 S.E. of regression 0.116914 Akaike info criterion -1.426989 Sum squared resid 0.943155 Schwarz criterion -1.363252 Log likelihood 52.65812 F-statistic 722.7032
* Realizar una predicción para diciembre del 2007, sabiendo que t es igual a 1 en
2002.1.
=++== 957.0*)142/943155.072*018201.0149.3(12*12.2007
^12.2007
^eIGVEdYY
= 83.27
* Interpretación de ^
2β * 100:
Al transcurrir un periodo la variable “Precio del barril de petróleo desestacionalizada”
aumenta por término medio en un 1,82%.
a.4) Modelo logístico Se utiliza para describir la evolución temporal de algunos fenómenos que presentan
tendencias de crecimiento acotadas a largo plazo, con un punto de inflexión intermedio.
Suelen ser útiles para representar funciones de consumo de bienes duraderos que se
caracterizan por un fuerte crecimiento al principio, tras el cual se produce un cambio en
el ritmo de crecimiento. Concretamente, se produce una desaceleración hasta
aproximarse sucesivamente al nivel de saturación del mercado. El modelo de regresión
que se ajusta es:
21
tuttd
eeKY
211 ββ −+
=
donde k, β1 y β2 son constantes positivas. Esta función tiene dos asíntotas, cuanto t→∞ ,
Yt tiende a K, y cuando t→-∞ , Yt tiende a 0, constituyendo este valor su asíntota
inferior.
Para la estimación directa de este modelo se utilizan métodos no lineales. 4) Función Gomperzt Se utiliza para describir fenómenos similares a la logística y su expresión es:
Ydt = k
te 2
1
β
β−
ut
4.2 Componente cíclico: Filtro de Holdrick-Prescott
A partir de este procedimiento se desea obtener el componente cíclico de la
variable. Para aplicar este filtro la variable ha de estar desestacionalizada. Se supone
una hipótesis aditiva: Ydt = Tt + Ct+ It, t= 1,...,T. A partir de estas consideraciones, se
desea obtener la serie suavizada, que en este caso, sería la tendencia Tt. Para ello habría
que minimizar la siguiente función:
{ }]))()(([)([ 2
1 211
2∑ ∑= =
−+ −−−+−t
T
tttttt
dTt
TTtTTTYMin λ
tras minimizar la función se obtiene un vector de dimensión 1xT que recoge el
componente tendencia: {T1, T2,..., TT}. λ es un parámetro que penaliza la variabilidad
del componente tendencia, los autores del método proponen los siguientes valores:
λ= 100 con datos anuales
λ= 1600 con datos trimestrales
λ= 14400 con datos mensuales.
Una primera aproximación al componente cíclico sería: C’t = Yd
t - Tt; no obstante, en
C’t está incluido el componente irregular, así pues, para conseguir la verdadera
estimación de Ct hay que volver a aplicar el filtro de Holdrick-Prescott a C’t para
obtener, nuevamente, una serie suavizada que sería Ct:
22
{ }]))()(([)([ 2
1 211
2'∑ ∑= =
−+ −−−+−t
T
ttttttt
TtCCCCCCMin λ
donde Ct es el componente cíclico.
Ejemplo Proc/Holdrick-Prescott filter: Serie “Paro registrado” (1996M1-2011M01)
-400000
-200000
0
200000
400000
1500000
2000000
2500000
3000000
3500000
4000000
4500000
1996 1998 2000 2002 2004 2006 2008 2010
PAROSA Trend Cycle
Hodrick-Prescott Filter (lambda=14400)
-100000
-80000
-60000
-40000
-20000
0
20000
40000
60000
1996 1998 2000 2002 2004 2006 2008 2010
CICLO
23
5. Predicción Antes de analizar la predicción es necesario señalar que se hagan explícitos los
siguientes supuestos:
a) Se considera que existe una cierta estabilidad en el fenómeno.
Ej. Serie no estable: Nº de terremotos en España en el mes de marzo
Número de terremotos
0
100
200
300
400
500
600
1985
1987
1989
1991
1993
1995
1997
1999
2001
2003
2005
2007
Marzo
b) Los datos han de ser homogéneos en el tiempo, es decir, se ha de mantener la
definición y los procedimientos de medición de la magnitud objeto de estudio.
Ej. La Encuesta de Ocupación Hotelera sustituyó desde enero del 1999 a la Encuesta
de Movimiento de Viajeros en Establecimientos Hoteleros, ampliando la
investigación a la categoría de una estrella y similares, puesto que además de
suponer más del 50% del total de establecimientos, representan más del 5% de
entrada de viajeros.
Si la variable que se investiga es Yt, el conjunto de información disponible es:
Y1, Y2, ..., YT
La predicción puede ser de tres tipos:
a) Interim: ^
1 ,Y ...,,^
2Y^
.TY
b) Ex-post: ...1^
+TY
24
c) Ex-ante: 0^Y , 1
^−Y , 2
^−Y ,...
Al error de predicción se le denomina:
et = tY^
- Yt.
Y el porcentaje del error de predicción se define como:
% Error de predicción= ( tY^
- Yt/ Yt) *100
* Medidas para valorar la capacidad predictiva de los modelos
1) Error absoluto medio: EAM
EAM = T
YYT
ttt∑
=
−1
^
, en el interior de la muestra.
EAM = M
YYM
mmm∑
=
−1
^
, hacia el futuro.
2) Porcentaje de error absoluto medio: PEAM
PEAM = T
YYYT
tttt∑
=
−1
^/)(
, en el interior de la muestra.
PEAM = M
YYYM
mmmm∑
=
−1
^/)(
, hacia el futuro.
3) Error cuadrático medio: ECM
ECM = T
YYt tt∑ − 2
^)(
, en el interior de la muestra.
25
ECM = M
YYm mm∑ − 2
^)(
, hacia el futuro.
4) Raíz del error cuadrático medio
RECM= ECM
Cuanto más cercanas estén a cero todas las medidas anteriores mejor será la
capacidad predictiva del modelo.
Las limitaciones de las medidas anteriores son que carecen de cota superior.
Además los valores que alcancen el EAM, el ECM y la RECM dependen de la
unidad de medida de la variable y, por consiguiente, no son adecuados para realizar
comparaciones al menos que vengan referidas las predicciones a la misma variable.
5) Coeficiente de desigualdad de Theil
T
Y
T
Y
TYY
UT
tt
T
tt
T
t
tt
∑∑
∑
==
=
+
−
=
1
2
1
2^
1
2^
)(
;
éste índice está acotado entre 0 y 1. Además es una medida adimensional. Otra
forma de expresar el coeficiente de desigualdad de Theil es exprensándolo al
cuadrado: U2.
• Descomposición de U2 = 2
1
2
1
2^
1
2^
)(
⎟⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜⎜
⎝
⎛
+
−
∑∑
∑
==
=
T
Y
T
Y
TYY
T
tt
T
tt
T
t
tt
=
De esta forma:
26
U2 = 2
1
2
1
2^
,2
1
2
1
2^
2
2
1
2
1
2^
2^ )1(2)()(
^^^
⎟⎟⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜⎜⎜
⎝
⎛
+
−
+
⎟⎟⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜⎜⎜
⎝
⎛
+
−
+
⎟⎟⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜⎜⎜
⎝
⎛
+
−
∑∑∑∑∑∑======
−−
T
Y
T
Y
rSS
T
Y
T
Y
SS
T
Y
T
Y
YY
T
tt
T
tt
yyyy
T
tt
T
tt
yy
T
tt
T
tt
=[ componente de sesgo +componente de varianza+ componente de covarianza].
Los dos primeros componentes forman la parte sistemática; mientras que el otro, la
parte no sistemática, lo ideal es que el componente de varianza y sesgo sean lo más
pequeños posibles.
Ejemplo
* Se ha estimado una modelo exponencial para la variable desestacionalizada del
paro:
-.04
-.02
.00
.02
.04
.06
14.4
14.6
14.8
15.0
15.2
15.4
2006 2007 2008 2009 2010
Residual Actual Fitted
27
14.4
14.6
14.8
15.0
15.2
15.4
2006 2007 2008 2009 2010
LNPAROSAF
Forecast: LNPAROSAFActual: LNPAROSAForecast sample: 2006M01 2011M01Adjusted sample: 2006M02 2011M01Included observations: 60
Root Mean Squared Error 0.021555Mean Absolute Error 0.017285Mean Abs. Percent Error 0.116371Theil Inequality Coefficient 0.000726 Bias Proportion 0.000000 Variance Proportion 0.001315 Covariance Proportion 0.998685
Interpretación de la información:
*Root mean squared error: RECM.
* Mean Absolute Error: EAM.
* Porcentaje del error absoluto medio: PEAM.
*Theil Inequality Coefficient: U.
* Bias Proportion + Variance Proportion + Covariance proportion: 1.