Normalidad JB, SWILK,Stata

download Normalidad JB, SWILK,Stata

of 23

  • date post

    27-Oct-2015
  • Category

    Documents

  • view

    33
  • download

    1

Embed Size (px)

Transcript of Normalidad JB, SWILK,Stata

  • 20/10/2011 1

    Normalidad de los errores

    Fortino Vela Pen

    Universidad Autnoma Metropolitanafvela@correo.xoc.uam.mx

    Octubre, 2010Mxico, D. F.

  • 20/10/2011 2

    Introduccin

    uXy +=

    ),0( 2Nui

    iii uxy ++= 21 ,o bien,donde

    ,o bien, ),( 2I0u N

    Uno de los supuestos bsicos del modelo de regresin lineal clsico es el que los errores tengan distribucin normal, esto es:

    Con el cumplimiento del supuesto de normalidad se tiene la justificacin terica para la utilizacin de pruebas estadsticas que involucren a las distribuciones t, F y 2 (de uso muy comn en la parte inferencial del modelo).

    No obstante, el supuesto de normalidad puede no ser tan crucial cuando se emplean muestras grandes.

  • 20/10/2011 3

    Una propiedad de la distribucin normal es que cualquier funcin lineal de variables normalmente distribuidas estar tambin normalmente distribuidas.

    Dado que los estimadores de MCO, y , son funciones lineales de entonces tambin siguen una distribucin normal.

    1

    ),( 2iii

    N

    2iu

    De esta manera, si se trabaja con muestras de menos de 100 observaciones resulta crucial el verificar si los errores cumplen, de manera aproximada, una distribucin normal.

  • 20/10/2011 4

    La prueba Jarque-Bera (JB)

    La literatura referente a probar la normalidad es vasta (vese White y MacDonald, 1980).

    La prueba Jarque-Bera (1987) es una prueba que considera los siguientes elementos para probar la normalidad de los errores de un modelo de regresin lineal.

    Sea uXy += donde [ ] 0=uE [ ] 2uu' =ESi se encuentra normalmente distribuido, entonces

    u

    [ ] 033 == tuE[ ] 444 3 == tuE

    La prueba JB toma este principio: que tanto se desvan los coeficientes de asimetra y curtosis

  • 20/10/2011 5

    Las medidas convencionales de asimetra (A) y curtsis(K) estn dadas, respectivamente*, por:

    33

    1

    =b 442

    =b

    La notacin y es tradicional en estadstica y no debe confundirse con los estimadores del modelo.

    1b

    =

    =

    T

    t

    iti uT 1

    1 donde i=2,3,4

    Los momentos sealados, y , se

    pueden estimar a partir de los residuales de MCO considerando que:

    2b

    Ab =1 Kb =2

  • 20/10/2011 6

    As, el coeficiente de asimetra (A) es el tercer momento respecto a la media.

    Mide el grado de simetra de la distribucin de probabilidad (que tan equilibrada o balanceada se encuentra).

    Si el coeficiente es mayor a cero, la distribucin es sesgada a la derecha, y en consecuencia presenta mayor nmero de observaciones a la izquierda.

    23

    1

    2

    1

    3

    =

    =

    =

    nu

    nu

    AT

    tt

    T

    tt

    (1)

  • 20/10/2011 7

    Por su parte, el coeficiente de curtosis (K) es el cuarto momento respecto a la media.

    Mide el grado de picudez o apuntamiento de la distribucin de probabilidad (que tan concentrada se encuentra).

    Cuando el coeficiente es centrado, si est es diferente a tres (mesocrtica), la distribucin muestra problemas. Platicrtica si b2>3 o leptocrtica si b2

  • 20/10/2011 8

    Bajo la hiptesis nula de que los errores se encuentran

    distribuidos normalmente, el estadstico JB se distribuye

    asintticamente como una , siendo igual a2

    )2(

    +

    =

    =

    =

    =

    =

    24

    3

    6

    2

    2

    1

    2

    1

    4

    2

    23

    1

    2

    1

    3

    nu

    nu

    u

    nu

    TJB

    T

    tt

    T

    tt

    T

    tt

    T

    tt

    ( )

    +=24

    36

    22 KATJB

  • 20/10/2011 9

    Este estadstico tiende a ser grande si A o K o ambos

    son significativamente diferentes de 0.

    Note que bajo Ho tanto A como K son cero.

  • 20/10/2011 10

    Considerando la informacin sobre ventas y publicidad de una empresa determinada, verifique si los residuales resultantes del modelo siguen aproximadamente una distribucin normal. Aplique la prueba Jarque-Bera.

    Ejemplo

    id Y X residual (u) u2 u3 u41 69 9 6.00 36.00 216.00 1296.002 76 12 3.25 10.56 34.33 111.573 52 6 -1.25 1.56 -1.95 2.444 56 10 -10.25 105.06 -1076.89 11038.135 57 9 -6.00 36.00 -216.00 1296.006 77 10 10.75 115.56 1242.30 13354.697 58 7 1.50 2.25 3.38 5.068 55 8 -4.75 22.56 -107.17 509.079 67 12 -5.75 33.06 -190.11 1093.13

    10 53 6 -0.25 0.06 -0.02 0.0011 72 11 2.50 6.25 15.63 39.0612 64 8 4.25 18.06 76.77 326.25

    Total 0.00 387.00 -3.75 29071.41

  • 20/10/2011 11

    Retomando (1) y (2) para los datos de este ejemplo se tiene:

    id Y X residual (u) u2 u3 u41 69 9 6.00 36.00 216.00 1296.002 76 12 3.25 10.56 34.33 111.573 52 6 -1.25 1.56 -1.95 2.444 56 10 -10.25 105.06 -1076.89 11038.135 57 9 -6.00 36.00 -216.00 1296.006 77 10 10.75 115.56 1242.30 13354.697 58 7 1.50 2.25 3.38 5.068 55 8 -4.75 22.56 -107.17 509.079 67 12 -5.75 33.06 -190.11 1093.13

    10 53 6 -0.25 0.06 -0.02 0.0011 72 11 2.50 6.25 15.63 39.0612 64 8 4.25 18.06 76.77 326.25

    Total 0.00 387.00 -3.75 29071.41

    ( ) -.001706312/38712/75.3

    23 =

    =A ( ) 2.3292912/38712/41.290712 ==K

  • 20/10/2011 12

    Construyendo el estadstico de prueba Jarque-Bera (JB) se tiene

    ( ) -.001706312/38712/75.3

    23 =

    =A ( ) 2.3292912/38712/41.290712 ==K

    ( ).018749650

    24332929.2

    6)0017063.0(12

    22

    =

    +

    =JB

    ( )

    +=24

    36

    22 KATJB

    5.992 05.0),2( =El valor de tablas es

    No se rechaza Ho, los errores del modelo se distribuyen aprox. normal

    5.9901874965.0

  • 20/10/2011 13

    En Stata se pueden encontrar los coeficientes A y K.reg y xpredict residual, residsum residual, d

    Residuals-------------------------------------------------------------

    Percentiles Smallest1% -10.25 -10.255% -10.25 -6

    10% -6 -5.75 Obs 1225% -5.25 -4.75 Sum of Wgt. 12

    50% .625 Mean 0Largest Std. Dev. 5.931426

    75% 3.75 3.2590% 6 4.25 Variance 35.1818295% 10.75 6 Skewness -.001706399% 10.75 10.75 Kurtosis 2.3293

    La prueba JB en Stata

  • 20/10/2011 14

    A continuacin se elabora el estadstico de prueba JB

    return listscalar JB= (r(N)/6) *((r(skewness)^2)+((r(kurtosis)-3)^2)/4)di "JB" = JBJB.22492532

    No se rechaza Ho, los errores del modelo se distribuyen aprox. normal

  • 20/10/2011 15

    El histograma de los residuales es quizs el mtodo

    grfico ms ampliamente usado para verificar la

    normalidad del trmino de error.

    En Stata el comando histogram es seguido por la variable sobre la cual se construir el

    La opcin normal agrega una curva de densidad normal al grfico.

    Pruebas grficas: histograma

    0

    .

    0

    2

    .

    0

    4

    .

    0

    6

    .

    0

    8

    D

    e

    n

    s

    i

    t

    y

    -10 -5 0 5 10Residuals

  • 20/10/2011 16

    El grfico de probabilidad-probabilidad (P-P plot o grfica porcentual) compara una funcin de distribucin acumulada emprica con una funcin de distribucin terica (e.g., la funcin de distribucin normal estndar).

    El comando pnorm produces un grfico P-P estandarizado normal.

    La forma de interpretar este grfico es la siguiente: si los puntos se aproximan al comportamiento lineal sealado en el grfico, se puede considerar que la funcin emprica de la distribucin acumulada es similar a la terica, y por tanto se comporta normalmente. Si los puntos se alejan a la lnea recta, la variable se aleja de una distribucin normal.

    Otras pruebas grficas: probabilidad-probabilidad (P-P) y cuantil-cuantil (Q-Q)

  • 20/10/2011 17

    En el grfico P-P que ofrece Stata la distribucin acumulada de la variable emprica se ubica sobre el eje x mientras que la distribucin acumulada terica normal sobre el eje y.

    0

    .

    0

    0

    0

    .

    2

    5

    0

    .

    5

    0

    0

    .

    7

    5

    1

    .

    0

    0

    N

    o

    r

    m

    a

    l

    F

    [

    (

    r

    e

    s

    i

    d

    u

    a

    l

    -

    m

    )

    /

    s

    ]

    0.00 0.25 0.50 0.75 1.00Empirical P[i] = i/(N+1)

  • 20/10/2011 18

    Similarmente, la grfica cuantil-cuantil (Q-Q plot)

    compara los valores ordenados de una variable con los

    cuantiles de una distribucin terica especifica (i.e., la

    distribucin normal).

    Si las dos distribuciones son consistentes, los puntos

    sobre la grfica asumen un patrn lineal que pasa a

    atravs del origen con una recta de pendiente unitaria.

    Las grficas P-P y Q-Q se emplean para determinar

    visualmente que tan bien se ajustan los datos empricos

    al comportamiento de una distribucin terica.

  • 20/10/2011 19

    -

    1

    0

    -

    5

    0

    5

    1

    0

    R

    e

    s

    i

    d

    u

    a

    l

    s

    -10 -5 0 5 10Inverse Normal

    La instruccin en Stata es qnorm.

  • 20/10/2011 20

    La prueba sktest (Skewness-Kurtosis) que realiza Statasigue los mismos principios que la prueba JB. Para su correcta aplicacin se requiere un mnimo de 8 observaciones.

    Auque utiliza a los coeficientes de asimetra y curtosis, sktest presenta una prueba de normalidad b