Análisis estadístico de datos simulados Estimadores jgimenez/Modelos_y... · Estimación de...

download Análisis estadístico de datos simulados Estimadores jgimenez/Modelos_y... · Estimación de parámetros

of 25

  • date post

    18-Jul-2018
  • Category

    Documents

  • view

    212
  • download

    0

Embed Size (px)

Transcript of Análisis estadístico de datos simulados Estimadores jgimenez/Modelos_y... · Estimación de...

  • Anlisis estadstico de datos simuladosEstimadores puntuales

    Georgina Flesia

    FaMAF

    2 de mayo, 2013

  • Anlisis estadstico

    Modelizacin estadstica:I Elegir una distribucin en base a los datos observados.I Estimar los parmetros de la distribucin (EMV).I Pruebas de bondad de ajuste.

    Estimacin de parmetrosI Estimador puntual.I Varianza del estimador. Var().I Error cuadrtico medio del estimador. E [( )2].I Estimadores por intervalo e intervalos de confianza.

  • Estimacin de parmetros

    Dada una muestra de n datos observados, se llama estimador delparmetro a cualquier funcin de los datos observados.Propiedades de un buen estimador puntual

    I Insesgabilidad: se dice que el estimador es insesgado siE [] = .

    I Consistencia: si al aumentar la muestra, el estimador seaproxima al parmetro.

    I Eficiencia: se calcula comparando su varianza con la de otroestimador.

    I Suficiencia: utiliza toda la informacin obtenida de la muestra.

  • Media muestral

    Dadas n observaciones: X1,X2, . . . ,Xn, con una misma distribucin,la media muestral se define por

    X (n) =X1 + X2 + + Xn

    n.

    La media muestral se utiliza como un estimador de la media , esdecir, de = E [Xi ], si la media es finita.Estimador insesgado.

    E [X (n)] = E

    [n

    i=1

    Xin

    ]=

    ni=1

    E [Xi ]n

    =nn

    = .

  • Media muestral

    Dadas n observaciones: X1,X2, . . . ,Xn, con una misma distribucincon media finita ,

    X (n) =X1 + X2 + + Xn

    n.

    Estimador consistente.

    limn

    [X (n)] = .

    por la ley de los grandes nmeros.

  • Media muestral

    Dadas n observaciones: X1,X2, . . . ,Xn, con una misma distribucincon media finita y varianza finita

    X (n) =X1 + X2 + + Xn

    n.

    Z =

    n(X (n) )/.

    Estimador asintticamente normal.

    limn

    [FZ (n)(x)] = (x).

    por el teorema central del lmite.

  • Mtodos de estimacin mas comunes

    I Estimador de mxima verosimilitud

    I Estimador de momentos

  • Estimador de mxima verosimilitud

    Si la distribucin supuesta es discreta para los datos observados, yse desconoce un parmetro .Sea p(x) la probabilidad de masa para dicha distribucin.

    Dado que se han observado datos X1,X2, . . . ,Xn, se define la funcinde mxima verosimilitud L() como sigue:

    L() = p(X1) p(X2) p(Xn).

    El estimador de mxima verosimilitud es el valor que maximiza L():

    L() L(), valor posible.

  • Estimador de mxima verosimilitud

    Si la distribucin supuesta es continua, y f(x) es la densidad paradicha distribucin.

    Dado que se han observado datos X1,X2, . . . ,Xn, se define la funcinde mxima verosimilitud L() como sigue:

    L() = f(X1) f(X2) f(Xn).

    El estimador de mxima verosimilitud es el valor que maximiza L():

    L() L(), valor posible.

  • Estimador de mxima verosimilitud

    El estimador de mxima verosimilitud tiene, en general, lassiguientes propiedades:

    1. Es nico: L() > L() para cualquier otro valor de .2. La distribucin asinttica de tiene media .3. Es invariante: = h(), entonces = h().4. La distribucin asinttica es la normal.5. Es fuertemente consistente: limn = .

  • Distribucin exponencial

    EjemploPara la distribucin exponencial, = 1/ ( > 0) y f(x) = ex

    para x 0.

    L() =(eX1

    ) (eX2

    ) (eXn

    )= n exp

    (

    ni=1

    Xi

    )

  • Distribucin exponencial

    ln(L()) = ln(n exp

    (

    ni=1

    Xi

    ))

    = n ln() n

    i=1

    Xi

    dd

    ln(L()) =n

    ni=1

    Xi

    = 0

    =1

    1n

    ni=1 Xi

    =1

    X (n)=

    1Media muestral.

    =1

    =1n

    ni=1

    Xi = X (n) = Media muestral.

  • Distribucin geomtricaEjemploPara la distribucin geomtrica, = p y pp(x) = p(1 p)x1 parax = 1,2, . . . .

    L(p) = p(1 p)X11 . . . p(1 p)Xn1

    = pn(1 p)n

    i=1(Xi1)

    = pn(1 p)n

    i=1 Xi (1 p)n

    =

    (p

    1 p

    )n(1 p)

    ni=1 Xi

    ln(L(p)) = n ln(p

    1 p) + ln(1 p)

    ni=1

    Xi

    = n ln(p) n ln(1 p) + ln(1 p)n

    i=1

    Xi

  • Distribucin geomtrica

    ddp

    ln(L(p)) =ddp

    [n ln(p) + ln(1 p)[n

    i=1

    Xi n]]

    =np 1

    1 p(

    ni=1

    Xi n) = 0

    np

    =1

    1 p(

    ni=1

    Xi ) n

    1 p = p(1n

    Xi 1)

    1 = p + p(1n

    Xi ) p

    p =(

    1n

    Xi

    )1

  • Estimadores de mxima verosimilitud:

    Distribuciones continuas:I Uniforme: a = min{Xi}, b = max{Xi}.I Exponencial: = X (n).I Gamma, Weibull: y se resuelven numricamente.I Normal:

    = X (n), =[

    n 1n

    S2(n)]1/2

    =

    [1n

    ni=1

    (Xi X )2]1/2

    .

    I Lognormal:

    =

    ni=1 log(Xi )

    n, =

    [ni=1(log(Xi ) )2

    n

    ]1/2.

  • Estimadores de mxima verosimilitud

    Distribuciones discretas:I Binomial (t ,p): si t es conocido, p = X (n)/t .I Bernoulli: Caso binomial con t = 1 e igual p.I Geomtrica: p = 1

    X(n).

    I Binomial negativa (s,p): nmero de ensayos hasta el s-simoxito. Si s es conocido: p = s

    X(n).

    I Poisson: = X (n).

  • Error cuadrtico medio

    I : estimador del parmetro de una distribucin FI Se define el error cuadrtico medio (ECM) de con respecto al

    parmetro como

    ECM(, ) = E [( )2].

    E [( )2] = E [( E [] + E [] )2]= E [( E [])2] + (E [] )2

    = Var() + (E() )2

    I El error cuadrtico medio de un estimador es igual a su varianzams el sesgo al cuadrado.

    I Si el estimador es insesgado, su ECM es igual a la varianza.

  • ECM de la media muestral respecto de la mediaMuestra de X : X1,X2, . . . ,Xn, E [Xi ] =

    ECM(X (n), ) = E [(X (n) )2]

    = Var(X (n)) =1n2

    ni=1

    Var(Xi ) =2

    n

    La media muestral es un buen estimador de E [X ] si /

    n espequeo.

    I El ECM depende de la distribucin de Xi y del tamao de lamuestra.

    I Teorema central del lmite. Si Z N(0,1) y n es grande:

    P

    (|X (n) |/

    n> c

    ) P{|Z | > c}.

  • Varianza muestral

    El indicador2

    ncomo estimacin del error en la media muestral, tiene

    el inconveniente que es en general desconocida.

    Para estimar la varianza se utiliza el estimador

    S2(n) =n

    i=1(Xi X (n))2

    n 1.

    I Estimador insesgado de la varianzaI Frmula a utilizar:

    E[S2(n)

    ]= Var(X )

    ni=1

    (Xi X (n))2 =n

    i=1

    X 2i nX2(n)

  • Varianza muestral

    E [X 2i ] = Var(Xi ) + (E [Xi ])2 = 2 + 2.

    E [X2(n)] =

    2

    n+ 2.

    (n 1)E [S2(n)] = nE [X 21 ] nE [X2(n)] = n(2 + 2) n(

    2

    n+ 2)

    E [S2(n)] = 2

    Utilizaremos S(n) =

    S2(n) como estimador de la desviacinestndar.

    I Error del estimador X (n): 2/n.I Simulacin de datos: Si el objetivo es estimar la media, para

    disminuir el error deben generarse muestras de tamao n, ngrande.

  • Media muestral

    I Elegir un valor aceptable d para la desviacin estndar delestimador.

    I Generar (n) datos hasta que /

    n < d . (S/

    n < d)I Conviene generar al menos 100 datos para:

    I asegurar normalidad de la distribucin de X (n).I para disminuir la varianza de S.

    I La estimacin de estar dada por el ltimo valor de X (n).I El algoritmo implica calcular en cada paso X (n) y S(n).I Es posible calcularlo recursivamente.

  • Media muestral

    Clculo recursivo de X (n) y S2(n)

    I X (1) = X1,I S2(1) = 0.

    X (j + 1) = X (j) +Xj+1 X (j)

    j + 1

    S2(j + 1) =(

    1 1j

    )S2(j) + (j + 1)(X (j + 1) X (j))2

  • Estimacin de una proporcin

    El estimador X (n) puede utilizarse tambin para estimar laproporcin de casos en una poblacin.

    Xi =

    {1 probabilidad p0 probabilidad 1 p.

    I X (n) es un estimador insesgado de p.

    I E [(X (n) p)2] = Var(X (n)) = p(1 p)n

    I En este caso, se estima la varianza del estimador X (n) por:

    X (n)(1 X (n))n

    .

  • Algoritmo: Clculo de E [X ]

    Algorithm 1: Estimacin de la media M de X con error d

    Generar X , M X M = X (1) = X1;S2 0 S2 = S2(1) = 0;for 1 < j 100 do

    Generar X ; A M;M M + (X M)/j ;S2 (1 1/(j 1))S2 + j(M A)2

    endj 100;while

    S2/j > d do

    j j + 1;Generar X ;A M;M M + (X M)/j ;S2 (1 1/(j 1))S2 + j(M A)2

    endreturn M

  • Algoritmo: Clculo de una probabilidad

    Algorithm 2: Estimacin de la probabilidad p de X con error dGenerar X X es 0 o 1;p X ;for 1 < j 100 do

    Generar X ;p p + (X p)/j

    endj 100;while

    p(1 p)/j > d do

    j j + 1;Generar X ;p p + (X p)/j ;

    endreturn p