Documento 06 - Intervalo de Confianza I

download Documento 06 - Intervalo de Confianza I

of 30

Transcript of Documento 06 - Intervalo de Confianza I

  • EAS201a Inferencia Estadstica Pgina 1 Segundo Semestre 2014

    Intervalos de Confianza: Caso una sola muestra

    Un segundo mtodo que se utiliza para estimar un parmetro desconocido de una poblacin asociada a una

    variable aleatoria Y -discreta o continua-, con distribucin conocida f(y; ), est basado en los llamados

    Intervalos de Confianza (IdeC) . La construccin de dichos intervalos se sustenta en la siguiente propiedad.

    Todo estimador del parmetro es una variable aleatoria, por lo cual debe tener asociada alguna

    distribucin de probabilidad

    Estas distribuciones de probabilidad que se obtienen de las muestras se llaman distribuciones muestrales. Las

    distribuciones ms usualmente utilizadas son la Normal Estndar, la Chi-Cuadrado, la t de Student, y la F de

    Fischer. En base a dichas distribuciones, podemos calcular probabilidades, y as entonces combinaremos las

    probabilidades con las muestras aleatorias.

    Ejemplo:

    Sea: Y1, Y2, Y3,...,Yn una m.a. de tamao n de la distribucin N(, 2). Sabemos que el estimador mximo

    verosmil de la media est dado por V . Este estimador tiene asociada una distribucin de

    probabilidad )/,( 2 n , y a partir de ello podemos hacer la siguiente afirmacin probabilstica:

    9544,022

    n

    P

    Lo que implica que:

    9544,022

    nnP

    Esta ltima expresin es interesante de analizar ya que ser esencial en el estudio de los IdeC. Ntese que el

    argumento de la probabilidad determina el intervalo:

    nY

    nY

    2,2

    .

    Dado que el estimador es una variable aleatoria, entonces este intervalo resulta ser un Intervalo Aleatorio.

    Por otra parte, como en la inferencia clsica se asume que la media es una constante, entonces la forma

    correcta de interpretar dicha probabilidad es la siguiente:

    La probabilidad que el intervalo aleatorio

    nY

    nY

    2,2

    contenga a es 95,44%

  • EAS201a Inferencia Estadstica Pgina 2 Segundo Semestre 2014

    Adems, considerando la interpretacin frecuentista de la probabilidad, podemos decir que cualquiera sea el

    verdadero valor del parmetro , de cada 100 intervalos aleatorios generados equivalentes al anteriormente

    mencionado, aproximadamente entre 95 y 96 de ellos deberan contener la media . Para entender de mejor

    forma esta ltima interpretacin se puede utilizar la aplicacin adjunta hecha en Excel, en la cual se simul

    250 muestras de tamao 36 de una distribucin N(, 2). Se puede dar los valores que se desee tanto a la

    media como a la varianza de la distribucin normal, una vez generadas las 250 muestras se trata de contar

    todos aquellos intervalos aleatorios que NO lograron cubrir a la media . A modo de ejemplo se hizo una

    aplicacin a una distribucin N(12,9), obtenindose los resultados expuestos en el siguiente cuadro:

    En este caso el nmero de intervalos que no contiene a la media result ser 15. Dicho valor debera estar

    cerca de (1-0.9544)*250 = 11.4 11 intervalos. Ntese que cada uno de estos 250 intervalos es una

    realizacin del intervalo aleatorio cuyos lmites son:

    136

    32 YYLIInferiorLmite 1

    36

    32 YYLSSuperiorLmite

    Intervalo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

    LI 11,1 11,2 10,0 11,1 11,8 12,2 11,3 10,9 11,0 11,1 10,8 11,5 10,9 12,0 10,3 11,4 11,2 10,6 11,5 11,2 11,5 10,8 11,3 11,3 11,5

    LS 13,1 13,2 12,0 13,1 13,8 14,2 13,3 12,9 13,0 13,1 12,8 13,5 12,9 14,0 12,3 13,4 13,2 12,6 13,5 13,2 13,5 12,8 13,3 13,3 13,5

    Contiene NO NO

    Intervalo 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50

    LI 11,2 10,8 10,9 11,0 11,9 10,7 11,3 11,4 11,3 10,2 10,5 11,0 12,3 10,5 10,5 9,6 11,2 11,7 10,3 10,1 10,8 10,8 12,2 11,7 11,2

    LS 13,2 12,8 12,9 13,0 13,9 12,7 13,3 13,4 13,3 12,2 12,5 13,0 14,3 12,5 12,5 11,6 13,2 13,7 12,3 12,1 12,8 12,8 14,2 13,7 13,2

    Contiene NO NO NO

    Intervalo 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75

    LI 11,2 11,6 11,0 10,7 10,3 11,0 11,6 11,3 10,8 11,3 10,9 12,2 10,2 10,9 9,7 11,1 10,8 11,1 11,6 10,8 12,2 10,5 10,8 10,8 10,3

    LS 13,2 13,6 13,0 12,7 12,3 13,0 13,6 13,3 12,8 13,3 12,9 14,2 12,2 12,9 11,7 13,1 12,8 13,1 13,6 12,8 14,2 12,5 12,8 12,8 12,3

    Contiene NO NO NO

    Intervalo 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100

    LI 11,1 11,6 10,5 11,4 10,3 11,1 10,9 11,7 11,0 10,8 11,4 11,1 11,8 11,3 10,3 10,7 11,3 11,0 10,2 11,3 11,3 11,5 10,6 10,8 11,0

    LS 13,1 13,6 12,5 13,4 12,3 13,1 12,9 13,7 13,0 12,8 13,4 13,1 13,8 13,3 12,3 12,7 13,3 13,0 12,2 13,3 13,3 13,5 12,6 12,8 13,0

    Contiene

    Intervalo 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125

    LI 9,8 9,7 10,9 10,8 11,3 11,1 10,1 10,8 10,8 11,4 10,9 10,4 11,2 11,4 10,7 11,2 11,2 11,1 10,6 11,5 11,2 12,1 10,8 11,1 11,5

    LS 11,8 11,7 12,9 12,8 13,3 13,1 12,1 12,8 12,8 13,4 12,9 12,4 13,2 13,4 12,7 13,2 13,2 13,1 12,6 13,5 13,2 14,1 12,8 13,1 13,5

    Contiene NO NO NO

    Intervalo 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150

    LI 11,4 11,3 11,1 10,9 11,1 10,5 11,3 10,9 11,5 11,1 11,3 11,1 12,0 10,7 10,4 11,3 10,8 10,6 11,0 10,4 10,7 10,6 11,3 10,7 11,2

    LS 13,4 13,3 13,1 12,9 13,1 12,5 13,3 12,9 13,5 13,1 13,3 13,1 14,0 12,7 12,4 13,3 12,8 12,6 13,0 12,4 12,7 12,6 13,3 12,7 13,2

    Contiene NO

    Intervalo 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175

    LI 10,7 11,5 11,0 10,1 10,2 10,8 11,5 11,3 11,4 11,0 10,7 11,2 10,2 11,1 11,4 11,7 10,1 11,1 12,3 10,6 10,6 11,3 11,7 10,3 10,9

    LS 12,7 13,5 13,0 12,1 12,2 12,8 13,5 13,3 13,4 13,0 12,7 13,2 12,2 13,1 13,4 13,7 12,1 13,1 14,3 12,6 12,6 13,3 13,7 12,3 12,9

    Contiene NO

    Intervalo 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

    LI 10,7 10,3 10,8 11,3 11,3 11,0 10,1 11,0 10,0 10,6 11,1 11,8 11,3 10,1 11,2 10,4 10,5 11,6 10,7 10,7 11,0 11,4 11,0 10,6 10,9

    LS 12,7 12,3 12,8 13,3 13,3 13,0 12,1 13,0 12,0 12,6 13,1 13,8 13,3 12,1 13,2 12,4 12,5 13,6 12,7 12,7 13,0 13,4 13,0 12,6 12,9

    Contiene

    Intervalo 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225

    LI 10,9 10,9 11,0 12,1 11,4 10,5 11,5 10,7 10,2 11,3 10,8 11,4 11,6 10,1 11,3 11,3 11,0 11,2 11,6 10,5 10,3 11,4 11,7 11,1 10,6

    LS 12,9 12,9 13,0 14,1 13,4 12,5 13,5 12,7 12,2 13,3 12,8 13,4 13,6 12,1 13,3 13,3 13,0 13,2 13,6 12,5 12,3 13,4 13,7 13,1 12,6

    Contiene NO

    Intervalo 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250

    LI 11,1 11,1 11,1 11,3 11,0 11,1 10,9 11,2 10,7 10,8 10,4 11,1 11,0 10,8 11,0 11,2 11,3 11,1 11,1 12,1 10,8 10,6 11,2 11,4 11,0

    LS 13,1 13,1 13,1 13,3 13,0 13,1 12,9 13,2 12,7 12,8 12,4 13,1 13,0 12,8 13,0 13,2 13,3 13,1 13,1 14,1 12,8 12,6 13,2 13,4 13,0

    Contiene NO

  • EAS201a Inferencia Estadstica Pgina 3 Segundo Semestre 2014

    En la realidad se selecciona una sola muestra aleatoria de tamao n (en este caso, 36). Supongamos que la

    muestra efectivamente seleccionada fue la nmero 10, en cuyo caso el promedio muestral fue 12,1. Luego, el

    intervalo (11,1 ; 13,1) es una realizacin del intervalo aleatorio (Y -1, Y +1). Desde el punto de vista

    probabilstico en el sentido clsico, es CORRECTO decir que la probabilidad que el intervalo aleatorio

    (Y - 1, Y + 1) contiene al parmetro con una probabilidad del 95,44%, o lo que resulta equivalente:

    P(Y - 1 Y + 1) = 0,9544

    Por otra parte es INCORRECTO afirmar que la media esta contenida en el intervalo (11,1 ; 13,1) con una

    probabilidad del 95,44%, ya que en este caso, todo lo que se encuentra en el argumento de dicha probabilidad

    es constante. Sin embargo la probabilidad del 95,44% del intervalo aleatorio induce una pseudo-probabilidad

    llamada Probabilidad Fiducial, o, en su expresin ms comn, Confianza. As entonces, la siguiente

    afirmacin es comnmente aceptada:

    Con una confianza del 95,44% se puede afirmar que el intervalo ( 11,1 ; 13,1) contiene a la media

    Definicin: Sea Y1, Y2 , Y3 , ... , Yn una m.a. de tamao n de la distribucin f(y; ). Se llama Intervalo de

    Confianza (1 ) para el parmetro desconocido , a una realizacin de un Intervalo Aleatorio que con

    probabilidad (1 ) contiene al parmetro .

    Ejemplo:

    Para el ejemplo anterior, el intervalo aleatorio (Y - 1, Y + 1) contiene al parmetro con una probabilidad

    del 95,44%, por lo tanto el intervalo ( y - 1, y + 1) es un Intervalo de Confianza del 95,44% para el

    parmetro , donde y es una realizacin de la variable aleatoria Y .

    Recuerde que, en general, cuando se denote la variable con letra mayscula, corresponder al estimador del

    parmetro de estudio, y la minscula har referencia a la estimacin, es decir, a la realizacin del estimador en

    la muestra.

  • EAS201a Inferencia Estadstica Pgina 4 Segundo Semestre 2014

    Observaciones:

    Los niveles de confianza que usualmente se utilizan son: 90%; 95%; 98%, siendo el ms recurrido 95%.

    Un Intervalo de Confianza se puede interpretar como una realizacin o estimacin del correspondiente

    Intervalo Aleatorio, al igual que en estimacin puntual en que usualmente se confunde Estimador con

    Estimacin, en este caso al Intervalo Aleatorio se le llama Intervalo de Confianza.

    Los IdeC pueden ser bilaterales o unilaterales, para el caso que el parmetro representa la media de una

    distribucin entonces el formato de los respectivos IdeC ser de la siguiente forma:

    e, e Bilateral Simtrico, donde e es la llamada precisin o error de estimacin.

    e,

    Unilateral Izquierdo o con cota inferior (unilateral inferior)

    , e Unilateral Derecho o con cota superior (unilateral superior) Usualmente para el caso bilateral se usa el caso simtrico, ya que as el intervalo de confianza para

    tiene amplitud mnima.

    El mtodo ms utilizado para construir los IdeC es el de la Cantidad Pivotal.

    Los Pivotes son variables aleatorias construidas a partir de las distribuciones muestrales, los cuales tienen

    la siguiente propiedad: en el formato del Pivote explcitamente aparece el parmetro y la muestra

    aleatoria, no obstante la distribucin de probabilidades no depende de dicho parmetro.

    Definicin: Sea: Y1, Y2, Y3, ... , Yn una m.a. de tamao n de la distribucin discreta o continua f(y ;). Sea

    la funcin Q = q (Y1, Y2 , Y3 , ... , Yn; ), la cual depende simultneamente de la m.a. y del parmetro . Si la

    distribucin de probabilidades de Q es independiente del parmetro , entonces Q es una Cantidad Pivotal o

    Pivote.

    Ahora enumeraremos algunos Pivotes tiles para el caso de una sola muestra en base a los cuales se obtendrn

    los intervalos de confianza para los parmetros de los modelos ms usuales.

  • EAS201a Inferencia Estadstica Pgina 5 Segundo Semestre 2014

    Pivotes usuales en base a la distribucin Chi-Cuadrado y t de Student

    Si Y1, Y2, Y3, ... , Yn es una m.a.s. de tamao n de N(, 2), se cumplen las siguientes propiedades:

    1. N(, 2/n). (Si n > 30 , por el TLC no se requiere que los Yi provengan de una normal)

    2. n

    Z/

    N(0, 1) (ste es un pivote para asumiendo que 2 es conocido)

    3.

    2

    2

    iZ )1(2 (El cuadrado de una N(0,1) es Chi-Cuadrado de parmetro 1)

    4.

    2

    22

    1

    2

    iini

    i

    i

    YYZ )(

    2 n (Propiedad reproductiva de la Chi-Cuadrado)

    Ntese que en una Chi-Cuadrado, se cumple que: E[(n)] = n y V[(n)] = 2n. Por lo tanto, por el TLC

    se cumple que, para muestras grandes, (n) se aproxima a la N(n , 2n)

    5. W =

    2

    2

    2

    21

    YYSn

    i )1(2 n . (ste es un Pivote para la varianza

    2)

    Ntese que la diferencia entre este caso y el anterior esta en que el parmetro media poblacional fue

    reemplazado por su estimador, en tal caso la distribucin Chi-Cuadrado pierde un grado de libertad.

    6. La distribucin t de Student se construye de la siguiente forma: Sea Z una variable aleatoria con

    distribucin normal estandarizada, e independientemente sea V una variable aleatoria con distribucin

    Chi-Cuadrado de parmetro n. Entonces el siguiente cociente tiene distribucin Student de parmetro n.

    2;2

    )(;0)(;)(/

    nn

    nTVTEnt

    nV

    ZT

    Aplicando a una m.a, se obtiene un Pivote para , asumiendo a 2 como desconocido, bajo muestra

    pequea:

    )1(

    )1(

    2

    2)1(

    nt

    n

    s

    Y

    n

    Sn

    n

    Y

    T

  • EAS201a Inferencia Estadstica Pgina 6 Segundo Semestre 2014

    Intervalo de Confianza para en una distribucin N(, 2) con Varianza conocida

    Sea Y1, Y2, Y3, ... , Yn una m.a. de tamao n de la distribucin N(, 2). Entonces el IdeC (1 ) para es

    nzy

    nzy

    **

    2/12/1

    Donde Z1 /2 es el percentil (1 /2) de la N(0,1)

    Para demostrar esto, recurrimos al pivote n

    Z/

    , con conocido.

    Usando la simetra de la distribucin Normal podemos afirmar que: P (-Z1 /2 < Z < +Z1 /2) = 1

    Luego: P (-Z1 /2 < Z < + Z1 /2) = P (-Z1 /2 < n/

    < + Z1 /2) = 1

    nzY

    nzYP

    **

    2/12/1 = 1

    De lo que se puede concluir que:

    nzy

    nzy

    **

    2/12/1,

    Es un Intervalo de Confianza (1 ) bilateral simtrico para la media asumiendo que es conocido

    21 z

    21

    z

    21 z

    21

    z

    12/ 2/

  • EAS201a Inferencia Estadstica Pgina 7 Segundo Semestre 2014

    Intervalo de Confianza para en una distribucin N(, 2), con Varianza desconocida

    Sea Y1, Y2, Y3,...,Yn una m.a. de tamao n < 30 de la N(, 2). El Intervalo de Confianza (1 ) para es

    n

    sty

    n

    sty nn 1 2/1

    1

    2/1 ,

    Donde 1

    2/1

    nt es el percentil (1 /2) de la t(n-1)

    Para demostrar esto, recurrimos al pivote: nS

    T/

    , con 2 desconocido.

    Usando la simetra de la distribucin t de Student podemos afirmar que: P (-1

    2/1

    nt T +1

    2/1

    nt ) = 1

    .

    Luego:

    P (-1

    2/1

    nt nS /

    +

    1

    2/1

    nt ) = P( nStnStnn // 1 2/1

    1

    2/1

    ) = 1 .

    De lo que se puede concluir que:

    nstynsty nn /,/ 1 2/11 2/1

    Es un Intervalo de Confianza (1 ) bilateral simtrico para la media , asumiendo que es desconocido y

    que la muestra es pequea.

    1

    2/1

    nt 1

    2/1

    nt

    12/ 2/

    1

    2/1

    nt

  • EAS201a Inferencia Estadstica Pgina 8 Segundo Semestre 2014

    Intervalo de Confianza para en una distribucin N(, 2), con Varianza desconocida, caso

    muestras grandes,

    Si en el caso anterior, consideramos el caso muestra grande, esto es , sabemos que la distribucin T

    tiende a la N(0,1), por lo tanto el Intervalo resulta ser:

    nsZynsZy /,/ 2/12/1

    En este particular caso, basados en el Teorema del Lmite Central, esta ltima frmula no necesita la

    normalidad de la poblacin. De acuerdo al Teorema del Lmite Central para el caso de muestras grandes la

    condicin de normalidad de la distribucin poblacional no es necesaria, por lo tanto podemos obtener IdeC

    para la media en el caso de muestras grandes de otros modelos usuales no necesariamente normales, tales

    como los de la siguiente tabla

    n

    yzy

    n

    yzyYY

    n

    yzy

    n

    yzyYYP

    n

    ppzp

    n

    ppzppppB

    IdeCVarianzaMediaModelo

    *

    21

    *

    21

    2

    2

    *

    21

    *

    21

    *

    21

    *

    21

    22

    ,11

    )exp(

    ,)(

    )1(,

    )1()1()1(),1(

    )()()(

    Nota

    Una expresin alternativa que se tiene cuando se construyen los intervalos de confianza y que podemos

    destacar en este caso particular de muestras grandes es la siguiente:

    (

    ) (| |

    )

    Una interpretacin que podemos hacer en este caso es la siguiente

    Con una confianza ( 1- ) podemos afirmar que la distancia entre el promedio muestral y el poblacional es a

    lo mas igual al error de estimacin.

  • EAS201a Inferencia Estadstica Pgina 9 Segundo Semestre 2014

    Intervalo de Confianza para en una distribucin N(, 2), con media desconocida

    Sea Y1,Y2,Y3,...,Yn una m.a. de tamao n de la N(, 2) Entonces un IdeC (1) para 2, con desconocido

    es:

    2

    2),1(

    2

    2

    21),1(

    2

    )1()1( 2

    nn

    snsn

    Donde : 22/),1( n es el percentil (1/2 ), y 2 2/),1( n es el percentil /2 de la distribucin

    n

    En este caso un pivote es )1()1( 2

    2

    n

    nW

    . A pesar que la distribucin no es simtrica, por

    simplicidad conviene tomar:

    P ( 22/),1( n < W < 2 2/),1( n ) = 1

    Luego:

    P(2

    2),1(

    n

    0 ;

    La distribucin Exponencial de parmetro es un caso particular de la distribucin Gama con parmetros

    = 1 y = 1/.

    yY eyfY )(exp , y > 0

  • EAS201a Inferencia Estadstica Pgina 13 Segundo Semestre 2014

    El EMV del parmetro es /1MV , es consistente, y su varianza alcanza la CCR, 2/n, con distribucin

    asinttica Normal: nN /, 2

    La suma de n variables aleatorias independientes isodistribuidas exp{} sigue una distribucin Gama, donde

    el parmetro = n, y = 1/

    )1

    ,(1

    nGYni

    ii

    Caso N 1: En base a la distribucin exacta Gama

    Sea Q una v.a. tal que Q = , se puede probar que Q G(n, 1/n). Por lo tanto Q es un pivote para . De la

    distribucin Gama (existente en Excel), se pueden obtener los percentiles q1 = g/2 (n, 1/n); q1 = g1-/2 (n, 1/n),

    tales que P(q1

  • EAS201a Inferencia Estadstica Pgina 14 Segundo Semestre 2014

    Luego un IdeC ( 1 ) bilateral para es: )1(

    1

    )1(

    1

    21

    21

    n

    z

    yn

    z

    y

    .

    Anlogamente un IdeC ( 1 ) bilateral para la media es: )1(

    1)1( 2

    12

    1

    n

    z

    yn

    z

    y

    Caso N 3: Muestra grande, distribucin Normal aproximada, Propiedades TLC

    Por el TLC se tiene que: ),(2

    nNY a

    luego )

    1,

    1(

    2nNY a

    . Por lo tanto

    Z

    Y

    n

    N

    1

    10 1

    ( , ) , es un pivote para

    1

    P zY

    n

    z

    1 2 1 2

    1

    11

    Despejando el parmetro se tiene: PY

    z

    n Y

    z

    n

    11

    11 1

    1 2 1 2( ) ( )

    .

    Luego un IdeC (1 ) bilateral para es:

    )1(1

    )1(1

    21

    21

    n

    z

    yn

    z

    y

    Anlogamente un IdeC (1 ) bilateral para la media es :

    n

    z

    y

    n

    z

    y

    21

    21 1

    1

    1

  • EAS201a Inferencia Estadstica Pgina 15 Segundo Semestre 2014

    Ejemplos de Intervalos de Confianza usando frmulas ya obtenidas

    1. El gerente de crditos y cobranza de una empresa comercial, debe precisar sus polticas de crdito.

    Suponga que el gerente desea estimar la proporcin de cuentas consideradas incobrables en la empresa,

    para ello desea usar un IdeC Bilateral del 95%, con una precisin de 0,05.

    a) Cuntas cuentas deben formar la muestra para cumplir con los objetivos planteados por el gerente?

    Si la proporcin de cuentas incobrables entonces p es la proporcin muestral

    Se pide determinar n tal que: 95,005,005,0 PPP

    A partir de la frmula de IdeC para una proporcin , podemos establecer que:

    n

    ppz

    )1(05,0

    975,0

    n = )1(

    05,0

    96,12

    pp

    n = 1.536,64 p(1-p)

    El tamao muestral depende de p a travs de la funcin: f(p) = p(1-p). sta corresponde a la varianza

    estimada del modelo Bernoulli. Una solucin conocida como el caso de varianza mxima consiste en

    buscar aquel valor de p que maximiza dicha funcin, como esta grfica corresponde a una parbola

    invertida que se anula para p = 0 y para p = 1, entonces el mximo se produce para p = 0,5 y corresponde

    a 0,25.

    As entonces el mximo valor de n esta dado por n = 1.536,64 * 0,25 = 384 cuentas

    b) Si se toma una muestra con el nmero de cuentas establecidas en el punto anterior y se determina que el

    10% de ellas son incobrables Qu Intervalo del 95% de Confianza resulta de ello?

    El I. de C. Para esta dado por:

    n

    ppzp

    n

    ppzp

    )1(,

    )1(

    21

    21

    384

    9,0*1,096,11,0

    384

    9,0*1,096,11,0

    13,007,0

  • EAS201a Inferencia Estadstica Pgina 16 Segundo Semestre 2014

    c) Compare y comente el IdeC Propuesto por el gerente con el realmente obtenido en el punto anterior.

    El intervalo propuesto exige una precisin del 5%, sin embargo el obtenido supera dicho valor llegando a

    ser del 3%, dado que el tamao muestral es el de varianza mxima y asume que la proporcin estar en

    alrededor del 50%, pero en realidad en ste caso es del 10%.

    d) Qu pasa con el tamao de la muestra si el gerente afirma lo siguiente? La proporcin real de

    incobrables no puede superar el 15%, ya que ello implicara que la compaa estara al borde de la

    quiebra, y tal hecho dista mucho de nuestra realidad financiera

    A diferencia del caso anterior en que la varianza es mxima para una proporcin del 50% en ste caso el

    mximo se produce en p = 15% , por lo tanto el tamao muestral es igual a:

    )1(

    05,0

    96,12

    ppn

    , con p = 0,15 n = 1.536,64 * 0,15(1-0,15) n = 196

    En general la frmula para determinar el tamao de muestra n en un muestreo para proporciones, dada una

    error de estimacin (e.e.) y un nivel de confianza () est definido por:

    )1(.. 2

    2

    2/1

    0pp

    ee

    zn

    Para distintas confianzas y precisiones, caso de varianza mxima y tamao poblacin infinita tenemos:

    CONFIANZA

    90% 95% 98%

    d n0 d n0 d n0

    0,01 6.765 0,01 9.604 0,01 13.572

    0,02 1.691 0,02 2.401 0,02 3.393

    0,03 752 0,03 1.067 0,03 1.508

    0,04 423 0,04 600 0,04 848

    0,05 271 0,05 384 0,05 543

    0,10 68 0,10 96 0,10 136

    La frmula precedente asume que la poblacin es infinita, vale decir, cuando las sucesivas realizaciones

    no afectan la probabilidad puntual del acontecimiento en estudio. Cuando esto no ocurre, es decir si la

    poblacin es de tamao finito (variando la probabilidad de ocurrencia con cada elemento de la muestra

  • EAS201a Inferencia Estadstica Pgina 17 Segundo Semestre 2014

    que es retirado), el tamao de muestra n0 debe ser corregido por el llamado factor de correccin para

    poblacin finita (f.c.p.f.), esto es,

    N

    n

    nn

    11 0

    0

    2. Una empresa cervecera sabe que las cantidades de cerveza que contienen sus latas sigue una distribucin

    Normal con desviacin estndar 0.05 litros.

    (a) Se extrae una muestra de 16 latas. Si un IdeC para la media de la poblacin es (0,4755 ; 0,5245). Con

    qu nivel de confianza se construy dicho intervalo?

    Este es un intervalo bilateral para la media con varianza conocida, por lo tanto la amplitud est dada por

    95,0196,12/1

    049,04755,05245,02 **

    21

    zn

    zA

    (b) Si se quiere un intervalo de 98% de confianza, que tenga una amplitud de 0,02 litros a cada lado de la

    media. De qu tamao debe ser la muestra?

    13701,0

    05,001,0..

    *99,0

    *99,0

    nz

    nn

    zee

    confianza 0,95 0,95 0,95 0,9 0,9 0,9

    d 0,1 0,05 0,01 0,1 0,05 0,01

    n0 96 384 9.604 68 271 6.765

    N n n n n n n5.000.000 96 384 9.586 68 271 6.756

    1.000.000 96 384 9.513 68 271 6.720

    500.000 96 384 9.423 68 270 6.675

    200.000 96 383 9.164 68 270 6.544

    100.000 96 383 8.763 68 270 6.336

    50.000 96 381 8.057 68 269 5.959

    25.000 96 378 6.939 67 268 5.324

    12.500 95 373 5.431 67 265 4.390

    7.500 95 365 4.212 67 261 3.557

    5.000 94 357 3.288 67 257 2.875

    4.000 94 351 2.824 67 254 2.514

    3.000 93 341 2.286 66 248 2.079

    2.500 93 333 1.984 66 244 1.826

    1.000 88 278 906 63 213 871

    500 81 217 475 60 176 466

    200 65 132 196 51 115 194

    100 49 80 99 41 73 99

  • EAS201a Inferencia Estadstica Pgina 18 Segundo Semestre 2014

    3. Un analista de crditos tiene una intencin de aprobar en promedio ms de 100 crditos semanales.

    En las ltimas 20 semanas, la aprobacin promedio fue de 101,9 crditos, con una desviacin estndar de

    4,5 crditos. Asumiendo normalidad.

    a. Construya un IdeC apropiado que le permita averiguar si con un 95% de confianza el analista cumpli

    o no con su intencin.

    b. Puede Usted hacer la misma afirmacin que en la respuesta anterior con un 99% de confianza?

    c. Para qu niveles de confianza el analista S cumple con su intencin y para qu niveles NO cumple?

    a.- Se trata de obtener un IdeC del 95% Unilateral Inferior para la media , caso varianza desconocida,

    muestra pequea , esto es:

    n

    snty *

    1

    1

    207291,19,101

    5,4 100,16

    Como la cota inferior del intervalo unilateral supera los 100 crditos, se asume con una confianza del

    95% que el analista SI cumple con su esperanza

    b.- Se trata de obtener un IdeC del 99% Unilateral Inferior para la media , caso varianza desconocida,

    muestra pequea , esto es,

    n

    snty *

    1

    1

    208609,29,101

    5,4 99,34

    Como la cota Inferior del intervalo unilateral no supera los 100 crditos, se asume con una confianza del

    99% que el analista NO cumple con su esperanza

    c.- Se pide determinar el nivel de confianza (1 ) de tal modo que

    %3,96189,15,4

    201009,101

    19

    1100

    1

    1*

    t

    n

    snty

    Este ltimo valor se obtuvo directamente de la planilla Excel. Entonces para niveles de confianza

    inferiores al 96,3% el analista SI cumple con su esperanza y para niveles superiores NO cumple su

    esperanza, podramos decir tambin que el nivel de confianza exacto del 96,3% es de INDIFERENCIA.

    Nota: La funcin de Excel que se utiliz en este caso, corresponde al percentil de la distribucin T, esto es,

    1- DISTR.T( 1,89 ; 19 ; 1 ) = 96,3%

  • EAS201a Inferencia Estadstica Pgina 19 Segundo Semestre 2014

    4. El detergente en polvo es comercializado en cajas que tienen un peso rotulado que se debe respetar.

    Con el objeto de estimar el peso medio de las cajas, se realiza el siguiente proceso.

    De la produccin total, se extraen dos muestras aleatorias independientes, pesndose el contenido de

    detergente, obtenindose los siguientes resultados :

    Muestra Tamao Promedio Varianza

    N1 10 152 4

    N2 15 150 2

    Como ambas muestras son de la misma distribucin, considere una sola muestra de tamao 25 para

    Obtener un Intervalo de Confianza bilateral del 95% para . Asuma normalidad.

    Construiremos los estadgrafos asumiendo que es una sola muestra de tamao 25, para ello tenemos que

    8,15025

    1501515210 **

    y ;

    24

    2525

    1

    22

    2

    i

    ii

    yys

    para que esta expresin quede correctamente determinada es necesario encontrar la sumatoria de las 25

    observaciones al cuadrado, lo cual haremos de la siguiente forma:

    604.56815015214;076.2311521049 2**25

    11

    22

    **

    10

    1

    2

    i

    ii

    i

    ii

    yy

    de donde:

    667,324

    8,15025604.568 2*2

    s

    as el IdeC para est dado por

    59,15101,15025

    667,324

    975,08,150

    25

    667,324

    975,08,150 ** tt

  • EAS201a Inferencia Estadstica Pgina 20 Segundo Semestre 2014

    5. Una embotelladora de bebidas gaseosas, sabe que la cantidad real de bebida contenida en cada botella

    rotulada con un valor nominal de 250 cc, vara de botella en botella. El contenido medio de llenado es

    importante, sin embargo la variacin del contenido tambin es de vital importancia para la compaa, ya

    que una alta variabilidad significar que algunas botellas contendrn poca bebida o contrariamente

    mucha, siendo ambos extremos malos para la compaa. Para analizar este tema, el departamento de

    control de calidad escogi 40 botellas, obtenindose los siguientes resultados.

    249,73 247,73 250,63 246,08 240,45 255,83 247,04 253,36 257,38 233,77

    251,92 249,60 254,99 250,30 245,08 251,62 254,95 242,75 250,29 251,37

    241,10 250,59 251,91 254,92 254,00 246,84 243,17 237,38 256,95 252,28

    253,92 251,29 249,09 247,30 241,08 251,73 249,08 250,42 237,36 249,10

    a. Asumiendo normalidad. Obtenga un IdeC del 95% para la verdadera varianza de llenado.

    El IdeC bilateral ( 1- ) para 2 esta dado por :

    2

    2),1(

    2

    2

    21),1(

    2

    )1()1( 2

    nn

    snsn

    654,23120,58

    2

    *

    2

    * 6,34396,3439 2

    05,5722,232

    b. En el departamento de control de calidad sospechan que produccin no esta alcanzando a cumplir con el

    valor nominal. Para qu niveles de confianza ellos S tienen razn?

    Se trata de un IdeC unilateral inferior para , con varianza desconocida y muestra grande, esto es,

    n

    szy *1

    Se debe buscar (1- ) tal que

    2501

    *

    n

    szy

    Luego 2842,16,34

    4014,1)250( *1

    s

    nyz

    (1- ) = 90,0% (Confianza de Indiferencia)

    Para niveles de confianza MENORES a 90,0% el departamento de Control de Calidad SI tiene razn.

    Para comprobar la afirmacin precedente considere 2 niveles de confianza distintos, uno inferior al 90%

    y otro superior, as por ejemplo, si usted toma una confianza del 85% el IdeC resulta ser 249,78, en

    tal caso la cota superior es menor a 250, por lo tanto a este nivel de confianza el departamento de control

    de calidad SI tiene razn en afirmar que el contenido medio de las botellas NO esta alcanzando el valor

    nominal, si usted considera el 95% de confianza se obtiene el intervalo 250,32 como dicho valor

    supera a 250, entonces es posible que la media alcance dicho valor, por lo tanto con una confianza del

    95% no es concluyente la afirmacin del departamento de control de calidad.

  • EAS201a Inferencia Estadstica Pgina 21 Segundo Semestre 2014

    6. Una oficina comercial atiende clientes de tal modo que los tiempos de atencin por cliente pueden ser

    considerados como variables aleatorias con distribucin exponencial de parmetro . Se tom una

    muestra aleatoria de 40 clientes, encontrndose que el tiempo promedio fue de 8,2 min. Construya un

    IdeC del 95 % para el tiempo medio de atencin, utilice los tres mtodos antes expuestos.

    Caso N 1: Mtodo de distribucin exacta

    )/1,(

    2

    )/1,(

    21

    nnnn g

    y

    g

    y

    )40/1,35(

    025,0

    )40/1,35(

    975,0

    2,82,8

    gg

    7144,0

    2,8

    3329,1

    2,8

    Por lo tanto de acuerdo a este mtodo un IdeC bilateral del 95% es: 6,15 11,48

    Caso N 2: Mtodo de propiedades asintticas - EMV.

    n

    zy

    n

    zy 2/12/1 11

    40

    96,112,8

    40

    96,112,8

    Por lo tanto de acuerdo a este mtodo un IdeC bilateral del 95% es: 5,66 10,74

    Caso N 3: Mtodo de propiedades asintticas - TLC.

    n

    z

    y

    n

    z

    y

    21

    21

    11

    40

    96,11

    2,8

    40

    96,11

    2,8

    Por lo tanto de acuerdo a este mtodo un IdeC bilateral del 95% es: 6,26 11,88.Las dos ltimas

    soluciones se basan en caso muestras grandes, por lo tanto utilizan como aproximacin la distribucin

    normal, sin embargo, el primer caso no utiliza aproximaciones siendo por lo tanto una mejor solucin

    como intervalo para la media .

  • EAS201a Inferencia Estadstica Pgina 22 Segundo Semestre 2014

    7. El nmero de goles marcados Y por el equipo de ftbol de la Universidad Catlica (UC) contra la

    Universidad de Chile (UCH) en cada uno de los 118 partidos jugados entre 1939 y 1993 siguen una

    distribucin Poisson de parmetro . La tabla siguiente muestra los resultados obtenidos.

    N de goles N de partidos

    0 37

    1 36

    2 21

    3 19

    4 3

    5 2

    6 0

    a) Determine un IdeC bilateral del 95% para la media de dicha distribucin.

    Un IdeC (1 ) bilateral para est dado por:

    n

    yzy

    n

    yzy *

    21

    *

    21

    , .

    Al aplicar los datos a dicha frmula tenemos:

    118

    33,196,133,1,

    118

    33,196,133,1 **

    Luego el IdeC bilateral del 95% para es: 1,12 1,54

    b) Determine un IdeC bilateral al 95% para la probabilidad que la UC le marque al menos 1 gol a la UCH.

    P(Y 1) = 1 P(Y = 0) = 1 - e , por lo tanto se trata de encontrar un IdeC para una funcin g(),

    donde g() = 1 - e es una funcin montona creciente. Luego, el IdeC Bilateral del 95% para g()

    es: 1 - 12,1e 1 - e 1 - 54,1e 0,67 P(Y 1) 0,79

    c) Con qu confianza se puede afirmar que La probabilidad que en un prximo partido la UC le

    marque al menos 1 gol a la UCH es mayor o igual a 0.685?

    P(Y 1) 0,685 1 - e 0,685 1,1552. Se trata entonces de un intervalo unilateral

    inferior dado, y se desea encontrar con qu confianza fue obtenido. Luego, la ecuacin a resolver es:

    1552,1*1 n

    yzy

    647,1

    118

    33,1

    1552,133,1

    1

    z

    Por lo tanto, con una confianza del 95% se puede afirmar que P(Y 1) 0,685

  • EAS201a Inferencia Estadstica Pgina 23 Segundo Semestre 2014

    Los siguientes ejemplos se referirn a algunos casos especiales de construccin de pivotes, distintos a los ya

    ejemplificados anteriormente

    8. La media muestral es un buen estimador puntual de la media poblacional , sin embargo tambin

    puede ser usada para predecir un valor futuro de Y independientemente seleccionado desde la misma

    poblacin.

    Sea Y1, Y2, Y3, ... , Yn una m.a. de una distribucin N(, 2), donde la media muestral de estas primeras

    n observaciones es y la varianza es S2. Encontrar un IdeC (1 ) bilateral simtrico para una nueva

    observacin 1nY que es independiente de las anteriores. Asuma varianza poblacional desconocida.

    N(, 2/n) ; Yn+1 N(, 2) ( - Yn+1) N(, 2 + 2/n)

    )1,0(1

    1 N

    n

    n

    YYZ n

    Como es desconocido, entonces un pivote para Yn+1 esta dado por:

    )1(1

    1

    nt

    n

    nS

    YYT n

    As entonces un IdeC para Yn+1 esta dado por :

    n

    nsnty

    ny

    n

    nsnty

    112/11

    112/1

    **

  • EAS201a Inferencia Estadstica Pgina 24 Segundo Semestre 2014

    9. Sea Y1, Y2, Y3, ... , Yn una m.a. de una distribucin N(, 2). Se dispone de dos estadsticos

    independientes T1 y T2 los cuales poseen las siguientes propiedades

    V = T1 N(0,1), e independientemente

    W= (2(n-1) T2) (2n-2)

    Podemos construir una distribucin T, esto es,

    )1(2(

    )1(2

    )1(2

    )1(2 2

    1

    2

    2

    1

    nt

    T

    T

    n

    n

    Tn

    TT

    As entonces se puede establecer que:

    1)1(2

    )1(2

    2/1

    2

    1)1(2

    2/1

    nn

    T

    T

    ntP

    Un IdeC (1 ) bilateral para el parmetro

    1

    2)1(2

    2/1

    1

    2)1(2

    2/1

    )1(2)1(2

    t

    tnt

    t

    tnt nn

    10. Sea Y1, Y2, Y3, ....,Yn una muestra aleatoria de tamao grande de una distribucin Poisson de parmetro

    , si se desea obtener un intervalo de confianza bilateral del 95% para el parmetro , veremos que

    podemos encontrar diversas soluciones, de acuerdo al pivote que utilicemos.

    Primera solucin: En base a la distribucin aproximada de Y

    Mediante las propiedades asintticas de los EMV se sabe que

    nNY

    a

    4

    1,

    Estandarizando tenemos: 1,0

    2

    1N

    n

    YZ

    a

    .

    Luego el IdeC del 95% bilateral para esta dado por: n

    Yn

    Y2

    96,1

    2

    96,1

    Elevando al cuadrado se obtiene el intervalo pedido

    22

    2

    96,1

    2

    96,1

    nY

    nY

  • EAS201a Inferencia Estadstica Pgina 25 Segundo Semestre 2014

    Segunda solucin: En base a la distribucin aproximada de , estimando la varianza.

    Sabemos que:

    nNY

    a , 1,0N

    n

    YZ

    a

    Como la dispersin es funcin de , podemos estimarla, resguardando la normalidad ya que la

    muestra es de tamao grande, entonces 1,0N

    n

    Y

    YZ

    a

    Un IdeC bilateral para el parmetro esta dado por: n

    YY

    n

    YY 96,196,1

    Tercera solucin: En base a la distribucin aproximada de , no estimando la varianza

    Usando la distribucin aproximada de , es decir en el mismo pivote anterior no estimamos la

    varianza. Por lo tanto debemos despejar el parmetro a partir de la siguiente expresin:

    95,096,196,1

    n

    YP

    95,096,1 2

    2

    n

    YP

    95,08416,32

    nYP

    95,00

    8416,32 22

    Y

    nYP

    Para determinar los valores de , en que la parbola es menor o igual a 0, debemos resolver la

    ecuacin de 2 grado:

    08416,3

    2 22

    Y

    nY

    Las soluciones para en esta ecuacin son:

    2

    48416,3

    28416,3

    2 22

    Yn

    Yn

    Y

    2

    6598,38416,39208,1

    nn

    Y

    nY

  • EAS201a Inferencia Estadstica Pgina 26 Segundo Semestre 2014

    De donde el IdeC esta dado por:

    22

    6598,38416,39208,16598,38416,39208,1

    nn

    Y

    nY

    nn

    Y

    nY

    Si en este intervalo los trminos n

    9208,1 y

    2

    6598,3

    n son despreciables, entonces el IdeC se transforma

    en: n

    YY

    n

    YY

    8416,38416,3 , el cual es equivalente al obtenido en la segunda solucin

    Como ejemplo tomemos una muestra de tamao 500 de una distribucin Poisson, con promedio = 99,2

    96 88 82 96 90 97 92 96 104 91 100 101 108 97 84 97 83 99 100 103

    95 114 108 89 87 83 110 95 97 121 96 101 96 81 93 106 94 92 112 107

    104 82 100 107 97 96 95 102 116 109 107 94 105 88 96 85 98 101 106 93

    95 110 91 90 93 92 96 98 104 107 72 87 97 93 106 97 97 103 89 91

    106 105 89 97 94 100 110 104 104 105 95 95 91 97 92 85 91 103 105 116

    102 102 110 99 100 93 107 87 102 85 92 98 99 104 93 92 113 86 104 86

    86 90 95 109 83 93 84 96 110 93 82 100 92 88 96 104 75 81 100 104

    104 95 108 90 95 101 86 112 120 91 96 116 96 96 100 92 87 107 110 94

    97 103 92 119 102 95 104 115 108 125 81 91 99 105 110 109 97 109 96 124

    105 99 130 96 84 107 105 98 110 90 98 94 91 105 100 106 88 95 90 107

    102 101 85 103 114 88 89 97 115 93 106 93 96 133 97 87 94 102 94 95

    90 94 93 106 85 98 93 105 95 116 109 89 93 99 89 98 93 92 92 85

    111 126 88 96 94 107 97 82 100 113 100 93 100 97 109 106 92 100 95 105

    95 102 92 94 103 96 104 89 97 99 108 109 97 131 90 107 104 89 105 100

    100 99 89 111 86 95 113 89 97 115 87 104 97 96 93 96 99 106 111 98

    99 96 95 98 97 102 112 106 103 92 98 91 86 101 90 98 106 86 99 100

    94 105 102 94 105 78 97 112 105 91 101 96 118 96 97 106 108 109 98 85

    111 117 88 109 86 101 91 113 110 96 105 117 105 115 98 100 86 92 103 103

    124 98 107 78 76 91 122 101 107 112 97 94 104 93 115 96 94 100 101 99

    115 101 96 96 133 95 77 107 117 104 104 101 113 93 87 111 83 99 104 114

    107 90 113 112 106 105 99 98 96 113 92 98 95 107 101 87 93 83 99 88

    94 112 108 89 92 109 106 95 86 107 116 94 109 109 104 98 92 94 101 95

    117 118 109 93 104 103 92 97 101 106 91 111 90 111 99 91 98 97 99 116

    102 107 86 96 93 102 118 90 102 110 93 98 84 107 98 112 94 111 107 104

    98 97 86 92 113 79 113 77 107 109 90 113 100 95 96 105 94 89 106 90

    Entonces los intervalos obtenidos para cada una de las tres soluciones es.

    Primera Solucin: ( 98,3289 ; 100,0749 )

    Segunda Solucin: ( 98,3270 ; 100,0730 )

    Tercera Solucin : ( 98,3308 ; 100,0769 )

  • EAS201a Inferencia Estadstica Pgina 27 Segundo Semestre 2014

    Ejercicios Propuestos: Intervalos de Confianza, Caso Una Muestra

    1. Un instituto de opinin pblica desea obtener una muestra de votantes suficientemente grande de tal

    modo que con probabilidad 0,01 la proporcin muestral obtenida a favor de un cierto candidato resulte

    inferior al 50% sabiendo que la verdadera proporcin es del 52%. Determine el tamao de muestra.

    2. El contenido de nicotina en una marca de cigarrillos es Normal con desviacin estndar 1 miligramo. Se

    quiere estimar el contenido promedio.

    Cul es el error estndar de la media muestral si n =10 y si n = 20?

    Cul es el error de estimacin de la media con una confianza del 95%?

    De qu tamao debe ser la muestra si se quiere que el e.e. no supere a 0.5 miligramos?.

    3. Una empresa cervecera sabe que las cantidades de cerveza que contienen sus latas sigue una distribucin

    Normal con desviacin estndar 0.03 litros.

    a. Se extrae una muestra de 25 latas. Si un intervalo de confianza para la media de la poblacin es (0.28,

    0.38). Cul es el nivel de confianza?

    b. Si se quiere un intervalo de 99% de confianza, que tenga una amplitud mxima de 0.03 litros a cada lado

    de la media. De qu tamao debe ser la muestra?

    4. El contenido efectivo de 15 paquetes de caramelos en gramos es 123, 131, 109, 108, 121, 120, 119, 131,

    127, 119, 115, 118, 123, 121, 117.

    a. Cul es el error estndar estimado de la media?

    b. Construya un intervalo de confianza 0.95 para la media de los pesos.

    c. Cmo vara la amplitud del intervalo de confianza cuando (i) aumenta la confianza a 0.99, (ii) aumenta

    la varianza de la muestra al doble, (iii) aumenta el tamao de la muestra al doble?

    5. Sea Y1, Y2, Y3,..., Yn una muestra aleatoria de una distribucin Normal. Si n es grande, se demuestra

    que la distribucin de la mediana se puede aproximar por la distribucin normal, esto es,

    nNMe /2, 2 A partir de esta relacin construya un intervalo de confianza (1 ) bilateral para asuma 2 conocido.

    Compare el intervalo de confianza con el obtenido a partir de la media.

    6. Sea 1

    Y una muestra aleatoria de Tamao 1 de una distribucin Uniforme en el intervalo (0, )

    a. Verifique que la nueva variable 1YX tiene distribucin Uniforme en el intervalo (0,1)

    b. Utilizando lo obtenido en el punto anterior. Construya un IdeC (1 ) bilateral simtrico para el

    parmetro .

  • EAS201a Inferencia Estadstica Pgina 28 Segundo Semestre 2014

    7. Para un pas, se define su Lnea de Pobreza como el porcentaje de sus habitantes que se consideran

    pobres de acuerdo a un estndar socioeconmico internacional. Un centro de estudios, acaba de realizar

    una encuesta basada en una muestra aleatoria de n individuos para determinar la Lnea de Pobreza en

    Chile. Usando un estimador insesgado con una distribucin normal en el muestreo, se obtiene un

    Intervalo de Confianza de longitud mnima [26% , 30%] con una confianza del 95%.

    a. Cul es el estimador insesgado de y d su valor?

    b. Con qu tamao de muestra se obtuvo el IdeC dado en el enunciado?

    c. Considerando un IdeC unilateral superior para , como [0; 30%], encuentre el nivel de confianza.

    d. Suponiendo que la estimacin del porcentaje es la misma anterior. Cul es el tamao de muestra que se

    necesita para obtener un IdeC del 90% con un error de muestreo (e.e.) de 1%?

    8. La casa matriz de Teleflores est en Caracas y tiene una red muy grande de floristas (cerca de 500 locales

    a travs de varios pases del mundo) la venta es un 30% va Internet y 70% va Telfono. Internet es slo

    uno de los mecanismos de venta, ya que est limitado por el uso de las computadoras. Para negocios de

    gran volumen, el telfono permite llegar a un mercado mayor, ya que an un alto % de los clientes

    potenciales, o no tiene acceso a Internet, o no acostumbra a comprar por este medio. El resultado de

    Teleflores muestra que una combinacin de ambas vas es la clave, pues si slo se tuviera el servicio por

    Internet se perderan muchas ventas, es mejor seguir considerando el antiguo mtodo del telfono

    gratuito.

    Un ndice de la calidad de ste servicio telefnico es el tiempo de espera, esto es, el tiempo que transcurre

    desde que el telfono suena por primera vez hasta que el agente de ventas telefnico contesta. El estndar

    de Teleflores es que el tiempo medio de espera no debiera ser mayor de 30 segundos .

    La cadena tiene inspectores secretos que viajan a travs del mundo verificando distintos aspectos del

    servicio, entre otros indicadores al llegar a un pas lo primero que controlan es el tiempo de espera, para

    ello realizan llamadas telefnicas aleatorias a la lnea gratuita 800 de los distintos locales de ese pas,

    registrando los tiempos de espera. En una visita de rutina efectuada a Brasil, los tiempos en segundos

    fueron: 5, 10, 10, 10, 11, 12, 13, 13, 14, 14, 14, 15, 15, 16, 17, 17, 18, 18, 19, 19, 25, 25, 26, 27, 30, 30,

    33, 34, 35, 38, 39, 40, 40, 50, 50, 51, 51, 55, 58, 59, 65, 83.

    En base a la informacin de la muestra obtenga algunas antecedentes estadsticos y en base a ellos realice

    algn informe a la gerencia de Teleflores. Particularmente:

    a. Obtenga un Intervalo de Confianza del 95% para la desviacin estndar del tiempo de espera.

    b. Al observar el IdeC anterior realice un pre-informe.

    c. Obtenga un IdeC unilateral con del 95% para la el tiempo medio de espera.

    d. Al observar el IdeC anterior y los antecedentes del pre-informe realice un informe final

    e. Variara el informe final si el tiempo medio estndar de espera de Teleflores se modifica de 30 a 35

    seg.?

  • EAS201a Inferencia Estadstica Pgina 29 Segundo Semestre 2014

    9. Un nuevo tipo de tubos elctricos tiene una duracin la cual se puede considerar como una variable

    aleatoria continua Y con funcin densidad de probabilidad de la forma:

    y

    ey

    yf 2

    ; y > 0

    En el envase de cada tubo se lee el siguiente rtulo: Duracin media 2.000 hrs. Se probaron 32 tubos

    obtenindose una duracin promedio de 1.950 hrs.

    a. Obtenga el Estimador Mximo Verosmil del parmetro .

    b. Obtenga E ( ) ; V ( ) ; C.C.R.( ).

    c. Obtenga un Intervalo de Confianza aproximado para el parmetro , con confianza 95%.

    En base a los resultados ya obtenidos determine si es correcto lo que promete el fabricante.

    10. La variabilidad en la obtencin de las caractersticas de un producto es fuente de mala calidad. Por ello

    muchas veces interesa asegurar que la varianza no supere determinado valor. Sea Y1, Y2, Y3,..., Yn una

    m.a. de tamao n de la distribucin N(, 2).

    a. Construya un IdeC (1 ) unilateral superior para 2 asumiendo que la media es conocida

    b. Si el intervalo anterior se considera con una confianza del 95% Cul debe ser el mnimo tamao de

    muestra para que la Amplitud Esperada del intervalo obtenido no supere al triple de la varianza 2?

    Nota: En este caso el intervalo unilateral superior asume que la cota inferior es cero, esto es, (0 , LS).

    11. El departamento de inventarios de una empresa seleccion al azar, de una bodega de productos

    terminados, una muestra de 50 cajas, cada una de las cuales contiene 3 artculos, encontrndose los

    siguientes resultados

    # Artculos fallados # de Cajas

    0 37

    1 10

    2 1

    3 2

    Obtenga un IdeC del 95% para la proporcin de artculos buenos

    Si la bodega contiene N=12.000 cajas del mismo tipo. Obtenga un IdeC del 95% para el nmero total de

    artculos buenos en la bodega.

    12. Sea Y1, Y2, Y3,..., Yn una m.a. de la distribucin N(, 2) con 2 desconocida. Demuestre que el IdeC

    bilateral simtrico para

    n

    sty

    n

    sty nn 1 2/1

    1

    2/1 , , tiene Amplitud Mnima.

  • EAS201a Inferencia Estadstica Pgina 30 Segundo Semestre 2014

    13. Una m.a. Y1, Y2, Y3,..., Yn de tamao 50 de la distribucin exponencial de parmetro , entreg un

    promedio de 558.

    a. Obtenga un IdeC del 95% bilateral para el Primer Cuartil.

    b. Obtenga un IdeC del 95% bilateral para el Segundo Cuartil.

    c. Obtenga un IdeC del 95% bilateral para el Tercer Cuartil.

    14. Supngase que ocurren 175 caras y 225 sellos al lanzar 400 veces una moneda. Para averiguar si la

    moneda est bien balanceada, determine un IdeC del 99% para la probabilidad de cara.

    15. Sea Y1, Y2, Y3,..., Yn una m.a. de tamao n de la distribucin Bernoulli de parmetro . A travs de las

    propiedades asintticas de los estimadores de mxima verosimilitud (es decir, pensando en que se cuente

    con una muestra grande), obtenga un IdeC (1 ) bilateral para la varianza poblacional.

    16. Una compaa que vende seguros para automviles desea encontrar el valor medio de las solicitudes de

    reparacin de las carroceras de los autos asegurados. De qu tamao se debe seleccionar la muestra, si

    se desea un IdeC bilateral del 95% de confianza con una Amplitud no mayor a US$50?

    a. Asuma que la desviacin estndar es de US$ 300.

    b. Asuma que la desviacin estndar es de US$ 450

    c. Qu le sucedera a la Amplitud del intervalo de confianza si se utilizase el valor de n escogido

    suponiendo = 450, cuando en realidad la verdadera desviacin estndar es de US$ 300?.

    Nota: Para de terminar el tamao muestral, en este problema se asume conocido, por lo tanto dada una

    confianza y un e.e. entonces el valor de n se obtiene resolviendo la ecuacin: 2

    2/1

    ..

    ee

    zn

    .

    Sin embargo, bajo el caso de varianza desconocida, para encontrar n se debera resolver: 2

    1

    2/1

    ..

    ee

    stn

    n

    , en

    cuya circunstancia tenemos dos problemas: hay que estimar a travs de S, y tampoco se puede entrar a la tabla

    t dado que no se conoce n. Para evitar dichos inconvenientes, en primer lugar se consideran restricciones

    distintas tales como:

    La Amplitud deseada se especifica como una fraccin de la desviacin estndar

    El tamao de muestra se asume lo suficientemente grande de tal modo que la distribucin t se aproxime

    por z.

    Aplique al ejemplo que e.e. debe ser 0,5 veces s y caso muestra grande.