Cálculo de la potencia del contraste

Post on 27-Nov-2015

88 views 1 download

Transcript of Cálculo de la potencia del contraste

Cálculo de la potencia del contraste

• Recordemos que la potencia de un contraste estadístico es el complementario del error tipo II (1-β).

Potencia

• También se definió como

P Rechazar𝐻0 𝐻0 = fals𝑎)

• La potencia representa la probabilidad de poder detectar el efecto de interés que estamos buscando.

• ¡Es de lo más importante!

Ejemplo 2.6

• Supongamos que la duración media de una lámpara de bajo consumo de una determinada marca es de 1000 horas con un desviación típica de 220 horas.

• La empresa que las fabrica introduce un nuevo proceso de fabricación y afirma que la vida media de las nuevas es superior a las antiguas. Vamos a suponer que como hipótesis alternativa única se plantea un promedio de duración de 1060 horas.

• Tomando un nivel de significación del 5%, determinar el error tipo II y la potencia de la prueba, si el estudio se realizara con un muestra de 100 lámparas.

Hipótesis

• Aunque usualmente los contrastes se plantean con hipótesis exhaustivas y mutuamente excluyentes, para calcular la potencia de contraste se han de plantear dos hipótesis en las que sólo figura el signo “igual”.

𝐻0: 𝜇 = 1000 𝐻1: 𝜇 = 1060

• Asumiendo que la Sx es la misma en ambas distribuciones tendríamos dos distribuciones poblacionales parcialmente solapadas con medias 1000 y 1060 y desviación típica 220.

• Pero como estamos cogiendo muestras de n = 100, trabajamos con la distribución muestral de la media con desviaciones típicas

𝜎𝑌_ =

𝜎𝑌

𝑛=

220

100

• Si las vemos en un rango más apropiado, podremos trabajar mejor con ellas.

• Y esto es lo que se ha hecho en el texto para tener una mejor representación.

Lógica a seguir

• Z=(X-m)/s

𝑍 =𝑋 − 𝜇

𝜎

• En este gráfico se muestra claramente la lógica del cálculo: computamos el valor del tiempo de rotura de la lámpara (X) que deja por debajo de sí 1- en la distribución H0.

• A continuación, determinamos el valor de X si H1 fuese cierta (no H0). Obsérvese que los ejes de ambas distribuciones son el mismo (las gráficas deberían estar solapadas) y deben estar en correspondencia oportuna.

• 1º step: distribución muestral de las duraciones medias de las lámparas antiguas.

𝑍 =𝑌_

− 𝜇0

𝜎𝑌_

En las tablas de la curva normal buscamos la Z que deja por encima de sí el 0.05 de la distribución.

• 1º step: distribución muestral de las duraciones medias de las lámparas antiguas.

𝑍 =𝑌_

− 𝜇0

𝜎𝑌_

Luego si Z = 1.64 deja por encima de sí el 0.05 de la distribución ¿a qué valor Directo (X) se corresponde esta Z en la distribución de las lámparas antiguas?

• Luego sabiendo que Z = 1.64, que la media de la distribución de tiempo en la distribución antigua es de 1000 horas y que el error típico viene dado (conocemos la desviación típica poblacional, ) por el cociente entre Y y la raíz cuadrada del número de lámparas utilizadas:

• Ahora solamente debemos despejar el valor de horas correspondiente a una Z = 1.64.

Resultado:

Observamos que calculando la media de tiempo utilizando la Normal tipificada, tenemos el valor crítico 1.64 (correspondiente a una Y media de 1036,1 horas) si utilizamos la distribución de las lámparas antiguas.

Pero ¿cuánto srá este valor en el nuevo tipo de lámparas que tienen una media de 1060 horas y asumimos que la misma Sx que las antiguas? Utilizamos el mismo “truco” que antes pero a la inversa ya que ahora conocemos todos los valores de la Z.

Pero ¿cuánto srá este valor en el nuevo tipo de lámparas que tienen una media de 1060 horas y asumimos que la misma Sx que las antiguas? Utilizamos el mismo “truco” que antes pero a la inversa ya que ahora conocemos todos los valores de la Z.

Ahora buscamos en las tablas la probabilidad de este valor de Z. Resulta valer 0.1379.

Por último, volvemos a la distribución de puntuaciones directas (distribución muestral de las medias con N = 100) y vemos que la probabilidad del área gris (β) es la probabilidad de cometer un error tipo II. Luego su complementario (área amarilla) será 1- β, la potencia.

1 − 𝛽 = 1 − 0.1379 = 0.8621

• Luego la probabilidad de que los resultados de la investigación permitan rechazar H0 cuando es realmente falsa es de 0.86.

• Recordemos que el contraste se ha realizado asumiendo que H0 era cierta.

• Si se rechazara la hipótesis nula de que el promedio de duración es de 1000 horas, pero en realidad esta hipótesis fuera verdadera (es decir, el nuevo proceso de fabricación no alarga la duración) entonces estaríamos cometiendo un error (tipo I) del 5%.

• Por otro lado, si se acepta la hipótesis nula, pero la alternativa es la verdadera, la probabilidad de cometer este error (tipo II) es del 13,79%. Por tanto, la potencia de la prueba es del 86,21% (1 – 0,1379 = 0,8621).

Ejemplo 2.7

• Para contrastar la presunta “habilidad detectora” de la dama se preparan 16 tazas de té, siguiendo ambos procedimientos: en ocho se vierte primero la leche, y en otros ocho se vierte primero la infusión. La presentación se realiza al azar y la dama sólo tiene que decir cuál ha sido el procedimiento (primero la leche y después el té, o a la inversa).

• Supongamos, por ejemplo, que la dama acierta en 12 ocasiones. Vamos a utilizar este dato como hipótesis alternativa, para calcular la potencia de un contraste unilateral derecho con un nivel de significación de 0,05.

• En este caso, la hipótesis nula es que la señora no puede realizar esta discriminación (0 = 0,5 ) en relación a lo que sucedería si la señora puede, efectivamente, realizarla con una probabilidad superior al azar (H1) que, en este caso, hemos supuesto igual a 0,75 = 12/16 = 3/4.

• Si la probabilidad de acertar es del 50% (8 ocasiones con n = 16) concluimos que la señora no tiene esa habilidad.

• Pero incluso aunque no lo tenga, la señora no tiene porqué acertar 8 de las 16 veces inexcusablemente. Habrá cierta variabilidad en el número de aciertos INCLUSO aunque H0 sea cierta.

• Por ello debemos preguntarnos ¿a partir de qué número de aciertos procederíamos a rechazar la hipótesis nula con un nivel de significación de 0,05?.

• Consultamos en la tabla de la distribución binomial para n=16 y p=0,5 (H0) el número de aciertos superiores a 8 (que representa en este caso el 50%) y cuya suma sea al menos igual o menor que el alfa fijado.

• Observamos que n (número de ensayos), x es el número de aciertos posibles (x <= n) y los valores de probabilidad no son acumulados.

Bajo la H0

𝛼 < 0.05

0.0278 + 0.0085 + 0.0018 + 0.0002 + 0.0000 = 0.0383 < 0.05 Acierta 12 o más ocasiones

Esto para H0 ¿y para H1?

• Sabiendo que la potencia corresponde a la probabilidad de rechazar la hipótesis nula cuando es falsa, es decir, cuando la dama sí tiene esa habilidad y que esta decisión se toma cuando es capaz de acertar en 12 o más ocasiones, la potencia del contraste se obtiene calculando la probabilidad de acertar en 12 o más ocasiones cuando la dama sí tiene esa habilidad.

Esto para H0 ¿y para H1?

• La dama tendrá eta habilidad si p=0,754 . Por consiguiente, acudimos a la tabla de la distribución binomial con n=16, p=0,75.

• ¡Pero esta probabilidad no aparece en la Tabla!

Esto para H0 ¿y para H1?

• Esto quiere decir que si la probabilidad de acertar es 0,75, la de fallar es 0,25.

• Entonces la probabilidad de tener 12 aciertos (con p=0,75) en N=16 ensayos es la misma que la probabilidad de tener 4 fallos (con p=0,25) en esos mismos 16 ensayos.

• Y esta probabilidad de p=0,25 sí que figura en la tabla binomial.

• 12 aciertos o más (4 fallos o menos) en 16 ensayos (con p = 0.75) es lo mismo que 4 aciertos o menos en 16 ensayos con p = 0.25.

• Tabla de la distribución binomial para N = 16 y p =0,25. 0.2252 + 0.2079 + 0.1336 + 0.0534 + 0.0100 =

0.6302 = 1-

En términos gráficos

• Por consiguiente, para calcular la potencia de un contraste se necesita que la H0 y la H1 sean simples.

• Cuando H1 es compuesta (plantea más de un valor como media poblacional), la potencia del contraste varía en función de dos factores: – La distancia entre el valor de H0 y H1 (cuando H0 y

H1 son simples, esta distancia está fijada).

– El tamaño muestral.

• En este caso y para un mismo valor del error tipo I (), se pueden confeccionar lo que se denominan curvas de potencia, las cuales permiten fácilmente localizar la potencia de un contraste según sea el valor que puede tomar H1 y el tamaño de la muestra.

Curvas de potencia para un fijado

• Se puede ver que para un tamaño muestral de 100, la potencia, efectivamente, está por encima de 0,85.

Nivel crítico p y errores en los contrastes

• En las pruebas clásicas de contrastes es preciso establecer el error tipo I (máximo riesgo que estamos dispuestos a admitir al tomar una decisión) antes de realizar el contraste, de modo que este valor no influya en la decisión final que se toma.

• No obstante, establecer previamente un nivel de error tipo I, presenta algún inconveniente que puede ser decisivo en la decisión que se tome.

Inconvenientes

• La decisión que se tome sobre puede depender del nivel de significación que se establezca, y se puede dar la circunstancia de que sea rechazada con un nivel del 5% y no serlo con el 1%.

• Determinar cuán pequeño debe ser dependerá de factores que pueden ser simplemente las creencias previas sobre los procesos de toma de decisión que se han realizado anteriormente sobre la misma o parecida cuestión y también sobre las consecuencias que se deriven al tomar una decisión errónea.

Inconvenientes

• Debido a estos inconvenientes, en el análisis de datos moderno se ha introducido el denominado nivel crítico p, que se define como el nivel de significación más pequeño al que una hipótesis nula puede ser rechazada con la medida de discrepancia obtenida.

• Nivel crítico p es la probabilidad asociada a la medida de discrepancia que hemos obtenido a partir de la información obtenida en nuestra muestra y cuantifica la probabilidad de obtener unos datos como los obtenidos en lainvestigación o más extremos bajo el supuesto de que la hipótesis nula es verdadera.

• Al utilizar como criterio para la decisión el nivel crítico p no hay que establecer previamente un nivel de significación, y ésta se toma en función del valor de p. Si p es pequeño se rechazará , y si es grande se aceptará .

• Obviamente persiste el problema de determinar qué es grande y qué pequeño. Entonces para tomar una decisión hay que recurrir al criterio del grado de cercanía o alejamiento de p a, por ejemplo, el valor 0,05. Si es claramente inferior, se rechaza , si es claramente superior se acepta , y si está en torno a ese valor, se vuelve a tomar nueva evidencia muestral y se repite el contraste.

• No obstante, el empleo del nivel crítico p como criterio de decisión tampoco está exento de problemas, ya que, al igual que las medidas de discrepancia observada entre y la evidencia muestral, depende del tamaño de la muestra utilizada.

• Es por ello que se han explorado nuevas medidas, independientes del tamaño muestral: el tamaño del efecto.

¿Potencia? Para eso primero tenemos que confiar en el producto…

• En 1876, un documento interno de la

compañía Western Union, aseguraba lo siguiente: “El llamado teléfono tiene demasiadas limitaciones para considerarlo seriamente un medio de comunicación. No posee ningún valor para nosotros”.

¿Potencia? Para eso primero tenemos que confiar en el producto…

• Por otro lado, en 1943, Thomas Watson,

presidente de la empresa IBM, estaba poco convencido sobre el futuro del mercado informático: “Creo que en el mundo hay mercado para unos cinco ordenadores como mucho”.