Parte II Chi-Cuadrada χ 2 Maestría de Salud Pública Universidad de Xochicalco 2º Semestre 12 de...
-
Upload
juan-luis-villalba-flores -
Category
Documents
-
view
212 -
download
0
Transcript of Parte II Chi-Cuadrada χ 2 Maestría de Salud Pública Universidad de Xochicalco 2º Semestre 12 de...
Parte II
Chi-Cuadrada χ2
Maestría de Salud Pública Universidad de Xochicalco 2º Semestre 12 de Junio del 2009Dr Burgos Dra. Rangel
Temas a tratar
• Corrección de Yates• Prueba de McNemar para muestras
correlacionadas• Prueba de bondad de ajuste para la
distribución χ2
• Combinación de valores-p• Repaso• Habrá preguntas y Ejercicios
Corrección de Yates
• Se puede utilizar cuando alguna de las celdas tiene un valor esperado <5
• Considerada muy conservadora aumenta el riesgo del error tipo II
• Es mejor utilizar la prueba exacta de Fisher
Prueba de McNemar
• Utilizada cuando queremos comparar una variable en el mismo sujeto “antes y después”
• Se utiliza para muestras correlacionadas donde los “sujetos” son sus “propios controles” o son “pareados”.
• Útil en variables dicotómicas
Prueba de McNemar: Uso de analgésicos antes y después de vertebroplastía
• Datos:
Evans AJ, et al. Radiology 2003; 226: 366-372
A24
B4
C20
D5
Antes
DespuésAnalg
No
Analg No
Total 44 9 53
28
25
Cálculos:
=(4 - 20)2
4 +20 = 10.67
Prueba de Hipótesis:
df= (r - 1)(c - 1) = 1 0.5χ2 = (1) Rechazar H0
ResultadosDespués*Antes Crosstab
Antes Total Analg No Despues Analg 24 4 28 No 20 5 25Total 44 9 53
Prueba de Chi-Cuadrada
Valor Exact Sig. (2-colas)
Prueba de McNemar 0.002N de Casos Validos 53
Prueba de Bondad de Ajuste para χ2
Utilizada cuando tenemos dos o mas categorías de una variable.
Determina que tan bien un distribución hipotética se ajusta a la distribución observada
Genética de los rosales• En mi patio tengo un grupo de rosales hibridos.
Mi hipótesis de genetista es (de acuerdo a la teoría de Mendel) que debo de tener 50% flores rosas, 25% flores blancas, y 25% flores rojas.
Pp Pp
PP Pp Pp pp
Flores
• Tengo 120 de estas plantas. El resultado de los colores de las flores fue el siguiente
Rosa Blanca Roja
75 20 25
Flores – Realidades y ExpectativasRecuerden, yo esperaba 50% Rosas, 25% Blancas y 25% Rojas.
Si plante 120 semillas, yo esperaría la siguiente variedad de flores
Rosa Blanca Roja
Observado 75 20 25
Rosa Blanca Roja
Esperado 60 30 30
Flores – Realidades y Expectativas
Rosa Blanca Roja
Observado 75 20 25
Esperado 60 30 30
Si mi hipótesis es correcta (50%, 25%, 25%), ¿que tan probable es que obtener esta diferencia en la distribución de colores observados y la distribución esperada?
Si mi hipótesis es correcta (50%, 25%, 25%), ¿que tan probable es que obtener esta diferencia en la distribución de colores
observados y la distribución esperada?• Utilizada para determinar si la probabilidad es
< α. En tal caso rechazo la hipótesis0
O• Si la probabilidad es > α, no rechazo mi
hipótesis0
La Prueba χ2
La Prueba Chi-Cuadrada• Hipótesis
– H0: P(rosa, blanca, roja) = .5, .25, .25
“La proporción de la población de flores rosas, blancas y rojas es de .5, .25, y .25 respectivamente”.
– H1: P(rosa, blanca, roja) ≠ .5, .25, .25
“La proporción de la población de flores rosas, blancas, y rojas es diferente a .5, .25, y .25 respectivamente”
Categorías mutuamente excluyentes, exhaustivas (∑P = 1)
La Prueba Chi-Cuadrada• La hipótesis para la prueba de bondad-de-ajuste
se establece en términos de proporciones. • La prueba Chi-Cuadrada se lleva a cabo en
frecuencias reales no proporciones. • Específicamente, la χ2 opera en las diferencias
entre las frecuencias observadas y las esperadas.
• Primero asegúrese que todo esta en frecuencias
La prueba de Chi-Cuadrada
∑E = 120
Rosa Blanca Roja
Observado 75 20 25
Esperado 120(.5)=60 120(.25)=30 120(.25)=30
•Frecuencias observadas = O•Frecuencias esperadas = E
•E = N x Proporción esperada•E = N x P(celda)
•Note que siempre, ∑E = ∑O
∑O = 120
En la prueba de Chi Cuadrada…
• …calculamos (O-E)2/E en cada celda, • sumamos todos los valores de (O-E)2 de todas
las celdas, • y comparamos el valor de esta suma a un
valor crítico.
χ2 = ∑ (0-E)2
E
La Distribución Chi Cuadrada
• Los estadísticos han encontrado que si la H0 es correcta y calcula la estadística χ2 para todas las muestras posibles de N tamaño, los valores son de una distribución de probabilidades llamada la distribución χ2.
Características de la distribución χ2
• Una familia de distribuciones con diferentes grados de libertad (df).
• Con cola positiva pronunciada; esto disminuye a > df.
• El valor mínimo = 0 (χ2 no puede ser negativa)• El valor promedio aumenta (toda la
distribución se desplaza a la derecha) al aumentar los df.
Características de la distribución χ2
Una familia de distribuciones que varia de acuerdo a los df.
• Si la diferencia entre O’s y E’s es mayor, la χ2
aumenta. • Ya que solo nos interesa rechazar la H0 si la
diferencia entre las frecuencias observadas y esperadas es mayor que lo esperado aleatoriamente, la región para rechazar la H0 se encuentra en la cola positiva.
Características de la distribución χ2
Chi-Cuadrada: Prueba de una Cola
Regla de decisión: rechazar H0 si χ2> χ2c0
Encontrando χ2
• Tabla de χ2
• df = k-1• Por que?
– Si tiene tres categorías, solo la suma de dos tiene la libertad para variar
• Escoja el valor α, lea la lista de df para encontrar la χ2
c
c
Encontrando a la χ2c
Los Seis Pasos Obligatorios
• Establecer H0 y H1
• Escoja su α• La distribución probabilística es χ2 con k-1 df
(grados de libertad). • Encuentre y establezca la regla de decisión:
se rechaza la H0 si χ2 > χ2
• Calcule la χ2
• Aplique la regla de decisión.
co
o
Calculando la χ2o
Rosa Blanca Roja
Observado 75 20 25
Esperado 60 30 30
Encontrando la χ2o
Rosa Blanca Roja
Observado 75 20 25
Esperado 60 30 30
Siempre, ∑(O-E) = 0
Rosa Blanca Roja
Observado- Esperado 15 -10 -5
Encontrando la χ2
Rosa Blanca Roja
Observado- Esperado 15 -10 -5
Rosa Blanca Roja
(Observado- Esperado)2 225 100 25
o
Encontrando la χ2o
Rosa Blanca Roja
(Observado- Esperado)2 225 100 25
Esperado 60 30 30
Rosa Blanca Roja
(Observado- Esperado)2/Esperado 3.75 3.33 0.83
∑[(O-E)2/E] = χ2 = 7.91
Ya que χ2 > χ2 , rechazamos la H0
Componentes de laχ2
o c
Interpretación
• Ya que rechazamos la H0, la hipótesis del genetista no se ajustó a los datos.
• La distribución de categorías (colores) en la población plantas es probablemente diferente a la esperada de .5 rosas, .25 blancas, .25 rojas
Otro Ejemplo• La compañía de nutrición enteral “Bimbo” que
se encuentra por debajo de “Ensure” en ventas , cree, que dada la oportunidad, la mayoría de los consumidores preferirían “Bimbo”, diseñan una prueba “ciega” para probar su hipótesis. Una muestra aleatoria de 100 ancianos prueban una muestra de cada nutrición enteral y se les pregunta cual les gustó mas. 57 prefieren Bimbo, mientras que 43 escogen “Ensure”.
¿Pueden promocionar que las personas prefieren “Bimbo”?
• H0: p(Bimbo)=P(Ensure) o p(Bimbo, Ensure)= .5, .5
• H1: p(Bimbo) ≠ p(Ensure) o p(Bimbo, Ensure) ≠ .5, .5
Respuestas
• Utilice α = .05• df = 1, distribución χ2 con 1 df• Χ2 para α = .05, df = 1, es de _____. Rechazar
la H0 si χ2 ≥ ______
• Calcular
c3.84
3.84o
Chi-Cuadrada
Nutrición O E O-E (O-E)2 (O-E)2/EBimbo 57Ensure 43
χ2 =
• Hacer el calculo
50
50
7-7
4949
0.980.98
1.96
Ya que la χ2 < χ2 (1.96 < 3.84), retenemos la H0
Bimbo no puede asumir que mas personas los prefierenco
c
Mejoren calificación
• Encontramos que 57 vs. 43 no nos permite rechazar la H0.
• ¿Cual es el numero mas pequeño en preferencias para Bimbo que nos llevaría a un hallazgo significativo? (rechazar H0) a α = 0.05?
• Una respuesta correcta ahora puede valer puntos para su calificación final
Supuestos de la prueba de Bondad-de-Ajuste
• Las observaciones en diferentes categorias son independientes
• Las categorias son mutuamente excluyentes• Las categorias son exahustivas• Ninguna Frecuencias esperadas < 2• “Pocas” frecuencias esperadas < 5
– La distribucion χ2 no describe apropiadamente probabilidades de muestreos cuando las frecuencias esperadas son pequeñas
Combinación de valores p
• 5 estudios para probar la efectividad encontraron lo siguientes resultados:
• Estudio 1: p1=0.15; Estudio 2: p2=0.07; Estudio 3: p3=0.5; Estudio 4: p4=0.22; Estudio 5: p5= 0.09
• Para un valor p arbitrario, la hipótesis nula que dice que es correcto , -2logep puede considerarse derivado de una distribución χ2 con 2 df.
• Si hay k estudios independientes, cada uno contribuye 2k df
– 2loge(0.15) = 3.79
– 2loge(0.7) = 5.32
– 2loge(0.50) = 1.39
– 2loge(0.22) = 3.03
– 2loge (0.9) = 4.82
Total = 18.35
df = 2k = 2 x 5 = 10 dfΧ2 : ______ p: ______
c
Combinación de valores pCalculo de Χ2
Ojo con la Chi-Cuadrada
A+ A- Total
Enf+ 51 59 110
Enf- 549 1341 1890
Total 600 1400 2000
Sacar Chi- Cuadrada
Vuelvan a sacar Chi-Cuadrada
A+ A- Total
Enf+ 50 50 100
Enf- 450 450 900
Total 500 500 1000
Europeos
A+ A- Total
Enf+ 1 9 10
Enf- 99 891 990
Total 100 900 1000
Africanos
Ojo con los Resultados
ESPURIO
Al separar en subgrupos:
Repaso χ2
• La χ2 – es una prueba no paramétrica aplicada a datos de frecuencia categórica.
• La distribución probabilística relevante es la distribución χ2.– Una familia de distribuciones con diferentes grados de
libertad (df)– Con asimetría positiva con mínimo = 0– La asimetría disminuye a > grados de libertad– El centro de la distribución y valores críticos aumentan
> grados de libertad.
Repaso χ2
• Área de rechazo en la cola positiva,• Regla de decisión: rechazar la H0 si χ2 ≥ χ2
• Dos formas de uso: – Prueba de independencia
• Utilizada para probar si dos o mas variables categóricas están relacionadas
• Utilizada para saber si dos o mas muestras esta relacionadas
– Prueba de Bondad de Ajuste• Utilizada para determinar si una distribución observada
“se ajusta” a una distribución hipotética (o esperada)
c0
Aunque no siempre seamos así!
• Siendo que la Epidemiología y Bioestadística (al igual que la naturaleza) obedece a las matemáticas, la regla de “nada por nada es la ley” será aplicada en nuestra materia, para darles la oportunidad de obtener una “gran calificación”
En la próxima claseHaremos las evaluaciones del curso, ya que
ustedes, nuestros pupilos, van a: 1.resolver unos problemas de epidemiología en el
pizarrón y, 2.explicar en forma clara, concreta, breve y
exhaustiva (como buen profesional) un tema utilizando las palabras claves indicadas.
Son solo cinco minutos para explicar el tema, no se permitirá uso de PowerPoint, solo pizarrón
Próxima Clase, orden aleatorio:
• Dr. Arellano: Resolver ejercicio #1 en clase y explicar en menos de 5 minutos la “Paradoja de Simpson”.
• Dr. Oceguera: Resolver ejercicio #2, explicar en que consiste el “Triangulo de Pascal” y demostrar su uso en clase, se espera que dibuje uno en clase (5 min).
• Dra. Kapika: Resolver ejercicio #3, explicar error tipo I y II (5 min)
• Enf. Barreras: Resolver ejercicio # 4 y explicar en menos de 5 minutos las bases matemáticas de la “corrección de Yates” debe de incluir las palabras clave: “distribución continua” y “discreta”.
• Dr. Villegas: Resolver ejercicio # 5 y explicar en menos de 5 minutos la prueba para proporciones correlacionadas de McNemar.
Próxima Clase, orden aleatorio:
• Dr. Garcia: Resolver ejercicio #6 y explicar en 5 minutos las bases matemáticas para asignar grados de libertad y como afecta a la distribución de la Chi-Cuadrada (debe incluir las siguientes palabras clave: “proporciones marginales” , “variancia”, “media y “moda” ).
Podría haber sorpresas y ejercicios adicionales durante la clase (Todo es posible de acuerdo a la incertidumbre probabilística -epidemiológica)
Próxima Clase, orden aleatorio:
MUCHA SUERTE,