Parte II Chi-Cuadrada χ 2 Maestría de Salud Pública Universidad de Xochicalco 2º Semestre 12 de...

Post on 25-Jan-2016

212 views 0 download

Transcript of Parte II Chi-Cuadrada χ 2 Maestría de Salud Pública Universidad de Xochicalco 2º Semestre 12 de...

Parte II

Chi-Cuadrada χ2

Maestría de Salud Pública Universidad de Xochicalco 2º Semestre 12 de Junio del 2009Dr Burgos Dra. Rangel

Temas a tratar

• Corrección de Yates• Prueba de McNemar para muestras

correlacionadas• Prueba de bondad de ajuste para la

distribución χ2

• Combinación de valores-p• Repaso• Habrá preguntas y Ejercicios

Corrección de Yates

• Se puede utilizar cuando alguna de las celdas tiene un valor esperado <5

• Considerada muy conservadora aumenta el riesgo del error tipo II

• Es mejor utilizar la prueba exacta de Fisher

Prueba de McNemar

• Utilizada cuando queremos comparar una variable en el mismo sujeto “antes y después”

• Se utiliza para muestras correlacionadas donde los “sujetos” son sus “propios controles” o son “pareados”.

• Útil en variables dicotómicas

Prueba de McNemar: Uso de analgésicos antes y después de vertebroplastía

• Datos:

Evans AJ, et al. Radiology 2003; 226: 366-372

A24

B4

C20

D5

Antes

DespuésAnalg

No

Analg No

Total 44 9 53

28

25

Cálculos:

=(4 - 20)2

4 +20 = 10.67

Prueba de Hipótesis:

df= (r - 1)(c - 1) = 1 0.5χ2 = (1) Rechazar H0

ResultadosDespués*Antes Crosstab

Antes Total Analg No Despues Analg 24 4 28 No 20 5 25Total 44 9 53

Prueba de Chi-Cuadrada

Valor Exact Sig. (2-colas)

Prueba de McNemar 0.002N de Casos Validos 53

Prueba de Bondad de Ajuste para χ2

Utilizada cuando tenemos dos o mas categorías de una variable.

Determina que tan bien un distribución hipotética se ajusta a la distribución observada

Genética de los rosales• En mi patio tengo un grupo de rosales hibridos.

Mi hipótesis de genetista es (de acuerdo a la teoría de Mendel) que debo de tener 50% flores rosas, 25% flores blancas, y 25% flores rojas.

Pp Pp

PP Pp Pp pp

Flores

• Tengo 120 de estas plantas. El resultado de los colores de las flores fue el siguiente

Rosa Blanca Roja

75 20 25

Flores – Realidades y ExpectativasRecuerden, yo esperaba 50% Rosas, 25% Blancas y 25% Rojas.

Si plante 120 semillas, yo esperaría la siguiente variedad de flores

Rosa Blanca Roja

Observado 75 20 25

Rosa Blanca Roja

Esperado 60 30 30

Flores – Realidades y Expectativas

Rosa Blanca Roja

Observado 75 20 25

Esperado 60 30 30

Si mi hipótesis es correcta (50%, 25%, 25%), ¿que tan probable es que obtener esta diferencia en la distribución de colores observados y la distribución esperada?

Si mi hipótesis es correcta (50%, 25%, 25%), ¿que tan probable es que obtener esta diferencia en la distribución de colores

observados y la distribución esperada?• Utilizada para determinar si la probabilidad es

< α. En tal caso rechazo la hipótesis0

O• Si la probabilidad es > α, no rechazo mi

hipótesis0

La Prueba χ2

La Prueba Chi-Cuadrada• Hipótesis

– H0: P(rosa, blanca, roja) = .5, .25, .25

“La proporción de la población de flores rosas, blancas y rojas es de .5, .25, y .25 respectivamente”.

– H1: P(rosa, blanca, roja) ≠ .5, .25, .25

“La proporción de la población de flores rosas, blancas, y rojas es diferente a .5, .25, y .25 respectivamente”

Categorías mutuamente excluyentes, exhaustivas (∑P = 1)

La Prueba Chi-Cuadrada• La hipótesis para la prueba de bondad-de-ajuste

se establece en términos de proporciones. • La prueba Chi-Cuadrada se lleva a cabo en

frecuencias reales no proporciones. • Específicamente, la χ2 opera en las diferencias

entre las frecuencias observadas y las esperadas.

• Primero asegúrese que todo esta en frecuencias

La prueba de Chi-Cuadrada

∑E = 120

Rosa Blanca Roja

Observado 75 20 25

Esperado 120(.5)=60 120(.25)=30 120(.25)=30

•Frecuencias observadas = O•Frecuencias esperadas = E

•E = N x Proporción esperada•E = N x P(celda)

•Note que siempre, ∑E = ∑O

∑O = 120

En la prueba de Chi Cuadrada…

• …calculamos (O-E)2/E en cada celda, • sumamos todos los valores de (O-E)2 de todas

las celdas, • y comparamos el valor de esta suma a un

valor crítico.

χ2 = ∑ (0-E)2

E

La Distribución Chi Cuadrada

• Los estadísticos han encontrado que si la H0 es correcta y calcula la estadística χ2 para todas las muestras posibles de N tamaño, los valores son de una distribución de probabilidades llamada la distribución χ2.

Características de la distribución χ2

• Una familia de distribuciones con diferentes grados de libertad (df).

• Con cola positiva pronunciada; esto disminuye a > df.

• El valor mínimo = 0 (χ2 no puede ser negativa)• El valor promedio aumenta (toda la

distribución se desplaza a la derecha) al aumentar los df.

Características de la distribución χ2

Una familia de distribuciones que varia de acuerdo a los df.

• Si la diferencia entre O’s y E’s es mayor, la χ2

aumenta. • Ya que solo nos interesa rechazar la H0 si la

diferencia entre las frecuencias observadas y esperadas es mayor que lo esperado aleatoriamente, la región para rechazar la H0 se encuentra en la cola positiva.

Características de la distribución χ2

Chi-Cuadrada: Prueba de una Cola

Regla de decisión: rechazar H0 si χ2> χ2c0

Encontrando χ2

• Tabla de χ2

• df = k-1• Por que?

– Si tiene tres categorías, solo la suma de dos tiene la libertad para variar

• Escoja el valor α, lea la lista de df para encontrar la χ2

c

c

Encontrando a la χ2c

Los Seis Pasos Obligatorios

• Establecer H0 y H1

• Escoja su α• La distribución probabilística es χ2 con k-1 df

(grados de libertad). • Encuentre y establezca la regla de decisión:

se rechaza la H0 si χ2 > χ2

• Calcule la χ2

• Aplique la regla de decisión.

co

o

Calculando la χ2o

Rosa Blanca Roja

Observado 75 20 25

Esperado 60 30 30

Encontrando la χ2o

Rosa Blanca Roja

Observado 75 20 25

Esperado 60 30 30

Siempre, ∑(O-E) = 0

Rosa Blanca Roja

Observado- Esperado 15 -10 -5

Encontrando la χ2

Rosa Blanca Roja

Observado- Esperado 15 -10 -5

Rosa Blanca Roja

(Observado- Esperado)2 225 100 25

o

Encontrando la χ2o

Rosa Blanca Roja

(Observado- Esperado)2 225 100 25

Esperado 60 30 30

Rosa Blanca Roja

(Observado- Esperado)2/Esperado 3.75 3.33 0.83

∑[(O-E)2/E] = χ2 = 7.91

Ya que χ2 > χ2 , rechazamos la H0

Componentes de laχ2

o c

Interpretación

• Ya que rechazamos la H0, la hipótesis del genetista no se ajustó a los datos.

• La distribución de categorías (colores) en la población plantas es probablemente diferente a la esperada de .5 rosas, .25 blancas, .25 rojas

Otro Ejemplo• La compañía de nutrición enteral “Bimbo” que

se encuentra por debajo de “Ensure” en ventas , cree, que dada la oportunidad, la mayoría de los consumidores preferirían “Bimbo”, diseñan una prueba “ciega” para probar su hipótesis. Una muestra aleatoria de 100 ancianos prueban una muestra de cada nutrición enteral y se les pregunta cual les gustó mas. 57 prefieren Bimbo, mientras que 43 escogen “Ensure”.

¿Pueden promocionar que las personas prefieren “Bimbo”?

• H0: p(Bimbo)=P(Ensure) o p(Bimbo, Ensure)= .5, .5

• H1: p(Bimbo) ≠ p(Ensure) o p(Bimbo, Ensure) ≠ .5, .5

Respuestas

• Utilice α = .05• df = 1, distribución χ2 con 1 df• Χ2 para α = .05, df = 1, es de _____. Rechazar

la H0 si χ2 ≥ ______

• Calcular

c3.84

3.84o

Chi-Cuadrada

Nutrición O E O-E (O-E)2 (O-E)2/EBimbo 57Ensure 43

χ2 =

• Hacer el calculo

50

50

7-7

4949

0.980.98

1.96

Ya que la χ2 < χ2 (1.96 < 3.84), retenemos la H0

Bimbo no puede asumir que mas personas los prefierenco

c

Mejoren calificación

• Encontramos que 57 vs. 43 no nos permite rechazar la H0.

• ¿Cual es el numero mas pequeño en preferencias para Bimbo que nos llevaría a un hallazgo significativo? (rechazar H0) a α = 0.05?

• Una respuesta correcta ahora puede valer puntos para su calificación final

Supuestos de la prueba de Bondad-de-Ajuste

• Las observaciones en diferentes categorias son independientes

• Las categorias son mutuamente excluyentes• Las categorias son exahustivas• Ninguna Frecuencias esperadas < 2• “Pocas” frecuencias esperadas < 5

– La distribucion χ2 no describe apropiadamente probabilidades de muestreos cuando las frecuencias esperadas son pequeñas

Combinación de valores p

• 5 estudios para probar la efectividad encontraron lo siguientes resultados:

• Estudio 1: p1=0.15; Estudio 2: p2=0.07; Estudio 3: p3=0.5; Estudio 4: p4=0.22; Estudio 5: p5= 0.09

• Para un valor p arbitrario, la hipótesis nula que dice que es correcto , -2logep puede considerarse derivado de una distribución χ2 con 2 df.

• Si hay k estudios independientes, cada uno contribuye 2k df

– 2loge(0.15) = 3.79

– 2loge(0.7) = 5.32

– 2loge(0.50) = 1.39

– 2loge(0.22) = 3.03

– 2loge (0.9) = 4.82

Total = 18.35

df = 2k = 2 x 5 = 10 dfΧ2 : ______ p: ______

c

Combinación de valores pCalculo de Χ2

Ojo con la Chi-Cuadrada

A+ A- Total

Enf+ 51 59 110

Enf- 549 1341 1890

Total 600 1400 2000

Sacar Chi- Cuadrada

Vuelvan a sacar Chi-Cuadrada

A+ A- Total

Enf+ 50 50 100

Enf- 450 450 900

Total 500 500 1000

Europeos

A+ A- Total

Enf+ 1 9 10

Enf- 99 891 990

Total 100 900 1000

Africanos

Ojo con los Resultados

ESPURIO

Al separar en subgrupos:

Repaso χ2

• La χ2 – es una prueba no paramétrica aplicada a datos de frecuencia categórica.

• La distribución probabilística relevante es la distribución χ2.– Una familia de distribuciones con diferentes grados de

libertad (df)– Con asimetría positiva con mínimo = 0– La asimetría disminuye a > grados de libertad– El centro de la distribución y valores críticos aumentan

> grados de libertad.

Repaso χ2

• Área de rechazo en la cola positiva,• Regla de decisión: rechazar la H0 si χ2 ≥ χ2

• Dos formas de uso: – Prueba de independencia

• Utilizada para probar si dos o mas variables categóricas están relacionadas

• Utilizada para saber si dos o mas muestras esta relacionadas

– Prueba de Bondad de Ajuste• Utilizada para determinar si una distribución observada

“se ajusta” a una distribución hipotética (o esperada)

c0

Aunque no siempre seamos así!

• Siendo que la Epidemiología y Bioestadística (al igual que la naturaleza) obedece a las matemáticas, la regla de “nada por nada es la ley” será aplicada en nuestra materia, para darles la oportunidad de obtener una “gran calificación”

En la próxima claseHaremos las evaluaciones del curso, ya que

ustedes, nuestros pupilos, van a: 1.resolver unos problemas de epidemiología en el

pizarrón y, 2.explicar en forma clara, concreta, breve y

exhaustiva (como buen profesional) un tema utilizando las palabras claves indicadas.

Son solo cinco minutos para explicar el tema, no se permitirá uso de PowerPoint, solo pizarrón

Próxima Clase, orden aleatorio:

• Dr. Arellano: Resolver ejercicio #1 en clase y explicar en menos de 5 minutos la “Paradoja de Simpson”.

• Dr. Oceguera: Resolver ejercicio #2, explicar en que consiste el “Triangulo de Pascal” y demostrar su uso en clase, se espera que dibuje uno en clase (5 min).

• Dra. Kapika: Resolver ejercicio #3, explicar error tipo I y II (5 min)

• Enf. Barreras: Resolver ejercicio # 4 y explicar en menos de 5 minutos las bases matemáticas de la “corrección de Yates” debe de incluir las palabras clave: “distribución continua” y “discreta”.

• Dr. Villegas: Resolver ejercicio # 5 y explicar en menos de 5 minutos la prueba para proporciones correlacionadas de McNemar.

Próxima Clase, orden aleatorio:

• Dr. Garcia: Resolver ejercicio #6 y explicar en 5 minutos las bases matemáticas para asignar grados de libertad y como afecta a la distribución de la Chi-Cuadrada (debe incluir las siguientes palabras clave: “proporciones marginales” , “variancia”, “media y “moda” ).

Podría haber sorpresas y ejercicios adicionales durante la clase (Todo es posible de acuerdo a la incertidumbre probabilística -epidemiológica)

Próxima Clase, orden aleatorio:

MUCHA SUERTE,