APLICACIONES DE CHI CUADRADA.ppt

40
APLICACIONES DE JI- CUADRADO 2

Transcript of APLICACIONES DE CHI CUADRADA.ppt

APLICACIONES DE JI-CUADRADO 2 Relacin entre z y 2 Recordamos que:z = yi / ; donde yi es cada valor de la variable Y Y la relacin es: _2 (1) = (y /) 2=z 2 Cuando son dos muestras entonces: _2 (2) = (y1 /) 2+ (y2 /) 2 =z12 + z22 Para cualquier tamao de muestra n, la suma de los valores dez2 tendr una distribucin _2 con n grados de libertad _2 (2) =

z12 + z22 + z32 + .+ zn2 CARACTERSTICAS DE LA DISTRIBUCIN DE 2 _2 es siempre positivo porque es una suma de cuadrados. Varia desde 0 a (no tiene valores negativos) Depende del parmetro grados de libertad. Media de la Distribucin = gl = k Varianza de la Distribucin = 2gl = 2k Moda = gl-2 para gl>2 y 0 para gl=1 La distribucin tiene sesgo positivo y cuando los gl aumentan se aproxima a la distribucin normalgl=2gl=3gl=4gl=50 2 Chi2 6 8TIPOS DE PRUEBA DISTRIBUCIN JICUADRADA UNA VARIABLEDOS VARIABLES PRUEBADE HOMOGENEIDAD PRUEBA DEINDEPENCENCIA PRUEBADE BONDAD DE AJUSTE DISTRIBUCION 2 BONDAD DE AJUSTE Se utiliza para la comparacin de la distribucin de una muestra con alguna distribucin terica que se supone describe a la poblacin de la cual se extrajo. INDEPENDENCIA La Ho indica que dos variables o criterios de clasificacin son independientes cuando se aplican a un conjunto de individuos (unidades de observacin) HOMOGENEIDAD Se extraen Muestras Independientes de varias poblaciones y se prueban para ver si son homogneas con respecto a algn criterio de clasificacin. PRUEBA DEBONDAD DE AJUSTE Se trata de probar si los datos de una muestra tomada difieren de cierta distribucin predeterminada. Los n datos (valores)tomados deben estar divididos en categoras o intervalos mutuamente excluyentes y observar la frecuencia de ocurrencia de los valores de cada categora. Se comparan las frecuencias observadas con frecuencias esperadas. Se basa en la Distribucin de Probabilidad multinomial PROPIEDADES DE LA DISTRIBUCIN DE PROBABILIDAD MULTINOMIAL1. La situacin consiste en n oportunidadesidnticas. 2. Para cada oportunidad hay k posibles resultados. 3. La probabilidad de k resultados son p1, p2, ...... pk y se mantienen constantes de ensayo en ensayo donde p1 + p2 + ...... + pk = 1 4. Los ensayos son independientes. 5. La variable aleatoria de inters son los conteos n1, n2, ...... nk en cada una de la k categoras.TRADUCIENDO 1. La tasa de ocupacin de pacientes internos en un hospital va a ser evaluada en 250 hospitales (n). 2. Para cada hospital la posible tasa de ocupacin va desde 0 hasta 110.0. Esta tasa se resumen en 8 (k) categoras: 0-39.9; 40-49.9; 50 -59.9; 60-69.9; 70-79.9; 80.0 a 89.9; 90.0-99.9; 100.0-110.0 3. La probabilidad de estar en categora en particular est dado por p. La suma las probabilidades de todas las categoras es 1. 4. La tasa de ocupacin de un hospital es independiente de la tasa de ocupacin de otro hospital. 5. La variable aleatoria de inters son los el nmero de hospitales en cada categoran1, n2, ...... n8. Prueba de Bondad de Ajuste CategoraFrecuenciaobservada

K1 n1 K2 n2 K3 n3 K4 n4 K5 n5 K6 n6 K7 n7 K8 n8 Total 250 Prueba de Bondad de Ajuste Las probabilidades pi, de caer en la categora i estn dadas por la H0 , son constantes entre ensayos y suman 1. La hiptesis nula es H0: pi = valores dados, es decir los datos siguen una distribucin determinada con la cual se calcularn las frecuencias esperadas. La hiptesis alternativa H1: al menos una de las pi es distinta de la probabilidad dada en la H0. PRUEBA DE BONDAD DE AJUSTE Laspruebasdebondaddeajusteson herramientastilesparaevaluarlobienqueseaproximaunmodelodeunasituacinrealaun diseo descrito previamente (modelo terico). Porejemplo,asumamosquetenemosun conjuntodedatosquesedistribuyen normalmente,asesqueunapruebaestadstica particular puede ser usada. Cmo podemos decidir si la suposicin o hiptesis es vlida? EltestX2parabondaddeajuste,compara valores observados y esperados. H0 : hasido seleccionado de una poblacin que tiene una distribucin especfica. H1:lamuestranohasidoseleccionadadeuna poblacin que tiene la distribucin especfica. Nota: Lahiptesisalternanoindicacomolaverdadera distribucin difiere de lahipottica. PRUEBA DE BONDAD DE AJUSTE : DATOS CategoraFrecuenciaobservada

00.0-39.916/250 40.0-49.918 50.0-59.922 60.0-69.951 70.0-79.962 80.0-89.955 90.0-99.922 100.0-109.94 Total 250 PRUEBA DE BONDAD DE AJUSTE SUPUESTOS PARA LA PRUEBA DE _2 Experimento multinomial. Lo que se satisface tomando una muestra aleatoria de la poblacin de inters. El tamao de muestra es lo suficientemente grande para que el nmero esperado en las categoras sea > 5, paraasegurar que _2 se aproxime a la distribucin real (multinomial). Se puede recurrir a colapsar categoras contiguas (celdas) con valores esperados menores de 5. PRUEBA DE BONDAD DE AJUSTE: HIPTESIS Ho: La poblacin de la que se extrajo la muestra, las tasas de ocupacin siguen una distribucin normal. Ha: La poblacin de la que se extrajo la muestra, las tasas de ocupacinno siguen una distribucin normal. =>|.|

\|=r1 i1) - (r2- 1X2X si0H rechazar yijE2ijEijO2Xr = k = nmero de categoras. PRUEBA DE BONDAD DE AJUSTE: ESTADISTICA DE PRUEBAPRUEBA DE BONDAD DE AJUSTE: REGLA DE DECISION Si el valor de la prueba estadstica (_2 calculado) es mayor que el valor crtico (_2

de la tabla) se rechaza la hiptesis nula. _2 = 18.5 PRUEBA DE BONDAD DE AJUSTE : CALCULO DE LA ESTADISTICA DE PRUEBA Categora Frecuencia observada

FrecuenciaEsperada (Oi-Ei)2/Ei 00.0-39.9 1614.55.145 40.0-49.9 1822.18.788 50.0-59.9 2238.657.173 60.0-69.9 5149.62.038 70.0-79.9 6250.482.629 80.0-89.9 5538.387.19 90.0-99.9 2221.88.001 100.0-109.9 49.923.533 110.0 y mas 04.354.35 Total 250250.025.854 PRUEBA DE BONDAD DE AJUSTE DECISION ESTADISTICA: RECHAZO CONCLUSION: LAS TASAS DE OCUPACION HOSPITALARIA NO SIGUEN UNA DISTRIBUCION NORMAL VALOR P < 0.01 PRUEBAS BASADAS EN LA DISTRIBUCIONCHI-CUADRADA Laspruebasdeindependenciayde homogeneidadestnentrelasms comnmenteusadasenlos procedimientos estadsticos. Estostestestnbasadosenunatcnica introducidaporKarlPearsonen1900, quinhasidollamadoel"fundadordela ciencia estadstica". Tablas de Contingencia INDEPENDENCIA Experimento multinomial con clasificacin con 2 factores. Los datos se pueden resumir en una tabla de 2 dimensiones. La Ho indica que 2 variables o criterios de clasificacin son independientes cuando se aplican a un conjunto de individuos. La prueba de Independencia se efecta para probar si hay asociacin entre las variables categricas A y B Totales Marginales Aleatorios Tablas de Contingencia HOMOGENEIDAD Se extraen Muestras Independientes de varias poblaciones.Se prueban para ver si son homogneas con respecto a algn criterio de clasificacin. La prueba de Homogeneidad es una generalizacin de la prueba de igualdad de dos proporciones. Se trata de probar si para cada nivel de la variable B, la proporcin con respecto a cada nivel de la variable A es la misma HIPTESIS LAS HIPTESIS DE INDEPENDENCIA: HO: LAS VARIABLES A Y B SON INDEPENDIENTES P(AB)=P(A) P(B) H1: LAS VARIABLES A Y B ESTN ASOCIADAS HIPTESIS LAS HIPTESIS DE HOMOGENEIDAD: HO: LAS PROPORCIONES DE CADAVALOR DE LA VARIABLE A SON IGUALES EN CADA CATEGORA DE LA VARIABLE B. HA: AL MENOS UNA DE LAS PROPORCIONES ES DIFERENTE. PRUEBAS DE INDEPENDENCIA Y HOMOGENEIDAD Ambas hiptesis se pruebanusando una prueba de Ji-Cuadrado: donde Oij es la frecuenciaobservada de la celda que est en la fila i, columna j es la frecuencia esperada de la celda (i, j). La frecuencia esperada es aquella que sera esperable encontrar si la hiptesis nula es verdadera. .221 1( )r cij iji jijO EE_= ==j iijc rEn=PRUEBAS DE INDEPENDENCIA Y HOMOGENEIDAD El estadstico de la prueba se distribuye como unachi-cuadrada La hiptesis nula se rechaza si, dondees el nivel de significancia. _ _o212>cal( 1) ( 1) gl r c = Sepiensaqueciertomedicamentoes unfactorqueestasociadoala incontinenciaurinaria.Alosefectosde probar sus dichos realiz un estudio en unhospitaldondelosqueusabanel medicamentolosclasificcomo usuariosdelmedicamento(M)yno usuarionsdelmedicamentos(NM)y conincontinencia(IU)ysin incontinencias(NIU)urinarias obteniendo los siguientes resultados. ? PRUEBA DE INDEPENDENCIA IU NIU TotalM 34 757 791NM 7 2427 2434Total 41 3184 3225PRUEBA DE INDEPENDENCIA C x F/ n= 41 X791/3225 =10.063184 x 791/ 3225 = 780.9 41 x 2434/3225 = 30.93184 X 2434 /3225 = 2403. X =(34 -10.06)2/10.06 + ( 757-780.9)2/780.9 + (7-30.9)2/30.9 + (2427-2403)2/2403= 76.43 Cuando se usa chi-cuadrada Para tablas 2 x 2 Si el total del tamao de muestra es > 40, entonces X2 puede ser usada. Si n est entre 20 y 40, y el valor esperado ms pequeo es 5, X2 puede ser usada. De otra forma, se usa el valor exacto de Fisher. Para tablas 2 x c La prueba X2 es vlida si no ms del 20% de los valores esperados es menos de 5, y ninguno es menos de 1. La Prueba Chi-cuadrado de independencia. 2.764 fueron clasificados de acuerdo a sus ingresos yel tiempotranscurridodesdequeellosconsultaronpor ltima vez a un mdico. Ingresos (en miles) Tiempo < 6 meses7 -12meses > 12 meses TOTAL 801 18638 35 22754 45 21978 78 355112 140 653285 259 259 326 375 607 1.197 TOTAL 1.604567 557 2.764 Proporcionanestosdatosevidenciasuficientepara indicar que existe una asociacin entre el ingreso y eltiempotranscurridodesdelaltimaconsultaal mdico?. Dosvariablessonindependientescuandola distribucindeunadeellasnodependedela distribucinde la otra. Sinoexisteasociacinentrelasdosvariablesse dicequeson independientes. Dos variablesson independientes sialconocer el valordeunadeellasparaunsujetonoayudapara determinarelvalordelaotravariableparaelmismo sujeto. H0:losdoscriteriosdeclasificacinson independientes. H1 : los dos criterios de clasificacin no son independientes. Secomparanlasceldasdefrecuenciasobservadascon lasceldasdefrecuenciasesperadasyseusala estadstica : = =(((((

|.|

\|=fl ic1 jijE2ijEijO2xdonde ( )( ) 1 c 1 f2x2x ~y la decisines rechazar H0 a un nivel de significacinsielvalorcalculadodelaestadsticaX2excedeelvalorde tabla: o( )( ) 1 c 1 f21x oH0 :el ingreso y el tiempo transcurrido desde la ltima visita al mdico son independientes. H1: las dos variables no son independientes.La estadstica de prueba calculada es de 47.9 para 8 grados de libertad al 95%. El valor crtico es 15.507. Por lo tanto se rechaza la hiptesis nula PRUEBA DE HOMOGENEIDAD. Esta prueba se usa para comparar proporciones en dos o ms muestras. H0 :laskpoblaciones son"homogneas"conrespectoalaproporcindesujetosque poseen la caracterstica de inters. Engeneralseseleccionaunamuestradecadapoblacinenestudioylossujetosse clasificandeacuerdoaunacaractersticade inters.Laestadsticaqueseusaenestapruebaeslamismaqueseusaparalapruebade independencia : rechaza se y ) 1 1)(c (r21x2x siOH >o= =(((((

|.|

\|=fl ic1 jijE2ijEijO2xPara determinar la conciencia pblica y preocupacin por lacontaminacinatmosfrica,seentrevistauna muestrade40residentesencadaunadetresreasdel gran Santiago.Lapreguntafue : AREANOSIDUDANO SABETOTAL NORTE531 2240 SUR1021 4540 ORIENTE1120 7240 TOTAL2672139120 eslacontaminacinatmosfricaunproblemaensu vecindario?. H0:lastrespoblacionesderesidentesson homogneasconrespectoalconocimientodelos problemas de la polucin. H1 :las tres poblaciones no son homogneas..La estadstica calculada es de 10.97. El valro crtico es 12.59. Por lo tanto no hay evidencia para rechazar la hiptesis nula.