15. Prueba de Chi Cuadrado. Muestras Independientes

download 15. Prueba de Chi Cuadrado. Muestras Independientes

of 16

Transcript of 15. Prueba de Chi Cuadrado. Muestras Independientes

Prueba de 2 Una, dos y ms de dos muestras independientes

Prueba de 2Muestras independientes

IntroduccinEs frecuente que en la investigacin educativa, y en general en la investigacin, el investigador se interese por variables y/o cualidades, las cuales se presentan en categoras, que pueden ser dos o ms. As, por ejemplo, no es infrecuente hablar de rendimiento bajo y alto; de clase social alta, media y baja; del xito en selectividad entendiendo por tal el superar/no superar el reto; del sexo de los alumnos en varn y hembra; etc. La prueba Chi Cuadrado es adecuada para analizar los datos, que no son otros que frecuencias dentro de cada categora. Es decir, los datos se presentan en escala nominal y lo que se analiza son las frecuencias dentro de cada categora, es decir, cuntos hombres, cuntos han superado la selectividad, cuntos alumnos son de rendimiento bajo, etc. Ahora bien, con el anlisis qu se pretende? En esencia la Prueba de Chi Cuadrado es una prueba del tipo de bondad de ajuste; es decir, permite contrastar si unas determinadas frecuencias observadas o empricas en las categoras en que se ha dividido la variable se comportan conforme a las frecuencias que fueran de esperar si se comportaran conforme a una hiptesis nula es decir, la hiptesis de no diferencia entre las frecuencias; o ms bien hay que interpretarlas conforme a una hiptesis alterna, es decir, de diferencias entre las respuestas a las categoras. Afirma Siegel (1976, 64): Con el fin de comparar un grupo de frecuencias observado con uno esperado, debemos, por supuesto, ser capaces de indicar qu frecuencias son esperadas. La hiptesis de nulidad establece la proporcin de objetos que caen en cada una de las categoras de la poblacin presumida. Esto es, a partir de la hiptesis de nulidad podemos deducir cules son las frecuencias esperadas. La tcnica 2 prueba si las frecuencias observadas estn suficientemente prximas a las esperadas que podran ocurrir conforme a H0. Se van a insertar dos ejemplos, que son los ejemplos que se van a considerar en este documento, esto es, el caso de una muestra y el de dos muestras. Si bien en ambos casos se contrasta, como se ha dicho, si las frecuencias encontradas en las categoras se distribuyen conforme fuera esperable bajo la hiptesis nula, o no, cada uno de los casos aade algo especfico, sobre todo en el caso de dos muestras, que aadir el poder comprobar si entre las variables puestas en juego existe entre relacin. 1. Supngase el caso de una muestra en que se le pregunta a 100 universitarios si son/no son partidarios de la selectividad (no se admite se podra admitir, en cuyo caso se tratara de tres categoras- la opcin de no sabe-no contesta). Esa es la pregunta: Son los universitarios partidarios de la selectividad?

Eduardo Lpez

Pgina 1

26/04/2011

Prueba de 2 Una, dos y ms de dos muestras independientes

El investigador parte de la hiptesis (nula) de no diferencia o inclinacin hacia una de las opciones; es decir, en principio, no hay por qu esperar que los universitarios se decanten hacia una de las opciones con preferencia a la otra. Por ello, la primera distribucin de las 100 respuestas sera equilibrada en las dos categoras u opciones: S-50 a su favor, no-50 a su favor. Es Ud. partidario de la selectividad? N = 100 universitarios Frecuencias esperadas/tericas (bajo H0) Cules son las frecuencias observadas? S 50 ? 100 0 24 No 50 ? 0 100 76 Total 100 100 100 100 100

Si sa es la frecuencia terica o esperada bajo la hiptesis nula, las frecuencias empricas u observadas sern las que resulten de la consulta a la muestra. Si fueran 100 s/0 no 0 s/100 no los alumnos se decantaran por una de las opciones absolutamente. Entonces se puede pensar que la relacin o inclinacin de los alumnos hacia una de las opciones es total y en consecuencia la relacin es perfecta. Existe relacin cuando las frecuencias se alejan del modelo terico, que es el de 50/50, que es una inclinacin o relacin nula. Y si fuera del tipo 24/76 las frecuencias se han alejado de lo esperable en un grado al parecer considerable, pero habra que ver si suficiente como para decir que dichas frecuencias no pueden explicarse por azar H0. Esto lo determina la prueba Chi Cuadrado a un determinado nivel de confianza, para un determinado tipo de muestra, etc., es decir, segn cuales sean los presupuestos de los que la investigacin parta. La base de la prueba en esencia es sta: Si la frecuencia observada es 24/76, la prueba contabiliza el grado de divergencia, o convergencia, segn se mire, entre la frecuencia observada 24 vs. 50, que era lo esperable (24 - 50), y entre 76 vs. 50, que era tambin lo esperable (76 50). Cuanta mayor sea la divergencia entre 24 y 50 y entre 76 y 50, ms se incrementar la probabilidad de que tales divergencias se deban no al azar sino a un factor sistemtico, en este caso, que los universitarios se decanten a favor de la selectividad o por el contrario se inclinen contra la selectividad. 2. Analicemos el caso de dos muestras. En efecto, utilizando el mismo ejemplo, la pregunta se formula no a una muestra sino a dos muestras, por ejemplo, una de chicos universitarios y otra de universitarias, en total 100, 50 chicos y 50 chicas. Es Ud. partidario de la selectividad? Sexo de los alumnos: N = 100 S No Varn: Universitarios (n = 50) 25 25 Hembra: Universitarias (n = 50) 25 25 Sub total 50 50

Eduardo Lpez

Pgina 2

26/04/2011

Prueba de 2 Una, dos y ms de dos muestras independientes

En este caso la pregunta del problema vara: Existe relacin entre el sexo y las preferencias por la selectividad? El sexo presenta dos categoras varn y hembra- lo que hace que el diseo sea de dos muestras. Qu pueden responder los universitarios? Si son 50 chicos y 50 chicas y se les formulan dos opciones s partidario/no- lo lgico es que, si no se inclinan especialmente por una de las opciones (hiptesis nula de no relacin entre sexo y preferencia por selectividad), respondan los chicos 25 que s/25 que no; y las chicas 25 que s/25 que no. Ahora bien, supongamos que obtenemos de la consulta la siguiente respuesta: Los chicos se decantan por la selectividad en su totalidad y las chicas por la no selectividad. En este caso la inclinacin de los chicos por una opcin es total y de las chicas tambin. Existe relacin perfecta entre sexo y preferencias por selectividad, ya que la divergencia es total: (50 25), (0 25), (0 25) y (50-25). Es Ud. partidario de la selectividad? Sub total Sexo de los alumnos: N = 100 S No Varn: Universitarios (n = 50) 50/25 0/25 50 Hembra: Universitarias (n = 50) 0/25 50/25 50 Sin embargo, lo ordinario es que las muestras de chicos y chicas no sean iguales y que la decantacin de las submuestras por una de las opciones no sea total sino intermedia, por ejemplo del tipo de los datos que se incluyen a continuacin: Es Ud. partidario de la selectividad? Sexo de los alumnos: N = 100 S No Varn: Universitarios (n = 50) 38 12 Hembra: Universitarias (n = 50) 16 34 54 46 Tota les 50 50 100

En estos casos el clculo de las frecuencias esperadas de cada casilla interior requiere otro procedimiento que la mera particin igualitaria de las frecuencias, ya que el porcentaje de partidarios y no partidarios no es equilibrado. Las frecuencias esperadas respetarn las frecuencias subtotales, es decir, sern las que corresponda para el porcentaje de casos en las categoras subtotales. Por tanto, la frecuencia esperada de cada casilla se calcula dividiendo el producto de sus correspondientes subtotales por el total. As: Para Para Para Para el el el el 36: 54 (50) / 100 = 25.92 12: 46 (50) /100 = 22.08 18: 54 (50) / 100 = 28.08 34: 46 (50) / 100 = 23.92. Tota les 50 50 100

Es Ud. partidario de la selectividad? Sexo de los alumnos: N = 100 S No Varn: Universitarios (n = 50) 38/27 12/23 Hembra: Universitarias (n = 50) 16/27 34/23 54 46

Eduardo Lpez

Pgina 3

26/04/2011

Prueba de 2 Una, dos y ms de dos muestras independientes

Estas frecuencias son las que correspondera tener cada casilla de ser cierta la hiptesis de nulidad. Es precisamente la prueba de Chi Cuadrado la que registra el grado de divergencia entre lo obtenido y lo esperable bajo la hiptesis nula, y comprueba si esa divergencia es fcilmente asumible por Ho es preciso acudir a una prueba alternativa.

La Prueba de Chi CuadradoPor tanto, esta tcnica puede usarse para probar la existencia de una diferencia significativa entre el nmero observado de objetos o respuestas de cada categora y un nmero esperado, basado en la hiptesis de nulidad (Siegel, 1976, p. 64). La prueba de Chi Cuadrado registra la magnitud del acuerdo entre las frecuencias observadas y las esperadas a travs de la frmula: =k2

ki=1

( Fo Fe) 2 Fe

En la frmula e elemento i=1 seala la necesidad de sumar todas las categoras de k desde la primera i- cuando empieza en uno, es decir, sin descontar ninguna. Desde luego si el acuerdo entre los dos tipos de frecuencias para cada casilla es grande, la diferencia (Fo Fe) ser pequea y, consecuentemente, 2 ser tambin pequea. Sin embargo, si la divergencia es grande, el valor de 2 calculado con la frmula, tambin ser grande. A grandes rasgos, podemos decir que para valores mayores de 2, aumentarn las probabilidades de que las frecuencias observadas no provengan de la poblacin en la que se bas la hiptesis de nulidad (Siegel, 1976, 65). Cundo eso se puede decir? La respuesta no puede ser otra que depende de varios supuestos, como siempre ocurre en los contrastes de hiptesis, siendo el punto de partida la hiptesis de nulidad, ya que todo el proceso se pone en marcha para probarla o contrastarla: 1. En primer lugar, es preciso formular la hiptesis de nulidad; 2. Ser preciso fijar el nivel mximo de error que se est dispuesto a cometer cuando, si se rechazara la hiptesis nula, sin embargo, sta fuera verdadera: Nivel de significacin; 3. Depender del tamao de las muestras en lo que las muestras tienen de especfico, en este caso, categoras, con las restricciones de los estadsticos: Grados de libertad; 4. Ser preciso acudir a la prueba estadstica adecuada al problema, naturaleza de los datos, condiciones del modelo, etc. ; 5. Habr que identificar la distribucin muestral del estadstico, que va a ser el modelo terico al que se ajuste el suceso emprico, identificando la probabilidad que corresponde al suceso emprico en ese modelo terico; y, finalmente, 6. Todo lo anterior nos delimitar el valor crtico a partir del cual el suceso emprico deja de ser mero producto explicable por azar (Ho), pasando a buscarse una explicacin alternativa, ya que, aun siendo posible, no es probable.

Eduardo Lpez

Pgina 4

26/04/2011

Prueba de 2 Una, dos y ms de dos muestras independientes

Veamos con algo ms de detalle estos supuestos. Se comenzar, lgicamente, por la hiptesis nula, dado que todo el proceso estadstico se habilita para dar la oportunidad de probar la hiptesis nula: 1) Hiptesis nula: Ho: Fo = Fe. Es decir, a nivel poblacional las frecuencias obtenidas u observadas en las distintas categoras en que se dividen las variables coinciden con las tericamente esperables. 2) Nivel de significacin: Poco puede decirse, excepto que el nivel alfa () lo fija previamente el investigador en funcin del control de variables, de las consecuencias del estudio, etc. 3) Prueba estadstica: La prueba estadstica, tal como se ha dicho, corresponde al valor obtenido del clculo con la frmula siguiente:

2

= ki=1

( Fo Fe) 2 Fe

Todos los autores hablan de condiciones, suposiciones o precauciones en el uso de 2. Welkowitz et al. (1981, 314/6) en concreto mencionan cuatro: Las observaciones son independientes; es decir, ninguna respuesta o frecuencia puede estar relacionada o depender de otra; Cada sujeto debe formar parte solamente de una de las categoras de la variable; Los clculos deben integrar a todos los sujetos de la muestra. La precaucin o forma de comprobacin consistir en hacer coincidir las frecuencias observadas con las esperadas; Cuantos ms grados de libertad, menos estricta es la exigencia respecto del valor mnimo de las frecuencias esperadas. Esta prueba se basa en la hiptesis de que dentro de cualquier categora las frecuencias muestrales estn normalmente distribudas en torno a la poblacin, o valor esperado (Welkowitz et al., 1981, 315). Esto significa que la hiptesis de normalidad no crea problemas cuando las frecuencias esperadas son bastante grandes, pero cuando stas son pequeas y a medida que son ms pequeas menos vlidos son los resultados de la prueba de 2. 4) La distribucin muestral de 2, grados de libertad y valor crtico de rechazo: Si sabemos el valor de la prueba estadstica - 2- precisamos saber cul es su distribucin muestral para juzgar ese evento particular de 2 y decidir si se rechaza o no la hiptesis nula. Pues bien, puede mostrarse que la distribucin muestral de 2 conforme a H0, calculada con la frmula de arriba, sigue la distribucin Chi Cuadrada con grados de libertad gl- igual a: k 1. En la tabla correspondiente se obtienen ciertos valores crticos, los ms usuales, bien entendido que no hay una distribucin muestral sino tantas cuantos valores de gl. Vayamos a unos ejemplos para fundamentar el concepto de distribucin Chi Cuadrado.

Eduardo Lpez

Pgina 5

26/04/2011

Prueba de 2 Una, dos y ms de dos muestras independientes

Se han calculado los valores de Chi Cuadrado en tres ejemplos distintos, el de las 100 monedas lanzadas al aire, el de los 270 dados lanzados al aire y el de los 180 alumnos medidos en rendimiento e inteligencia. En el caso de las monedas las frecuencias no son independientes, porque si salen 45 caras, no queda otra alternativa que salir 55 cruces. Slo una frecuencia puede variar libremente, tiene un grado de libertad, estando la otra determinada. Del clculo de las frecuencias esperadas y observadas, y aplicando la prueba de Chi Cuadrado se llega a obtener un valor de 2, que en este caso vale la unidad, 1. Si se lanzaran otras 100 monedas se obtendran otras frecuencias probablemente y otro valor de 2. Y as sucesivamente con otros lanzamientos. Cuantos ms lanzamientos se hagan, ms valores de 2 se obtendrn. En el caso de los dados ocurre otro tanto pero aplicado a las posibilidades de figuras, que son seis. Es decir, al lanzar los 270 dados pueden salir seis figuras pero, conocidas cinco figuras, la sexta no puede variar, est fijada y condicionada por el nmero de veces que hayan salido las otras cinco. Existen cinco grados de libertad. Pero, como se deca, si se lanzan de nuevo 270 dados muchas otras veces nos saldrn modelos de otras figuras y en consecuencia se obtendrn nuevos valores de 2. Y cuantos ms lanzamientos se efecten, ms valores de 2 se obtendrn. Algo similar ocurre si se examinan nuevos 180 alumnos medidos en dos variables, inteligencia (alta / media l baja) y rendimiento (alto/medio/bajo). En este caso, el anlisis es preciso hacerlo por categoras de variables, esto es, en las tres categoras de inteligencia y en las tres de rendimiento. Si dos de las categoras de inteligencia adquieren las frecuencias que fueren en los subtotales, la tercera categora no tiene la libertad de tener una frecuencia arbitraria sino la que rena la condicin de que los alumnos sumen 180 en inteligencia. Otro tanto ocurre en la variable rendimiento, que tiene asimismo dos grados de libertad. Luego en total los grados de libertad del problema son: (3-1) (3-1) = 4. Se ha dicho que cuantos ms lanzamientos de 100 monedas de 270 dados y cuantos ms anlisis del rendimiento e inteligencia en muestras de 180 alumnos se hagan, ms valores de 2 se obtendrn. Pues bien, la distribucin de frecuencias de los valores de 2 es una distribucin muestra! de 2 para un grado de libertad en el caso de las monedas, de cinco grados de libertad para los dados y de cuatro grados de libertad para los alumnos. La distribucin muestral terica de 2 ya se conoce pero es distinta para cada nmero distinto de grados de libertad; es decir, existen tantas distribuciones muestrales de 2 como grados de libertad. En los apndices de los manuales de Estadstica se contiene una tabla con ciertos valores de 2 de las distintas distribuciones de Chi Cuadrado asociados a ciertos niveles de probabilidad de ocurrencia de sucesos, los cuales valores se comportan como valores crticos de 2. La utilidad de dichas tablas radica en que permiten comparar un valor emprico de 2, que lleva asociado un valor de probabilidad, con el valor crtico de la tabla correspondiente a un determinado grado de libertad y nivel de probabilidad. Es decir, el valor crtico se comporta como el mnimo exigido al valor de 2 del correspondiente problema para que pueda ser considerado como improbable y permita decidir que la diferencia entre las frecuencias esperadas y las obtenidas no son mera casualidad, probablemente (1- ).

Eduardo Lpez

Pgina 6

26/04/2011

Prueba de 2 Una, dos y ms de dos muestras independientes

Distribuciones Chi Cuadrado, para gl = 1 y 6

Distribuciones Chi Cuadrado, regiones crticas (alfa = 0.05) y varios gl Es decir, los valores mnimos exigidos al valor de 2 de un problema concreto para que sea significativo a diferentes niveles de significacin, vienen fijados en dichas tablas. Si se consultan las tablas y se desea clarificar el ejemplo de 2 igual a 1 y a un grado de libertad, se puede afirmar que para que 2 fuera significativo a un nivel de significacin, p.e. de 0.01, como mnimo debera ser de 6.63. Como esta condicin no se cumple, es preciso afirmar y concluir que las frecuencias observadas no son tan disonantes de las esperadas como para poder afirmar que las (no slo esas) monedas estn probablemente (1 - 0.01 = 0.99) trucadas. Si esto se aplica al problema de los dados, puede afirmarse que para que las divergencias entre las frecuencias esperadas y las obtenidas no sean mera casualidad sino sesgo en las caras de los dados, de los cuales los 270 son una muestra, se precisa que el valor 2 del problema, a un nivel de probabilidad de 0.01 y con 5 grados de libertad, sea como mnimo: 2 2 0.01 5gl = 15.09, tal como se puede consultar en las tablas. La realidad es que: (=20.568) 0.01 25gl (= 15.09). Luego las divergencias entre las frecuencias esperadas y las obtenidas no son mera casualidad probablemente (1 - 0.01 = 0.99) sino sesgo en las caras de los dados, de los cuales los 270 son una muestra. Si se centra la atencin en el estudio de la relacin entre inteligencia y rendimiento, es preciso comparar el valor emprico de 2 con el crtico de las tablas al nivel de probabilidad de 0.01 y con 4 grados de libertad. Es decir, 2 (= 52.277) 0.0124gl (=13.28). Se puede concluir que son significativas o no debidas probablemente (1 - 0.01) al azar o casualidad las divergencias entre las frecuencias esperadas y las obtenidas. Dicho de modo ms prctico, existe relacin entre inteligencia y rendimiento; en concreto, los alumnos de inteligencia alta suelen ser asimismo alumnos de rendimiento alto y al revs, los alumnos de inteligencia baja suelen ser alumnos de rendimiento tambin bajo. Se ver en la tabla de Chi Cuadrado que los grados de libertad son los equivalentes a 30. Esto no quiere decir que no existen casos en los que los grados de libertad sean superiores, pero, justo es decirlo, no son nada frecuentes; son, ms bien, muy raros. Cuando los grados de libertad son superiores a 30 gl > 30- la expresin (22) - [(2gl-1)] tiene una distribucin que

Eduardo Lpez

Pgina 7

26/04/2011

Prueba de 2 Una, dos y ms de dos muestras independientes

es aproximadamente normaL En consecuencia, en prueba de una cola ambas distribuciones arrojan unos valores crticos similares:2 0.05 gi>30 2 0.01 gi>30

= 0.05tgl >30 (=1.64) y = 0.01tgl>30 (=2.326).

Se van a comentar a continuacin dos casos, el de una muestra y el de dos, dejando de lado los aspectos tcnico-estadstico-matemticos de la distribucin Chi Cuadrado. Me parece oportuno remitir a la obra de Glass y Stanley (1974) titulada Mtodos estadsticos aplicados a las ciencias sociales, quienes insertan el captulo 11, titulado Distribuciones tericas empleadas en Estadstica Inferencial y donde se habla, entre otras, de Distribuciones ChiCuadrado (pgs. 230-234).

I.

El caso de una muestra

En ocasiones el investigador se interesa por el nmero de sujetos que se clasifican en diversas categoras (dos o ms), para comprobar si esa clasificacin es conforme a lo esperable por azar, es decir, si los sujetos se distribuyen de una manera no tendenciosa (hiptesis nula) o ms bien existe un sesgo en dicha distribucin. Esta tcnica es del tipo de bondad de ajuste, que puede usarse para probar la existencia de una diferencia significativa entre el nmero observado de objetos o respuestas de cada categora y un nmero esperado, basado en la hiptesis de nulidad (Siegel, 1976, 64).

Un ejemplo: Existe relacin entre el puesto que se ocupa en la clase segn la proximidad al profesor y la obtencin de una alta calificacin?Siegel (1976, 66-68) inserta el ejemplo de la relacin entre la posicin en la posta de salida de los caballos de carrera y la probabilidad de obtencin del triunfo en una. Para ello, parte de 8 postas de salida o boxes en una carrera y recoge en qu lugar de partida salieron 144 ganadores, para comprobar si los que salieron en las posiciones externas tenan menor probabilidad de ganar. En nuestro caso se puede hablar, por ejemplo, de 24 aulas en un centro o en diversos centros, que tienen filas de 8 en fondo, en las cuales se registra la posicin de los 6 alumnos con ms alta calificacin. Se quiere comprobar si la cercana del pupitre del alumno a la mesa del profesor se relaciona con la probabilidad de sacar ms alta calificacin. La distribucin esperada es la que se tiene en la tabla adjunta, si no hubiera relacin. Posicin en la fila del aula (1:1 fila; 8:ltima) 1 Frec.Esperadas 18 2 18 3 18 4 18 5 18 6 18 7 18 8 18 144 Total

Es decir, los 144 ganadores se distribuyen por igual entre las filas de proximidad a la mesa del profesor. Sin embargo, lo que el investigador quiere comprobar es si existe divergencia

Eduardo Lpez

Pgina 8

26/04/2011

Prueba de 2 Una, dos y ms de dos muestras independientes

significativa entre las frecuencias tericamente esperadas y las que en un estudio concreto puede obtener. Esto es lo que tiene que resolver el contraste estadstico, si esta divergencia es producto del azar o es algo ms. Para ello, sigamos las etapas del proceso de decisin.

Supuestos:1. Hiptesis nula: Ho: Fo1 = Fo2 = Fo3 = = Fo8. Son varias las formas de redactar la hiptesis; otra es escribiendo: Fon = Fen. En esencia, viene a decir que no hay diferencias en el nmero esperado de alumnos de alto rendimiento ubicados en las distintas posiciones de asiento de clase; las diferencias observadas son meramente variaciones aleatorias esperadas en una muestra al azar de la poblacin rectangular. 2. Nivel de significacin: = 0.01 y N = 144, el nmero total de estudiantes de alto rendimiento identificados en 18 clases diferentes. 3. Grados de libertad: k 1 = 8 1 = 7. Donde k: nmero de puestos de fondo. 4. Prueba estadstica: Prueba de Chi Cuadrado, ya que estamos comparando los datos de una muestra con alguna presunta poblacin en la que se comparan las frecuencias observadas y esperadas en categoras discretas, que son las 8 poblaciones de tipos de asiento (8 postas en el caso de los caballos). Su frmula es sta:

2

= ki=1

( Fo Fe) 2 Fe

Aunque no es el caso, qu sucede cuando las frecuencias esperadas son pequeas? Podemos distinguir dos casos: Cuando los gl = 1, esto es, cuando k = 2, cada frecuencia esperada debe ser por lo menos de 5. Cuando gl > 1, esto es, cuando k > 2, la prueba de 2 no debe usarse, si ms del 20 % de las frecuencias esperadas es menor de 5 cuando cualquier frecuencia esperada es menor de 1. Qu hacer en estos casos? Caben dos opciones: Combinar categoras prximas para que las condiciones se cumplan, siempre que tenga lgica la combinacin, y as poder recurrir a Chi Cuadrado; Recurrir a la prueba binomial, si son dos categoras por combinacin. 5. Distribucin muestral: Distribucin Chi Cuadrado. 6. Valor que delimita la regin de rechazo: : 0.0127 (= 18.48). Por tanto, para poder rechazar la Ho tiene que darse: podr rechazar.

2

2 0.01 7

(= 18.48). En caso contrario, no se

Resultados y anlisis estadstico:Recogidos los 6 resultados mejores de alumnos en cada una de las 24 aulas identificadas, se obtuvieron las frecuencias en los ranking siguientes:

Eduardo Lpez

Pgina 9

26/04/2011

Prueba de 2 Una, dos y ms de dos muestras independientes

Posicin en la fila del aula (1:1 fila; 8:ltima) 1 Frec.Observadas 29 2 19 3 18 4 25 5 17 6 10 7 15 8 11

Total 144

De la simple observacin de las frecuencias parece concluirse que la distribucin no es aleatoria, ya que se han podido localizar alumnos con ms alto rendimiento en las posiciones de primera lnea que en las finales. En efecto, de los 144 alumnos con alto rendimiento, nada menos que 29 se ubicaban en primera fila, mientras que en la ltima se han podido identificar a solamente 11. Ya se ha visto ms arriba que, sin embargo, si acturamos bajo el supuesto de que la distribucin de las altas calificaciones es aleatoria entre los puestos, las frecuencias que cabra esperar en cada una de las filas hubiera sido de 18 alumnos de alto rendimiento: 144/8. Es decir, existe una clara divergencia entre las frecuencias observadas y las esperadas para cada ranking de puesto: Posicin en la fila del aula (1:1 fila; 8:ltima) 1 Frec.Observadas Frec.Esperadas Diferencia: O-E 29 18 +11 2 19 18 +12

3 18 18 0

4 25 18 +7

5 17 18 -1

6 10 18 -8

7 15 18 -3

8 11 18 -7

Total 144 144

Este es el valor de Chi Cuadrado: =16.3.

2

=

ki=1

( Fo Fe) 2 Fe

(29 18) 2 (19 18) 2 (18 18) 2 (25 18) 2 (17 18) 2 (10 18) 2 (15 18) 2 (11 18) 2 + + + + + + + = 16.3. 18 18 18 18 18 18 18 18

Decisin estadstica:Dado que no se cumple que: 2 (= 16.3) la Ho.2 0.01 7

(= 18.48): No se puede rechazar

ConclusinNo existe relacin entre el alto rendimiento de los alumnos y la posicin de proximidad al profesor que ocupen en los pupitres.

Eduardo Lpez

Pgina 10

26/04/2011

Prueba de 2 Una, dos y ms de dos muestras independientes

II.

El caso de dos muestras independientes

Cito textualmente de Siegel (1976, 130) cuando habla de la funcin de la prueba de Chi Cuadrado para dos muestras independientes: Cuando los datos de investigacin consisten en frecuencias de categoras discretas, puede usarse la prueba de 2 para determinar la significacin de las diferencias entre dos grupos independientes. La medicin implicada puede ser tan vaga como una escala nominal. La hiptesis que usualmente se pone a prueba supone que los dos grupos difieren con respecto a alguna caracterstica y, por lo tanto, con respecto a la frecuencia relativa con que los miembros del grupo son encontrados en diferentes categoras. Para probar esta hiptesis, contamos el nmero de casos de cada grupo en cada categora y comparamos la proporcin de casos en las diferentes categoras de un grupo con la del otro grupo. Lo que se est diciendo es que las variables que se estudian pueden ser cualidades, discretas por tanto, y pueden ser variables pero la medicin implicada se presenta en escala nominal, es decir, cada variable est dividida en dos, tres o ms categoras. Lo que se estudia es si las frecuencias correspondientes a cada categora se distribuyen aleatoriamente o ms bien conforme a ciertas reglas, lo que podra implicar que existe relacin entre las variables. El formato de presentacin de los datos puede ser diverso. Existe un formato, el ms sencillo y probablemente el ms comn, que es el que corresponde a una tabla de contingencia 2 2 y tiene una frmula sencilla, que adems presenta una correccin por continuidad-, a la que se aludir ms adelante cuando se hable en los supuestos de la prueba estadstica. El formato se ha ilustrado anteriormente al hablar en la introduccin de la relacin entre el sexo de los alumnos y la probabilidad de superar la selectividad. Se ilustrar en el problema de superacin de la selectividad y la especialidad cursada en Bachillerato. Siegel (1976, 135) presenta el ejemplo de la relacin entre cambio de carrera acertada y desacertada- y desercin de los estudios desertan o continan- entre un grupo de alumnos brillantes. El formato es el siguiente:

Variable 2Categora A Categora B

Variable 1Categora 1

Frecuencia de 1A Frecuencia de 1BSubtotal de 1

Frecuencia de 2A Frecuencia de 2BSubtotal de 2

Categora 2

Subtotal de A Subtotal de B Frecuencia total

Un problema: Existe relacin entre la opcin de especialidad en Bachillerato Ciencias Puras y Letras- y la superacin de la selectividad s/no?Eduardo Lpez Pgina 11 26/04/2011

Prueba de 2 Una, dos y ms de dos muestras independientes

Por tanto, el planteamiento del problema es conforme a este esquema:

Superacin de Especialidad en Bachillerato Ciencias Puras Letras selectividad Superan No superan Frecuencias (?) Frecuencias (?) Subtotales: 100 Frecuencias (?) Frecuencias (?) Subtotales: 100 Subtotales (?) Subtotales (?) Total: 200

En su momento los alumnos de Bachillerato eligieron Ciencias Puras o Letras. Para el estudio fueron seleccionados al azar de varios centros 100 alumnos de cada especialidad. Lo que procede es esperar a que realicen la selectividad, les den los resultados y se podrn incluir los subtotales de los que superaron y los que no superaron de entre los doscientos alumnos. Adems, cuntos de Ciencias Puras superaron y no superaron, as como los de Letras.

Supuestos y plan de anlisis de datos:1) Ho: Fo = Fe en cada una de las cuatro casillas; 2) Nivel de significacin: = 0.05; 3) Prueba estadstica: . En tablas de contingencia 2x2, como es el caso, cuando tanto r como k son iguales a 2, deber usarse la frmula (Siegel, 1976, 133), que es una frmula que, adems de otras ventajas, incorpora una correccin por continuidad, que mejora marcadamente la aproximacin de la distribucin de 2 calculada por medio de la distribucin de Chi cuadrado (pg. 133).2

N (/ AD BC / N ) 2 2 = ( A + B ).(C + D ).( A + C ).( B + D )2

4) Distribucin muestral: Conforme a 5) Grados de libertad: (r 1) . (k 1) = (2 - 1) . (2 - 1) = 1. Donde: r = nm. filas; k = nm. columnas. 6) Valor de la regin crtica :0.05

2

21 gl

(= 3.84).2

Esto significa que el valor emprico de debe ser igual o mayor que el valor crtico para poder rechazar la Ho: : 2 0.0521 gl (= 3.84). En el supuesto de una relacin significativa entre las variables, es posible calcular dicha relacin en trminos de un ndice de correlacin, que es un ndice general de relacin entre variables a partir de Chi Cuadrado, llamado Phi de Cramer, cuya frmula es la siguiente: =

2 / N (k 1)

Eduardo Lpez

Pgina 12

26/04/2011

Prueba de 2 Una, dos y ms de dos muestras independientes

Donde: k es el nmero menor de las filas o columnas y el resto de los smbolos son conocidos, siendo 2 el valor emprico de la prueba estadstica y N el del tamao de la muestra. Dicho ndice se interpreta de idntica forma a como se interpreta el coeficiente de correlacin de Pearson.

Resultados:Una vez efectuadas las pruebas de selectividad, corregidos los ejercicios y asignada la decisin sobre el pase de selectividad, se obtuvieron los siguientes resultados:

Superacin de Especialidad en Bachillerato Ciencias Puras Letras selectividad Superan No superan Subtotales 90-A 10-C A+C:100 60-B 40-D B+D:100

Subtotales A+B:150 C+D:50 Total: 200

Anlisis estadstico:Dado que la prueba de Chi Cuadrado requiere el contraste de las frecuencias esperadas y las observadas, se calcularon las frecuencias esperadas: 1) 2) 3) 4) 150 150 100 100 (100) / 200 = 75; (100) / 200 = 75; (50) /200 = 25; (50) /200 = 25.

Por tanto, queda la tabla siguiente (se indican entre parntesis las frecuencias esperadas):

Superacin de Especialidad en Bachillerato Ciencias Puras Letras selectividad Superan No superan Subtotales 90 (75)-A 10 (25)-C 100 60 (75)-B 40 (25)-D 100

Subtotales 150 50 Total: 200

El valor de 2 se va a calcular mediante las dos frmulas, para que se vea la diferencia entre ambas, si bien, como se ha indicado, es vlida la primera, que est corregida por continuidad:

200(/(90)40 60(10) / 200 ) 2 2 = = 22.43 (90 + 60).(10 + 40).(90 + 10).(60 + 40)2

Mediante la frmula standard nos da lo siguiente:

Eduardo Lpez

Pgina 13

26/04/2011

Prueba de 2 Una, dos y ms de dos muestras independientes

2 =

(90 75) 2 (60 75) 2 (10 25) 2 (40 25) 2 + + + = 24 . 75 75 25 25

Decisin estadstica:La decisin estadstica surge de la comparacin entre la 2 emprica y la crtica, en el sentido que se indic en el supuesto de la regin crtica, as: 2 (22.43) 2 0.05 1 gl

(= 3.84): Rechazo de la Ho.

Conclusin:Existe relacin significativa entre la opcin de especialidad en Bachillerato Ciencias Puras y Letras- y la superacin de la selectividad s/no. Es decir, los alumnos que eligen Ciencias tienen ms altas probabilidades (0.95) de superar la selectividad que los alumnos de Letras.

Relacin entre variables:Acaba de afirmarse que existe relacin significativa entre la opcin de especialidad en Bachillerato y la superacin de la selectividad. Si esto es as, cunta es esa relacin? =

22.43 / 200(2 1) = 0.33.

Por tanto, la correlacin significativa (p < 0.05)- entre especialidad y superacin de la selectividad es de 0.33, la cual, aunque significativa, es modesta.

III. El caso de > dos muestras independientesNo se va a desarrollar este diseo puesto que en esencia tiene idntica resolucin. Los grados de libertad siempre son: (c 1). (f 1), esto es, columnas menos uno por filas menos uno. Siegel (1976, 205-210) propone un problema, del que se incluye el planteamiento, los datos y el valor final de la prueba estadstica. El problema consiste bsicamente en comprobar si exista relacin entre nivel social y especialidad cursada por los estudiantes adolescentes de una ciudad estadounidense en el nivel secundario. La clase social se midi segn su apreciacin subjetiva, es decir, a cul de las cinco clases sociales consideraban que pertenecan (I-V); la especialidad era: Preparatoria, General y Comercial. La muestra fueron 390 estudiantes. Debido a que de la clase social I tena pocos representantes, se unieron la I y la II, puesto que Chi cuadrado requiere que las frecuencias esperadas de cada celda no sean demasiado pequeas. Cuando no se cumple, los resultados carecen de sentido. Por ello, se recomienda que en pruebas con gl mayores a 1, menos del 20 por ciento de las celdillas debern tener una frecuencia esperada menor a 5 y ninguna celdilla deber tener una frecuencia esperada menor que 1.

Eduardo Lpez

Pgina 14

26/04/2011

Prueba de 2 Una, dos y ms de dos muestras independientes

Estos son los valores de la muestra o la frecuencia de inscripcin de los jvenes procedentes de cinco clases sociales en tres cursos de la escuela secundaria. Se indican entre parntesis la frecuencia terica o esperada: Curso o especialidad Preparatoria General Comercial Subtotales I y II 23(7.3) 11(18.6) 1(9.1) 35 Clase III 40(30.3) 75(77.5) 31(38.2) 146 social IV 16(38.0) 107(97.1) 60(47.9) 183 Total V 2(5.4) 14(13.8) 10(6.8) 26 81 207 102 390

El valor emprico de Chi Cuadrado es: 2 = 69.2.

Eduardo Lpez

Pgina 15

26/04/2011

Prueba de 2 Una, dos y ms de dos muestras independientes

Eduardo Lpez

Pgina 16

26/04/2011