Aplicaciones de las Pruebas Chi cuadrada Geografia

Post on 25-Jul-2015

8.736 views 2 download

Transcript of Aplicaciones de las Pruebas Chi cuadrada Geografia

Unidad II: La distribución ji cuadrada (χ2). Características y Aplicaciones sobre variables cualitativas. Pruebas de hipótesis de bondad de ajustes y Análisis de Tablas de contingencia.

I.- CARACTERISTICAS DE LA DISTRIBUCIÓN JI-CUADRADA

En estadística, la distribución ji-cuadrado, también denominada ji-cuadrado de Pearson, es una distribución de probabilidad continua con un parámetro k que representa los grados de libertad de la variable aleatoria que se describe a continuación:

donde Zi son variables de distribución normal, de media cero y varianza uno.

Esta distribución se expresa habitualmente

Donde el subíndice k es le número de sumandos, se denomina grados de libertad de la distribución.

La Distribución ji-cuadrado, tiene por función de densidad

Donde el parámetro k se denomina grados de libertad de la distribución.

La Distribución ji-cuadrado no tiene sentido para valores negativos de x, como se puede ver en la figura.

Téngase en cuenta que para k = 1 y k = 2 la función de densidad para x = 0, se hace infinito:

Para el resto de los valores de k, para x = 0, la función vale 0.

Valores de Valores de χχ22

ProbabilidadProbabilidad

Grados de libertadGrados de libertad

Téngase en cuenta que para k = 1 y k = 2 la función de densidad para χχ22 = 0, se hace infinito. Para el resto de los valores de k, para χχ22 = 0, la función vale 0.

Uso De la tabla de la Distribución Ji-cuadrado y Prueba de hipótesis sobre una varianza

En la tabla de distribución ji-cuadrado se pueden encontrar algunos cuantiles o valores tabulados de la distribución para diferentes grados de libertad. Para calcular la probabilidad de que una variable distribuida como una ji-cuadrado con grados de libertad sea mayor o igual a un cierto valor se procede de la siguiente forma:

•Se busca en la tabla la fila que corresponde a los grados de libertad de la distribución y dentro de esa fila se localiza (de manera exacta o aproximada) el valor x.x. •Luego se lee la probabilidad buscada mirando el encabezamiento de la columna correspondiente.

Por ejemplo, si X se distribuye como una χ2 con 5 grados de libertad entonces:p( X ≥ 9,24) = 0.1Como ejercicio de uso de la tabla encontrar:a) p( X ≥ 6,26) si X se distribuye como una χ2 con 15 grados de libertad.b) p(S2(n-1) /σ2 ≥ 16,93) si S2 fue obtenido a partir de una muestra de tamaño 10.

        P(χ2 ≥) = α            

grados                    

libertad 0.995 0.99 0.975 0.95 0.9 0.1 0.05 0.025 0.01 0.005

1 0.00 0.00 0.00 0.00 0.02 2.71 3.84 5.02 6.63 7.88

2 0.01 0.02 0.05 0.10 0.21 4.61 5.99 7.38 9.21 10.60

3 0.07 0.11 0.22 0.35 0.58 6.25 7.81 9.35 11.34 12.84

4 0.21 0.30 0.48 0.71 1.06 7.78 9.49 11.14 13.28 14.86

5 0.41 0.55 0.83 1.15 1.61 9.24 11.07 12.83 15.09 16.75

6 0.68 0.87 1.24 1.64 2.20 10.64 12.59 14.45 16.81 18.55

7 0.99 1.24 1.69 2.17 2.83 12.02 14.07 16.01 18.48 20.28

8 1.34 1.65 2.18 2.73 3.49 13.36 15.51 17.53 20.09 21.95

9 1.73 2.09 2.70 3.33 4.17 14.68 16.92 19.02 21.67 23.59

10 2.16 2.56 3.25 3.94 4.87 15.99 18.31 20.48 23.21 25.19

11 2.60 3.05 3.82 4.57 5.58 17.28 19.68 21.92 24.72 26.76

12 3.07 3.57 4.40 5.23 6.30 18.55 21.03 23.34 26.22 28.30

13 3.57 4.11 5.01 5.89 7.04 19.81 22.36 24.74 27.69 29.82

14 4.07 4.66 5.63 6.57 7.79 21.06 23.68 26.12 29.14 31.32

15 4.60 5.23 6.26 7.26 8.55 22.31 25.00 27.49 30.58 32.80

16 5.14 5.81 6.91 7.96 9.31 23.54 26.30 28.85 32.00 34.27

17 5.70 6.41 7.56 8.67 10.09 24.77 27.59 30.19 33.41 35.72

18 6.26 7.01 8.23 9.39 10.86 25.99 28.87 31.53 34.81 37.16

19 6.84 7.63 8.91 10.12 11.65 27.20 30.14 32.85 36.19 38.58

20 7.43 8.26 9.59 10.85 12.44 28.41 31.41 34.17 37.57 40.00

21 8.03 8.90 10.28 11.59 13.24 29.62 32.67 35.48 38.93 41.40

22 8.64 9.54 10.98 12.34 14.04 30.81 33.92 36.78 40.29 42.80

23 9.26 10.20 11.69 13.09 14.85 32.01 35.17 38.08 41.64 44.18

p (X ≥ χ2) = α

III.- APLICACIÓN DE LA JI- CUADRADA EN PRUEBAS DE BONDAD DE AJUSTE

Análisis de Tablas de contingencia con un criterio de clasificación

Tipos de Accidentes

FO (frecuencia observada)

Arrollamiento (A) 12

Colisión (C) 15

Objeto Fijo (OF) 23

Total Observados 50

III.- APLICACIÓN DE LA JI- CUADRADA EN PRUEBAS DE BONDAD DE AJUSTE

Análisis de Tablas de contingencia con un criterio de clasificación

Tipos de Accidentes

Proporciónesperada

Arrollamiento (A) 0,333Colisión (C) 0,333Objeto Fijo (OF) 0,333

Total 1,00

III.- APLICACIÓN DE LA JI- CUADRADA EN PRUEBAS DE BONDAD DE AJUSTE

Análisis de Tablas de contingencia con un criterio de clasificación

Tipos de Accidentes

Proporciónesperada

Arrollamiento (A) 0,333Colisión (C) 0,333Objeto Fijo (OF) 0,333

Total 1,00

La prueba de bondad de ajuste radica en la comparación de las frecuencias observadas con aquellas frecuencias esperadas (por la hipótesis nula)

Ho : P1 = P2 = P3 = 0,333, es decir Ho: Los tipos de accidentes registraron igual proporción de ocurrencia. En porcentaje se leería en un 33,3 % igual para cada categoría de accidente. Por tanto, las frecuencias esperadas (FE) se calcularían multiplicando la proporción planteada en la hipótesis nula (en este ejemplo, P = 0,333) por el número total de frecuencias observadas (en este ejemplo, FO total = 50).

Tipos de Accidentes

FO(frecuencia observada)

FE(Frecuencia Esperada)

Arrollamiento (A) 12 16,7

Colisión (C) 15 16,7

Objeto Fijo (OF) 23 16,7

FE =P*FO total FE = 0,333*50 = 16,7

La Prueba estadística usada en esta situación se basa en la

distribución ji cuadrada y se describe a continuación

c

2cc

3

233

2

222

1

211

C

1i i

2ii2

c

FE

)FEFO(....

FE

)FEFO(

FE

)FEFO(

FE

)FEFO(

FE

)FEFO(

87,37,16

69,39

7,16

89,2

7,16

09,22

7,16

)7,1623(

7,16

)7,1615(

7,16

)7,1612(

FE

)FEFO(

222

C

1i i

2ii2

c

0 2 4 6 8 10

0.0

0.1

0.2

0.3

0.4

0.5

2

De

nsid

ad

de

Pro

ba

bilid

ad

4.61

0 2 4 6 8 10

0.0

0.1

0.2

0.3

0.4

0.5

2

De

nsid

ad

de

Pro

ba

bilid

ad

3.87 4.61

Región rechazo de Ho

Región aceptación de Ho

0 2 4 6 8 10

0.0

0.1

0.2

0.3

0.4

0.5

2

De

nsid

ad

de

Pro

ba

bilid

ad

3.87 4.61

Región rechazo de Ho

Región aceptación de Ho

Aquí se verifica que el valor calculado es menor al valor 4.61 de la tablase acepta la hipótesis nula en la cual estadísticamente podemos afirmar que la proporción de accidentes fue igual entre categorías.

1.Supóngase que se realiza la siguiente pregunta en una encuesta: ¿conviene el cambio curricular?, y las respuestas establecidas son SI, NO y No Sé. Sí la indiferencia o el desconocimiento fuera total, la proporción de respuestas en cada categoría sería igual; pruébese al 10% de significancia sí la indiferencia prevalece en los encuestados.

Respuestas Fo

Si 55

No 35

No Sé 30

Ho: P(si) = P(no) = P(no sabe) ; La indiferencia prevaleceHa: P i ≠ P j ; La indiferencia NO prevalece , y si se tiene preferencia por alguna de las respuestas dadas.

Respuestas Fo FE

Si 55 40

No 35 40

No Sé 30 40

TOTAL de FO / # categorías = 120 / 3 = 40 !!!!!!!!

Ho: P(si) = P(no) = P(no sabe) ; La indiferencia prevaleceHa: P i ≠ P j ; La indiferencia NO prevalece , y si se tiene preferencia por alguna de las respuestas dadas.

Respuestas Fo FE

Si 55 40

No 35 40

No Sé 30 40

75,840

)4030(40

)4035(40

)4055(

FE

)FEFO(

222

C

1i i

2ii2

c

8,75

Ho: P(si) = P(no) = P(no sabe) ; La indiferencia prevaleceHa: P i ≠ P j ; La indiferencia NO prevalece , y si se tiene preferencia por alguna de las respuestas dadas.

Respuestas Fo FE

Si 55 40

No 35 40

No Sé 30 40

Se ha rechazado la hipótesis nula y se decide a favor de la HaConclusión?

Municipio Proporción de Habitantes en cada

municipio

FrecuenciasObservadas de

comercios en cada municipio

A 6% 30B 20% 106C 20% 103D 20% 103E 4% 28F 30% 146

Total 100% 516

Ho: La Proporción de comercios es igual a la Proporción de habitantes en cada municipio .Ha: La Proporción de comercios NO es igual a la Proporción de habitantes en cada municipio .

Municipio Proporción de Habitantes en cada

municipio

FrecuenciasObservadas de

comercios en cada municipio

A 6% 30B 20% 106C 20% 103D 20% 103E 4% 28F 30% 146

Total 100% 516

Sí la Ho es cierta entonces del total de 516 comercios en la región El 6% de ellos están en el municipio A = 31El 20% de ellos están en el municipio B = 103El 20% de ellos están en el municipio C = 103El 20% de ellos están en el municipio D = 103El 4% de ellos están en el municipio E = 21El 30% de ellos están en el municipio F = 155

Municipio Proporción de Habitantes en cada

municipio

FrecuenciasObservadas de

comercios en cada municipio

A 6% 30B 20% 106C 20% 103D 20% 103E 4% 28F 30% 146

Total 100% 516

Municipio Proporción de Habitantes en cada

municipio

FrecuenciasObservadas de comercios en

cada municipio

FrecuenciasEsperadas de comercios en

cada municipio

A 6% 30 31B 20% 106 103C 20% 103 103D 20% 103 103E 4% 28 21F 30% 146 155

Total 100% 516 516

Se acepta Ho, lo cual implica que:

Existe relación entre la proporción de comercios y la proporción de habitantes entre los municipios !!!!!

Municipio Proporción de Habitantes en cada

municipio

FrecuenciasObservadas de comercios en

cada municipio

FrecuenciasEsperadas de comercios en

cada municipio

A 6% 30 31B 20% 106 103C 20% 103 103D 20% 103 103E 4% 28 21F 30% 146 155

Total 100% 516 516