La Prueba Chi-Cuadrado

download La Prueba Chi-Cuadrado

of 23

  • date post

    23-Jul-2015
  • Category

    Documents

  • view

    50
  • download

    2

Embed Size (px)

Transcript of La Prueba Chi-Cuadrado

1

TABLA DE CONTENIDO

INTRODUCCION________________________________________________________________2 OBJETIVOS_____________________________________________________________________3 MARCO TEORICO_______________________________________________________________4 DISTRIBUCION CHI- CUADRADO. ()____________________________________________5 PRUEBAS DE BONDAD DE AJUSTE.______________________________________________5Definicin..................................................................................................................................................5 Prueba para un ajuste uniforme..............................................................................................................8 Prueba de ajuste a un patrn especifico................................................................................................10 Prueba de Normalidad...........................................................................................................................11 Utilizando la formula (1.1) se tiene que:...............................................................................................16 (20-22.8)2 (142-135.9)2 (310-341.3) 2 (370-341.3) 2 (128-135.9) 2 (40-22.8 ) 2 ........................16 2=---------- + ----------- + ------------ + ------------- + ----------- + ----------.............................................16 22.8 135.9 341.3 341.3 135.9 22.8..............................................16 Tablas de Contingencia..........................................................................................................................17Atributo B Ubicacin...........................................................................................................................................18 Atributo B - Ubicacin...........................................................................................................................................19

CONCLUSION__________________________________________________________________20 BIBLIOGRAFIA________________________________________________________________21 ANEXOS_______________________________________________________________________22TABLA E DISTRIBUCION NORMAL............................................................................................22 TABLA H DISTRIBUCION CHI-CUADRADO..............................................................................23

2 INTRODUCCION

Siempre que obtengamos muestras de una poblacin, existe la cuestin de la confiabilidad de los resultados obtenido por muestreo con respecto a la poblacin. Necesitamos saber si las diferencias entre los resultados obtenidos por muestreo y los esperados de acuerdo con las leyes de las probabilidades son los suficientemente pequeas como para que no afecten las inferencias que deseamos obtener de los datos para nuestro uso. En otras palabras, necesitamos saber si los datos obtenidos son confiables y no contienen errores que puedan invalidar sus resultados. Una de las medidas de la discrepancia mas tiles es la prueba Chi-cuadrado, la cual viene proporcionada por el estadstico 2. Si 2 = 0, las frecuencias observadas y tericas coinciden completamente; mientras que si 2 >0, no coinciden exactamente. A valores ms grandes de 2 mayor discrepancia entre las frecuencias observadas y esperadas.

3

OBJETIVOS

1.

Comprender la importancia de comparar los resultados

obtenidos por muestreo, con los resultados esperados tericamente con las leyes de la probabilidad. Aprender a aplicar la prueba 2 para diferentes supuestos o

2.

hiptesis de acuerdo a los datos obtenidos. 3. Aprender el uso de tablas de contingencia para medir la relacin

entre diferentes factores que afectan un conjunto de datos.

4

MARCO TEORICO

Las pruebas que requieren de un supuesto respecto a la poblacin, se denominan pruebas parametricas, debido a que tales pruebas dependen de estos postulados y sus parmetros. En la practica, surgen muchas situaciones en las cuales no es posible hacer de forma segura ningn supuesto sobre el valor de un parmetro o sobre la forma de su distribucin poblacional. Entonces se deben utilizar otras pruebas que no dependan de un solo tipo de distribucin o de valores parametricos especficos. Estas pruebas se denominan no parametricas. Estas pruebas son procedimientos estadsticos que pueden utilizarse para contrastar hiptesis cuando no son posibles los supuestos respecto a los parmetros o a las distribuciones poblacionales. Dentro de estas pruebas se encuentran las de Chi-cuadrado (2), la del Signo, de Rachas, de Mann-Whitney y otras. Para el calculo del estadstico Chi-cuadrado (2, es necesario emplear tanto observaciones de muestras como propiedades de ciertos parmetros de la poblacin. Si estos parmetros son desconocidos, hay que estimarlos a partir de la muestra. l numero de grados de libertad de un estadstico, generalmente denotado por v, se define como el numero N de observaciones independientes en la muestra (o sea el tamao de la muestra) menos el numero k de parmetros de la poblacin, que debe ser estimado a partir de observaciones mustrales. En smbolos, v = N- k. En el caso del 2, el numero de observaciones independientes en la muestra es N, de donde podemos calcular s. Sin embargo, como debemos estimar , k = 1 y v = N-1.

5

DISTRIBUCION CHI- CUADRADO. ()

Una de las herramientas no parametricas mas tiles es la prueba chi cuadrado (2). Al igual que la distribucin t, la distribucin Chi-cuadrado es toda una familia de distribuciones. Existe una distribucin Chi-cuadrado para cada grado de libertad. a medida que se incrementa el numero de grados de libertad, la Las dos aplicaciones ms distribucin Chi-cuadrado se vuelve menos sesgada. independencia a travs de las tablas de contingencia.

comunes de Chi-cuadrado son las pruebas de bondad de ajuste y las pruebas de

PRUEBAS DE BONDAD DE AJUSTE.

Definicin.

Medidas sobre una forma de

que tan cerca se ajustan los datos muestrales observados a Si el ajuste es

distribucin particular planteada como hiptesis.

razonablemente cercano, puede concluirse que si existe la forma de distribucin planteada como hiptesis.

Las tomas de decisiones en los negocios muchas veces requiere que se pruebe alguna hiptesis sobre una distribucin poblacional desconocida. Por ejemplo, se puede plantear la hiptesis que la distribucin poblacional es uniforme y que todos los valores posibles tienen la misma probabilidad de ocurrir. Las hiptesis que se probaran son:

6

HO: la distribucin poblacional es uniforme. HA: la distribucin poblacional no es uniforme.

La prueba de bondad de ajuste se utiliza entonces para determinar si la distribucin de los valores en la poblacin se ajusta a una forma en particular planteada como hiptesis, en este caso, una manera distribucin uniforme. De la misma que con todas las pruebas estadsticas de esta naturaleza, los datos

muestrales se toman de la poblacin y estos constituyen la base de los hallazgos.

Si 2=0, las frecuencias observadas y esperadas coinciden completamente; mientras que si 2>0, no coinciden exactamente. A valores ms grandes de 2, mayor discrepancia existe entre las frecuencias observadas y esperadas. Si existe gran diferencia entre la frecuencia observada en la muestra y lo que se esperara observar, en tal caso es menos probable que la hiptesis sea verdadera. Es decir, la hiptesis debe rechazarse cuando las observaciones obtenidas en la muestra difieren tanto del patrn que se espera que ocurra la distribucin planteada como hiptesis, que no puede ser atribuida a un error de muestreo. En tales casos la hiptesis no es lo suficientemente confiable para una buena toma de decisiones.

Por ejemplo, si se hace rodar un dado bueno, es razonable plantear como hiptesis un patrn de resultados tal que cada resultado (un numero del 1 al 6) ocurra aproximadamente un sexto de las veces. Sin embargo, si un porcentaje de nmeros pares ocurre, significativamente grande o significativamente pequeo es falsa.

puede concluirse que el dado no esta balanceado adecuadamente y que la hiptesis

7Para contrastar la hiptesis relativa a una distribucin poblacional, se debe analizar la diferencia entre las expectativas con base en la distribucin planteada como hiptesis y los datos reales que aparecen en la muestra. Esto es precisamente lo que hace la prueba Chi-cuadrado de bondad de ajuste. Determina si las observaciones muestrales se ajustan a las expectativas. La prueba toma la siguiente forma: k (Oi - Ei) = --------------i=1 Ei en donde Oi Ei k es la frecuencia de los eventos observados en los datos muestrales es la frecuencia de los eventos esperados si la hiptesis es correcta es el numero de categoras o clases

(1.1)

La prueba tiene K - m - 1 grados de libertad, en donde m es el numero de parmetros a estimar. Vale la pena notar que el numerador de la formula esperados al cuadrado. Cuando estas diferencias son (1.1) mide la diferencia

entre las frecuencias de los eventos observados y las frecuencias de los eventos grandes, haciendo que se incremente, debera rechazarse la hiptesis. Dependiendo de los datos disponibles, podemos realizar la prueba de Chi-cuadrado de bondad de ajuste de tres maneras, pruebas para una ajuste uniforme, pruebas de ajuste para un patrn especifico y pruebas de normalidad.

8

Prueba para un ajuste uniforme

Esta prueba de Chi-cuadrado se usa cuando la frecuencia esperada para todas las clases es uniforme, de aqu su nombre. Ilustramos esta prueba con el siguiente ejemplo:Chris Columbus, director de mercadeo de Seven Seas, Inc, tiene la responsabilidad de controlar el nivel de existencia para cuatro tipos de botes vendidos por su firma. En el pasado ha ordenado nuevos botes bajo la premisa de que l