of 24

• Author

marifer-rj
• Category

## Documents

• view

176

0

Embed Size (px)

1

TABLA DE CONTENIDO

INTRODUCCION_______________________________________________________________2 OBJETIVOS____________________________________________________________________3 MARCO TEORICO______________________________________________________________4 DISTRIBUCION CHI- CUADRADO. ( )___________________________________________5 PRUEBAS DE BONDAD DE AJUSTE.______________________________________________5Definicin..................................................................................................................................................5 Prueba para un ajuste uniforme..............................................................................................................8 Prueba de ajuste a un patrn especifico................................................................................................10 Prueba de Normalidad...........................................................................................................................11 Utilizando la formula (1.1) se tiene que:...............................................................................................16 (20-22.8)2 (142-135.9)2 (310-341.3) 2 (370-341.3) 2 (128-135.9) 2 (40-22.8 ) 2 ........................16 2=---------- + ----------- + ------------ + ------------- + ----------- + ----------...........................................16 22.8 135.9 341.3 341.3 135.9 22.8..............................................16 Tablas de Contingencia..........................................................................................................................17Atributo B Ubicacin...........................................................................................................................................18 Atributo B - Ubicacin...........................................................................................................................................19 Atributo A - Clasificacin..................................................................................................................................19

2 INTRODUCCION

y tericas coinciden completamente; mientras que si

>0, no coinciden

mayor discrepancia entre las frecuencias

3

OBJETIVOS

1. Comprender la importancia de comparar los resultados obtenidos por muestreo, con los resultados esperados tericamente con las leyes de la probabilidad. 2. Aprender a aplicar la prueba 2

para diferentes supuestos o hiptesis

de acuerdo a los datos obtenidos. 3. Aprender el uso de tablas de contingencia para medir la relacin entre diferentes factores que afectan un conjunto de datos.

4

MARCO TEORICO

5

Definicin.

Medidas sobre una forma de

que tan cerca se ajustan los datos muestrales observados a Si el ajuste es

razonablemente cercano, puede concluirse que si existe la forma de distribucin planteada como hiptesis.

Las tomas de decisiones en los negocios muchas veces requiere que se pruebe alguna hiptesis sobre una distribucin poblacional desconocida. Por ejemplo, se puede plantear la hiptesis que la distribucin poblacional es uniforme y que todos los valores posibles tienen la misma probabilidad de ocurrir. Las hiptesis que se probaran son:

6

HO: la distribucin poblacional es uniforme. HA: la distribucin poblacional no es uniforme.

La prueba de bondad de ajuste se utiliza entonces para determinar si la distribucin de los valores en la poblacin se ajusta a una forma en particular planteada como hiptesis, en este caso, una manera distribucin uniforme. De la misma que con todas las pruebas estadsticas de esta naturaleza, los datos

muestrales se toman de la poblacin y estos constituyen la base de los hallazgos.

Si 2=0, las frecuencias observadas y esperadas coinciden completamente; mientras que si 2>0, no coinciden exactamente. A valores ms grandes de 2, mayor discrepancia existe entre las frecuencias observadas y esperadas. Si existe gran diferencia entre la frecuencia observada en la muestra y lo que se esperara observar, en tal caso es menos probable que la hiptesis sea verdadera. Es decir, la hiptesis debe rechazarse cuando las observaciones obtenidas en la muestra difieren tanto del patrn que se espera que ocurra la distribucin planteada como hiptesis, que no puede ser atribuida a un error de muestreo. En tales casos la hiptesis no es lo suficientemente confiable para una buena toma de decisiones.

Por ejemplo, si se hace rodar un dado bueno, es razonable plantear como hiptesis un patrn de resultados tal que cada resultado (un numero del 1 al 6) ocurra aproximadamente un sexto de las veces. Sin embargo, si un porcentaje de nmeros pares ocurre, significativamente grande o significativamente pequeo es falsa.

7Para contrastar la hiptesis relativa a una distribucin poblacional, se debe analizar la diferencia entre las expectativas con base en la distribucin planteada como hiptesis y los datos reales que aparecen en la muestra. Esto es precisamente lo que hace la prueba Chi-cuadrado de bondad de ajuste. Determina si las observaciones muestrales se ajustan a las expectativas. La prueba toma la siguiente forma: k (Oi - Ei) = --------------i=1 Ei en donde Oi Ei k es la frecuencia de los eventos observados en los datos muestrales es la frecuencia de los eventos esperados si la hiptesis es correcta es el numero de categoras o clases

(1.1)

La prueba tiene K - m - 1 grados de libertad, en donde m es el numero de parmetros a estimar. Vale la pena notar que el numerador de la formula (1.1) mide la diferencia

entre las frecuencias de los eventos observados y las frecuencias de los eventos esperados al cuadrado. Cuando estas diferencias son grandes, haciendo que se incremente, debera rechazarse la hiptesis. Dependiendo de los datos disponibles, podemos realizar la prueba de Chi-cuadrado de bondad de ajuste de tres maneras, pruebas para una ajuste uniforme, pruebas de ajuste para un patrn especifico y pruebas de normalidad.

8

Prueba para un ajuste uniforme

Esta prueba de Chi-cuadrado se usa cuando la frecuencia esperada para todas las clases es uniforme, de aqu su nombre. Ilustramos esta prueba con el siguiente ejemplo:Chris Columbus, director de mercadeo de Seven Seas, Inc, tiene la responsabilidad de controlar el nivel de existencia para cuatro tipos de botes vendidos por su firma. En el pasado ha ordenado nuevos botes bajo la premisa de que los cuatro tipos son igualmente populares y la demanda de cada tipo es la misma. Sin embargo, recientemente las existencias se han vuelto ms difciles de controlar, y Chris considera que debera probar su hiptesis respecto a una demanda uniforme. Sus hiptesis son:

HO: La demanda es uniforme para los cuatro tipos de botes HA: La demanda no es uniforme para los cuatro tipos de botes Suponiendo uniformidad en la demanda, la hiptesis nula presume que de una muestra aleatoria de botes, los navegantes de fin de semana compraran un numero igual de cada tipo. Para probar esta hiptesis, Chris selecciona una muestra de n=48 botes vendidos durante los ltimos meses. Si la demanda es uniforme, puede esperar que 48/4=12 botes de cada tipo se vendan. La Tabla 1.1 Muestra esta expectativa junto con la frecuencia real vendida de cada tipo. Se nota que (Oi)= (Ei). Chris debe determinar ahora si los nmeros vendidos realmente en cada una de las categoras K=4 esta lo suficientemente cerca de lo que se esperara si la demanda fuese uniforme. Aplicando la formula 1.1 tenemos el siguiente resultado: TABLA 1.1 Tipo de Bote Pirate's Revenge Jolly Roger Bluebeard's Treasure Ahab's Quest Ventas Observadas(Oi) 15 11 10 12 48 Ventas Esperadas(Ei) 12 12 12 12 48

Utilizando la formula (1.1) tenemos que:

9

(15-12)2 (11-12)2 (10-12)2 (12-12)2 2= ------------- + ------------ + -------------+ ------------ = 1.17 12 12 12 12 El valor 1.17 se compara con un valor critico de 2

tomando de la tabla H

(ver anexo). Debido a que no existen parmetros que tengan que estimarse, m=0 y entonces los grados de libertad segn su formula es igual a 4-0-1 = 3 grados de libertad. Si Chris deseara probar al nivel del 5%, se encontrara que 2 0.05,3

> 7.815

Regla de decisin: No rechazar si

2

< 7.815. Rechazar si 2>7.815

Gracias a que 1.17< 7.815, la hiptesis nula de que la demanda es uniforme no se rechaza. Las diferencias entre lo que se observo en realidad, O i, y lo que Chris esperaba observar si la demanda fuera la misma para los cuatro tipos de botes, Ei, no son los suficientemente grandes como para refutar la hiptesis nula. Las diferencias no son significativas y pueden atribuirse simplemente a un error de muestreo.

1

Prueba de ajuste a un patrn especifico.

2

(15-14.4)2 (11-9.6)2 (10-19.2)2 (12-4.8)2 = -------------+-------------+-------------+----------- = 15.41 14.4 9.6 19.2 4.8

El valor 15.41 se compara con el valor critico de

2

tomado de la tabla H (Ver

anexo). De nuevo no existen parmetros que tengan que estimarse, m = 0 y entonces los grados de libertad segn su formula es igual a 4-0-1=3 grados de libertad. De la misma manera deseamos probar al nivel del 5%, se encontrara que 2 0.05,3

> 7.8152

Regla de decisin: No rechazar si

< 7.815. Rechazar si 2>7.815

1

Dado que 15.41> 7.815, la hiptesis nula de que la demanda se ajusta a un patrn especifico se rechaza. Las diferencias entre lo que se observo en realidad, Oi, y lo que Chris esperaba observar si la demanda fuera la dada segn la tabla 1.2 para los cuatro tipos de botes, Ei, son los suficientemente grandes como para refutar la hiptesis nula. Las diferencias son significativas y no pueden atribuirse simplemente a un error de muestreo.

HO: Los niveles de llenados estn distribuidos normalmente. HA: Los niveles de llenado no estn distribuidos normalmente.

1TABLA 1.3 PSI 0 y por debajo de 580 580 y por debajo de 590 590 y por debajo de 600 600 y por debajo de 610 610 y por debajo de 620 620 y por encima Total Frecuencia Real 20 142 310 370 128 30 1,000

Igual que antes, la prueba requiere comparar estas observaciones reales con las que esperaramos encontrar si prevaleciera la normalidad. Para encontrar las frecuencias esperadas debemos calcular las probabilidades de que los tanques seleccionados aleatoriamente tengan los niveles de contenido en los intervalos presentados en la tabla 1.3.

a) La probabilidad de que un tanque caiga en el primer intervalo P(0%580). El problema esta representado en la figura 1.3a. Debemos determinar el rea sombreada bajo la curva. As:

X- Z=---------

-2 0 (a)

580 600 Z=------------ = -2 O UN AREA DE 0.4772 10 Entonces P(0