Download - estadistica 2 unidad 1

Transcript
Page 1: estadistica 2 unidad 1

FÓRMULAS-FUNCIONES

PRUEBA DE HIPÓTESIS-FÓRMULAS

Para probar la hipótesis se calcula el estadístico de prueba Z y se compara con los valores críticos de Z.

A. PRIMERA SITUACIÓN. Solamente se cuenta con los valores X , μH , σ o s y n.

1. El valor Z para probar la hipótesis cuando σ es conocido:

Z = (X−μH) ⁄ (σ /√n)

En donde: X es la media muestral. μH es el valor de la media poblacional bajo la hipótesis nula. σ /√n es el error estándar de la distribución muestral.

2. El valor Z utilizado para probar la hipótesis cuando σ es desconocida:

Cuando σ es desconocida, se utiliza la desviación estándar muestral y Z se vuelve.

Z = (X−μH) ⁄ (s /√ n)

En donde s es la desviación estándar muestral.

B. SEGUNDA SITUACIÓN. Solamente se toman en cuenta los valores X , σ o s y n.

C. TERCERA SITUACIÓN. Solamente se cuenta con la tabla muestral.

PRUEBA DE HIPOTESIS-FUNCIONES

Para probar la hipótesis, ya sea con σ conocido o con s, se utilizan las funciones NORMALIZACION, DISTR.NORM.ESTAND y DISTR.NORM.ESTAND.INV .A

1. Ir a la Etiqueta Fórmulas Grupo Biblioteca de funciones Más funciones Estadísticas NORMALIZACIÓN.

1

Page 2: estadistica 2 unidad 1

2. Su sintaxis es =NORMALIZACION(x, media, desv_estándar), donde el argumento x es el valor que se desea normalizar (la media muestral), el argumento media es la media aritmética de la distribución (valor de la media poblacional bajo la hipótesis nula) y el argumento desv_estándar es la desviación estándar de la distribución (dividida entre la raíz cuadrada del tamaño de la muestra)

3. EJEMPLO. Un embotellador de refrescos de cola debe determinar si el peso promedio de sus envases es de 16 onzas ¿ = 16 onzas).

Debido a que se plantea la hipótesis de que μ = 16 onzas, la hipótesis nula y la alternativa son:

H0: μ = 16H1: μ ≠ 16

Si el embotellador selecciona una muestra de n = 50 envases, con una media de X = 16.375 onzas y una desviación estándar de s = 0.866 onzas, calcular el valor de Z.

Solución:

a. En el cuadro de diálogo Argumentos de función ingresar:

* En la ventana x el valor de la media muestral: 16.375* En la ventana media el valor de la hipótesis nula: 16* En la ventana desv_estándar el valor de s dividido entre raíz cuadrada de n: .866/raíz(50)* Dar clic en Aceptar.* El resultado de la fórmula se muestra en la parte inferior del cuadro de diálogo: 2.9149

2

Page 3: estadistica 2 unidad 1

b. La regla empírica dice que el 95% de las X en la distribución de muestreo están a 1.96 errores estándar de la media poblacional y se calcula así:

α = 1.00 – (0.05/2) = 0.975

Ir a la Etiqueta Fórmulas Más funciones Estadísticas DISTR.NORM.ESTAND.INV.

En la ventana Probabilidad, ingresar el valor 0.975 o la referencia a la columna y celda que contiene el dato. El resultado es: 1.959963 por lo tanto 1.96

Estos valores de Z ± 1.96 son valores críticos que determinan las zonas de rechazo. Por lo tanto, el criterio de decisión es:

Se acepta la hipótesis nula si – 1.96 ≤ Z ≤ 1.96. Se rechaza si Z ¿ – 1.96 o Z ¿ 1.96

c. Como Z = 2.91 ¿ 1.96, se rechaza la hipótesis nula con un nivel de significancia de 5%

d. El porcentaje correspondiente al valor Z se calcula mediante la función DIST.NORM.ESTAND cuya sintaxis es =DISTR.NORM.ESTAND(Z) donde el argumento Z es el valor cuya distribución se desea obtener (2.91).

e. En el cuadro de diálogo Argumentos de función insertar la referencia a la celda donde se hizo el primer cálculo, en este ejemplo A1.

3

Page 4: estadistica 2 unidad 1

* Dar clic en Aceptar.* El resultado de la fórmula se muestra en la parte inferior del cuadro de diálogo: 0.9982 es decir, el 99.82% de probabilidad de que μ ≠ 16.

Para probar la hipótesis, tomando solamente en cuenta los valores X , σ o s y n, se utilizan las funciones NORMALIZACION y DISTR.NORM.ESTANDB

1. Este procedimiento consiste en calcular la diferencia entre X y μH y luego proceder a resolver el problema.

2. Tomando el mismo ejemplo desarrollado en el apartado anterior tenemos:

X – μH: 16.357 – 16 = 0.357

a. Para la función NORMALIZACIÓN, en el cuadro de diálogo Argumentos de función ingresar:

* En la ventana x el valor de la media muestral: .375* En la ventana media el valor de la hipótesis nula: 0* En la ventana desv_estándar el valor de s dividido entre raíz cuadrada de n: .866/raíz(50)* Dar clic en Aceptar.* El resultado de la fórmula se muestra en la parte inferior del cuadro de diálogo: 2.9149

b. Para la función DISTR.NORM.ESTAND, repetir el paso (d) del apartado anterior.

c. Para el nivel de significancia (DISTR.NORM.ESTAND.INV), repetir el paso b del apartado anterior.

4

Page 5: estadistica 2 unidad 1

Para probar la hipótesis, cuando solamente en cuenta con la tabla muestral, se recurre a Análisis de datos Regresión y la función DISTR.T.INV.C

1. EJEMPLO. Cierta línea aérea considera que existe una relación directa entre los gastos publicitarios y el número de pasajeros que eligen viajar por su compañía. Para determinar si existe dicha relación, y de ser así cuál podría ser exactamente, la empresa ha decidido llevar a cabo un estudio aplicando el método de los mínimos cuadrados.

Se cuenta con una serie histórica mensual de gastos de publicidad y el número de pasajeros para n = 15 últimos meses. Los datos aparecen en la tabla siguiente. Los pasajeros están representados por la variable Y porque se supone que dependen de la publicidad y las cifras son en miles.

MES PUBLICIDAD (X) PASAJEROS (Y)1 10 152 12 173 8 134 17 235 10 166 15 217 10 148 14 209 19 24

10 10 1711 11 1612 13 1813 16 2314 10 1515 12 16

Solución:

Obviamente, lo primero es ingresar los datos en una hoja de Excel en el rango A1:C16.

a. Ir a la Etiqueta Datos Grupo Análisis Análisis de datos Regresión Aceptar, para abrir el cuadro de diálogo.

5

Page 6: estadistica 2 unidad 1

b. Ingresar los datos siguientes:

* En la ventana Rango Y de entrada: C1:C16* En la ventana Rango X de entrada: B1:B16* Activar la casilla Rótulos.* Dejar activada la opción En una hoja nueva.*Dar clic en Aceptar.

6

Page 7: estadistica 2 unidad 1

INTERPRETACION

* La celda B4 (Coeficiente de correlación) muestra que existe una relación positiva entre el número de pasajeros y los gastos de publicidad en un 96.84%

* La celda B5 (Coeficiente de determinación R^2) muestra que el 93.78% del cambio en el número de pasajeros se explica mediante el cambio en los gastos de publicidad.

* La celda B7 (Error típico o Error estándar Se) determina el grado de confianza y muestra que el número de pasajeros estará entre el valor estimado ± Se. Se expresa en la unidad de medida del valor de Y, en este caso miles: 0.907 = 907 pasajeros.

* La celda B17 (Intercepción) muestra el valor de a.

* La celda B18 (PUBLICIDAD (X)) muestra el valor de b.

* La celda D18 (Estadístico t para PUBLICIDAD (X)) representa la prueba del parámetro poblacional. Por ejemplo: si α = 5%: t0.05,13 = 2.160 (tabla de distribución t: columna 0.975, fila 13), el criterio de decisión podría ser: Rechazar hipótesis nula si t ¿ 2.160, para esto:

H0: β1 = 0H1: β1 ≠ 0

El valor α se calcula mediante la función DISTR.T.INV cuyos argumentos son:

Probabilidad: en este caso 0.05Grados de libertad: en este caso 13.

7

Page 8: estadistica 2 unidad 1

La interpretación es:

* Como t (13.995) > α (2.160) se rechaza H0 lo que indica que existe una relación entre la publicidad y el número de pasajeros.

* En caso de aceptar H0 estaríamos concluyendo que no existe relación entre la publicidad y el número de pasajeros.

EJERCICIOS

1. Como gerente de compras de una empresa, debe decidir si actualiza o no las computadoras de su departamento. Le han dicho que el costo promedio de las computadoras es de US $ 2100. Una muestra entre 64 minoristas revela un precio promedio de US $ 2251 con una desviación estándar de US $ 812. Con base en un nivel de significancia de 5% ¿cree que su información es correcta?

a. Defina el juego de hipótesis

b. Defina el nivel de significancia.

c. Aplique cualquiera de los dos métodos (tomando en cuenta μH o tomando solamente en cuenta la diferencia entre las medias) para calcular el valor Z.

d. Defina la regla de decisión.

e. Explique qué significado tiene la distribución normal estándar en este ejercicio.

f. ¿Qué acción recomienda?

2. Cuando regresaron de las minas a su casa, los siete enanos le dijeron a Blancanieves que extrajeron un promedio semanal de 12 toneladas de oro. No estando dispuesta a creer dicha afirmación sin prueba alguna, la señorita Nieves recopiló datos durante 49 semanas encontrando una media de 11.5 toneladas y una desviación estándar de 1.1 toneladas. Con un nivel de significancia de 10% ¿cree usted que los enanos están en lo correcto?

a. Defina el juego de hipótesis

b. Defina el nivel de significancia.

8

Page 9: estadistica 2 unidad 1

c. Aplique cualquiera de los dos métodos (tomando en cuenta μH o tomando solamente en cuenta la diferencia entre las medias) para calcular el valor Z.

d. Defina la regla de decisión.

e. Explique qué significado tiene la distribución normal estándar en este ejercicio.

f. ¿Qué acción recomienda?

3. Debido al excesivo tiempo que se invierte en trasladarse hasta la fábrica, el departamento en donde usted trabaja está considerando modificar los horarios de labores. El jefe considera que los empleados invierten un promedio de 50 minutos para llegar al trabajo. Setenta empleados se toman en promedio 47.2 minutos con una desviación estándar de 18.9 minutos. Fije α en 1% y compruebe la hipótesis.

a. Defina el juego de hipótesis

b. Defina el nivel de significancia.

c. Aplique cualquiera de los dos métodos (tomando en cuenta μH o tomando solamente en cuenta la diferencia entre las medias) para calcular el valor Z.

d. Defina la regla de decisión.

e. Explique qué significado tiene la distribución normal estándar en este ejercicio.

f. ¿Qué acción recomienda?

4. Un supermercado local gastó miles de pesos en la remodelación de su local. Aunque el cierre temporal alejó a los clientes, el gerente espera que éstos regresen y disfruten de las nuevas comodidades. Antes de remodelar, la facturación del supermercado era de $ 325,330 semanalmente. Ahora que se ha terminado la remodelación, el gerente tomó una muestra de 36 semanas para ver si de alguna manera el cierre temporal afectó el negocio. Se reportó una media de $ 341,660 y una desviación estándar de $ 129,550. A un nivel de significancia de 1% ¿qué puede decidir el gerente?

a. Defina el juego de hipótesis

b. Defina el nivel de significancia.

c. Aplique cualquiera de los dos métodos (tomando en cuenta μH o tomando solamente en cuenta la diferencia entre las medias) para calcular el valor Z.

d. Defina la regla de decisión.

e. Explique qué significado tiene la distribución normal estándar en este ejercicio.

9

Page 10: estadistica 2 unidad 1

f. ¿Qué acción recomienda?

5. Una empresa de comida rápida tiene contemplado eliminar del menú la línea de pollo frito. El argumento es que los ingresos han descendido por debajo de la media de $ 4500 que se tenía en el pasado. ¿Será esta una decisión razonable si 144 observaciones revelan una media de $ 4477 y una desviación estándar de $ 1228? La gerencia está dispuesta a aceptar una probabilidad del 2% si se comete el Error tipo I.

a. Defina el juego de hipótesis

b. Defina el nivel de significancia.

c. Aplique cualquiera de los dos métodos (tomando en cuenta μH o tomando solamente en cuenta la diferencia entre las medias) para calcular el valor Z.

d. Defina la regla de decisión.

e. Explique qué significado tiene la distribución normal estándar en este ejercicio.

f. ¿Qué acción recomienda?

6. Como supervisor de producción, su responsabilidad es garantizar que las bolsas con semillas de pasto que produce la empresa pesen en promedio 25 kilos. Preocupado por el hecho de que no se cumpla con esta especificación, usted selecciona 25 bolsas y encuentra una media de 23.8 kilos con una desviación estándar de 6.6 kilos. ¿Deberá ordenar parar la línea de empaque y se hagan los ajustes en el proceso de llenado? Para minimizar un Error tipo I fije el valor de α en 1%

a. Defina el juego de hipótesis

b. Defina el nivel de significancia.

c. Aplique cualquiera de los dos métodos (tomando en cuenta μH o tomando solamente en cuenta la diferencia entre las medias) para calcular el valor Z.

d. Defina la regla de decisión.

e. Explique qué significado tiene la distribución normal estándar en este ejercicio.

f. ¿Qué acción recomienda?

7. Usted acaba de ser contratado como asistente de gerencia para un fabricante de partes para computadora. En su primer día de trabajo, usted necesita supervisar el tiempo requerido para elaborar una parte determinada que se supone toma un tiempo promedio de 15 minutos. Su supervisor inmediato está preocupado porque la contratación de trabajadores no entrenados ha incrementado el tiempo de elaboración de una parte por encima de los 15 minutos fijados. Usted

10

Page 11: estadistica 2 unidad 1

toma una muestra de 20 trabajadores y encuentra una media de 17.3 minutos y s = 1.9 minutos. A una valor α de 1% ¿qué le informará a su superior?

a. Defina el juego de hipótesis

b. Defina el nivel de significancia.

c. Aplique cualquiera de los dos métodos (tomando en cuenta μH o tomando solamente en cuenta la diferencia entre las medias) para calcular el valor Z.

d. Defina la regla de decisión.

e. Explique qué significado tiene la distribución normal estándar en este ejercicio.

f. ¿Qué acción recomienda?

8. Una empresa produce autopartes que se utilizan en los tractocamiones. El gerente de finanzas desea desarrollar un modelo de regresión que pueda utilizarse para predecir los costos. Seleccionó unidades producidas como una variable de predicción y recolectó los siguientes datos (en miles).

UNIDADES COSTO12.3 6.28.3 5.36.5 4.14.8 4.4

14.6 5.214.6 4.814.6 5.96.5 4.2

a. Calcule e interprete el modelo de regresión (el rango de salida debe ser en la misma hoja). ¿Cuál es el porcentaje de relación entre los costos y las unidades producidas? ¿En qué porcentaje se explica el cambio en los costos mediante el cambio en las unidades producidas?

b. Calcule el valor α para la prueba de parámetro poblacional al 5%.

c. Si el criterio de decisión fuese: No rechazar H0 si t está entre ± α ¿qué decisión debe tomarse?

d. ¿Qué puede decirnos el gerente acerca de la relación entre unidades producidas y su costo?

11

Page 12: estadistica 2 unidad 1

9. La siguiente tabla contiene información de una empresa dedicada a la venta de una conocida marca de cerveza. Su producto principal es el envase de cristal de 250 cc., al que corresponden estos datos:

VENTAS miles

PUBLICIDAD miles

120 8115 9130 10142 14148 12144 16165 20160 22175 26180 24

a. Calcule e interprete el modelo de regresión (el rango de salida debe ser en la misma hoja). ¿Cuál es el porcentaje de relación entre las ventas y la publicidad? ¿En qué porcentaje se explica el cambio en las ventas mediante el cambio en los gastos de publicidad?

b. Calcule el valor α para la prueba de parámetro poblacional al 5%.

c. Si el criterio de decisión fuese: No rechazar H0 si t está entre ± α ¿qué decisión debe tomarse?

d. ¿Qué podemos inferir acerca de la relación entre los gastos de publicidad y las ventas?

10. Un hipermercado ha decidido ampliar el negocio. Decide estudiar de forma exhaustiva el número de cajas registradoras que va a instalar, para evitar grandes colas. Para ello, se obtuvieron los siguientes datos procedentes de otros establecimientos similares acerca del número de cajas registradoras y del tiempo medio de espera.

No CAJAS T. ESPERA10 5912 5114 4212 3218 2620 22

12

Page 13: estadistica 2 unidad 1

a. Calcule e interprete el modelo de regresión (el rango de salida debe ser en la misma hoja). ¿Cuál es el porcentaje de relación entre el número de cajas y el tiempo medio de espera? ¿En qué porcentaje se explica el cambio en el número de cajas mediante el cambio en el tiempo de espera?

b. Calcule el valor α para la prueba de parámetro poblacional al 5%.

c. Si el criterio de decisión fuese: No rechazar H0 si t está entre ± α ¿qué decisión debe tomarse?

d. ¿Qué podemos inferir acerca de la relación entre el número de cajas y el tiempo medio de espera?

11. Una compañía de seguros considera que el número de vehículos que circulan por una determinada autopista a más de 120 km/hr, puede explicarse en función del número de accidentes que ocurren en ella. Durante 5 días obtuvieron los siguientes resultados:

ACCIDENTES VEHICULOS 5 157 182 101 89 20

a. Calcule e interprete el modelo de regresión (el rango de salida debe ser en la misma hoja). ¿Cuál es el porcentaje de relación entre el número de vehículos y el número de accidentes? ¿En qué porcentaje se explica el cambio en el número de vehículos mediante el cambio en los accidentes?

b. Calcule el valor α para la prueba de parámetro poblacional al 5%.

c. Si el criterio de decisión fuese: No rechazar H0 si t está entre ± α ¿qué decisión debe tomarse?

d. ¿Qué podemos inferir acerca de la relación entre el número de vehículos y el número de accidentes?

12. Una empresa de manufacturas basa las predicciones de sus ventas anuales en los resultados oficiales de la demanda total en la industria. A continuación se dan los datos de demanda total y las ventas efectuadas por la empresa en los últimos 11 años.

13

Page 14: estadistica 2 unidad 1

DEMANDA VENTAS 200 9220 6400 12330 7210 5390 10280 8140 4280 7290 10380 14

a. Calcule e interprete el modelo de regresión (el rango de salida debe ser en la misma hoja). ¿Cuál es el porcentaje de relación entre las ventas y la demanda? ¿En qué porcentaje se explica el cambio en las ventas mediante el cambio en la demanda?

b. Calcule el valor α para la prueba de parámetro poblacional al 5%.

c. Si el criterio de decisión fuese: No rechazar H0 si t está entre ± α ¿qué decisión debe tomarse?

d. ¿Qué podemos inferir acerca de la relación entre las ventas y la demanda?

13. La tabla registra el número de días que han transcurrido desde que se ha detectado un nuevo virus informático y el número de ordenadores infectados en un país.

DIAS PC INFEC 1 2552 15004 21055 50508 16300

10 4532011 5857014 37580016 152564020 2577000

14

Page 15: estadistica 2 unidad 1

a. Calcule e interprete el modelo de regresión (el rango de salida debe ser en la misma hoja). ¿Cuál es el porcentaje de relación entre las PC infectadas y los días transcurridos? ¿En qué porcentaje se explica el cambio en las PC infectadas mediante el cambio en los días transcurridos?

b. Calcule el valor α para la prueba de parámetro poblacional al 5%.

c. Si el criterio de decisión fuese: No rechazar H0 si t está entre ± α ¿qué decisión debe tomarse?

d. ¿Qué podemos inferir acerca de la relación entre las PC infectadas y los días transcurridos?

14. Se desea estudiar la posible relación entre los gastos en material informático de una empresa y sus ingresos globales. Para ello se recoge una muestra de datos anuales de gastos e ingresos de 7 empresas, los datos muestrales son los de la tabla adjunta.

INGRESOS GASTOS 20 2550 15

100 25200 57300 75400 91500 121

a. Calcule e interprete el modelo de regresión (el rango de salida debe ser en la misma hoja). ¿Cuál es el porcentaje de relación entre los gastos y los ingresos ¿En qué porcentaje se explica el cambio en los gastos mediante el cambio en los ingresos?

b. Calcule el valor α para la prueba de parámetro poblacional al 5%.

c. Si el criterio de decisión fuese: No rechazar H0 si t está entre ± α ¿qué decisión debe tomarse?

d. ¿Qué podemos inferir acerca de la relación entre los gastos y los ingresos?

15. Un analista financiero está preparando un estudio acerca del comportamiento del consumidor. Recopiló los datos que aparecen en la tabla para determinar si existe una relación entre el ingreso del consumidor y los niveles de consumo.

INGRESO CONSUMO15

Page 16: estadistica 2 unidad 1

24 1612 831 1528 1735 2410 1123 1510 78 3

15 1114 1015 9

a. Calcule e interprete el modelo de regresión (el rango de salida debe ser en la misma hoja). ¿Cuál es el porcentaje de relación entre los ingresos y el consumo ¿En qué porcentaje se explica el cambio en el consumo mediante el cambio en los ingresos?

b. Calcule el valor α para la prueba de parámetro poblacional al 5%.

c. Si el criterio de decisión fuese: No rechazar H0 si t está entre ± α ¿qué decisión debe tomarse?

d. ¿Qué podemos inferir acerca de la relación entre el consumo y los ingresos?

16