estadistica 2 unidad 1

of 21 /21

Click here to load reader

Embed Size (px)

Transcript of estadistica 2 unidad 1

FRMULAS-FUNCIONES

PRUEBA DE HIPTESIS-FRMULASPara probar la hiptesis se calcula el estadstico de prueba Z y se compara con los valores crticos de Z. A. PRIMERA SITUACIN. Solamente se cuenta con los valores X, H, o s y n. 1. El valor Z para probar la hiptesis cuando es conocido: Z = (X- H)(/n) En donde: X es la media muestral. H es el valor de la media poblacional bajo la hiptesis nula. n es el error estndar de la distribucin muestral. 2. El valor Z utilizado para probar la hiptesis cuando es desconocida: Cuando es desconocida, se utiliza la desviacin estndar muestral y Z se vuelve. Z = (X- H)(s/n) En donde s es la desviacin estndar muestral. B. SEGUNDA SITUACIN. Solamente se toman en cuenta los valores X, o s y n. C. TERCERA SITUACIN. Solamente se cuenta con la tabla muestral.

PRUEBA DE HIPOTESIS-FUNCIONES

A

Para probar la hiptesis, ya sea con conocido o con s, se utilizan las funciones NORMALIZACION, DISTR.NORM.ESTAND y DISTR.NORM.ESTAND.INV . 1. Ir a la Etiqueta Frmulas Grupo Biblioteca de funciones Ms funciones Estadsticas NORMALIZACIN.

1

2. Su sintaxis es =NORMALIZACION(x, media, desv_estndar), donde el argumento x es el valor que se desea normalizar (la media muestral), el argumento media es la media aritmtica de la distribucin (valor de la media poblacional bajo la hiptesis nula) y el argumento desv_estndar es la desviacin estndar de la distribucin (dividida entre la raz cuadrada del tamao de la muestra) 3. EJEMPLO. Un embotellador de refrescos de cola debe determinar si el peso promedio de sus envases es de 16 onzas ( = 16 onzas). Debido a que se plantea la hiptesis de que = 16 onzas, la hiptesis nula y la alternativa son: H0: = 16 H1: 16 Si el embotellador selecciona una muestra de n = 50 envases, con una media de X = 16.375 onzas y una desviacin estndar de s = 0.866 onzas, calcular el valor de Z. Solucin: a. En el cuadro de dilogo Argumentos de funcin ingresar: * En la ventana x el valor de la media muestral: 16.375 * En la ventana media el valor de la hiptesis nula: 16 * En la ventana desv_estndar el valor de s dividido entre raz cuadrada de n: .866/raz(50) * Dar clic en Aceptar. * El resultado de la frmula se muestra en la parte inferior del cuadro de dilogo: 2.9149

2

b. La regla emprica dice que el 95% de las X en la distribucin de muestreo estn a 1.96 errores estndar de la media poblacional y se calcula as: = 1.00 (0.05/2) = 0.975 Ir a la Etiqueta Frmulas DISTR.NORM.ESTAND.INV. Ms funciones Estadsticas

En la ventana Probabilidad, ingresar el valor 0.975 o la referencia a la columna y celda que contiene el dato. El resultado es: 1.959963 por lo tanto 1.96 Estos valores de Z 1.96 son valores crticos que determinan las zonas de rechazo. Por lo tanto, el criterio de decisin es: Se acepta la hiptesis nula si 1.96 Z 1.96. Se rechaza si Z < 1.96 o Z > 1.96 c. Como Z = 2.91 > 1.96, se rechaza la hiptesis nula con un nivel de significancia de 5% d. El porcentaje correspondiente al valor Z se calcula mediante la funcin DIST.NORM.ESTAND cuya sintaxis es =DISTR.NORM.ESTAND(Z) donde el argumento Z es el valor cuya distribucin se desea obtener (2.91). e. En el cuadro de dilogo Argumentos de funcin insertar la referencia a la celda donde se hizo el primer clculo, en este ejemplo A1.

3

* Dar clic en Aceptar. * El resultado de la frmula se muestra en la parte inferior del cuadro de dilogo: 0.9982 es decir, el 99.82% de probabilidad de que 16.

B

Para probar la hiptesis, tomando solamente en cuenta los valores X, o s y n, se utilizan las funciones NORMALIZACION y DISTR.NORM.ESTAND

1. Este procedimiento consiste en calcular la diferencia entre X y H y luego proceder a resolver el problema. 2. Tomando el mismo ejemplo desarrollado en el apartado anterior tenemos: X H: 16.357 16 = 0.357 a. Para la funcin NORMALIZACIN, en el cuadro de dilogo Argumentos de funcin ingresar: * En la ventana x el valor de la media muestral: .375 * En la ventana media el valor de la hiptesis nula: 0 * En la ventana desv_estndar el valor de s dividido entre raz cuadrada de n: .866/raz(50) * Dar clic en Aceptar. * El resultado de la frmula se muestra en la parte inferior del cuadro de dilogo: 2.9149 b. Para la funcin DISTR.NORM.ESTAND, repetir el paso (d) del apartado anterior. c. Para el nivel de significancia (DISTR.NORM.ESTAND.INV), repetir el paso b del apartado anterior. 4

C

Para probar la hiptesis, cuando solamente en cuenta con la tabla muestral, se recurre a Anlisis de datos Regresin y la funcin DISTR.T.INV. 1. EJEMPLO. Cierta lnea area considera que existe una relacin directa entre los gastos publicitarios y el nmero de pasajeros que eligen viajar por su compaa. Para determinar si existe dicha relacin, y de ser as cul podra ser exactamente, la empresa ha decidido llevar a cabo un estudio aplicando el mtodo de los mnimos cuadrados. Se cuenta con una serie histrica mensual de gastos de publicidad y el nmero de pasajeros para n = 15 ltimos meses. Los datos aparecen en la tabla siguiente. Los pasajeros estn representados por la variable Y porque se supone que dependen de la publicidad y las cifras son en miles. ME S 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 PUBLICIDA D (X) 10 12 8 17 10 15 10 14 19 10 11 13 16 10 12 PASAJERO S (Y) 15 17 13 23 16 21 14 20 24 17 16 18 23 15 16

Solucin: 5

Obviamente, lo primero es ingresar los datos en una hoja de Excel en el rango A1:C16. a. Ir a la Etiqueta Datos Grupo Anlisis Anlisis de datos Regresin Aceptar, para abrir el cuadro de dilogo.

b. Ingresar los datos siguientes: * En la ventana Rango Y de entrada: C1:C16 * En la ventana Rango X de entrada: B1:B16 * Activar la casilla Rtulos. * Dejar activada la opcin En una hoja nueva. *Dar clic en Aceptar.

6

INTERPRETACION * La celda B4 (Coeficiente de correlacin) muestra que existe una relacin positiva entre el nmero de pasajeros y los gastos de publicidad en un 96.84% * La celda B5 (Coeficiente de determinacin R^2) muestra que el 93.78% del cambio en el nmero de pasajeros se explica mediante el cambio en los gastos de publicidad. * La celda B7 (Error tpico o Error estndar Se) determina el grado de confianza y muestra que el nmero de pasajeros estar entre el valor estimado Se. Se expresa en la unidad de medida del valor de Y, en este caso miles: 0.907 = 907 pasajeros. * La celda B17 (Intercepcin) muestra el valor de a. 7

* La celda B18 (PUBLICIDAD (X)) muestra el valor de b. * La celda D18 (Estadstico t para PUBLICIDAD (X)) representa la prueba del parmetro poblacional. Por ejemplo: si = 5%: t0.05,13 = 2.160 (tabla de distribucin t: columna 0.975, fila 13), el criterio de decisin podra ser: Rechazar hiptesis nula si t > 2.160, para esto: H0: 1 = 0 H1: 1 0 El valor se calcula mediante la funcin DISTR.T.INV cuyos argumentos son: Probabilidad: en este caso 0.05 Grados de libertad: en este caso 13.

La interpretacin es: * Como t (13.995) > (2.160) se rechaza H0 lo que indica que existe una relacin entre la publicidad y el nmero de pasajeros. * En caso de aceptar H0 estaramos concluyendo que no existe relacin entre la publicidad y el nmero de pasajeros.

EJERCICIOS1. Como gerente de compras de una empresa, debe decidir si actualiza o no las computadoras de su departamento. Le han dicho que el costo promedio de las computadoras es de US $ 2100. Una muestra entre 64 minoristas revela un precio promedio de US $ 2251 con una desviacin estndar de US $ 812. Con base en un nivel de significancia de 5% cree que su informacin es correcta? a. Defina el juego de hiptesis b. Defina el nivel de significancia. c. Aplique cualquiera de los dos mtodos (tomando en cuenta H o tomando solamente en cuenta la diferencia entre las medias) para calcular el valor Z. 8

d. Defina la regla de decisin. e. Explique qu significado tiene la distribucin normal estndar en este ejercicio. f. Qu accin recomienda? 2. Cuando regresaron de las minas a su casa, los siete enanos le dijeron a Blancanieves que extrajeron un promedio semanal de 12 toneladas de oro. No estando dispuesta a creer dicha afirmacin sin prueba alguna, la seorita Nieves recopil datos durante 49 semanas encontrando una media de 11.5 toneladas y una desviacin estndar de 1.1 toneladas. Con un nivel de significancia de 10% cree usted que los enanos estn en lo correcto? a. Defina el juego de hiptesis b. Defina el nivel de significancia. c. Aplique cualquiera de los dos mtodos (tomando en cuenta H o tomando solamente en cuenta la diferencia entre las medias) para calcular el valor Z. d. Defina la regla de decisin. e. Explique qu significado tiene la distribucin normal estndar en este ejercicio. f. Qu accin recomienda? 3. Debido al excesivo tiempo que se invierte en trasladarse hasta la fbrica, el departamento en donde usted trabaja est considerando modificar los horarios de labores. El jefe considera que los empleados invierten un promedio de 50 minutos para llegar al trabajo. Setenta empleados se toman en promedio 47.2 minutos con una desviacin estndar de 18.9 minutos. Fije en 1% y compruebe la hiptesis. a. Defina el juego de hiptesis b. Defina el nivel de significancia. c. Aplique cualquiera de los dos mtodos (tomando en cuenta H o tomando solamente en cuenta la diferencia entre las medias) para calcular el valor Z. d. Defina la regla de decisin. e. Explique qu significado tiene la distribucin normal estndar en este ejercicio. f. Qu accin recomienda? 9

4. Un supermercado local gast miles de pesos en la remodelacin de su local. Aunque el cierre temporal alej a los clientes, el gerente espera que stos regresen y disfruten de las nuevas comodidades. Antes de remodelar, la facturacin del supermercado era de $ 325,330 semanalmente. Ahora que se ha terminado la remodelacin, el gerente tom una muestra de 36 semanas para ver si de alguna manera el cierre temporal afect el negocio. Se report una media de $ 341,660 y una desviacin estndar de $ 129,550. A un nivel de significancia de 1% qu puede decidir el gerente? a. Defina el juego de hiptesis b. Defina el nivel de significancia. c. Aplique cualquiera de los dos mtodos (tomando en cuenta H o tomando solamente en cuenta la diferencia entre las medias) para calcular el valor Z. d. Defina la regla de decisin. e. Explique qu significado tiene la distribucin normal estndar en este ejercicio. f. Qu accin recomienda? 5. Una empresa de comida rpida tiene contemplado eliminar del men la lnea de pollo frito. El argumento es que los ingresos han descendido por debajo de la media de $ 4500 que se tena en el pasado. Ser esta una decisin razonable si 144 observaciones revelan una media de $ 4477 y una desviacin estndar de $ 1228? La gerencia est dispuesta a aceptar una probabilidad del 2% si se comete el Error tipo I. a. Defina el juego de hiptesis b. Defina el nivel de significancia. c. Aplique cualquiera de los dos mtodos (tomando en cuenta H o tomando solamente en cuenta la diferencia entre las medias) para calcular el valor Z. d. Defina la regla de decisin. e. Explique qu significado tiene la distribucin normal estndar en este ejercicio. f. Qu accin recomienda? 6. Como supervisor de produccin, su responsabilidad es garantizar que las bolsas con semillas de pasto que produce la empresa pesen en promedio 25 kilos. Preocupado por el hecho de que no se cumpla con esta especificacin, usted selecciona 25 bolsas y encuentra una media de 23.8 kilos con una 10

desviacin estndar de 6.6 kilos. Deber ordenar parar la lnea de empaque y se hagan los ajustes en el proceso de llenado? Para minimizar un Error tipo I fije el valor de en 1% a. Defina el juego de hiptesis b. Defina el nivel de significancia. c. Aplique cualquiera de los dos mtodos (tomando en cuenta H o tomando solamente en cuenta la diferencia entre las medias) para calcular el valor Z. d. Defina la regla de decisin. e. Explique qu significado tiene la distribucin normal estndar en este ejercicio. f. Qu accin recomienda? 7. Usted acaba de ser contratado como asistente de gerencia para un fabricante de partes para computadora. En su primer da de trabajo, usted necesita supervisar el tiempo requerido para elaborar una parte determinada que se supone toma un tiempo promedio de 15 minutos. Su supervisor inmediato est preocupado porque la contratacin de trabajadores no entrenados ha incrementado el tiempo de elaboracin de una parte por encima de los 15 minutos fijados. Usted toma una muestra de 20 trabajadores y encuentra una media de 17.3 minutos y s = 1.9 minutos. A una valor de 1% qu le informar a su superior? a. Defina el juego de hiptesis b. Defina el nivel de significancia. c. Aplique cualquiera de los dos mtodos (tomando en cuenta H o tomando solamente en cuenta la diferencia entre las medias) para calcular el valor Z. d. Defina la regla de decisin. e. Explique qu significado tiene la distribucin normal estndar en este ejercicio. f. Qu accin recomienda? 8. Una empresa produce autopartes que se utilizan en los tractocamiones. El gerente de finanzas desea desarrollar un modelo de regresin que pueda utilizarse para predecir los costos. Seleccion unidades producidas como una variable de prediccin y recolect los siguientes datos (en miles).

11

UNIDADE S 12.3 8.3 6.5 4.8 14.6 14.6 14.6 6.5

COSTO 6.2 5.3 4.1 4.4 5.2 4.8 5.9 4.2

a. Calcule e interprete el modelo de regresin (el rango de salida debe ser en la misma hoja). Cul es el porcentaje de relacin entre los costos y las unidades producidas? En qu porcentaje se explica el cambio en los costos mediante el cambio en las unidades producidas? b. Calcule el valor para la prueba de parmetro poblacional al 5%. c. Si el criterio de decisin fuese: No rechazar H0 si t est entre qu decisin debe tomarse? d. Qu puede decirnos el gerente acerca de la relacin entre unidades producidas y su costo?

9. La siguiente tabla contiene informacin de una empresa dedicada a la venta de una conocida marca de cerveza. Su producto principal es el envase de cristal de 250 cc., al que corresponden estos datos: VENT AS miles 120 115 130 142 148 144 165 160 175 180 PUBLICID AD miles 8 9 10 14 12 16 20 22 26 24

12

a. Calcule e interprete el modelo de regresin (el rango de salida debe ser en la misma hoja). Cul es el porcentaje de relacin entre las ventas y la publicidad? En qu porcentaje se explica el cambio en las ventas mediante el cambio en los gastos de publicidad? b. Calcule el valor para la prueba de parmetro poblacional al 5%. c. Si el criterio de decisin fuese: No rechazar H 0 si t est entre qu decisin debe tomarse? d. Qu podemos inferir acerca de la relacin entre los gastos de publicidad y las ventas? 10. Un hipermercado ha decidido ampliar el negocio. Decide estudiar de forma exhaustiva el nmero de cajas registradoras que va a instalar, para evitar grandes colas. Para ello, se obtuvieron los siguientes datos procedentes de otros establecimientos similares acerca del nmero de cajas registradoras y del tiempo medio de espera. T. ESPERA 59 51 42 32 26 22

No CAJAS 10 12 14 12 18 20

a. Calcule e interprete el modelo de regresin (el rango de salida debe ser en la misma hoja). Cul es el porcentaje de relacin entre el nmero de cajas y el tiempo medio de espera? En qu porcentaje se explica el cambio en el nmero de cajas mediante el cambio en el tiempo de espera? b. Calcule el valor para la prueba de parmetro poblacional al 5%. c. Si el criterio de decisin fuese: No rechazar H 0 si t est entre qu decisin debe tomarse? d. Qu podemos inferir acerca de la relacin entre el nmero de cajas y el tiempo medio de espera? 11. Una compaa de seguros considera que el nmero de vehculos que circulan por una determinada autopista a ms de 120 km/hr, puede explicarse en funcin del nmero de accidentes que ocurren en ella. Durante 5 das obtuvieron los siguientes resultados: 13

ACCIDEN TES 5 7 2 1 9

VEHICUL OS 15 18 10 8 20

a. Calcule e interprete el modelo de regresin (el rango de salida debe ser en la misma hoja). Cul es el porcentaje de relacin entre el nmero de vehculos y el nmero de accidentes? En qu porcentaje se explica el cambio en el nmero de vehculos mediante el cambio en los accidentes? b. Calcule el valor para la prueba de parmetro poblacional al 5%. c. Si el criterio de decisin fuese: No rechazar H 0 si t est entre qu decisin debe tomarse? d. Qu podemos inferir acerca de la relacin entre el nmero de vehculos y el nmero de accidentes? 12. Una empresa de manufacturas basa las predicciones de sus ventas anuales en los resultados oficiales de la demanda total en la industria. A continuacin se dan los datos de demanda total y las ventas efectuadas por la empresa en los ltimos 11 aos.

DEMAN VENT DA AS 200 9 220 6 400 12 330 7 210 5 390 10 280 8 140 4 280 7 14

290 380

10 14

a. Calcule e interprete el modelo de regresin (el rango de salida debe ser en la misma hoja). Cul es el porcentaje de relacin entre las ventas y la demanda? En qu porcentaje se explica el cambio en las ventas mediante el cambio en la demanda? b. Calcule el valor para la prueba de parmetro poblacional al 5%. c. Si el criterio de decisin fuese: No rechazar H 0 si t est entre qu decisin debe tomarse? d. Qu podemos inferir acerca de la relacin entre las ventas y la demanda? 13. La tabla registra el nmero de das que han transcurrido desde que se ha detectado un nuevo virus informtico y el nmero de ordenadores infectados en un pas.

DIAS 1 2 4 5 8 10 11 14 16 20

PC INFEC 255 1500 2105 5050 16300 45320 58570 375800 1525640 2577000

a. Calcule e interprete el modelo de regresin (el rango de salida debe ser en la misma hoja). Cul es el porcentaje de relacin entre las PC infectadas y los das transcurridos? En qu porcentaje se explica el cambio en las PC infectadas mediante el cambio en los das transcurridos? b. Calcule el valor para la prueba de parmetro poblacional al 5%. c. Si el criterio de decisin fuese: No rechazar H 0 si t est entre qu decisin debe tomarse?

15

d. Qu podemos inferir acerca de la relacin entre las PC infectadas y los das transcurridos? 14. Se desea estudiar la posible relacin entre los gastos en material informtico de una empresa y sus ingresos globales. Para ello se recoge una muestra de datos anuales de gastos e ingresos de 7 empresas, los datos muestrales son los de la tabla adjunta. INGRESO S 20 50 100 200 300 400 500

GASTOS 25 15 25 57 75 91 121

a. Calcule e interprete el modelo de regresin (el rango de salida debe ser en la misma hoja). Cul es el porcentaje de relacin entre los gastos y los ingresos En qu porcentaje se explica el cambio en los gastos mediante el cambio en los ingresos? b. Calcule el valor para la prueba de parmetro poblacional al 5%. c. Si el criterio de decisin fuese: No rechazar H 0 si t est entre qu decisin debe tomarse? d. Qu podemos inferir acerca de la relacin entre los gastos y los ingresos? 15. Un analista financiero est preparando un estudio acerca del comportamiento del consumidor. Recopil los datos que aparecen en la tabla para determinar si existe una relacin entre el ingreso del consumidor y los niveles de consumo.

INGRESO 24 12

CONSUM O 16 8

16

31 28 35 10 23 10 8 15 14 15

15 17 24 11 15 7 3 11 10 9

a. Calcule e interprete el modelo de regresin (el rango de salida debe ser en la misma hoja). Cul es el porcentaje de relacin entre los ingresos y el consumo En qu porcentaje se explica el cambio en el consumo mediante el cambio en los ingresos? b. Calcule el valor para la prueba de parmetro poblacional al 5%. c. Si el criterio de decisin fuese: No rechazar H 0 si t est entre qu decisin debe tomarse? d. Qu podemos inferir acerca de la relacin entre el consumo y los ingresos?

17