Actividad_3.pdf

9
Actividad 3: Intervalos de Confianza para 1 población ACTIVIDAD 3: Intervalos de Confianza para 1 población CASO 3-1: REAJUSTE DE MÁQUINAS_________________________________ Trabajamos como supervisores de una máquina dedicada a la producción de piezas metálicas cuya longitud sigue una distribución normal con media µ = 75,20 mm y desviación estándar σ = 0,5 mm. Tras realizar un reajuste en la máquina, sospechamos que µ habrá cambiado mientras que la desviación estándar de dicha variable no se habrá visto alterada. A fin de estimar el nuevo valor de µ , hemos tomado una muestra aleatoria de unidades producidas y registrado su longitud. Los resultados son los siguientes: 75,3 76,0 75,0 77,0 75,4 76,3 77,0 74,9 76,5 75,8 1. Encontrar un estimador puntual para µ y hallar la mediana de las observaciones. En primer lugar, introducimos los datos anteriores en la columna C1. Parece lógico pensar que un buen estimador de la media poblacional será la media muestral, la cual en este caso vale 75,92 mm: Seleccionamos Stat > Basic Statistics > Display Descriptive Statistics : Descriptive Statistics Variable N Mean Median TrMean StDev SE Mean Longitud 10 75,920 75,900 75,912 0,773 0,244 Variable Minimum Maximum Q1 Q3 Longitud 74,900 77,000 75,225 76,625 A3 - 1

Transcript of Actividad_3.pdf

Page 1: Actividad_3.pdf

Actividad 3: Intervalos de Confianza para 1 población

ACTIVIDAD 3: Intervalos de Confianza para 1 población

CASO 3-1: REAJUSTE DE MÁQUINAS_________________________________ Trabajamos como supervisores de una máquina dedicada a la producción de piezas metálicas cuya longitud sigue una distribución normal con media µ = 75,20 mm y desviación estándar σ = 0,5 mm. Tras realizar un reajuste en la máquina, sospechamos que µ habrá cambiado mientras que la desviación estándar de dicha variable no se habrá visto alterada. A fin de estimar el nuevo valor de µ , hemos tomado una muestra aleatoria de unidades producidas y registrado su longitud. Los resultados son los siguientes:

75,3 76,0 75,0 77,0 75,4 76,3 77,0 74,9 76,5 75,8 1. Encontrar un estimador puntual para µ y hallar la mediana de las observaciones.

En primer lugar, introducimos los datos anteriores en la columna C1. Parece lógico pensar que un buen estimador de la media poblacional será la media muestral, la cual en este caso vale 75,92 mm: Seleccionamos Stat > Basic Statistics > Display Descriptive

Statistics :

Descriptive Statistics Variable N Mean Median TrMean StDev SE Mean Longitud 10 75,920 75,900 75,912 0,773 0,244 Variable Minimum Maximum Q1 Q3 Longitud 74,900 77,000 75,225 76,625

A3 - 1

Page 2: Actividad_3.pdf

Estadística Aplicada con Minitab

A pesar de que la media de las observaciones sea de 75,92 , este dato por sí sólo no es suficiente como para confirmar nuestras sospechas sobre si se ha producido un cambio en la longitud media. Tal discrepancia entre el valor estimado para la nueva µ (75,92) y el valor de la antigua µ (75,20) podría deberse a una simple casualidad en la elección de las muestras.

2. Hallar un intervalo de confianza del 99% para la media poblacional.

Seleccionamos Stat > Basic Statistics > 1-Sample Z :

Z Confidence Intervals The assumed sigma = 0,500 Variable N Mean StDev SE Mean 99,0 % CI Longitud 10 75,920 0,773 0,158 ( 75,513; 76,327)

Observamos que hay una probabilidad del 0,99 de que la verdadera media poblacional se encuentre entre los valores 75,513 y 76,327. Este resultado sí resulta muy significativo: el hecho de que casi con toda probabilidad la nueva media se encuentre entre los valores 75,513 y 76,327 corrobora (ahora sí de forma bastante contundente) nuestras sospechas: la longitud media de las piezas ha variado (ya no es de 75,20 , sino que muy probablemente sea mayor).

A3 - 2

Page 3: Actividad_3.pdf

Actividad 3: Intervalos de Confianza para 1 población

CASO 3-2: IRSE DE PESCA CON MINITAB______________________________ Sabemos que la longitud de un determinado pez sigue una distribución normal de media 69 cm y desviación estándar 3 cm. 1. Simular, con ayuda del Minitab, la captura y posterior medición de 9 peces. Repetir esta

simulación hasta un total de 20 veces (con lo que habréis pescado 180 peces).

Seleccionamos Calc > Random Data > Normal :

Obtendréis algo similar a lo que se muestra en la siguiente ventana (los números no serán exactamente los mismos ya que el programa genera cada vez nuevos números aleatorios):

A3 - 3

Page 4: Actividad_3.pdf

Estadística Aplicada con Minitab

2. Para cada una de las 20 “capturas”, hallar el intervalo de confianza a nivel del 90% de la

media poblacional µ . ¿Cuántos de estos intervalos contienen el valor 69?.

Seleccionamos Stat > Basic Statistics > 1-Sample Z :

Z Confidence Intervals The assumed sigma = 3,00 Variable N Mean StDev SE Mean 90,0 % CI C1 9 69,62 2,09 1,00 ( 67,98; 71,27) C2 9 68,88 3,42 1,00 ( 67,24; 70,53) C3 9 69,15 2,69 1,00 ( 67,51; 70,80) C4 9 68,98 3,13 1,00 ( 67,34; 70,63) C5 9 68,56 2,48 1,00 ( 66,92; 70,21) C6 9 70,03 1,80 1,00 ( 68,38; 71,67) C7 9 67,93 3,42 1,00 ( 66,28; 69,57) C8 9 69,40 2,67 1,00 ( 67,76; 71,05) C9 9 69,41 3,65 1,00 ( 67,77; 71,06) C10 9 68,74 3,32 1,00 ( 67,10; 70,39) C11 9 67,43 2,70 1,00 ( 65,78; 69,07) C12 9 68,01 3,93 1,00 ( 66,36; 69,65) C13 9 68,38 3,08 1,00 ( 66,73; 70,02) C14 9 69,44 3,12 1,00 ( 67,80; 71,09) C15 9 68,67 1,65 1,00 ( 67,02; 70,31) C16 9 70,31 2,24 1,00 ( 68,67; 71,96) C17 9 70,23 3,35 1,00 ( 68,58; 71,87) C18 9 67,92 3,95 1,00 ( 66,27; 69,56) C19 9 68,99 4,00 1,00 ( 67,34; 70,63) C20 9 70,20 1,69 1,00 ( 68,56; 71,85)

En este caso, los 20 intervalos contienen el verdadero valor de la media µ = 69. Es de esperar que aproximadamente un 90% de los intervalos contengan dicho valor. Por tanto, para el caso de 20 intervalos, lo esperable es que aproximadamente 18 de ellos contengan el valor 69. ¿Qué habéis obtenido vosotros?.

A3 - 4

Page 5: Actividad_3.pdf

Actividad 3: Intervalos de Confianza para 1 población

3. Repetid el punto anterior tomando ahora un intervalo de confianza del 95%. ¿Son los intervalos resultantes más amplios o son más estrechos?.

De forma análoga a la anterior, obtendréis unos resultados similares a los siguientes: Z Confidence Intervals The assumed sigma = 3,00 Variable N Mean StDev SE Mean 95,0 % CI C1 9 69,62 2,09 1,00 ( 67,66; 71,58) C2 9 68,88 3,42 1,00 ( 66,92; 70,84) C3 9 69,15 2,69 1,00 ( 67,19; 71,11) C4 9 68,98 3,13 1,00 ( 67,02; 70,94) C5 9 68,56 2,48 1,00 ( 66,60; 70,52) C6 9 70,03 1,80 1,00 ( 68,07; 71,99) C7 9 67,93 3,42 1,00 ( 65,97; 69,89) C8 9 69,40 2,67 1,00 ( 67,44; 71,36) C9 9 69,41 3,65 1,00 ( 67,45; 71,37) C10 9 68,74 3,32 1,00 ( 66,78; 70,71) C11 9 67,43 2,70 1,00 ( 65,47; 69,39) C12 9 68,01 3,93 1,00 ( 66,05; 69,97) C13 9 68,38 3,08 1,00 ( 66,42; 70,34) C14 9 69,44 3,12 1,00 ( 67,48; 71,40) C15 9 68,67 1,65 1,00 ( 66,71; 70,63) C16 9 70,31 2,24 1,00 ( 68,35; 72,27) C17 9 70,23 3,35 1,00 ( 68,27; 72,19) C18 9 67,92 3,95 1,00 ( 65,96; 69,88) C19 9 68,99 4,00 1,00 ( 67,03; 70,95) C20 9 70,20 1,69 1,00 ( 68,24; 72,16) En este caso, sería de esperar que aproximadamente el 95% de los intervalos contuviese el valor 69. En

mi caso se da la circunstancia de que todos los intervalos lo contienen, lo cual era previsible dado que ya ocurría lo mismo en el punto anterior y que ahora los intervalos son algo más amplios que los anteriores: si mantenemos el tamaño muestral (n = 9 en este caso) constante, el aumentar el nivel de confianza (o probabilidad de que el intervalo contenga a la media) implica aumentar la amplitud del intervalo.

4. Repetid los puntos 1 y 2, esta vez con n = 100 en lugar de n = 9. ¿Qué ocurre con la

amplitud de los intervalos?. Nuevamente, es de esperar que aproximadamente 18 intervalos (un 90% de los 20) contengan el valor

69. Observaréis también que la amplitud de los intervalos ha disminuido considerablemente con respecto a la del punto 2. Ello es debido a que al aumentar el tamaño muestral n de 9 a 100 disponemos de mucha más información, por lo que podemos precisar mucho más el intervalo en el cual se espera (con probabilidad 0,9) que esté contenida la media.

A3 - 5

Page 6: Actividad_3.pdf

Estadística Aplicada con Minitab

CASO 3-3: TEST DE INTELIGENCIA____________________________________ A continuación se muestran los resultados de un test de inteligencia realizado a 53 alumnos escogidos al azar de entre los estudiantes de un centro de secundaria privado y elitista: 79 99 118 78 120 111 82 116 102 120 114 82 123 106 95 110 117 117 106 107 90 107 105 125 100 86 125 97 98 124 104 117 86 95 98 111 126 111 129 124 105 98 93 90 84 110 111 115 111 91 80 110 102 1. Comprobar si estos datos se distribuyen de forma aproximadamente normal.

Seleccionamos Stat > Basic Statistics > Normality Test :

Av erage: 104,906StDev : 13,8762N: 53

Anderson-Darling Normality TestA-Squared: 0,445P-Value: 0,274

80 90 100 110 120 130

,001

,01,05

,20

,50

,80

,95,99

,999

Prob

abilit

y

C1

Test de Normalidad

A3 - 6

Page 7: Actividad_3.pdf

Actividad 3: Intervalos de Confianza para 1 población

Se comprueba en el gráfico anterior que, en efecto, podemos suponer que la distribución de estos datos es aproximadamente normal ya que los puntos se aproximan bastante a la línea roja (más adelante veremos que también es posible llegar a tal conclusión a partir del p-valor que aparece en el margen inferior derecho de la gráfica).

2. Hallar un intervalo de confianza a nivel del 93% para la media poblacional.

Seleccionamos Stat > Basic Statistics > 1-Sample t :

Como se aprecia en el siguiente output, podemos afirmar que, con una probabilidad del 0,93, la media de las puntuaciones que obtendrían los alumnos de dicho centro en el test de inteligencia anterior estaría entre 101,38 y 108,43 puntos:

T Confidence Intervals Variable N Mean StDev SE Mean 93,0 % CI C1 53 104,91 13,88 1,91 ( 101,38; 108,43)

A3 - 7

Page 8: Actividad_3.pdf

Estadística Aplicada con Minitab

CASO 3-4: EL PESO MEDIO DE LAS ACEITUNAS________________________

Hemos seleccionado al azar 21 envases similares que contienen aceitunas de una determinada marca y lote. Después de escurrir las aceitunas de cada bote, las hemos pesado, obteniendo los siguientes resultados (en gramos): 110 105 112 116 122 120 109 118 114 120 121 108 115 116 118 120 117 109 112 116 114 1. Calcular la media y la desviación estándar muestral. Estudiar si los datos se distribuyen

de forma aproximadamente normal.

De forma análoga a razonamientos anteriores, se obtiene el siguiente output: Descriptive Statistics Variable N Mean Median TrMean StDev SE Mean C1 21 114,86 116,00 115,00 4,75 1,04 Variable Minimum Maximum Q1 Q3 C1 105,00 122,00 111,00 119,00

Para determinar si los datos se distribuyen de forma aproximadamente normal, podemos optar por usar un histograma o bien por realizar un test de normalidad. En este caso el test de normalidad es bastante más claro que el histograma a la hora de garantizar que es posible usar la hipótesis de normalidad:

105 107 109 111 113 115 117 119 121 123

0

1

2

3

4

C1

Freq

uenc

y

Histogram of C1, with Normal Curve

A3 - 8

Page 9: Actividad_3.pdf

Actividad 3: Intervalos de Confianza para 1 población

Av erage: 114,857StDev : 4,74643N: 21

Anderson-Darling Normality TestA-Squared: 0,310P-Value: 0,527

105 110 115 120

,001

,01,05

,20

,50

,80

,95,99

,999

Prob

abilit

y

C1

Test de Normalidad

2. Suponiendo que el peso de las aceitunas de cada envase del lote es una variable que se

distribuyen de forma aproximadamente normal, construir un intervalo de confianza al nivel del 98% para estimar el peso medio de las aceitunas contenidas en cada bote.

Siguiendo los pasos descritos en el problema anterior, llegaremos al siguiente output, donde se aprecia que el intervalo de confianza para µ al nivel deseado es (112,24 , 117,48) :

T Confidence Intervals Variable N Mean StDev SE Mean 98,0 % CI C1 21 114,86 4,75 1,04 ( 112,24; 117,48)

A3 - 9