7. Inferencia en poblaciones...

26
Informática. Universidad Carlos III de Madrid 1 7. Inferencia en poblaciones normales

Transcript of 7. Inferencia en poblaciones...

Page 1: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid1

7. Inferencia en poblaciones normales

Page 2: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid2

Tema 7: Inferencia en poblaciones normales

1. Inferencia en muestras pequeñas2. Inferencia con la distribución t de Student3. Inferencia sobre μ4. Inferencia sobre σ²

Page 3: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid3

1. Inferencia en muestras pequeñas

En el tema anterior usamos que si X es una v. aleatoria de interés con distribución cualquiera y con

si n es grande (n>30)

Construimos métodos estadísticos basados en la aproximación a esa normal

¿Y si n no es grande?

Page 4: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid4

1. Inferencia en muestras pequeñas

¿Y si n no es grande?

Las propiedades estadísticas de

/X

σ−

ˆ /XS n

μ−

cambian!! Dependen de la distribución de X

Los intervalos y los contrastes del tema anterior no serían correctos

En el caso de X normal, se tiene que independientemente del tamaño de n

(0,1)/

X Nnμ

σ− ∼ ˆ /

XS n

μ− ∼ Distribución

t de Student

Page 5: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid5

Tema 7: Inferencia en poblaciones normales

1. Inferencia en muestras pequeñas2. Inferencia con la distribución t de Student3. Inferencia sobre μ4. Inferencia sobre σ²

Page 6: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid6

2. Inferencia con la distribución t de Student

• La distribución t de Student es una variable aleatoria continua, simétrica, de media cero, y de perfil muy parecido a la normal estándar.

• Depende de un parámetro g que se denomina grados de libertad. Su notación habitual es tg

Page 7: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid7

2. Inferencia con la distribución t de Student

Puede demostrarse que si X∼N(μ,σ²),

1ˆ / nX tS n

μ−

− ∼La distribución cambia con n

Si el tamaño muestral es grande

1 (0,1)ˆ / nX t NS n

μ−

− ∼ ∼

Page 8: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid8

Tema 7: Inferencia en poblaciones normales

1. Inferencia en muestras pequeñas2. Inferencia con la distribución t de Student3. Inferencia sobre μ4. Inferencia sobre σ²

Page 9: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid9

3. Inferencia sobre μ

Intervalos de confianza para m

αα μ −

⎧ ⎫⎪ ⎪− ∈ ±⎨ ⎬⎪ ⎪⎩ ⎭

1; /2

ˆ(1 ) : n

SIC X t

n

en lugar de α /2z

Page 10: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid10

En una explotación minera las rocas excavadas se someten a un análisis químico para determinar su contenido de Cadmio. Después de analizar 25 rocas se obtiene que

Ejemplo

= 9.77x

Suponiendo que el contenido de Cadmio sigue una distribución normal. Se quiere construir un intervalo de confianza al 95% para el

contenido medio de Cadmio en las rocas de la mina.

=ˆ 3.164s

αα μ −

⎧ ⎫⎪ ⎪− ∈ ±⎨ ⎬⎪ ⎪⎩ ⎭

1; /2

ˆ(1 ) : n

SIC X t

n

Page 11: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid11

En una explotación minera las rocas excavadas se someten a un análisis químico para determinar su contenido de Cadmio. Después de analizar 25 rocas se obtiene que

Ejemplo

= 9.77x

Suponiendo que el contenido de Cadmio sigue una distribución normal. Se quiere construir un intervalo de confianza al 95% para el

contenido medio de Cadmio en las rocas de la mina.

=ˆ 3.164s

Para n=25

y a=0.05

a/2=0.025

=24;0.025 2.06t

μ ⎧ ⎫∈ ± =⎨ ⎬⎩ ⎭

3.164(0.95) : 9.77 2.06 (8.47,11.07)

25IC

Page 12: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid12

Para n=25

y a=0.05a/2=0.025

=24;0.025 2.06t

Usando la aproximación N(0,1) como si fuese para muestras grandes...

a/2=0.025

=0.025 1.96z

Page 13: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid13

μ ⎧ ⎫∈ ± =⎨ ⎬⎩ ⎭

3.164(0.95) : 9.77 2.06 (8.47,11.07)

25IC

Usando la t de Student: intervalo exacto

μ ⎧ ⎫∈ ± =⎨ ⎬⎩ ⎭

3.1649.77 1.96 (8.53,11)

25

Usando la aproximación a N(0,1) para muestras grandes

Si no usamos la t de Student, daremos un intervalo más estrecho del que tiene realmente un confianza del 95%. Este intervalo tiene una confianza menor de la que pensamos

Para poblaciones normales usaremos siempre la t de Student

Page 14: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid14

3. Inferencia sobre μ

Contraste de hipótesis

(a) H0:μ=μ0; frente a H1:μ≠μ0,

(b) H0:μ≤μ0; frente a H1:μ>μ0,

(c) H0:μ≥μ0; frente a H1:μ<μ0.

Se hacen igual, pero usando las siguientes distribuciones de referencia

00 (0,1)

/XZ N

σ−

= ∼ 00 1ˆ / n

XT tS n

μ−

−= ∼

Page 15: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid15

0 0 1 0: ; :H Hμ μ μ μ≥ <

0 0 1 0: ; :H Hμ μ μ μ≤ >

0 0 1 0: ; :H Hμ μ μ μ= ≠

PASO 1: PASO 2:

PASO 3:

(a)

Rechazo H0 Rechazo H0

Acepto H0

(a)

(b)

Rechazo H0

Acepto H0

(b)

(c)

Rechazo H0 Acepto H0

(c)

PASO 4:

La región de rechazo está donde señala H1

0 (0,1)Z N∼

0 1nT t −∼

α /2zα− /2zα−1; /2ntα−− 1; /2nt

αzα−1;nt

α−zα−− 1;nt

Page 16: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid16

Ejemplo Se quiere saber si la media de la ganancia β de los transistoresBC547B se mantiene el valor nominal μ=290

H0 : μ=290 H1: μ≠290

Con 100 datos:

p-valor del test de la chi-cuadrado para el ajuste de una normal:

p-value=0.43

Podemos asumir normalidad en X

Page 17: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid17

Ejemplo Se quiere saber si la media de la ganancia β de los transistoresBC547B se mantiene el valor nominal μ=290

H0 : μ=290 H1: μ≠290

Con 100 datos:

Rechazo H0 Rechazo H0

Acepto H0

(a)99;0.025t− 99;0.025t

a=0.05

1.98-1.98=0.025( 1.96)z

Con un nivel de significación del 5%, rechazamos H0

La diferencia entre los datos y 290 es significativa

El tamaño muestral es grande, y por eso el valor crítico es muy similar al de

N(0,1)

Page 18: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid18

Tema 7: Inferencia en poblaciones normales

1. Inferencia en muestras pequeñas2. Inferencia con la distribución t de Student3. Inferencia sobre μ4. Inferencia sobre σ²

Page 19: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid19

4. Inferencia sobre σ²

Estimadores de s2

( )2

2 1

n

ii

X XS

n=

−=∑ ( )2

2 1ˆ1

n

ii

X XS

n=

−=

sesgado (cuasivarianza)

insesgado

En poblaciones normales, la distribución muestral de estos estimadores está relacionada con la distribución chi-cuadrado

Page 20: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid20

La distribución c2

• La c2 es una variable aleatoria no negativa. Es asimétrica positiva

• Depende de un parámetro g que se llama grados de libertad

• Su notación es2gχ

Si X es normal

22

12

ˆ( 1)n

n S χσ −− ∼

22

12 nnS χσ −∼

4. Inferencia sobre σ²

Page 21: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid21

4. Inferencia sobre σ²

Intervalos de confianza para σ²

Operando igual que en el caso de la media...

No son simétricos alrededor de la

estimación

2 22

2 21; / 2 1;1 / 2

ˆ ˆ( 1) ( 1)(1 ) : ;n n

n s n sICα α

α σχ χ− − −

⎧ ⎫⎪ ⎪− −⎪ ⎪− ∈⎨ ⎬⎪ ⎪⎪ ⎪⎩ ⎭

2 22

2 21; / 2 1;1 / 2

(1 ) : ;n n

ns nsICα α

α σχ χ− − −

⎧ ⎫⎪ ⎪⎪ ⎪− ∈⎨ ⎬⎪ ⎪⎪ ⎪⎩ ⎭

Page 22: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid22

En una explotación minera las rocas excavadas se someten a un análisis químico para determinar su contenido de Cadmio. Después de analizar 25 rocas se obtiene que

Ejemplo

= 9.77x

Suponiendo que el contenido de Cadmio sigue una distribución normal. Se quiere construir un intervalo de confianza al 99% para la varianza poblacional s2

=ˆ 3.164s =2ˆ 10.01s

2 22

2 21; / 2 1;1 / 2

ˆ ˆ( 1) ( 1)(1 ) : ;n n

n s n sICα α

α σχ χ− − −

⎧ ⎫⎪ ⎪− −⎪ ⎪− ∈⎨ ⎬⎪ ⎪⎪ ⎪⎩ ⎭

Page 23: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid23

En una explotación minera las rocas excavadas se someten a un análisis químico para determinar su contenido de Cadmio. Después de analizar 25 rocas se obtiene que

Ejemplo

= 9.77x

Suponiendo que el contenido de Cadmio sigue una distribución normal. Se quiere construir un intervalo de confianza al 99% para la varianza poblacional s2

=ˆ 3.164s

a/2=0.005 a/2=0.005

224;0.995 9.89χ = 2

24;0.005 45.6χ =

Para una confianza del 99% tenemos a/2=0.005

2 22 24 3.165 24 3.165(0.99) : ,

45.6 9.89IC σ

⎛ ⎞× ×∈⎜ ⎟⎝ ⎠

( )2(0.99) : 5.27,24.29IC σ ∈

=2ˆ 10.01s

¿Podría ser σ2=25?

Page 24: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid24

4. Inferencia sobre σ²

Contraste de hipótesis para σ²

(a): H0 : σ²=σ0²; H1: σ²≠σ0²

(b): H0 : σ²≤σ0²; H1: σ²>σ0²

(c): H0 : σ²≥σ0²; H1: σ²<σ0²

Estadístico de contraste

220 2

0

ˆ( 1)n SXσ−

=

2 20 1nX χ −∼

220 2

0

nSXσ

=

Sigue la misma metodología que para otros parámetros

Distribución de referencia

Page 25: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid25

PASO 1: PASO 2:

PASO 3:

(a)

Rechazo H0 Rechazo H0

Acepto H0

(a)

(b)

(c)

PASO 4:

La región de rechazo está donde señala H1

H0 : σ²=σ0²; H1: σ²≠σ0²

H0 : σ²≥σ0²; H1: σ²<σ0²

H0 : σ²≤σ0²; H1: σ²>σ0²

220 2

0

ˆ( 1)n SXσ−

=

220 2

0

nSXσ

=

2 20 1nX χ −∼

21; / 2n αχ −

21;1 / 2n αχ − −

Rechazo H0Acepto H0

21;n αχ −

(b)

Rechazo H0Acepto H0

21;1n αχ − −

(c)

Page 26: 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid26

Ejemplo Sobre los transistores BC547B mencionados anteriormente, teníamos el objetivo de comprobar si la media no había cambiado, así como comprobar si la varianza no había aumentado. Podemos ahora contrastar este segundo punto. Los datos históricos decían que σ0²=760. Por tanto el contraste es

H0:σ²≤760;H₁:σ²>760.

Rechazo H0Acepto H0

299;0.05 123.2χ =

Con 100 datos2ˆ 766.85s =

220 2

0

ˆ( 1) 99 766.85 99.89760

n sxσ− ×

= = =

No rechazamos H0

La diferencia entre los datos y la hipótesis no es significativa

(con nivel 5%) y puede deberse al azar de la muestra