1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico...

31
1

Transcript of 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico...

Page 1: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

1

Page 2: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

2

Page 3: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

• Si la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado en la media, (μ - k, μ + k), tal que la probabilidad de que x pertenezca a dicho intervalo es p:

• P(μ – k < x < μ + k) = p

3

Page 4: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

• Ejemplo_1

• Hallemos el intervalo característico de una distribución normal N(0, 1) correspondiente a la probabilidad p=0,9.

• Si dentro del intervalo hay un área de 0,9, fuera de él habrá 0,1.

• Puesto que el intervalo es simétrico, el área de cada una de las dos colas es de 0,05. Por tanto: P (z > k) = 0,05 P (z ≤ k) = 0,95

• En las tablas encontramos p(1,64) = 0,9495, p (1,65) = 0,9505.

• Por tanto, asignaremos a k el punto medio de los valores 1,64 y 1,65. Es decir, k = 1,645 y, por tanto, P (-1,645 < z < 1,6451) = 0,9.

• Hemos encontrado un intervalo [-1,645; 1,6451], simétrico respecto al O, dentro del cual hay un área del 90% del total.

4

Page 5: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

• En una distribución normal N(0, 1), si (-k, k) es el intervalo característico correspondiente a una probabilidad p, diremos que k es el valor crítico correspondiente a p.

• Principales valores críticos

• 1 – α α/2 zα/2

• 0,9 0,05 1,645• 0,95 0,025 1,96• 0,99 0,005 2,575

5

Page 6: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

• A efectos prácticos podemos convertir una distribución normal N( μ, σ ) en una distribución normal tipificada o estándar N( 0, 1) , mediante el cambio de variable:

X - μ

Z = ---------

σ

• Operando tenemos: X - μ = Z.σ X = μ + Z.σ PERO K=X

• En una distribución N( μ, σ ) el intervalo característico correspondiente a una probabilidad p=1 – α es:

(-k, k) = (μ – Zα/2.σ , μ + Zα/2.σ)

• P(μ – k < x < μ + k) = p P(μ – Zα/2.σ < x < μ + Zα/2.σ ) = p

6

Page 7: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

• En una distribución normal N(0, 1), si (-k, k) es el intervalo característico correspondiente a una probabilidad p, diremos que k es el valor crítico correspondiente a p.

• Probabilidades Valor crítico Intervalos característicos

1 – α α/2 zα/2 (μ – Zα/2.σ , μ + Zα/2.σ)

• 0,9 0,05 1,645 (μ – 1,645.σ , μ + 1,645.σ)• 0,95 0,025 1,96 (μ – 1,965.σ , μ + 1,96.σ)• 0,99 0,005 2,575 (μ – 2,575.σ , μ + 2,575.σ)

7

Page 8: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

8

0,05 0,90 0,05-k 0 k=zα/2

0,025 0,95 0,025

0,005 0,99 0,005

•– 4.σ – σ μ + σ + 4.σ

Page 9: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

•  • Es el procedimiento utilizado para conocer las características

de un parámetro poblacional, a partir del conocimiento de la muestra.

• Con una muestra aleatoria, de tamaño n, podemos efectuar una estimación de un valor de un parámetro de la población; pero también necesitamos precisar un:

• Intervalo de confianza • Se llama así a un intervalo en el que sabemos que está un

parámetro, con un nivel de confianza específico.• Nivel de confianza (1- α )• Probabilidad de que el parámetro a estimar se encuentre en

el intervalo de confianza.• Nivel de significacion (α ) o riesgo admisible• Valor critico ( k) como (zα/2)

• Error de estimación admisible (E) • Que estará relacionado con el radio del intervalo de

confianza.

Page 10: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

• EJEMPLOS DE MEDIA MUESTRAL, x

• La media de las edades de una muestra de alumnos es de 15,25 años.• La media del sueldo bruto de una muestra de trabajadores es de 1250

€.• La media de fallos cometidos en una muestra de dictados es de 21,35 • EJEMPLOS DE PROPORCIÓN MUESTRAL, p’

• En una muestra de alumnos 3 de cada 7 han suspendido.• En una muestra de trabajadores el 18,37 % están en el paro.• De los 200 asistentes, 5 adquirieron algún producto de la empresa.

• NOTACIONES

• En una población la media muestral es μ, y la desviación típica, σ.• En una población la proporción media es μ = p, y la desviación típica, σ.

10

Page 11: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

•  • Es el procedimiento utilizado para conocer las

características de un parámetro poblacional, a partir del conocimiento de la muestra.

• Con una muestra aleatoria, de tamaño n, podemos efectuar una estimación de un valor de un parámetro de la población; pero también necesitamos precisar un:

• Intervalo de confianza• Se llama así a un intervalo en el que sabemos que está un

parámetro, con un nivel de confianza específico.• Nivel de confianza• Probabilidad de que el parámetro a estimar se encuentre

en el intervalo de confianza.• Error de estimación admisible • Que estará relacionado con el radio del intervalo de

confianza.

Page 12: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

Si una población tiene media μ y desviación típica σ, y tomamos muestras de tamaño n (n>30, ó cualquier tamaño si la población es "normal"), las medias de estas muestras siguen aproximadamente la distribución:

Estimación de la media de una población

n

xZ

0

Page 13: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

• Si en una población, una determinada característica se presenta en una proporción p, la proporción p' , de individuos con dicha característica en las muestras de tamaño n, se distribuirán según:

Page 14: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

• El tiempo que tardan las cajeras de un supermercado en cobrar a los clientes sigue una ley normal con media desconocida y desviación típica 0,5 minutos. Para una muestra aleatoria de 25 clientes se obtuvo un tiempo medio de 5,2 minutos.

• 1.Calcula el intervalo de confianza al nivel del 95% para el tiempo medio que se tarda en cobrar a los clientes.

• 2.Indica el tamaño muestral necesario para estimar dicho tiempo medio con un el error de ± 0,5 minutos y un nivel de confianza del 95%.

Page 15: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

n ≥ 4

Page 16: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

• En una fábrica de componentes electrónicos, la proporción de componentes finales defectuosos era del 20%. Tras una serie de operaciones e inversiones destinadas a mejorar el rendimiento se analizó una muestra aleatoria de 500 componentes, encontrándose que 90 de ellos eran defectuosos. ¿Qué nivel de confianza debe adoptarse para aceptar que el rendimiento no ha sufrido variaciones?

• p = 0.2 q = 1 - p =0.8 p'= 90/ 500 = 0.18• E = 0.2 - 0.18 = 0.02

P (1 - zα/2 <1.12) = 0.86861 - 0.8686 = 0.13140.8686 - 0.1314 = 0.737Nivel de confianza: 73.72%

Page 17: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

17

Prueba de hipótesis

Page 18: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

• Una creencia sobre la población, principalmente sus parámetros:• Media• Varianza• Proporción/Tasa

• OJO: Si queremos contrastarla, debe establecerse antes del análisis.

• Dicha creencia puede ser o no ser verdadera

Unidad III: Prueba de Hipotesis 18

Page 19: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

años 20XUnidad III: Prueba de Hipotesis 19

Creo que la edad media es 17

años...

Son demasiados...

¡Gran diferencia!

Rechazo la hipótesis

Muestra aleatoria

Page 20: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

• Hipótesis nula Ho• La que contrastamos

• Los datos pueden refutarla

• No debería ser rechazada sin una buena razón.

• Hipótesis Alternativa H1• Niega a H0

• Los datos pueden mostrar evidencia a favor

• No debería ser aceptada sin una gran evidencia a favor.

Unidad III: Prueba de Hipotesis 20

:H

:H

1

0%50p

%50p

, ,

, ,

Page 21: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

60.1

Unidad III: Prueba de Hipotesis 21

• Problema: ¿La altura media o promedio de los estudiantes de la UASF es 1.60 m?

• Solución:

• Traducir a lenguaje estadístico:

• Establecer su opuesto:

• Seleccionar la hipótesis nula

60.1

60.1:0 H

Page 22: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

000,20

Unidad III: Prueba de Hipotesis 22

• Problema: El tiempo de vida promedio de una determinada pieza usada en el ensamblaje de una marca de computadoras es de 20,000 horas.

• Solución:

– Traducir a lenguaje estadístico:

– Establecer su opuesto:

– Seleccionar la hipótesis nula

000,20

000,20:0 H

Page 23: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

23

¿Quién es H0?

Problema: El porcentaje de personas atacadas por cierta epidemia es una ciudad grande, no es mayor del 10%.

Solución:

Traducir a lenguaje estadístico:

Establecer su opuesto:

Seleccionar la hipótesis nula

10.0p

10.0p

10.0:0 pH

Page 24: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

• Durante los últimos semestres, el profesor de Estadística de una universidad ha registrado que el rendimiento medio de sus alumnos es de 14 puntos. Este año le ha tocado 40 alumnos sobresalientes porque su rendimiento medio ha sido 17 puntos y el profesor les proclama como superiores a todos los alumnos que ha tenido en la fecha. • Qué hipótesis plantearía?

24

14:1 H

14:0 H

Page 25: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

Región crítica• Valores ‘improbables’ si...• Es conocida antes de realizar

el experimento: resultados experimentales que refutarían H0

Nivel de significación: • Número pequeño: 1% , 5%• Fijado de antemano por el

investigador• Es la probabilidad de rechazar

H0 cuando es cierta

25

No rechazo H0

Reg. Crit.Reg. Crit.

=5%

=40

Page 26: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

Unidad III: Prueba de Hipotesis 26

La posición de la región crítica depende de la hipótesis alternativa

Unilateral Unilateral

Bilateral

H1: <20 H1: >20

H1: 20

Page 27: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

• El nivel de significación α se concentra en dos partes (o colas) simétricas respecto de la media.

• La región de aceptación en este caso no es más que el correspondiente intervalo de probabilidad para x o p', es decir:

Page 28: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

• Contraste unilateral•  • Caso 1

• La hipótesis nula es del tipo H0: μ ≥ k (o bien H0: p ≥ k).

• La hipótesis alternativa, por tanto, es del tipo H1: μ < k (o bien H1: p < k).

• El nivel de significación α se concentra en una parte o cola. • La región de aceptación en este caso será:

1 - α α z α

0.90 0.10 1.28

0.95 0.05 1.645

0.99 0.01 2.33

Page 29: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

• Caso 2

• La hipótesis nula es del tipo H0: μ ≤ k (o bien H0: p ≤ k).

• La hipótesis alternativa, por tanto, es del tipo H1: μ > k (o bien H1: p > k).

• La región de aceptación en este caso será:

Page 30: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

Bilateral H0=k H1 ≠ k

Unilater

al

H0≥ k H1 < k

H0 ≤k H1> k

1. Enunciar la hipótesis nula H0 y la alternativa H1.Bilateral H0=k H1 ≠ kUnilateral H0≥ k H1 < k

H0 ≤k H1> k

2.A partir de un nivel de confianza 1 - α o el de significación α. Determinar:

-El valor zα/2 (bilaterales), o bien zα (unilaterales)-La zona de aceptación del parámetro muestral (x o p') o intervalo de confianza

3.Verificacion : Calcular el parametro muestral x o p', a partir de la muestra.

4. Si el valor del parámetro muestral está dentro de la zona de la aceptación, se acepta la hipótesis con un nivel de significación α. Si no, se rechaza.

Page 31: 1. 2 S i la variable x tiene una distribución de media μ, se llama intervalo característico correspondiente a una probabilidad p a un intervalo centrado.

• Se sabe que la desviación típica de las notas de cierto examen de Matemáticas es 2,4. Para una muestra de 36 estudiantes se obtuvo una nota media de 5,6. ¿Sirven estos datos para confirmar la hipótesis de que la nota media del examen fue de 6, con un nivel de confianza del 95%?

1. Enunciamos las hipótesis nula y alternativa:H0 : μ = 6 La nota media no ha variado.H1 : μ ≠ 6 La nota media ha variado.2. Zona de aceptación Para α = 0.05, le corresponde un valor crítico: zα/2 = 1.96.Determinamos el intervalo de confianza para la media:(6-1,96 · 0,4 ; 6+1,96 · 0,4) = (5,22 ; 6,78)

3. Verificación. Valor obtenido de la media de la muestra: 5,6 .

4. Decisión• Aceptamos la hipótesis nula H0, con un nivel de significación del 5%.