Introducción a la Inferencia Estadistica

46
Introducción a la Inferencia Estadistica Dept. of Marine Science and Applied Biology Jose Jacobo Zubcoff

description

Introducción a la Inferencia Estadistica. Dept. of Marine Science and Applied Biology Jose Jacobo Zubcoff. Introducción a la Inferencia Estadistica. Intervalo de confianza para la media poblacional,  conocido. Intervalos de confianza. - PowerPoint PPT Presentation

Transcript of Introducción a la Inferencia Estadistica

Page 1: Introducción a la Inferencia Estadistica

Introducción a la Inferencia Estadistica

Dept. of Marine Science and Applied BiologyJose Jacobo Zubcoff

Page 2: Introducción a la Inferencia Estadistica

Intervalos de confianza

Intervalos de confianza: sirven para estimar el valor de un Parámetro de la población.

Un intervalo de confianza del 1-α% para un parámetro es un intervalo de valores calculado a partir de los datos de la muestra

Probabilidad 1-α de que contenga el verdadero valor del parámetro. El nivel de confianza suele ser 0,90 (90%), 0,95 (95%) ó 0,99 (99%).

Interpretación práctica

Introducción a la Inferencia Estadistica

Intervalo de confianza para la media poblacional, conocido

Page 3: Introducción a la Inferencia Estadistica

Introducción a la Inferencia Estadistica

Intervalo de confianza para la media poblacional, conocido

Page 4: Introducción a la Inferencia Estadistica

La media muestral y la desviación estándar son buenos estimadores

Estos estimadores son a la vez variables aleatorias. Tienen una determinada distribución, en el caso de la media es Normal.

Así pues podemos calcular un intervalo de valores [a,b] tales que

)( bXaP = C

Introducción a la Inferencia Estadistica

Intervalo de confianza para la media poblacional, conocido

Page 5: Introducción a la Inferencia Estadistica

Intervalo de confianza para la media poblacional, conocido

Supongamos que disponemos de una población en la que tenemos una v.a. con distribución N(,) con conocida.

Obtenemos una muestra de tamaño n y deseamos estimar la media de la población.

El estimador puntual de la misma es la media muestral cuya distribución muestral es conocida

),(n

x

n

xZ

tendrá distribución

normal estándarEl estadístico

Introducción a la Inferencia Estadistica

Page 6: Introducción a la Inferencia Estadistica

Sobre la distribución N(0 , 1) podremos seleccionar dos puntos simétricos -z/2 y z /2 , tales que

P(-z /2 Z z /2 ) = 1-

Intervalo de confianza para la media poblacional, conocido

Introducción a la Inferencia Estadistica

Page 7: Introducción a la Inferencia Estadistica

Sustituyendo Z

12/2/ z

n

xzP

Despejando nos queda el intervalo de confianza,

12/2/

nzx

nzxP

Intervalo de confianza para la media poblacional, conocido

Introducción a la Inferencia Estadistica

Page 8: Introducción a la Inferencia Estadistica

Gráficamente: para una normal tipificada, un intervalo de confianza del 95% se puede representar como:

95%

2.5%2.5%

La probabilidad de que una variable normal tipificada tome valores en el intervalo

[-1.96,1.96] es del 95%.

Introducción a la Inferencia Estadistica

Intervalo de confianza para la media poblacional, conocido

Page 9: Introducción a la Inferencia Estadistica

Intervalo de confianza para la media poblacional, conocido

Ejemplo,• Obtener un I. C. del 95% para el promedio de una poblacion de 500

novillos, de los cuales se pesa una muestra de 25 animales, obteniéndose =390 kg. Se sabe que 2 es de 400 kg2.x

Introducción a la Inferencia Estadistica

Page 10: Introducción a la Inferencia Estadistica

Ejemplo,• Obtener un I. C. del 95% para el promedio de una poblacion de 500

novillos, de los cuales se pesa una muestra de 25 animales, obteniéndose =390 kg. Se sabe que 2 es de 400 kg2.x

Introducción a la Inferencia Estadistica

12/2/

nzx

nzxP

Intervalo de confianza para la media poblacional, conocido

Page 11: Introducción a la Inferencia Estadistica

Ejemplo,• Obtener un I. C. del 95% para el promedio de una poblacion de 500

novillos, de los cuales se pesa una muestra de 25 animales, obteniéndose =390 kg. Se sabe que 2 es de 400 kg2.x

25

2096.1390

25

2096.1390

84,39716,382

Introducción a la Inferencia Estadistica

12/2/

nzx

nzxP

Intervalo de confianza para la media poblacional, conocido

Page 12: Introducción a la Inferencia Estadistica

Si la varianza poblacional es desconocida y la variable es normal

(o se puede aproximar a la normal por el Teorema central del límite)• Se usa la t de Student, • Con n –1 grados de libertad • Desvíación típica muestral.

El intervalo de confianza resulta

1)1;2/()1;2/(

n

stx

n

stxP nn

Intervalo de confianza para la media poblacional, conocido

Introducción a la Inferencia Estadistica

Page 13: Introducción a la Inferencia Estadistica

Ejemplo, En un establecimiento dedicado a la elaboración de alimentos para aves, se afirma que su producto aumenta el peso promedio de las aves en 30 gr. diarios. En una muestra de 9 aves tomadas al azar, se obtuvo un aumento promedio de 35gr. con desviación de 3,04 gr.

Estimar el intervalo de confianza al 95% para el verdadero aumento promedio

Intervalo de confianza para la media poblacional, conocido

Introducción a la Inferencia Estadistica

Page 14: Introducción a la Inferencia Estadistica

Ejemplo, En un establecimiento dedicado a la elaboración de alimentos para aves, se afirma que su producto aumenta el peso promedio de las aves en 30 gr. diarios. En una muestra de 9 aves tomadas al azar, se obtuvo un aumento promedio de 35gr. con desviación de 3,04 gr.

Estimar el intervalo de confianza al 95% para el verdadero aumento promedio

9

04.3306.235

9

04.3306.235

Intervalo de confianza para la media poblacional, conocido

Introducción a la Inferencia Estadistica

Page 15: Introducción a la Inferencia Estadistica

Ejemplo, En un establecimiento dedicado a la elaboración de alimentos para aves, se afirma que su producto aumenta el peso promedio de las aves en 30 gr. diarios. En una muestra de 9 aves tomadas al azar, se obtuvo un aumento promedio de 35gr. con desviación de 3,04 gr.

Estimar el intervalo de confianza al 95% para el verdadero aumento promedio

9

04.3306.235

9

04.3306.235

34.3766.32

Intervalo de confianza para la media poblacional, conocido

Introducción a la Inferencia Estadistica

Page 16: Introducción a la Inferencia Estadistica

Contrastes de Hipótesis

Introducción a la Inferencia Estadistica

Que es: hipótesis estadística es una afirmación respecto a alguna característica de una población. 

Ho : Hipótesis nula H1 : Hipótesis alternativa

Errores que se pueden cometer

Pueden ser unilaterales o bilaterales

Conclusiones a partir de una muestra aleatoria y significativa, permite aceptar o rechazar la hipótesis nula

Page 17: Introducción a la Inferencia Estadistica

No rechazo H0

Reg. Crit.Reg. Crit.

=5%

=40

Contrastes de Hipótesis

Introducción a la Inferencia Estadistica

Ho : μ = μo

H1 : μ ≠ μo

Contraste bilateral

Page 18: Introducción a la Inferencia Estadistica

4020X

Si supongo que H0 es cierta...

... el resultado del experimento sería improbable. Sin embargo ocurrió.

¿qué hace un científico cuando su teoría no coincide con sus predicciones?

Contrastes de Hipótesis

Introducción a la Inferencia Estadistica

Page 19: Introducción a la Inferencia Estadistica

4020X

... el resultado del experimento sería improbable. Sin embargo ocurrió.

Rechazo que H0 sea cierta.

Contrastes de Hipótesis

Introducción a la Inferencia Estadistica

Si supongo que H0 es cierta...

Page 20: Introducción a la Inferencia Estadistica

4038X

Si supongo que H0 es cierta...

... el resultado del experimento es coherente.

• No hay evidencia contra H0

• No se rechaza H0

• El experimento no es concluyente

• El contraste no es significativo

¿Si una teoría hace predicciones con éxito, queda probado que es cierta?

Contrastes de Hipótesis

Introducción a la Inferencia Estadistica

Page 21: Introducción a la Inferencia Estadistica

Región crítica• Es conocida antes de realizar el

experimento: resultados experimentales que refutarían H0

Nivel de significación: • Número pequeño: 1% , 5%• Fijado apriori por el investigador• Probabilidad de rechazar H0

cuando es cierta

No rechazo H0

Reg. Crit.Reg. Crit.

=5%

=40

Contrastes de Hipótesis

Introducción a la Inferencia Estadistica

Page 22: Introducción a la Inferencia Estadistica

La posición de la región crítica depende de la hipótesis alternativa

Unilateral Unilateral

Bilateral

H1: <40 H1: >40

H1: 40

Contrastes de Hipótesis

Introducción a la Inferencia Estadistica

Page 23: Introducción a la Inferencia Estadistica

Significación: p-valor

H0: =40

Contrastes de Hipótesis

Introducción a la Inferencia Estadistica

Page 24: Introducción a la Inferencia Estadistica

43X

No se rechazaH0: =40

H0: =40

Contrastes de Hipótesis

Introducción a la Inferencia Estadistica

Page 25: Introducción a la Inferencia Estadistica

43X

No se rechazaH0: =40

Significacion. P-valorProbabilidad de tener una muestra que discrepe aún más que la nuestra de H0. Probabilidad de obtener una muestra “más extraña” que la obtenida.P-valor es conocido después de realizar el experimento aleatorioEl contraste es no significativo cuando p>

P-valorP

Contrastes de Hipótesis

Introducción a la Inferencia Estadistica

Page 26: Introducción a la Inferencia Estadistica

50X

Se rechaza H0: =40

Se acepta H1: >40

Contrastes de Hipótesis

Introducción a la Inferencia Estadistica

Page 27: Introducción a la Inferencia Estadistica

P

P

50X

Se rechaza H0: =40

Se acepta H1: >40

El contraste es estadísticamente significativo cuando p<Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori.

Contrastes de Hipótesis

Introducción a la Inferencia Estadistica

Page 28: Introducción a la Inferencia Estadistica

• Sobre – Número pequeño,

elegido a priori antes de diseñar el experimento

– Conocido sabemos todo sobre la región crítica

• Sobre p– Es conocido tras realizar

el experimento

– Conocido p sabemos todo sobre el resultado del experimento

• Sobre el criterio de rechazo– Contraste significativo = p menor que

Contrastes de Hipótesis

Introducción a la Inferencia Estadistica

Page 29: Introducción a la Inferencia Estadistica

• Estamos estudiando el efecto del estrés sobre la presión arterial. Nuestra hipótesis es que la presión sistólica media en varones jóvenes estresados es mayor que 18 cm de Hg. Estudiamos una muestra de 36 sujetos:

X = 18,5 S = 3,6

• Plantear Contraste• Estadístico• Zona de Rechazo• P-valor• Conclusiones

• β

Contrastes de Hipótesis

Introducción a la Inferencia Estadistica

t(35)0,05=1,69T=0,833No esta en Región CríticaNo es > 1,69P-valor para T=0,833, y para 35 g.l. es aproximadamente 0,20

NO Se rechaza H0: <=18

H1: >18

Page 30: Introducción a la Inferencia Estadistica

El contraste es estadísticamente significativo cuando p<Pero que pasa cuando NO Rechazo?

El error cometido es βPara calcularla se debe concretar H1

μ1= 20 (Cuidado: el criterio para este valor no es estadístico)

Contrastes de Hipótesis

Introducción a la Inferencia Estadistica

Page 31: Introducción a la Inferencia Estadistica

Cuando Acepto Ho:

El error β es

P(Z<zα) tomando μ1= 20

Calculamos el Z correspondiente

Contrastes de Hipótesis

Introducción a la Inferencia Estadistica

En este caso hemos calculado βpara un n dado y para una

μ1

Page 32: Introducción a la Inferencia Estadistica

Calculo del Tamaño MuestralSe obtiene a partir de L2

Contrastes de Hipótesis

Introducción a la Inferencia Estadistica

L2 μ1μo

Podemos fijar n y calcular β

Podemos fijar β y entoncesdebemos calcular n para cumplir con ese error

ó

Page 33: Introducción a la Inferencia Estadistica

Calculo del Tamaño MuestralSe obtiene a partir de L2

Contrastes de Hipótesis

Introducción a la Inferencia Estadistica

L2 μ1μo

n = (zα + zβ)2 (σ/δ)2

En este caso hemos fijadoβ y entonces debemos calcular el n para cumplir con ese error

δ

Page 34: Introducción a la Inferencia Estadistica

Comportamiento de β, δ y el tamaño muestral

Contrastes de Hipótesis

Introducción a la Inferencia Estadistica

L2 μ1μo μ1μo

n = (zα + zβ)2 (σ/δ)2

Si fijamos β

n DISMINUYE cuando aumento δ

δ

Page 35: Introducción a la Inferencia Estadistica

• Intervalo de Confianza para la Varianza

Intervalo de Confianza

Introducción a la Inferencia Estadistica

Page 36: Introducción a la Inferencia Estadistica

• Plantear Contraste

Estadístico

Contrastes de Hipótesis para Varianza

Introducción a la Inferencia Estadistica

Page 37: Introducción a la Inferencia Estadistica

Contrastes para dos Poblaciones

Introducción a la Inferencia Estadistica

Page 38: Introducción a la Inferencia Estadistica

Contrastes para dos Poblaciones Independientes

Introducción a la Inferencia Estadistica

Varianzas Conocidas

Bilateral Unilateral

σx2 σy

2

( ) - ΔoZexpt =

P-valor = P(z > zexpt )P-valor = 2 P(z > |zexpt |)

Page 39: Introducción a la Inferencia Estadistica

Contrastes para dos Poblaciones Independientes

Introducción a la Inferencia Estadistica

Varianzas Iguales Varianzas Distintas

Page 40: Introducción a la Inferencia Estadistica

Contrastes para dos Poblaciones Independientes

Introducción a la Inferencia Estadistica

Intervalo de confianza para diferencia de mediasVarianzas Conocidas

xσy

2σx2

Page 41: Introducción a la Inferencia Estadistica

Contrastes para dos Poblaciones Independientes

Introducción a la Inferencia Estadistica

Problema. Se quiere comprobar si los datos de número de resfriados durante el periodo de exámenes por estudiante influyen tomando vitamina C. Los sig. datos corresponden a muestras a las que se les ha suministrado placebo (x) y Acido Ascorbico (y).x = 2,2 y = 1,9Sx = 0,12 Sy= 0,10Nx= 155 Ny = 208

Page 42: Introducción a la Inferencia Estadistica

Contrastes para dos Poblaciones Independientes

Introducción a la Inferencia Estadistica

Placebo (x) y Acido Ascorbico (y).x = 2,2 y = 1,9Sx = 0,12 Sy= 0,10Nx= 155 Ny = 208

σy2

σx2

FNnum – 1 , Nden – 1 , 0.025

Varianzas Iguales1,2 < 1,3637

Page 43: Introducción a la Inferencia Estadistica

Contrastes para dos Poblaciones Independientes

Introducción a la Inferencia Estadistica

Placebo (x) y Acido Ascorbico (y).x = 2,2 y = 1,9Sx = 0,12 Sy= 0,10Nx= 155 Ny = 208

(pero iguales)

Page 44: Introducción a la Inferencia Estadistica

Contrastes para dos Poblaciones Independientes

Introducción a la Inferencia Estadistica

Problema. 2 Los sig. datos corresponden a muestras de dos ciudades En las que se ha observado el nivel de contaminación de plomo en el agua corriente. Verificar si hay diferencias entre ambas ciudades.

x y

Page 45: Introducción a la Inferencia Estadistica

Contrastes para dos Poblaciones Independientes

Introducción a la Inferencia Estadistica

Page 46: Introducción a la Inferencia Estadistica

Contrastes para dos Poblaciones Dependientes

Introducción a la Inferencia Estadistica

1) Definimos la variable D como:D = {Antes - Despues} óD = {Despues - Antes} óD = { X - Y} óD = { Y - X}

2) Proponemos el contraste3) Calculamos el estadístico en función de la definición de D y del contraste propuesto, siendo D unavariable Normal 4) Obtenemos las conclusiones y aportamos el p-valor