Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de...

24
“Pruebas Pruebas de de Hipótesis Hipótesis” ( , , ( )) P θ Ω F Valor de desconocido. θ Hay un contexto. Hay un fenómeno aleatorio de interés. Se observa , realización del fenómeno aleatorio. Lo anterior implica razonamiento inductivo. X

Transcript of Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de...

Page 1: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

““PruebasPruebas de de HipótesisHipótesis””

( , , ( ))P θΩ FValor de desconocido.θ

Hay un contexto. Hay un fenómeno aleatorio de interés.

Se observa , realización del

fenómeno aleatorio.

Lo anterior implica razonamiento inductivo.

X

Page 2: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

Modelo estadístico (paramétrico)Modelo estadístico (paramétrico)

( ) | P θ θ ∈Θ espacio paramétrico

parámetro (desconocido)θ

Θ

parámetro (desconocido)

El modelo estadístico elegido para

representar el fenómeno aleatorio

puede variar, dependiendo de

opiniones.

θ

Page 3: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

HipótesisHipótesis

H ⊂ ΘHecho: como se desconoce ,

no hay certeza sobre validez de .

P roblema inferencial de "prueba de hipótesis":

H

θ

Problema inferencial de "prueba de hipótesis":

a la luz de datos, , ¿cuál es la p lausibilidad de ?

(contrastar con pregunta:

A la luz de d

X H

atos, , ¿cuál es valor de ?)

Nota: ¡¡ existe antes de comenzar!!

X

H

θ

Page 4: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

Evidencia o datos (X)

H

Medida de viabilidad o

plausibilidad de la

hipótesis H a la luz de los

datos X

Page 5: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

ComponenteComponente ““conductualconductual” en ” en

unauna pruebaprueba de de hipótesishipótesis¿Para ¿Para quéqué queremosqueremos resolver el resolver el problemaproblema

de de inferenciainferencia? A ? A vecesveces (no (no siempresiempre): ): parapara

modificarmodificar mi mi conductaconducta..

EjemploEjemplo: : ObservoObservo cielocielo grisgris ((datosdatos). ). InfieroInfieroEjemploEjemplo: : ObservoObservo cielocielo grisgris ((datosdatos). ). InfieroInfiero

queque vava a a lloverllover. . DecidoDecido llevarllevar un un paraguasparaguas..

Page 6: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

No No siempresiempre eses ““conductualconductual””

EjemploEjemplo: : niñoniño observaobserva queque magomago adivinóadivinó

la la cartacarta ((datosdatos). ). InfiereInfiere queque el el magomago tienetiene

poderespoderes sobrenaturalessobrenaturales..

Page 7: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

Jerzy Neyman (1894Jerzy Neyman (1894−1981)−1981)

Page 8: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

Egon Pearson (1895Egon Pearson (1895−1980)−1980)

Page 9: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

Karl Pearson (1857Karl Pearson (1857−1936)−1936)

Page 10: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

Paradigma de NeymanParadigma de Neyman--PearsonPearson

PremisasPremisas::

Hay Hay unauna hipótesishipótesis alternativaalternativa a a H.H. Para Para distinguirladistinguirla, , usemosusemos H=HH=H0 0 y y HH11..

ExisteExiste unauna actitudactitud ““conductualconductual”, ”, asociadaasociada a “a “rechazarrechazar” y ” y a “no a “no rechazarrechazar” ” HH0 0 en favor de en favor de HH11..

Se Se originanoriginan comocomo consecuenciaconsecuencia dos dos tipostipos de error: de error: TipoTipoSe Se originanoriginan comocomo consecuenciaconsecuencia dos dos tipostipos de error: de error: TipoTipoI y I y TipoTipo II.II.

El error de El error de TipoTipo I I eses conceptualmenteconceptualmente másmás gravegrave queque el el de de TipoTipo II.II.

Para Para realizarrealizar unauna pruebaprueba, se , se debedebe conceder la conceder la posibilidadposibilidad de de cometercometer en en ciertocierto gradogrado el error de el error de TipoTipo I. I. DenotemosDenotemos estoesto porpor αα,, la la probabilidadprobabilidad de de cometercometer error error de de TipoTipo I.I.

Page 11: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

NeymanNeyman--Pearson=juicioPearson=juicio

HH00 eses presunciónpresunción de de inocenciainocencia; ; HH11 eses “no “no inocenciainocencia”.”.

Error de Error de TipoTipo I I eses peorpeor queque TipoTipo IIII

Hay Hay implicaciónimplicación ““conductualconductual”: ”: condenarcondenar o o exonerarexonerar..exonerarexonerar..

La “La “pruebaprueba” de la ” de la hipótesishipótesis eses el el juiciojuicio..

Los “Los “datosdatos” ” eses la la evidenciaevidencia..

Se Se tratatrata de un de un procesoproceso de de razonamientorazonamientoinductivoinductivo, no , no deductivodeductivo. Hay . Hay incertidumbreincertidumbre..

¿¿CuántoCuánto vale vale αα??

Page 12: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

En un juicio:En un juicio:

No rechazar no es demostración de No rechazar no es demostración de

inocencia (¿OJ Simpson?).inocencia (¿OJ Simpson?).

Rechazar no es demostración de Rechazar no es demostración de

culpabilidad (no rechazar no es lo mismo culpabilidad (no rechazar no es lo mismo culpabilidad (no rechazar no es lo mismo culpabilidad (no rechazar no es lo mismo

que aceptar).que aceptar).

Si error de Tipo I aumenta, entonces Tipo Si error de Tipo I aumenta, entonces Tipo

II disminuye y viceII disminuye y vice--versa.versa.

Page 13: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

Noción matemática de optimalidad Noción matemática de optimalidad

que se deriva:que se deriva:

Fijar el valor de la constante Fijar el valor de la constante αα..

Minimizar la probabilidad de ocurrencia Minimizar la probabilidad de ocurrencia

del error de Tipo II.del error de Tipo II.

Noción de prueba más potente.Noción de prueba más potente.Noción de prueba más potente.Noción de prueba más potente.

Page 14: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

Ejemplo #1Ejemplo #1

Línea de producción industrial.Línea de producción industrial.

XX11, X, X22,..., X,..., Xnn observaciones de defectoobservaciones de defecto--no no defecto.defecto.

p=p=proporción de defectosproporción de defectos

Hipótesis: Hipótesis: HH : p<=10% vs. H: p<=10% vs. H : p>10% : p>10% Hipótesis: Hipótesis: HH00: p<=10% vs. H: p<=10% vs. H00: p>10% : p>10%

Consecuencia “conductual”: parar línea de Consecuencia “conductual”: parar línea de producción o no pararla.producción o no pararla.

Error de Tipo I es más grave que el error de Error de Tipo I es más grave que el error de Tipo II.Tipo II.

αα=proporción de “falsas alarmas”=proporción de “falsas alarmas”

Page 15: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

Ejemplo #2Ejemplo #2

Observación en astronomía.Observación en astronomía.

XX11, X, X22,..., X,..., Xnn observaciones de conteos de observaciones de conteos de cúmulos en sectores de la bóveda celeste.cúmulos en sectores de la bóveda celeste.

Hipótesis: Hipótesis: los conteos tienen distribución de los conteos tienen distribución de Poisson (distribución homogénea de estrellas en Poisson (distribución homogénea de estrellas en Poisson (distribución homogénea de estrellas en Poisson (distribución homogénea de estrellas en el espacio tridimensional).el espacio tridimensional).

Consecuencia “conductual”: ???Consecuencia “conductual”: ???

Error de Tipo I es más grave que el error de Error de Tipo I es más grave que el error de Tipo II???Tipo II???

αα=???=???

Page 16: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

¿Los datos rechazan la hipótesis?¿Los datos rechazan la hipótesis?

“Según los datos, se rechaza la hipótesis “Según los datos, se rechaza la hipótesis

nula.”nula.”

No exactamente: se rechaza también No exactamente: se rechaza también No exactamente: se rechaza también No exactamente: se rechaza también

porque alguien, o algo, eligió el valor de porque alguien, o algo, eligió el valor de αα..

Page 17: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

HipótesisHipótesis

H ⊂ Θ

Problema de "prueba de h ipótesis":

a la luz de datos, , ¿cuál es la p lausib ilidad de ?X H

Page 18: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

Ronald Aylmer Fisher Ronald Aylmer Fisher

(1890(1890−1962)−1962)

Page 19: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

Paradigma de Fisher (Paradigma de Fisher (pp--valores, o valores, o

pruebas de significancia)pruebas de significancia)

Premisas:Premisas:

D(X,H)>0 D(X,H)>0 es una “distancia entre datos y es una “distancia entre datos y

la hipótesis”, con la propiedad de que si la hipótesis”, con la propiedad de que si

D(XD(X ,H)>D(X,H)>D(X ,H), ,H), entonces entonces XX constituye constituye D(XD(X11,H)>D(X,H)>D(X22,H), ,H), entonces entonces XX11 constituye constituye

mayor evidencia en contra de mayor evidencia en contra de HH que que XX22..

pp--valor=valor=PPHH(D>d)(D>d), donde , donde dd=valor =valor

observado de observado de DD..

Page 20: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

Paradigma de Fisher (Paradigma de Fisher (pp--valores, o valores, o

pruebas de significancia)pruebas de significancia)Interpretación:Interpretación:

La estadística La estadística DD ordena muestras de acuerdo a la cantidad de ordena muestras de acuerdo a la cantidad de evidencia en contra de evidencia en contra de HH que representan.que representan.

No es relevante la noción “No es relevante la noción “HH es cierta”, sino la es cierta”, sino la utilidadutilidad de de HH para para describirdescribir XX..

pp--valor es un revalor es un re--escalamiento de escalamiento de DD a una escala a una escala [0,1][0,1]..

Cualquier Cualquier DD que cumpla ordenar muestras funciona. No hay noción que cumpla ordenar muestras funciona. No hay noción Cualquier Cualquier DD que cumpla ordenar muestras funciona. No hay noción que cumpla ordenar muestras funciona. No hay noción de que una de que una DD sea mejor que otra. No hay noción de optimalidad.sea mejor que otra. No hay noción de optimalidad.

Bajo Bajo HH, la distribución del , la distribución del pp--valor es valor es U(0,1).U(0,1).

Un valor chico de Un valor chico de pp indica evidencia en contra de indica evidencia en contra de HH. Un valor . Un valor grande de grande de pp, también, aunque con otra interpretación., también, aunque con otra interpretación.

Replicabilidad de experimentos es importante.Replicabilidad de experimentos es importante.

pp--valor puede cuantificar evidencia en contra de valor puede cuantificar evidencia en contra de HH, no a favor., no a favor.

pp--valor NO representa la probabilidad de que valor NO representa la probabilidad de que HH sea cierta.sea cierta.

pp--valor NO es un concepto frecuentista, como lo es el error de Tipo valor NO es un concepto frecuentista, como lo es el error de Tipo II--II en NeymanII en Neyman--Pearson.Pearson.

No es relevante el concepto de hipótesis alternativa, como en NNo es relevante el concepto de hipótesis alternativa, como en N--P.P.

Page 21: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

Paradigma BayesianoParadigma BayesianoPremisas:Premisas:

Se sabe algo acerca de Se sabe algo acerca de θθ aún antes de observar aún antes de observar XX. Esta . Esta información previa es cuantificable a través de una información previa es cuantificable a través de una densidad de probabilidad, densidad de probabilidad, ππ((θθ))..

Se conoce un modelo para datos, Se conoce un modelo para datos, f(X| f(X| θθ).).

Una vez observado Una vez observado XX, la información se actualiza, , la información se actualiza, mediante el Teorema de Bayes:mediante el Teorema de Bayes:mediante el Teorema de Bayes:mediante el Teorema de Bayes:

La probabilidad de que La probabilidad de que HH sea cierta a la luz de los datos sea cierta a la luz de los datos es:es:

( | ) ( )( | )

( | ) ( )

f Xf X

f X d

θ π θθ

θ π θ θ=∫

( | )Hf X dθ θ∫

Page 22: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

Paradigma BayesianoParadigma Bayesiano

Interpretación:Interpretación:

ππ((θθ)) es información subjetiva; luego la es información subjetiva; luego la

interpretación de probabilidad es subjetiva.interpretación de probabilidad es subjetiva.

Si no hay información previa, usar Si no hay información previa, usar ππ((θθ)) “no “no

informativa”.informativa”.informativa”.informativa”.

Page 23: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

Principales críticasPrincipales críticas

NeymanNeyman--PearsonPearson

Por naturaleza binaria se pierde resolución.Por naturaleza binaria se pierde resolución.

No siempre existen pruebas UMP.No siempre existen pruebas UMP.

pp--valoresvalorespp--valoresvalores

La La cuantificacióncuantificación de de incertidumbreincertidumbre no no poseeposee

interpretacióninterpretación probabilísticaprobabilística..

BayesianoBayesiano

Origen de densidad previa.Origen de densidad previa.

Page 24: Hay un contexto. Hay un fenómeno aleatorio de …““PruebasPruebasde de HipótesisHipótesis”” ( , , ( ))ΩFPθ Valor de desconocido.θ Hay un contexto. Hay un fenómeno aleatorio

ConceptosConceptos básicosbásicos en en pruebaspruebas

de de hipótesishipótesis a la Na la N--PPHipótesisHipótesis nulanula, , hipótesishipótesis alternativaalternativa..

ErroresErrores de de TipoTipo I y I y TipoTipo II.II.

EstadísticaEstadística de de pruebaprueba y y regiónregión críticacrítica..

FunciónFunción de de potenciapotencia de de unauna pruebaprueba..FunciónFunción de de potenciapotencia de de unauna pruebaprueba..