8 Test Ipotesi - Istituto Nazionale di Fisica Nuclearesantanas/chim/docs/8_Test_Ipotesi.pdf ·...

10
8 - Test di Ipotesi

Transcript of 8 Test Ipotesi - Istituto Nazionale di Fisica Nuclearesantanas/chim/docs/8_Test_Ipotesi.pdf ·...

Page 1: 8 Test Ipotesi - Istituto Nazionale di Fisica Nuclearesantanas/chim/docs/8_Test_Ipotesi.pdf · 2018-05-13 · •Soluzione Esercizio 1 (pag 2): 2) Definisco come statistica campionaria

8 - Test di Ipotesi

Page 2: 8 Test Ipotesi - Istituto Nazionale di Fisica Nuclearesantanas/chim/docs/8_Test_Ipotesi.pdf · 2018-05-13 · •Soluzione Esercizio 1 (pag 2): 2) Definisco come statistica campionaria

• Esercizio 1: Dopo anni di esperienza e’ noto che la distribuzione della concentrazione di rame nel sangue umano e’ ben descritta da una distribuzione gaussiana di parametri μ=3.2 10-5 cm-3 e σ=2.2 10-6 cm-3. All’ultimo esame del sangue trovo 9.2 10-5 cm-3.

- Devo preoccuparmi?

Page 3: 8 Test Ipotesi - Istituto Nazionale di Fisica Nuclearesantanas/chim/docs/8_Test_Ipotesi.pdf · 2018-05-13 · •Soluzione Esercizio 1 (pag 2): 2) Definisco come statistica campionaria

• Soluzione Esercizio 1 (pag 1): x = variabile casuale che rappresenta la concentrazione di rame nel sangue

umano.

Ipotesi H0 = ”la concentrazione di rame nel mio sangue e’ nella norma”.

Sotto questa ipotesi, la distribuzione di probabilita di x e’ nota ed e’ una gaus-

siana Gµ,�

(x) con µ = 3.20 10�5cm

�3e � = 0.22 10�6

cm

�3.

Il test di ipotesi a cui sono interessato in questo caso e’ un test ”a due code”,

ovvero sono interessato a sapere se il valore si discosta in valore assoluto dal

valore atteso (sia che esso sia molto maggiore o molto minore del valore at-

teso, in quanto entrambi indicherebbero un problema). Non essendo specifi-

cato il livello significativo del test, posso scegliere un valore ragionevole. Una

scelta tipica e’ considerare l’ipotesi rigettata se il valore misurato si discosta da

quello atteso per piu di 3�, che corrisponde ad un livello significativo dello 0.3%

(ovvero la probabilita di osservare un valor al di fuori delle 3� dal valore atteso

P (oltre 3�) = 1� P (entro 3�) = 100%� 99.7% = 0.3%).

Posso procedere in due modi equivalenti:

1) Definisco come statistica campionaria per il test di ipotesi come ⇠ = x.Se l’ipotesi e’ vera, la distribuzione di probabilita di ⇠ e’ G

µ,�

(⇠).Secondo la precedente scelta di livello significativo, l’intervallo per cui accetto

l’ipotesi e’ µ� 3� < ⇠ < µ+ 3�Il valore misurato di ⇠

mis

= xmis

= 9.2 10�5cm

�3che cade al di fuori dell’intervallo.

Pertanto l’ipotesi deve essere rigettata, ovvero devo preoccuparmi perche le mie

analisi del sangue non sono nella norma.

Un modo analogo di procedere e’ calcolare quante deviazioni standard separano

la misura dal valor medio della distribuzione. Si calcola tmis

=

xmis�µ

= 27.3:il valore misurato dista circa 27 deviazioni standard dal valor medio. La proba-

bilita di avere una misura oltre 27� da µ e’ infinitesima (gia per sole 5� questa

probabilita vale lo 0.00006%). Le mie analisi del sangue si discostano molto dal

valore atteso, e quindi devo sicuramente preoccuparmi.

Tipo di test di ipotesi:

- coerenza tra una misura/esperimento ed un modello

- distribuzione gaussiana, deviazione standard nota

- test “a due code”

Page 4: 8 Test Ipotesi - Istituto Nazionale di Fisica Nuclearesantanas/chim/docs/8_Test_Ipotesi.pdf · 2018-05-13 · •Soluzione Esercizio 1 (pag 2): 2) Definisco come statistica campionaria

• Soluzione Esercizio 1 (pag 2):

2) Definisco come statistica campionaria per il test di ipotesi come ⇠ =

x�µ

.

Se l’ipotesi e’ vera, la distribuzione di probabilita di ⇠ e’ G0,1(⇠), una cosid-

detta ”gaussiana standardizzata” ovvero una gaussiana con media µ pari a 0 e

deviazione standard � pari a 1. Il valore numerico della variabile ⇠ rappresenta

quindi per costruzione il numero di deviazioni standard che separano la misura

x dal suo valore atteso µ.

Secondo la precedente scelta di livello significativo, l’intervallo per cui accetto

l’ipotesi e’ quindi �3 < ⇠ < +3. Il valore misurato di ⇠

mis

= 27.3 che cade

al di fuori dell’intervallo. Pertanto l’ipotesi deve essere rigettata, ovvero devo

preoccuparmi perche le mie analisi del sangue non sono nella norma.

Page 5: 8 Test Ipotesi - Istituto Nazionale di Fisica Nuclearesantanas/chim/docs/8_Test_Ipotesi.pdf · 2018-05-13 · •Soluzione Esercizio 1 (pag 2): 2) Definisco come statistica campionaria

• Esercizio 2: Un fisico nucleare desidera verificare la conservazione dell’energia in una certa reazione nucleare e misura le energie iniziale e finale Ein=75+/-3 MeV ed Efin=60+/-9 MeV dove le incertezze sono le deviazioni standard di due popolazioni diverse gaussiane che descrivono le due misure.

- Determinare se la discrepanza osservata e’ significativa al livello del 5%.

Page 6: 8 Test Ipotesi - Istituto Nazionale di Fisica Nuclearesantanas/chim/docs/8_Test_Ipotesi.pdf · 2018-05-13 · •Soluzione Esercizio 1 (pag 2): 2) Definisco come statistica campionaria

• Soluzione Esercizio 2 (pag 1): Tipo di test di ipotesi:

- coerenza tra due misure/esperimenti

- distribuzioni gaussiane, deviazioni standard note

- test “a due code”

Ipotesi H0 = ”l’energia si conserva, e quindi le misure di energia iniziale e

finale sono in accordo tra loro”.

Secondo questa ipotesi:

Ei(Ef ) = variabile casuale distribuita secondo un gaussiana Gµ,�i(Gµ,�f ) con

deviazioni standard note �i(�f ) = 3(9) MeV. Il valore atteso delle due dis-

tribuzioni e’ ovviamente lo stesso (µ) essendo le due misure in accordo secondo

l’ipotesi. Si tratta di un test di ipotesi ”a due code” perche sono interessato

a valutare la di↵erenza in assoluto tra le due misure (ovvero l’energia non si

conserverebbe sia nel caso Ei << Ef che nel caso Ei >> Ef ).

Se le due misure sono in accordo allora la loro di↵erenza deve essere com-

patibile con 0. Si costruisce quindi la variabile � = Ei �Ef che ha come valore

atteso 0, e come deviazione standard �� =

q�2i + �2

f =

p3

2+ 9

2= 9.5 MeV

(somma in quadratura delle deviazioni standard assumendo le due misure in-

dipendenti).

Si puo procedere in due modi equivalenti:

1) Si utilizza come statistica campionaria ⇠ = � la cui distribuzione di prob-

abilita e’ gaussianana G0,��(�). Si calcola il valore misurato �mis = 75� 60 =

15 MeV. Si calcola quante deviazioni standard questo valore di↵erisce dal valore

atteso: tmis =�mis�0

��= 1.5789.. ⇠ 1.58.

Si calcola ora la probabilita che un valore misurato si discosti piu di tmis de-

viazioni standard dal valore atteso: P (oltre tmis�) = 1 � P (entro tmis�) =

2 · (50%�Q(tmis)) = 2 · (50%�Q(1.58)) = 2 · (50%� 44.29%) = 11.4%,

dove Q(t) =

R µ+t�µ Gµ,�(x)dx e’ un integrale che si trova tabulato per diversi

valori di t.Essendo la probabilita P (oltre tmis�) > ↵, dove ↵ = 5% e’ il livello significa-

tivo del test di ipotesi, l’ipotesi non puo essere rigettata (ovvero deve essere

accettata). Posso quindi a↵ermare che l’energia nel processo in esame si con-

serva.

Page 7: 8 Test Ipotesi - Istituto Nazionale di Fisica Nuclearesantanas/chim/docs/8_Test_Ipotesi.pdf · 2018-05-13 · •Soluzione Esercizio 1 (pag 2): 2) Definisco come statistica campionaria

• Soluzione Esercizio 2 (pag 2):

2) Si utilizza come statistica campionaria ⇠ =

���

la cui distribuzione di

probabilita e’ gaussiana standardizzata G0,1(⇠). Si calcola il valore misurato

⇠mis =

75�609.5 ⇠ 1.58. Per costruzione della variabile, ⇠ rappresenta proprio il

numero di deviazioni standard che separano la misura di � dal suo valore atteso

(pari a 0).

Si calcola ora la probabilita che un valore misurato di ⇠ si discosti piu di ⇠mis

dal valore atteso (pari a 0): P (oltre ⇠mis) = 1 � P (entro ⇠mis) = 2 · (50% �Q(⇠mis)) = 2 · (50%�Q(1.58)) = 2 · (50%� 44.29%) = 11.4%,

dove Q(t) =

R µ+t�µ Gµ,�(x)dx e’ un integrale che si trova tabulato per diversi

valori di t.Essendo la probabilita P (oltre ⇠mis) > ↵, dove ↵ = 5% e’ il livello significa-

tivo del test di ipotesi, l’ipotesi non puo essere rigettata (ovvero deve essere

accettata). Posso quindi a↵ermare che l’energia nel processo in esame si con-

serva.

Analogamente potevo prima calcolare l’intervallo dei valori di ⇠ (⇠1 < ⇠ < ⇠2)per cui l’ipotesi e’ accettata. Per un intervallo simmetrico attorno al valore

atteso 0 (|⇠1| = |⇠2| = ⇠↵), i valori di ⇠1 e ⇠2 si ottengono da:

P (⇠ < ⇠1 OR ⇠ > ⇠2) = 2 · P (⇠ > ⇠↵) = 2 · (50% � Q(⇠↵)) = ↵ = 5%. Quindi

Q(⇠↵) = 50%� 5%/2 = 47.5%, da cui si ottiene (dalle tabelle di Q(t)) il valoredi ⇠↵ = 1.96.L’intervallo per accettare l’ipotesi e’ quindi �⇠↵ < ⇠ < +⇠↵ ovvero �1.96 < ⇠ <+1.96. Il valore misurato ⇠mis = 1.58 cade all’interno dell’intervallo e quindi

l’ipotesi deve essere accettata (l’energia si conserva).

Page 8: 8 Test Ipotesi - Istituto Nazionale di Fisica Nuclearesantanas/chim/docs/8_Test_Ipotesi.pdf · 2018-05-13 · •Soluzione Esercizio 1 (pag 2): 2) Definisco come statistica campionaria

• Esercizio 3: Si lancia una moneta 12 volte e si ottiene testa 11 volte.

- Si ha evidenza significativa (a livello dell’1%) che la moneta e’ truccata?

Page 9: 8 Test Ipotesi - Istituto Nazionale di Fisica Nuclearesantanas/chim/docs/8_Test_Ipotesi.pdf · 2018-05-13 · •Soluzione Esercizio 1 (pag 2): 2) Definisco come statistica campionaria

• Soluzione Esercizio 3: Tipo di test di ipotesi:

- coerenza tra una misura/esperimento ed un modello

- distribuzione binomiale con parametri noti

- test “ad una coda”

L’ipotesi H0 e’ che ”la moneta non e’ truccata”.

L’evento ”successo” e’ il verificarsi di TESTA nel lancio di una moneta. Sottol’ipotesi formulata, la variabile casuale n (numero di TESTE in 12 lanci) e’ dis-tribuita secondo una binomiale BN,p con N = 12 e p = 1

2 . Il valore misurato e’nmis = 11.

Sono interessato a calcolare la probabilita di avere un valore di n maggioreo uguale a quello misurato (si tratta di un test di ipotesi ”ad una coda” inquanto sospetto che il numero di teste sia ”stranamente alto” rispetto al valoreatteso).BN,p(11) =

12!11!(12�11)! (

12 )

11(1� 12 )

12�11 = 0.29%

BN,p(12) =12!

12!(12�12)! (12 )

12(1� 12 )

12�12 = 0.02%

P (n � nmis) = P (n � 11) = BN,p(11)+BN,p(12) = 0.31% < ↵ = livello significativo =1% ! l’ipotesi H0 deve essere rigettata, ovvero la moneta e’ truccata.

NOTA: e’ importante sottolineare che la probabilita di osservare nmis = 11o 12, per quanto piccola, non e’ nulla. E’ dunque assolutamente possibile che cisia questa osservazione. In generale un test di ipotesi non e’ in grado di fornire la”certezza” riguardo il fatto che una ipotesi sia vera o falsa. Puo’ solo accettareo rigettare una ipotesi con un certo livello significativo (in questo test infattinell’ ↵ =1% dei casi il test di ipotesi rigettera una ipotesi vera).

Page 10: 8 Test Ipotesi - Istituto Nazionale di Fisica Nuclearesantanas/chim/docs/8_Test_Ipotesi.pdf · 2018-05-13 · •Soluzione Esercizio 1 (pag 2): 2) Definisco come statistica campionaria

Q(t) =R µ+t�µ Gµ,�(x)dx

µ µ+ t�

Gaussiana