Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se...

23
SMID a.a. 2004/2005 Dipartimento di Fisica Esercizi di statistica inferenziale Prof. Maria Antonietta Penco tel. 0103536404 [email protected] 26/1/2005

Transcript of Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se...

Page 1: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

SMIDa.a. 2004/2005

Dipartimento di Fisica

Esercizi di statistica inferenzialeProf. Maria Antonietta Penco

tel. [email protected]

26/1/2005

Page 2: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

Esercizio1E’ noto che un grande numero di pazienti con un determinato tipo di cancro, in una certa sede e in una certa fase clinica, ha un tempo medio di sopravvivenza di µ=38.3 mesi con una deviazione standard di σ =33.5 mesi (distribuzione non gaussiana). 100 pazienti affetti dalla malattia vengono trattati con una nuova tecnica.Ci si può chiedere prima dell’esperimento:

a)Ad un livello di significatività del 5% la nuova tecnica risulta migliore o peggiore di quella standard?

b) Ad un livello di significatività del 5% la nuova tecnica è più efficace di quella standard?

Page 3: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

CASO a)Non si ha nessuna informazione sulla nuova tecnica e

quindi si ritiene che i valori medi campionari possano risultare sopra o sotto la media. Il test è bidirezionale:

H0: µ = 38.3H1: µ ≠ 38.3

CASO b)Si ritiene (per prove già effettuate, informazioni aggiuntive…) che la sopravvivenza del campione sarà più alta della media e quindi si esegue un test monodirezionale:

H0: µ = 38.3H1: µ > 38.3

Page 4: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

Dopo la nuova cura il tempo medio di sopravvivenza del campione risulta di 44.5 mesi.

CASO a) Test bidirezionale

Poiché il campione è numeroso , per il teorema del limite centrale, la distribuzione campionaria delle medie è:

N (µ = 38.3,100

5.33)( =xσ ).

In base all’ipotesi nulla si ha una probabilità del 68% di ottenere una media campionaria compresa tra µ±σ, cioè tra [35.0, 41.7] e una probabilità del 95% di ottenere una media campionaria compresa tra µ±2σ, cioè tra [31.6, 45.0].

Page 5: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

La media campionaria dista dalla media della popolazione di 1.85 deviazioni standard:

85.135.3

3.385.44)(

=−

=−

=x

xzs σµ

.

Page 6: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

Poiché il valore critico corrispondente al livello di significatività α=0.05 (zc= ±1.96) è maggiore del valore sperimentale del campione non si può rifiutare l'ipotesi nulla. La nuova tecnica equivale a quella standard.

CASO b) Test monodirezionale

Page 7: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

Nel test monodirezionale il valore critico corrispondente al livello di significatività α=0.05 (zc= ±1.64) è minore del valore critico del test bidirezionale in quanto ci si riferisce solo ai valori superiori alla media. Pertanto la zona di rifiuto è maggiore, si è più propensi a rifiutare l’ipotesi nulla. Possiamo quindi osservare che:

il test monodirezionale è meno conservativo del test bidirezionale.

In questo caso, poiché zc<zs, si rifiuta l'ipotesi nulla. La nuova tecnica è migliore di quella standard.

Page 8: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

Esercizio 2

Un esperimento clinico confronta due analgesici A e B per stabilire se il farmaco A è più efficace del farmaco B. 100 pazienti hanno ricevuto A per una settimana e B per un'altra, in un ordine di somministrazione stabilito a caso. Alla fine ogni paziente ha espresso la propria preferenza per uno dei due farmaci. 65 soggetti hanno preferito A e 35 B.

Il farmaco A ha caratteristiche tali da farlo preferire al farmaco B?

Test monodirezionale Ho:nP=50 e H1:nP>50

Page 9: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

In base all’ipotesi di uguale efficacia dei due farmaci, la distribuzione campionaria delle frequenze nA è una normale:

N(µ = 50 ;σ = 5.05.0100 .. ⋅⋅ )

Se l’ipotesi nulla è corretta, si ha una probabilità del 68% di ottenere una frequenza di favorevoli al farmaco A compresa tra 50±5, cioè 45<nA<55 e una probabilità del 95% di ottenere una frequenza di favorevoli al farmaco A compresa entro due deviazioni standard, (50±10), cioè 40<nA<60.

Page 10: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

La frequenza campionaria è 65 e dista dalla media di tre deviazioni standard:

Il valore critico al 5% è zc=1.64, all’1% è zc=2.33. zs >2.33, i dati sono altamente significativi, il farmaco A ha caratteristiche migliori del farmaco B ad un livello di significatività dell' 1%. Si rifiuta l’ipotesi di uguale efficacia dei due analgesici.

Page 11: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

Altra soluzione :L’ipotesi nulla è sempre la stessa, cioè uguale efficacia dei due farmaci: La probabilità di avere risposte favorevoli al farmaco A o al farmaco B è la stessa.

H0 : P(A)=P(B)=P=0.5

1005050nt

1003565no

BA

no sono le frequenze sperimentali n1 sono le frequenze medie in base all’ipotesi nulla

Page 12: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

χ2= (65-50)2

50 + (35-50)2

50 = 9

Si può osservare che z2= χ2= 9 infatti come è noto :

Poiché χ2s> χ2

c = 6.63 (α=1% e 1 gdl), si rifiuta l’ipotesi che i due analgesici siano ugualmente efficaci. Il farmaco A è migliore del farmaco B.

Page 13: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

Esercizio 3Il tasso medio di glicemia in un campione di 12 pazienti trattati con il farmaco A è 105 mg/dl con una deviazione standard campionaria 7.2 mg/dl, mentre in un campione di 10 pazienti trattati con il farmaco B il tasso medio di glicemia è 112 mg/dl con una deviazione standard campionaria 8.7 mg/dl. a)Le varianze delle popolazioni ( che si suppone abbiano una distribuzione gaussiana), da cui sono stati estratti i campioni si possono ritenere uguali?b)Ad un livello di significatività del 5%, il farmaco A è da

ritenersi più efficace del farmaco B?

Page 14: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

a) Confronto tra varianze campionarie.

H0: σA2= σB

2 H1: σA2≠ σB

2

Il rapporto tra la varianza campionaria maggiore e la minore :

2)1(

2)1(

2

2

)1(

)1(

−=

AnB

ABn

A

B

n

n

ss

χ

χ

è distribuito secondo la variabile F:

Page 15: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

46.12.77.8

2

2

2

2

===A

Bs ssF

Il valore sperimentale di F risulta essere:

Mentre il valore critico F9,11=2.90 corrispondente al livello di significatività richiesto risulta maggiore.

L’ipotesi nulla è compatibile con i risultati sperimentali: si può assumere che le due popolazioni abbiano la stessa varianza.

Page 16: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

b) Test monodirezionale sinistro:

H0: µA=µB

H1: µA<µB

da cui:H0: µA-µB=0H1: µA-µB<0

Poichè si suppone che le varianze delle popolazioni da cui sono stati estratti i campioni siano uguali e inoltre la numerosità dei campioni è piccola, dobbiamo stimare la varianza della popolazione facendo una media pesata delle varianze campionarie:

Page 17: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

6.62)1()1()1()1( 22

2 =−+−−+−

=BA

BBAA

nnsnsnS

Per l’ipotesi nulla la distribuzione campionaria delle differenze delle medie ha valor medio zero, ma varianzastimata dai dati campionari, di conseguenza il rapporto :

BA

BABA

nns

xx11

)()(

+

−−− µµ

Page 18: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

è una variabile t di Student con (nA+nB-2)=20 gradi di libertà.

Il valore sperimentale risulta ts=-2.07.

La regione di rifiuto dell'ipotesi nulla è costituita dai valori di t minori o uguali al valore di t= - 1.725, cioè la coda sinistra della distribuzione di Student con 20 gradi di libertà, corrispondente ad un livello di significatività α=5%. Questo valore critico è tc=-1.725.

Il valore sperimentale è più piccolo del valore critico ts<tc e cade quindi nella zona di rifiuto dell’ipotesi di uguale efficacia. Possiamo concludere che il farmaco A è da ritenersi più efficace del farmaco B.

Page 19: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

Esercizio 4Si è somministrato un presunto antipiretico a sei pazienti e si è misurata la temperatura al momento della somministrazione e tre ore dopo. Ci si chiede se la riduzione è significativa.

Temperatura Paziente Prima Dopo tre ore Differenza

1 38.3 37.2 +1.12 39.1 38.4 +0.73 40.2 38.6 +1.64 37.6 36.7 +0.95 38.9 38.2 +0.76 38.7 38.2 +0.5

Somma 232.8 227.3 +5.5media 38.8 37.88 0.92

Page 20: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

Test d'ipotesi sulla differenza tra medie per prove ripetute.

I risultati delle due serie di misure sono correlati, le prove sono ripetute a distanza di tempo sullo stesso soggetto, non è possibile utilizzare il test delle differenze valido per campioni indipendenti.

In questo caso la distribuzione campionaria della differenza tra medie ha ancora come media la differenza tra le medie delle popolazioni da cui i campioni sono stati estratti, ma la varianza è data dalla somma delle varianze delle singole distribuzioni campionarie diminuita di un fattore dovuto alla correlazione.

Page 21: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

Poiché il coefficiente di correlazione in generale non è noto, si ricorre allora ad un metodo che consiste nel fare riferimento direttamente alle differenze tra i valori di ognuna delle n coppie. In questo modo si passa ad un unico campione di n differenze di tra i punteggi conseguiti da ciascun elemento della coppia e si pone come ipotesi nulla che l’antipiretico non sia efficace.

H0: µd=0 ;H1: µd<0

Sotto questa ipotesi si calcola quanto la media del campione si discosta dallo zero.

Page 22: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

La distribuzione campionaria delle medie ha media nulla per ipotesi:

µd=0cioè non c’è nessuna differenza prima e dopo l’assunzione del farmaco : il farmaco non è efficace.

La varianza è stimata dai dati campionari:

154.0111

)()(

222

2 =−

−−

∑=

∑ −=

ndn

n

d

n

ddds i

ii

i

Page 23: Esercizi di statistica inferenziale - ge.infn.itsquarcia/DIDATTICA/MSB/5_Esercizi... · Se l’ipotesi nulla è corretta, si ha una probabilità del 68% ... standard campionaria 7.2

16.06154.0)()(

2

===ndsds

E allora :

75.516.092.0

)(==

−=

dsdt d

tc = 2.57 α=5% 5 gdl. L'ipotesi nulla è rifiutata. L’antipiretico è efficace.