TEST D’IPOTESI - Home - people.unica.it...per cui i dati campionari consentono di rifiutare...

Post on 09-Aug-2020

1 views 0 download

Transcript of TEST D’IPOTESI - Home - people.unica.it...per cui i dati campionari consentono di rifiutare...

TEST D’IPOTESI

1 / 19

SignificativitàI valori della statistica test che definiscono la regione di rifiutosono definiti a partire dal livello di significatività α del test.

I livelli di significatività usualmente considerati sono α = 0.1, α =0.05 o α = 0.01.

2 / 19

SignificativitàI valori della statistica test che definiscono la regione di rifiutosono definiti a partire dal livello di significatività α del test.I livelli di significatività usualmente considerati sono α = 0.1, α =0.05 o α = 0.01.

2 / 19

SignificativitàI valori della statistica test che definiscono la regione di rifiutosono definiti a partire dal livello di significatività α del test.I livelli di significatività usualmente considerati sono α = 0.1, α =0.05 o α = 0.01.

2 / 19

ErroriNel processo decisionale sulle ipotesi si corre sempre il rischioche i dati campionari suggeriscano delle conclusioni errate. Siindividuano perciò due tipi di errore.

• Errore del primo tipo: rifiutare un’ipotesi nulla H0 quandoquesta è vera.

1 E’ l’errore più grave che si possa commettere.2 La probabilità di commettere errore del primo tipo è

α, viene fissata a priori dal ricercatore e si chiamalivello di significatività.

• Errore del secondo tipo: non rifiutare un’ipotesi nulla H0quando questa è falsa.

1 La probabilità di commettere errore del secondo tipoè β .

L’errore di primo e secondo tipo non possono mai verificarsi con-temporaneamente. Il primo può verificarsi solo se H0 è vera, ilsecondo solo se H0 è falsa.

3 / 19

ErroriNel processo decisionale sulle ipotesi si corre sempre il rischioche i dati campionari suggeriscano delle conclusioni errate. Siindividuano perciò due tipi di errore.

• Errore del primo tipo: rifiutare un’ipotesi nulla H0 quandoquesta è vera.

1 E’ l’errore più grave che si possa commettere.2 La probabilità di commettere errore del primo tipo è

α, viene fissata a priori dal ricercatore e si chiamalivello di significatività.

• Errore del secondo tipo: non rifiutare un’ipotesi nulla H0quando questa è falsa.

1 La probabilità di commettere errore del secondo tipoè β .

L’errore di primo e secondo tipo non possono mai verificarsi con-temporaneamente. Il primo può verificarsi solo se H0 è vera, ilsecondo solo se H0 è falsa.

3 / 19

ErroriNel processo decisionale sulle ipotesi si corre sempre il rischioche i dati campionari suggeriscano delle conclusioni errate. Siindividuano perciò due tipi di errore.

• Errore del primo tipo: rifiutare un’ipotesi nulla H0 quandoquesta è vera.

1 E’ l’errore più grave che si possa commettere.

2 La probabilità di commettere errore del primo tipo èα, viene fissata a priori dal ricercatore e si chiamalivello di significatività.

• Errore del secondo tipo: non rifiutare un’ipotesi nulla H0quando questa è falsa.

1 La probabilità di commettere errore del secondo tipoè β .

L’errore di primo e secondo tipo non possono mai verificarsi con-temporaneamente. Il primo può verificarsi solo se H0 è vera, ilsecondo solo se H0 è falsa.

3 / 19

ErroriNel processo decisionale sulle ipotesi si corre sempre il rischioche i dati campionari suggeriscano delle conclusioni errate. Siindividuano perciò due tipi di errore.

• Errore del primo tipo: rifiutare un’ipotesi nulla H0 quandoquesta è vera.

1 E’ l’errore più grave che si possa commettere.2 La probabilità di commettere errore del primo tipo è

α, viene fissata a priori dal ricercatore e si chiamalivello di significatività.

• Errore del secondo tipo: non rifiutare un’ipotesi nulla H0quando questa è falsa.

1 La probabilità di commettere errore del secondo tipoè β .

L’errore di primo e secondo tipo non possono mai verificarsi con-temporaneamente. Il primo può verificarsi solo se H0 è vera, ilsecondo solo se H0 è falsa.

3 / 19

ErroriNel processo decisionale sulle ipotesi si corre sempre il rischioche i dati campionari suggeriscano delle conclusioni errate. Siindividuano perciò due tipi di errore.

• Errore del primo tipo: rifiutare un’ipotesi nulla H0 quandoquesta è vera.

1 E’ l’errore più grave che si possa commettere.2 La probabilità di commettere errore del primo tipo è

α, viene fissata a priori dal ricercatore e si chiamalivello di significatività.

• Errore del secondo tipo: non rifiutare un’ipotesi nulla H0quando questa è falsa.

1 La probabilità di commettere errore del secondo tipoè β .

L’errore di primo e secondo tipo non possono mai verificarsi con-temporaneamente. Il primo può verificarsi solo se H0 è vera, ilsecondo solo se H0 è falsa.

3 / 19

ErroriNel processo decisionale sulle ipotesi si corre sempre il rischioche i dati campionari suggeriscano delle conclusioni errate. Siindividuano perciò due tipi di errore.

• Errore del primo tipo: rifiutare un’ipotesi nulla H0 quandoquesta è vera.

1 E’ l’errore più grave che si possa commettere.2 La probabilità di commettere errore del primo tipo è

α, viene fissata a priori dal ricercatore e si chiamalivello di significatività.

• Errore del secondo tipo: non rifiutare un’ipotesi nulla H0quando questa è falsa.

1 La probabilità di commettere errore del secondo tipoè β .

L’errore di primo e secondo tipo non possono mai verificarsi con-temporaneamente. Il primo può verificarsi solo se H0 è vera, ilsecondo solo se H0 è falsa. 3 / 19

Errori

4 / 19

p-value

Esiste una misura di sintesi probabilistica che viene usualmenteutilizzata per trarre conclusioni sulla’evidenza control’ipotesi nullain un test a partire dai dati.

Si dice p-value il più piccolo valore del livello di significatività α

per cui i dati campionari consentono di rifiutare l’ipotesi nulla.

In pratica, supponiamo che H0 sia vera. Consideriamo quindiquali valori della statistica test ci aspetteremmo di ottenere, sullabase della sua distribuzione campionaria, presumendo H0 vera.Se il valore osservato sul campione cade in una delle code delladistribuzione campionaria è lontano da quanto atteso sotto H0.Se H0 fosse vera un simile valore sarebbe poco usuale.Calcoliamo il p-value come la probabilità, sotto l’ipotesi nullavera, di osservare il valore calcolato o uno più estremo.Più piccolo è il p-value, maggiore è l’evidenza contro Ha.

5 / 19

p-value

Esiste una misura di sintesi probabilistica che viene usualmenteutilizzata per trarre conclusioni sulla’evidenza control’ipotesi nullain un test a partire dai dati.

Si dice p-value il più piccolo valore del livello di significatività α

per cui i dati campionari consentono di rifiutare l’ipotesi nulla.

In pratica, supponiamo che H0 sia vera. Consideriamo quindiquali valori della statistica test ci aspetteremmo di ottenere, sullabase della sua distribuzione campionaria, presumendo H0 vera.Se il valore osservato sul campione cade in una delle code delladistribuzione campionaria è lontano da quanto atteso sotto H0.Se H0 fosse vera un simile valore sarebbe poco usuale.Calcoliamo il p-value come la probabilità, sotto l’ipotesi nullavera, di osservare il valore calcolato o uno più estremo.Più piccolo è il p-value, maggiore è l’evidenza contro Ha.

5 / 19

p-value

Esiste una misura di sintesi probabilistica che viene usualmenteutilizzata per trarre conclusioni sulla’evidenza control’ipotesi nullain un test a partire dai dati.

Si dice p-value il più piccolo valore del livello di significatività α

per cui i dati campionari consentono di rifiutare l’ipotesi nulla.

In pratica, supponiamo che H0 sia vera. Consideriamo quindiquali valori della statistica test ci aspetteremmo di ottenere, sullabase della sua distribuzione campionaria, presumendo H0 vera.Se il valore osservato sul campione cade in una delle code delladistribuzione campionaria è lontano da quanto atteso sotto H0.Se H0 fosse vera un simile valore sarebbe poco usuale.

Calcoliamo il p-value come la probabilità, sotto l’ipotesi nullavera, di osservare il valore calcolato o uno più estremo.Più piccolo è il p-value, maggiore è l’evidenza contro Ha.

5 / 19

p-value

Esiste una misura di sintesi probabilistica che viene usualmenteutilizzata per trarre conclusioni sulla’evidenza control’ipotesi nullain un test a partire dai dati.

Si dice p-value il più piccolo valore del livello di significatività α

per cui i dati campionari consentono di rifiutare l’ipotesi nulla.

In pratica, supponiamo che H0 sia vera. Consideriamo quindiquali valori della statistica test ci aspetteremmo di ottenere, sullabase della sua distribuzione campionaria, presumendo H0 vera.Se il valore osservato sul campione cade in una delle code delladistribuzione campionaria è lontano da quanto atteso sotto H0.Se H0 fosse vera un simile valore sarebbe poco usuale.Calcoliamo il p-value come la probabilità, sotto l’ipotesi nullavera, di osservare il valore calcolato o uno più estremo.

Più piccolo è il p-value, maggiore è l’evidenza contro Ha.

5 / 19

p-value

Esiste una misura di sintesi probabilistica che viene usualmenteutilizzata per trarre conclusioni sulla’evidenza control’ipotesi nullain un test a partire dai dati.

Si dice p-value il più piccolo valore del livello di significatività α

per cui i dati campionari consentono di rifiutare l’ipotesi nulla.

In pratica, supponiamo che H0 sia vera. Consideriamo quindiquali valori della statistica test ci aspetteremmo di ottenere, sullabase della sua distribuzione campionaria, presumendo H0 vera.Se il valore osservato sul campione cade in una delle code delladistribuzione campionaria è lontano da quanto atteso sotto H0.Se H0 fosse vera un simile valore sarebbe poco usuale.Calcoliamo il p-value come la probabilità, sotto l’ipotesi nullavera, di osservare il valore calcolato o uno più estremo.Più piccolo è il p-value, maggiore è l’evidenza contro Ha.

5 / 19

p-value

6 / 19

p-valueQuando l’alternativa è bilaterale si considera l’area contenuta inentrambe le code per il calcolo del p-value.

7 / 19

Conclusione

Concludiamo che il test ha un risultato significativo, al livello pre-fissato α, se la statistica test calcolata sui dati cade nella regionedi rifiuto.

Alternativamente a partire dal valore calcolato del p-value con-cludiamo come segue:

• rifiutiamo H0 se p− value < α. In particolare:

1 se p− value < 0.10 rifiutiamo l’ipotesi nulla H0 con unlivello di significatività del 10%;

2 se p− value < 0.05 rifiutiamo l’ipotesi nulla H0 con unlivello di significatività del 5%;

3 se p− value < 0.01 rifiutiamo l’ipotesi nulla H0 con unlivello di significatività dell’1%.

8 / 19

Conclusione

Concludiamo che il test ha un risultato significativo, al livello pre-fissato α, se la statistica test calcolata sui dati cade nella regionedi rifiuto.Alternativamente a partire dal valore calcolato del p-value con-cludiamo come segue:

• rifiutiamo H0 se p− value < α. In particolare:

1 se p− value < 0.10 rifiutiamo l’ipotesi nulla H0 con unlivello di significatività del 10%;

2 se p− value < 0.05 rifiutiamo l’ipotesi nulla H0 con unlivello di significatività del 5%;

3 se p− value < 0.01 rifiutiamo l’ipotesi nulla H0 con unlivello di significatività dell’1%.

8 / 19

Conclusione

Concludiamo che il test ha un risultato significativo, al livello pre-fissato α, se la statistica test calcolata sui dati cade nella regionedi rifiuto.Alternativamente a partire dal valore calcolato del p-value con-cludiamo come segue:

• rifiutiamo H0 se p− value < α. In particolare:

1 se p− value < 0.10 rifiutiamo l’ipotesi nulla H0 con unlivello di significatività del 10%;

2 se p− value < 0.05 rifiutiamo l’ipotesi nulla H0 con unlivello di significatività del 5%;

3 se p− value < 0.01 rifiutiamo l’ipotesi nulla H0 con unlivello di significatività dell’1%.

8 / 19

Conclusione

Concludiamo che il test ha un risultato significativo, al livello pre-fissato α, se la statistica test calcolata sui dati cade nella regionedi rifiuto.Alternativamente a partire dal valore calcolato del p-value con-cludiamo come segue:

• rifiutiamo H0 se p− value < α. In particolare:

1 se p− value < 0.10 rifiutiamo l’ipotesi nulla H0 con unlivello di significatività del 10%;

2 se p− value < 0.05 rifiutiamo l’ipotesi nulla H0 con unlivello di significatività del 5%;

3 se p− value < 0.01 rifiutiamo l’ipotesi nulla H0 con unlivello di significatività dell’1%.

8 / 19

Test: proporzioni

• Consideriamo una variabile qualitativa che indicasuccesso o insuccesso, e p la proporzione di successinella popolazione;

• Assumiamo che il campione sia grande, n≥ 30, in mododa poter ritenere ragionevole che la distribuzione di P̂(proporzione campionaria) possa essere approssimatacon una distribuzione normale con media e deviazionestandard date da:

µP̂ = p σP̂ =

√p(1−p)

n

9 / 19

Test: proporzioni

• Consideriamo una variabile qualitativa che indicasuccesso o insuccesso, e p la proporzione di successinella popolazione;

• Assumiamo che il campione sia grande, n≥ 30, in mododa poter ritenere ragionevole che la distribuzione di P̂(proporzione campionaria) possa essere approssimatacon una distribuzione normale con media e deviazionestandard date da:

µP̂ = p σP̂ =

√p(1−p)

n

9 / 19

Test: proporzioni

• Consideriamo una variabile qualitativa che indicasuccesso o insuccesso, e p la proporzione di successinella popolazione;

• Assumiamo che il campione sia grande, n≥ 30, in mododa poter ritenere ragionevole che la distribuzione di P̂(proporzione campionaria) possa essere approssimatacon una distribuzione normale con media e deviazionestandard date da:

µP̂ = p σP̂ =

√p(1−p)

n

9 / 19

Test: proporzioni

Le ipotesi considerate per le proporzioni saranno unilaterali obilaterali, ossia{

H0 : p = p0

Ha : p 6= p0oppure

{H0 : p = p0

Ha : p > p0 o p < p0

dove p0 indica il particolare valore ipotizzato.

A partire dall’approssimazione normale della distribuzione di P̂si calcola la statistica

Z =P̂−p0

se0con se0 =

√p0(1−p0)

n

10 / 19

Test: proporzioni

Le ipotesi considerate per le proporzioni saranno unilaterali obilaterali, ossia{

H0 : p = p0

Ha : p 6= p0oppure

{H0 : p = p0

Ha : p > p0 o p < p0

dove p0 indica il particolare valore ipotizzato.

A partire dall’approssimazione normale della distribuzione di P̂si calcola la statistica

Z =P̂−p0

se0con se0 =

√p0(1−p0)

n

10 / 19

Test: proporzioni

Considerata la statistica

Z =P̂−p0

se0con se0 =

√p0(1−p0)

n

definiamo che per il test sulle proporzioni bilaterale:{H0 : p = p0

Ha : p 6= p0

la regola di decisione é:

Rifiutare H0 se z =p̂−p0

se0<−z α

2o z =

p̂−p0

se0> z α

2

11 / 19

Test: proporzioni

Considerata la statistica

Z =P̂−p0

se0con se0 =

√p0(1−p0)

n

definiamo che per il test sulle proporzioni unilaterale del tipo:{H0 : p = p0

Ha : p > p0

la regola di decisione é:

Rifiutare H0 se z =p̂−p0

se0> zα

12 / 19

Test: proporzioni

Considerata la statistica

Z =P̂−p0

se0con se0 =

√p0(1−p0)

n

definiamo che per il test sulle proporzioni unilaterale del tipo:{H0 : p = p0

Ha : p < p0

la regola di decisione é:

Rifiutare H0 se z =p̂−p0

se0<−zα

13 / 19

Test: proporzioni

Un membro della commissione nazionale afferma che nei testd’ingresso alla facoltà di medicina il tasso di risposte completa-mente esatte nella sezione di matematica sia 8%. Per verificarequesta ipotesi si considera un campione casuale di 500 studentie si osserva che la sezione di matematica risulta tutta correttasolo per 25 di loro. Verificare l’ipotesi ad un livello α = 0.05.

Osserviamo che n = 500 >> 30 per cui possiamo considerarel’approssimazione con la normale.

14 / 19

Test: proporzioni

Un membro della commissione nazionale afferma che nei testd’ingresso alla facoltà di medicina il tasso di risposte completa-mente esatte nella sezione di matematica sia 8%. Per verificarequesta ipotesi si considera un campione casuale di 500 studentie si osserva che la sezione di matematica risulta tutta correttasolo per 25 di loro. Verificare l’ipotesi ad un livello α = 0.05.

Osserviamo che n = 500 >> 30 per cui possiamo considerarel’approssimazione con la normale.

14 / 19

Test: proporzioni

15 / 19

Test: proporzioni

16 / 19

Test: proporzioni

Si effettuano 500 lanci di una moneta e si ottiene 267 volte testa.

a) Decidere se la moneta è truccata oppure no, con un livellodi significatività del 5%.

b) Ripetere il calcolo nel caso che il numero di volte in cui siottiene testa sia 280.

Per una moneta non truccata la probabilità di ottenere testa è0.5.

Le ipotesi del test sono:{H0 : p = p0 = 0.5Ha : p 6= 0.5

17 / 19

Test: proporzioni

Si effettuano 500 lanci di una moneta e si ottiene 267 volte testa.

a) Decidere se la moneta è truccata oppure no, con un livellodi significatività del 5%.

b) Ripetere il calcolo nel caso che il numero di volte in cui siottiene testa sia 280.

Per una moneta non truccata la probabilità di ottenere testa è0.5.Le ipotesi del test sono:{

H0 : p = p0 = 0.5Ha : p 6= 0.5

17 / 19

Test: proporzioni

Effettuiamo un test a due code con α = 0.05. Per questo livellodi significatività la regione di rifiuto è determinata da Z < −1.96oppure Z > 1.96.

a) n = 500 x = 267 allora p̂ = 267500 = 0.534 e p0 = 0.5, da cui

Z =p̂−p0

se0=

0.534−0.5√0.5(1−0.5)

500

=0.534−0.5

0.022= 1.54

Il valore Z = 1.54 < 1.96, cade quindi nella regioned’accettazione del test, per cui l’ipotesi nulla non puòessere rifiutata con un livello di significatività del 5%. Inconclusione la moneta non può ritenersi truccata

18 / 19

Test: proporzioni

Effettuiamo un test a due code con α = 0.05. Per questo livellodi significatività la regione di rifiuto è determinata da Z < −1.96oppure Z > 1.96.

a) n = 500 x = 267 allora p̂ = 267500 = 0.534 e p0 = 0.5, da cui

Z =p̂−p0

se0=

0.534−0.5√0.5(1−0.5)

500

=0.534−0.5

0.022= 1.54

Il valore Z = 1.54 < 1.96, cade quindi nella regioned’accettazione del test, per cui l’ipotesi nulla non puòessere rifiutata con un livello di significatività del 5%. Inconclusione la moneta non può ritenersi truccata

18 / 19

Test: proporzioni

Effettuiamo un test a due code con α = 0.05. Per questo livellodi significatività la regione di rifiuto è determinata da Z < −1.96oppure Z > 1.96.

b) n = 500 x = 280 allora p̂ = 280500 = 0.56 e p0 = 0.5, da cui

Z =p̂−p0

se0=

0.56−0.5√0.5(1−0.5)

500

=0.56−0.5

0.022= 2.72

Il valore Z = 2.72 > 1.96, cade quindi nella regione di rifiutodel test, per cui l’ipotesi nulla deve essere rifiutata con unlivello di significatività del 5% . In conclusione la monetapuò ritenersi truccata

19 / 19

Test: proporzioni

Effettuiamo un test a due code con α = 0.05. Per questo livellodi significatività la regione di rifiuto è determinata da Z < −1.96oppure Z > 1.96.

b) n = 500 x = 280 allora p̂ = 280500 = 0.56 e p0 = 0.5, da cui

Z =p̂−p0

se0=

0.56−0.5√0.5(1−0.5)

500

=0.56−0.5

0.022= 2.72

Il valore Z = 2.72 > 1.96, cade quindi nella regione di rifiutodel test, per cui l’ipotesi nulla deve essere rifiutata con unlivello di significatività del 5% . In conclusione la monetapuò ritenersi truccata

19 / 19