Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un...

31
22/04/2015 1 Variabili aleatorie In molte situazioni, si vuole assegnare un valore numerico ad ogni possibile risulta- to di un esperimento. Tale assegnamento viene chiamato variabile aleatoria o ca- suale. S T 0 1 2 3 ( ) X ω 1 ω 2 ω 3 ω 4 ω 5 ω 6 ω 7 ω 8 ω Variabile aleatoria discreta Esempio: lancio di tre monete distinguibili T T T C T T T C C T T C C T C T C T C C C C C .′

Transcript of Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un...

Page 1: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

1

Variabili aleatorie

In molte situazioni, si vuole assegnare un valore numerico ad ogni possibile risulta-to di un esperimento. Tale assegnamento viene chiamato variabile aleatoria o ca-suale.

S

T

0 1 2 3

( )X ω

Variabile aleatoria discreta

Esempio: lancio di tre monete distinguibili

T T

TC T

TT C

CT T

CC T

CT C

TC C

CC C

� �� ���. ���� ����′

Page 2: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

2

( )X ω

3

2

2

2

1

1

1

0

{ }( )1

1

8P ω =

{ }( )2

1

8P ω =

{ }( )3

1

8P ω =

{ }( )4

1

8P ω =

{ }( )5

1

8P ω =

{ }( )6

1

8P ω =

{ }( )7

1

8P ω =

{ }( )8

1

8P ω =

( )2 ?P X = =

T1ω

T T

TC T

TT C

CT T

CC T

CT C

TC C

CC C

In molte situazioni, si vuole assegnare un valore numerico ad ogni possibile risulta-to di un esperimento. Tale assegnamento viene chiamato variabile aleatoria o ca-suale.

Variabile aleatoria discreta

Esempio: lancio di tre monete distinguibili

Qual è la probabilità

di ottenere ‘due

teste’?

( ) { }2 X = = , ,

( )2P X P= = ,

Eventi e variabili aleatorie

Con la notazione si indica l’evento: (� � 2)TC T TT C CT T

,TC T TT C CT T =��

� � 1 � , ,CC T TC C CT C

� � � 1 � � = ��, ,CC T TC C CT C

Page 3: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

3

Distribuzioni di probabilità

La distribuzione di probabilità di una v.a. X è una tabella recante i valori assunti dalla v.a. con le rispettive probabilità.

X 0 1 2 3

P(X=x) 1/8 3/8 3/8 1/8

Proprietà: �)� � � � ∈ 0,1 ;�)∑ � � � � = 1. Condizione di normalizzazione

Grafico:

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0 1 2 3

Esempio: lancio di un dado

1 2 3 4 5 6

! �� "�#$ �����#′���% ! � 1,2,3,4,5,6

Y 1 2 3 4 5 6

P(Y=y) 1/6 1/6 1/6 1/6 1/6 1/6

Distribuzione di probabilità

Variabile aleatoria uniforme discreta

Page 4: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

4

Esempio: lancio di due dadi

� �� "#���$ *��� %%′

136 236 336 436 536 636 536 436 336 236 136

Funzione di ripartizione

Si definisce funzione di ripartizione (o cumulata) la funzione +(�) a valori in ,0,1- tale che+ � � � � . �X 0 1 2 3

P(X=x) 1/8 3/8 3/8 1/8

Esempio: lancio di 3 monete

+ 2 � 18 0 38 0 38Qualche caso particolare: � � . 3 � 1 � � 1 0 � 0 � � . 5 � 1 � � . 22 �0

� � � . 2 � � � � 0 0 � � � 1 0 �(� � 2)

X 0 1 2 3

F(x) 1/8 4/8 7/8 1

In forma tabellare:

Risulta che: + 0 1 + 1 1 + 2 1 +(3) Più in generale �3 . �4 → + �3 . + �4(funzione crescente)

Page 5: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

5

Esempio: Si calcoli la probabilità che lanciando 3 monete distinguibili, si verifichino non più

di 2 teste.

Esempio: Si calcoli la probabilità che lanciando 3 monete distinguibili, si verifichi almeno 1

testa.� � ≥ 1+ 2 � � � . 2 � � � � 0 0 � � � 1 0 �(� � 2)

� � � � 1 0 � � � 2 0 � � � 3 � 1 2 � � 1 1� 1 2 � � � 0 � 1 2 +(0)Esempio: Si calcoli la probabilità che lanciando 3 monete distinguibili, si verifichi più di 1

testa ma non più di 3 teste.�(1 1 � . 3) � � � � 2 0 � � � 3� � � � 0 0 � � � 1 0 � � � 2 0 � � � 3 2 ,� � � 0 0 � � � 1 ]

Più in generale si ha � � 1 � . � � + � 2 +(�)� +(3) 2 +(1)Esempio: Si calcoli la probabilità che lanciando 3 monete distinguibili, si verifichi almeno 1

testa ma non più di 3 teste.�(1 . � . 3) � � � � 1 0 � � � 2 0 � � � 3� � � � 0 0 � � � 1 0 � � � 2 0 � � � 3 2 ,� � � 0 ] � +(3) 2 +(0)

Media di una variabile aleatoria

Si definisce media di una variabile aleatoria, e si indica con E[X], la media pesata dei valori assunti dalla v.a. con i pesi pari alle probabilità:

7 � �8��(� � �) X 0 1 2 3

P(X=x) 1/8 3/8 3/8 1/8

Esempio: lancio di 3 monete

7 � � 18 9 0 0 38 9 1 0 38 9 2 0 18 9 3X 1 2 3 4 5 6

P(X=x) 1/6 1/6 1/6 1/6 1/6 1/6

Esempio: lancio di 1 dado

7 � � 16 (1 0 2 0 3 0 4 0 5 0 6)Un caso particolare: X a

P(X=x) 1 7 � � � Variabile

aleatoria

degenere

Page 6: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

6

Varianza di una variabile aleatoria

Si definisce varianza di una variabile aleatoria, e si indica con Var[X], la media pesata delle distanze al quadrato dei valori assunti dalla v.a. rispetto alla media, con pesi pa-ri alle probabilità: :�� � �8(� 2 7 � )4�(� � �)

X 0 1 2 3

P(X=x) 1/8 3/8 3/8 1/8

Esempio: lancio di 3 monete

:�� � � 3� 9 (0 2 1,5)40 �� 9 (1 2 1,5)40 �� 9 (2 2 1,5)40 3� 9 (3 2 1,5)4X 1 2 3 4 5 6

P(X=x) 1/6 1/6 1/6 1/6 1/6 1/6

Esempio: lancio di 1 dado

:�� � � 3; 9 (0 2 1,5)40(1 2 1,5)40(2 2 1,5)40⋯0(6 2 1,5)4La deviazione standard

è la radice quadrata del-

la varianza.

X a

P(X=x) 1 :�� � � (� 2 �)49 1Un caso particolare:

Proprietà

Linearità: 7 �� 0 � � �7 � 0 �X 0 1 2 3

P(X=x) 1/8 3/8 3/8 1/8

Esempio: lancio di 3 monete

7 2� 0 3 � 3� 9 3 0 �� 9 5 0 �� 9 7 0 3� 99 = 6 = 29 1,5 0 3 � 27 � 0 32X+3 3 5 7 9

P(X=x) 1/8 3/8 3/8 1/87 2� 0 3 � 27 � 0 3

Varianza: :�� �� 0 � � �4:�� �:�� 2� 0 3 � 3� 9 (3 2 6)40 �� 9 (5 2 6)40 �� 9 (7 2 6)40 3� 9 (9 2 6)4� 3 � 4 9 :��,�-Un caso particolare:

� � 1?� � 2@?

Sia e 7,�- � @ :��,�- � ?4�� 0 � � � 2 @? 7 � 2 @?:�� ABCD

= 3D 7 � 2 CD � 0

= 3DE :�� �

Page 7: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

7

Mediana

La mediana di una v.a. è quel valore M tale che +(F) ≥ 0,5.X 0 1 2 3

P(X=x) 1/8 3/8 3/8 1/8

Esempio: lancio di 3 monete

M=1, poiché + 1 � 0,5X 1 2 3 4 5 6

P(X=x) 1/6 1/6 1/6 1/6 1/6 1/6

Esempio: lancio di 1 dado

M=3, poiché + 3 � 0,5X 2 3 4 5 6 7 8 9 10 11 12

P(X=x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

Esempio: lancio di 2 dadi M=7, poiché + 7 � 0,58

Variabile aleatoria binomiale

Numero di teste nel lancio

di una moneta 10 volte

Numero di SI in

un referendum

Numero di titoli a rischio

immessi nel mercato

Numero di neonate

in un ospedale

Una variabile aleatoria binomiale restituisce il numero di successi in n prove ripetute bernoulliane. In ogni prova di Bernoulli la probabilità di successo è indicata con* ∈ 0,1 .

X 0 1 2 3

P(X=x) 1/8 3/8 3/8 1/8

� � 3 numero dei lanci della moneta* � 1/2 probabilità che esca testa (=successo)

Page 8: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

8

Esempio: Un processo industriale produce pezzi difettosi con probabilità * � 0,05.Identificando l’evento successo con l’osservazione di un pezzo difettoso ed immagi-

nando di campionare 5 pezzi a caso, si determini la distribuzione di probabilità della

v.a. X = numero di pezzi difettosi tra i 5 campionati.

Come calcolare le probabilità?

Si usano le tavole statistiche della funzione di ripartizione.

+ 0 � � � � 0 � 0,7738 + 1 � � � . 1 � 0,9774 + 2 � � � . 2 � 0,9988 …

� � . 2 � � � � 2 0 � � � 1 0 �(� � 0)-� � . 1 � � � � 1 0 �(� � 0) �(� � 2)

+ 2 2 +(1)� � . 3 � � � � 3 0 � � � 2 0 � � � 1 0 �(� � 0)-� � . 1 � � � � 1 0 �(� � 0) � � � 2 0 �(� � 3)

+ 3 2 +(1)X 0 1 2 3 4 5

F(x) 0,7738 0,9774 0,9988 1,000 1,000 1,000

+(1)+(2) �(� � 2)

Page 9: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

9

� � . 2 � � � � 2 0 � � � 1 0 �(� � 0)-� � . 1 � � � � 1 0 �(� � 0) �(� � 2)

+ 2 2 +(1)� � . 3 � � � � 3 0 � � � 2 0 � � � 1 0 �(� � 0)-� � . 1 � � � � 1 0 �(� � 0) � � � 2 0 �(� � 3)

+ 3 2 +(1)X 0 1 2 3 4 5

F(x) 0,7738 0,9774 0,9988 1,000 1,000 1,000

+(1)+(2)� � � 2 0 �(� � 3)

� � . 2 � � � � 2 0 � � � 1 0 �(� � 0)-� � . 1 � � � � 1 0 �(� � 0) �(� � 2)

+ 2 2 +(1)� � . 3 � � � � 3 0 � � � 2 0 � � � 1 0 �(� � 0)-� � . 1 � � � � 1 0 �(� � 0) � � � 2 0 �(� � 3)

+ 3 2 +(1)X 0 1 2 3 4 5

F(x) 0,7738 0,9774 0,9988 1,000 1,000 1,000

+(2)+(3) �(� � 3)

X 0 1 2 3 4 5

F(x) 0,7738 0,9774 0,9988 1,000 1,000 1,000

P(X=x) 0,9774-0,7738 0,9988-0,9774 1-0,9988 0 0 0

Page 10: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

10

Esempio: Un processo industriale produce pezzi difettosi con probabilità * � 0,05. Identificando l’evento successo con l’osservazione di un pezzo difet-

toso ed immaginando di campionare 5 pezzi a caso, si determini la distribuzio-

ne di probabilità della v.a. X = numero di pezzi difettosi tra i 5 campionati.

a) Qual è la probabilità di trovare almeno 1 pezzo difettoso nei 5 estratti?

b) Qual è la probabilità di trovare al più un pezzo difettoso nei 5 estratti?

c) Qual è la probabilità di trovare non più di un pezzo difettoso nei 5 estratti?

d) Qual è la probabilità di trovare 4 o 5 pezzi difettosi nei 5 estratti?

� � ≥ 1� � . 1 � +(1)

� � ≥ 4 � 1 2 � � 1 4 � 1 2 +(3)7 � � �* = 5 9 0,05 � 1,25Var � � 5 9 0,05 9 0,95 � 1,18 H � � 1,18

� 1 2 � � 1 1 � 1 2 +(0)

e) Calcolare media e varianza della v.a. X.

Esempio: Si consideri un’urna con 10 palline, di cui 4 rosse e 6 nere. Sia X la variabile aleato-

ria che restituisce il numero di palline rosse ottenute in 8 estrazioni dall’urna con reimissione.

a) Si calcoli il numero medio di palline rosse.

b) Si determini la probabilità di ottenere

esattamente due palline rosse.

7 � � �* = 8 9 0,4 � 3,2

� � � 2 � + 2 2 +(1)� 0,3154 2 0,1064 � 0,2090c) Si determini la probabilità di ottenere

almeno due palline rosse.

� � ≥ 2 � 1 2 �(� 1 2)� 1 2 + 1 � 1 2 0,1064 � 0,8936d) Si determini la probabilità di ottenere

più di quattro palline rosse.� � I 4 � 1 2 �(� . 3)� 1 2 + 3 � 1 2 0,5941

Page 11: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

11

Distribuzione binomiale di parametrin=10 e p=0,1

Distribuzione binomiale di parametrin=10 e p=0,5

Distribuzione binomiale di parametrin=10 e p=0,8

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0 1 2 3 4 5 6 7 8 9 10

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0 1 2 3 4 5 6 7 8 9 10

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0 1 2 3 4 5 6 7 8 9 10

Variabile aleatoria ipergeometrica

Una variabile aleatoria ipergeometrica restituisce il numero di successi in nprove ripetute non bernoulliane. In ogni prova la probabilità di successo non è costante.

k N-k

successi insuccessi

Si effettuano n estrazioni senza reimmissione

� Se sono stati giocati due numeri sulla

ruota di Napoli (ad esempio 27 e 31)

allora J � 90, K � 2, � � 5Qual è la probabilità di effettuare l’ambo?

�(� � 2)

Page 12: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

12

In questo caso, è possibile usare il fattore di correzione di una popolazione finita. J 2 �J 2 1 � 0,955J � 90, � � 5Per

In tal caso la probabilità di successo è 0,0222

e il numero di estrazioni è � � 5. p=4LM �

Nelle tavole il valore 0,0222 non è dato. In tal caso bisogna usare il valore

di p più prossimo al valore assegnato, ossia p=0,05. � � � 2 � + 2 2 +(1) � 0,9988 2 0,9774 � 0,0214

Il numero di prove di Bernoulli coincide con quello assegnato per la v.a. ipergeometrica, n=5.

La probabilità di successo è pari alla probabilità di successo alla prima

estrazione.

7 � � KJ 9 �:�� � � � 9 KJ 9 1 2 KJ 9 J 2 �J 2 1

Media:

Varianza:

� 290 9 5 � 0,11

� 5 9 290 9 1 2 290 9 90 2 590 2 1 � 0,10

Esempio: Si consideri un’urna con 10 palline, di cui 4 rosse e 6 nere.

Sia X la variabile aleatoria che restituisce il numero di palline rosse ottenute

in 8 estrazioni dall’urna senza reimmissione.

a) Si calcoli il numero medio di palline rosse.

b) Si determini la probabilità di ottenere

esattamente due palline rosse.� � � 2 � + 2 2 +(1)� 0,133

c) Si determini la probabilità di ottenere

almeno due palline rosse.� � ≥ 2 � 1 2 �(� 1 2) � 1 2 + 1 � 1d) Si determini la probabilità di ottenere

più di quattro palline rosse.� � I 4 � 1 2 + 4 � 0

7 � � KJ 9 � � 410 9 8 � 3,2(Lo stesso della v.a. binomiale)

Fattore di correzione è: 2/9=0,222

� � � 2 � 0,2090� � ≥ 2 � 0,8936

Page 13: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

13

Variabile aleatoria di Poisson

Simeon-Denis Poisson

La distribuzione di probabilità di una v.a. di Poisson è una appros-

simazione della distribuzione di probabilità di una v.a. binomiale,

al crescere del numero di prove e al diminuire della probabilità di

successo.

La v.a. di Poisson si applica nei processi di conteggi delle realizzazioni di un evento aleatorio.

• Numero di errori in una pagina di un libro

• Numero di telefonate ad un centralino telefonico

• Numero di automobili in ingresso in un parcheggio

• Numero di ombrelli lasciati su di un autobus

7 � � N:�� � � N La media rappresenta il numero medio di eventi per unità (un’ora;un giorno; la pagina di un libro…)

Esempio: Per studiare il processo con cui si riduce nel tempo la densità di una sostanza radio-

attiva, è stato osservato un pezzo di radio durante 2.550 intervalli temporali di ampiezza 7,5

secondi e registrato un numero di particelle emesse per unità di tempo per un totale di 10.094

particelle. Le frequenze sono riportate in tabella.

No.par

ticelle

Frequenza

0 226

1 858

2 1630

3 2065

4 1962

5 1491

6 948

7 513

8 243

9 108

10 50

Stabilire se è possibile assumere che

la v.a. che conta il numero di particelle

emesse può essere modellata con una

v.a. di Poisson.

a) Calcolo del parametro. N � 10.0942.550 � 3,95

Freq.relat.

0,0224

0,0850

0,1615

0,2046

0,1944

0,1477

0,0939

0,0508

0,0241

0,0107

0,0050

b)

Poisson

0,018

0,074

0,146

0,195

0,196

0,156

0,104

0,06

0,03

0,013

0,005

c) Grafico.

0

0,05

0,1

0,15

0,2

0,25

0 1 2 3 4 5 6 7 8 9 10

Teorico

Dati

Page 14: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

14

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0 1 2 3 4 5 6 7 8 9 10

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0 1 2 3 4 5 6 7 8 9 10

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0 1 2 3 4 5 6 7 8 9 10

Distribuzione di Poisson di parametro N�1

Distribuzione di Poisson di parametro N�2

Distribuzione di Poisson di parametro N�4

Una distribuzione binomiale può essere approssimata da una distribuzione di Poisson, quando

n è molto grande e p è molto piccolo.

Un criterio è : �*, �(1 2 *) I 5

0,0000

0,0200

0,0400

0,0600

0,0800

0,1000

0,1200

0,1400

0,1600

0,1800

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

Poiss

binom

0

0,05

0,1

0,15

0,2

0,25

0,3

0 1 2 3 4 5 6 7 8 9 10

poiss

binom

Poisson di parametro N�3090,25Binomiale di parametri n�30,p�0,25

Poisson di parametro N�1090,5Binomiale di parametri n�10,p�0,5

Page 15: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

15

Esempio: Il numero di errori di battitura commessi da una esperta dattilografa

segue una legge di Poisson di parametro 3 errori per pagina.

a) Calcolare la probabilità che in una pagina compaiano più di 3 errori.

b) Calcolare la probabilità che in una pagina compaiano meno di 2 errori.

d) Calcolare la probabilità che in due pagine compaiano almeno 4 errori.

c) Usando le tavole,

verificare che il nu-

mero medio di er-

rori è 3.

� � I 3� � 1 2

0 1 2 3 4 5 6 7 8 9

0,005 0,149 0,224 0,224 0,168 0,101 0,051 0,022 0,008 0,003

Se in una pagina vi sono 3 errori, in 2 pagine vi sono 6 errori. Per rispondere al quesito occorre

usare il parametro N � 6. � � ≥ 4 �

� 1 2 � � . 3 � 1 2 + 3 � 1 2 0,647� � � . 1 � + 1 � 0,199

1 2 � � . 3 � 1 2 + 3 � 1 2 0,151

0 1 2 3 4 5 6 70

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

Uniforme discreta, n=501

0 1 2 3 4 5 6 70

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

Uniforme discreta, n=101

0 1 2 3 4 5 6 70

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

Uniforme discreta, n=51

0 1 2 3 4 5 6 70

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

Uniforme discreta, n=21

0 1 2 3 4 5 6 70

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

Uniforme discreta, n=11

1 2 3 4 5 60

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

Uniforme discreta, n=6

Per passare dal modello discreto al modello continuo non basta solo “infittire” i valori del

range � perché le probabilità vanno a zero!!

?

Dal discreto al continuo

Page 16: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

16

0,1818=(1/11)/0,5 0,1961=(1/51)/0,1

0,1996=(1/501)/0,01 0,2=(1/5001)/0,001

Come evitare che le masse di probabilità vadano a zero?

Il profilo della curva viene detto funzione densità di probabilità.

Per questo tipo di variabili si ha che � � � � � 0Ossia, 0,2 9 0,001 = 1/5001

restituisce la probabilità che la variabile aleatoria assuma uno specifico valore.

Variabile aleatoria uniforme continua

Si definisce variabile aleatoria uniforme sull’intervallo �, � la variabile aleatoria

avente funzione densità: Q � � R 1� 2 � � ∈ ,�, �-0 ����#S

0

0,2

0,4

0,6

0,8

1

1,2

0 0,05 0,15 0,25 0,35 0,45 0,55 0,65 0,75 0,85 0,95 1

� � 0, � � 1 � 0,05 1 T . 0,25

81 9 ∆� �∆

Sommare le aree

di tutti i rettangoli

aventi per altezza la

funzione densità e

per base l’intervallo

tra due consecutive

barre

http://faraday.physics.utoronto.ca/PVB/Harrison/Flash/Integrals/Integrals.swf

Grafico per � Si assuma di voler calcolare

8� T � � ~8Q � ∆�∆

E poi far tendere ∆� a zeroW 1$�M,4XM,MX

T( �, � )

Page 17: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

17

� 0,05 1 T . 0,25 �

0

0,2

0,4

0,6

0,8

1

1,2

0 0,05 0,15 0,25 0,35 0,45 0,55 0,65 0,75 0,85 0,95 1

Più in generale, si ha: + � � � T . �

0

0,2

0,4

0,6

0,8

1

1,2

0 0,05 0,15 0,25 0,35 0,45 0,55 0,65 0,75 0,85 0,95 1

x

W $�M,4XM,MX � 0,25 2 0,05 � 0,20

� W $� M � �

Funzione di ripartizione

Probabilità su un intervallo

Più in generale, si ha: �3 1 �4 → + �3 . + �4

0

0,2

0,4

0,6

0,8

1

1,2

0 0,05 0,15 0,25 0,35 0,45 0,55 0,65 0,75 0,85 0,95 1�4�3+ 1 � 1

0

0,2

0,4

0,6

0,8

1

1,2

0 0,05 0,15 0,25 0,35 0,45 0,55 0,65 0,75 0,85 0,95 1

� �3 1 � . �4 � + �4 2 + �3� W $� � �4 2 �3 E

YProprietà:

In tal caso gli estremi di integrazione

possono essere inclusi entrambi:� �3 . � . �4

Page 18: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

18

La funzione di ripartizione ha forma:

+ � � Z 0 � 1 �W 1� 2 � $� � � 2 �� 2 � [ � ∈ ,�, �-1 � I �

0

0,2

0,4

0,6

0,8

1

1,2

-0,5

-0,4

-0,3

-0,2

-0,1 0

0,0

5

0,1

5

0,2

5

0,3

5

0,4

5

0,5

5

0,6

5

0,7

5

0,8

5

0,9

5 1

1,1

1,2

1,3

1,4

1,5

�, � � ,0,1-

0

0,2

0,4

0,6

0,8

1

1,2

6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

�, � � ,10,20-

�, � � ,10,20-Esempio:

� 15 1 T . 18 �

Grafico di + � per Grafico di + � per

+ 18 2 + 15 � 18 2 1010 2 15 2 1010

Esempio: Sia T un tempo di attesa alla fermata di un autobus. La corsa passa ogni 30 minuti

a partire dalle 7.00 del mattino. Se un passeggero arriva alla fermata in un momento casuale

con distribuzione uniforme tra le 8.00 e le 8.30, si calcoli con quale probabilità dovrà aspetta-

re il prossimo autobus

a) per meno di 5 minuti

b) per almeno 12 minuti.

c) Se ha già atteso 5 minuti, qual è la probabilità che debba attendere almeno altri 5 minuti?

d) Se ha già atteso 5 minuti, qual è la probabilità che debba attendere tra i 10 e i 15 minuti?

� + 5 � 530�, � � ,0,30-

�)� � I 12 �

� � I 10|� I 5 � � � I 10� � I 5 � 30 2 1030 2 5� 10 1 � 1 15|� I 5 � � 10 1 � 1 15� � I 5 � 15 2 1030 2 5

0

0,005

0,01

0,015

0,02

0,025

0,03

0,035

0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30

a) � � 1 51 2 + 12 � 30 2 1230

� � � I 10 ∩ � I 5�(� I 5)� � 10 1 � 1 15 ∩ � I 5�(� I 5)

7 � � � 0 �2 :�� � � (� 2 �)42=15 =15

Page 19: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

19

Variabile aleatoria gaussiana

La curva gaussiana sul marco tedesco

Inno di lode dedicato alla curva dallo statistico W.J. Youden

Carl Friedrich Gauss

Variabile aleatoria gaussiana

Cosa c’è di diverso in queste due curve?

J(0,1) J(19,4)

La curva gaussiana è caratterizzata

da due parametri:

� la media (linea rossa)

� la varianza (linea blu)

La curva gaussiana sul marco tedesco

Carl Friedrich Gauss

Page 20: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

20

J(0,1)J(19,4)

� Modificare la media equivale a traslare la curva

sull’asse delle ascisse

� Modificare la varianza equivale ad appuntire o

schiacciare la curva

Grafico delle funzioni di ripartizione.

^~J 0,1 → � � @ 0 ?^

La variabile aleatoria gaussiana standard

ha media 0 e varianza 1.

Ogni variabile aleatoria gaussiana si ottiene

per trasformazione lineare da una variabile

aleatoria gaussiana standard.

�~J @, ? → ^ � � 2 @?

Le due aree rosse sono equivalenti

�(15 1 � . 19)�(21 1 ^ . 0)

Infatti se 21 1 ^ . 0 � � 4 9 ^ 0 19 → 15 1 � . 19L’equivalenza delle due aree è visibile nel grafico sottostante:

Page 21: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

21

Relazione tra area sotto la curva gaussiana e funzione di ripartizione.

+(22)~0,35� W Q � $�B4

B_� �(� . 22)

Relazione tra area sotto la curva gaussiana e funzione di ripartizione. +(4,5)~0,9

� W Q � $�`,XB_

� �(� . 4,5)

Page 22: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

22

Per calcolare i valori dell’area è possibile usare le tavole statistiche della v.a. ^: +(22,68) �� 0,0037+(23,91) �� 0

+ 1,47 � + 1,08 �Il calcolo della funzione di ripartizione di ogni variabile aleatoria gaussiana va ricondotto alla

variabile aleatoria gaussiana standard.

0,9292 0,8599

Page 23: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

23

Esempio: Sia � una variabile aleatoria gaussiana di media 1500 e deviazione standard 300.

Calcolare � � . 1400

Per poter usare le tavole, è necessario trasformare la v.a. � nella variabile aleatoria

standard ^(�#���#* ��a#� $"���$��$aa�a#� ). Analoga trasformazione subirà

la costante 1400 (mediante l’operazione di standardizzazione).� . 1400� � ^ . 20,33

Si tratta di calcolare l’area in blu.

� � . 1400� 2 1500300 . 1400 2 1500300↔ ^ �� 20,33

Esempio: Sia � una variabile aleatoria gaussiana di media 1500 e deviazione standard 300.

Calcolare � � I 1630 .

� � 2 1500300 I 1630 2 1500300� ^ I 1630 2 1500300 � ^ I 130300

+ 0,43Osserviamo che

=0,3336

Si tratta di calcolare l’area in blu.

� �� �(^ . 0,43)

E’ necessario trasformare la v.a. � nella v.a. standard ^.

� � ^ I 0,43

Page 24: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

24

Esempio: � è una variabile aleatoria gaussiana con media 70 e deviazione standard 3,3.

Calcolare �(69 . � . 74)Si tratta di calcolare l’area in blu.

Per poter usare le tavole, è necessario trasformare

la v.a. � nella variabile aleatoria standard ^assieme ai valori 69 e 74.

^ � � 2 703,3 a3 � 69 2 703,3 � 20,30 → �(a3 1 ^ . a4)a4 � 74 2 703,3 � 1,21

Il problema inverso

Si dice p-esimo percentile �cdella variabile aleatoria quel valore tale che + �c � � � . �c � *Esempio: Sia � una variabile aleatoria gaussiana con media 70 e deviazione standard 3,3.

Determinare il 40-esimo percentile. + �M,`M � � � . �M,`M � 0,40

?

Si cerca sulla tavola della gaussiana quel valore ?tale che l’area a sinistra è uguale a 0,40

-0,25� ^ . 20,25 ~0,40 ^ � � 2 703,3 . 20,25� . 70 2 0,25 9 3,3

= 69,17

Page 25: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

25

Esempio: Sia � una variabile aleatoria gaussiana con media 70 e deviazione standard 3,3.

Determinare l’82-esimo percentile. + �M,�4 � � � . �M,�4 � 0,82

Si cerca sulla tavola della gaussiana quel valore

tale che l’area a sinistra è uguale a 0,82

0,92

� ^ . 0,92 ~0,82 ^ � � 2 703,3 . 0,92 � . 70 2 0,92 9 3,3 = 39, 64

La legge dei 3 sigma

� @ 2 ? 1 � . @ 0 ? � 68%� @ 2 2? 1 � . @ 0 2? � 95%� @ 2 3? 1 � . @ 0 3? � 99,7%

Page 26: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

26

Fissata un’area 1 2 esotto la curva densità gaussiana, gli estremi dell’intervallo cen-trato sulla media e tale che si dicono quantili.

1 2 e

e 2fe 2f� a3 1 ^ . a4 � 1 2 e

Quantili

a3Bg/4

� ^ . a3Bg/4 � 1 2 e 2f� ^ . ag/4 � e 2f

Esempio: Sia e � 0,05. Allora 1 2 e � 0,95 1 2 e 2f � 0,975E’ necessario cercare sulle tavole quei valori tali che � ^ . aM,M4X � 0,025

e � ^ . aM,LhX � 0,975e 2f � 0,025

aM,M4X � 21,96aM,LhX � 1,96NB: sono simmetrici

rispetto all’asse delle y.

In particolare

Quantili

Esempio: Sia e � 0,01. Allora 1 2 e � 0,99 1 2 e 2f � 0,995E’ necessario cercare sulle tavole quei valori tali che � ^ . aM,MMX � 0,005� ^ . aM,LLX � 0,995

e 2f � 0,005

aM,M4X � 22,57aM,LhX � 2,57

NB: sono simmetrici

rispetto all’asse delle y.

Esempio: Sia e � 0,1. Allora 1 2 e � 0,90 1 2 e 2f � 0,95E’ necessario cercare sulle tavole quei valori tali che e � ^ . aM,MX � 0,05� ^ . aM,LX � 0,95

e 2f � 0,05

aM,MX � 21,64aM,LX � 1,64NB: sono simmetrici

rispetto all’asse delle y.

Page 27: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

27

Q-Q Plot

Il grafico si riferisce alle altezze di 100 studenti di una scuola.

Ad esso è stato sovrapposto una densità gaussiana.

E’ possibile dire che la variabile aleatoria «altezzadi uno studente di quella scuola» è gaussiana?

Con quale media? Con quale varianza?

Un primo modo per verificare se il campione casuale

proviene da una popolazione gaussiana è il q-q plot.

Se i dati si distribuiscono lungo una retta, allora

è possibile ritenere valido il modello teorico.

Come si costruisce?

Q-Q Plot

� I dati vanno ordinati �(3) . �(4) . ⋯ . �(i)� Per ciascuno di essi va calcolata la funzione di ripartizione empirica

+ �(j) � 2 0,5�� Si determina il percentile di una variabile aleatoria standard corrispondente a jBM,X i⁄ .

� ^ . aj � jBM,Xi .

� I punti di coordinate �(j), aj vanno disegnati su un grafico.

Esempi di Q-Q plot non lineari

Page 28: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

28

Dati

12,09

10,08

12,60

11,31

8,89

11,23

11,90

11,54

8,09

12,16

Dati ordinati

8,09

8,89

10,08

11,23

11,31

11,54

11,90

12,09

12,16

12,60

F(x)

0,05

0,15

0,25

0,35

0,45

0,55

0,65

0,75

0,85

0,95

Percentili

-1,64

-1,03

-0,67

-0,39

-0,13

0,13

0,39

0,67

1,04

1,65

-2,0000

-1,5000

-1,0000

-0,5000

0,0000

0,5000

1,0000

1,5000

2,0000

8,00 9,00 10,00 11,00 12,00 13,00

Q-Q plot

Esempio: Disegnare un Q-Q plot per i seguenti dati.

Q-Q Plot

Istogrammi di campioni casuali costruiti con n=40 (blu), n=100 (verde), n=400 (giallo)

Q-Q plots

Page 29: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

29

Approssimazione di una binomiale con una gaussiana

La macchina di Galton

https://www.youtube.com/watch?v=PovNdxZ_ql8

Approssimazione di una binomiale con una gaussiana

n=10, p=0,1� l J(10 9 0,1; 10 9 0,1 9 0,9)n=50, p=0,1

� l J(50 9 0,1; 50 9 0,1 9 0,9)

� L’approssimazione di una v.a. binomiale con una v.a. gaussiana è possibile non solo quando

la prima distribuzione è simmetrica. Ma ogni qual volta la media della v.a. binomiale è mag-

giore di 5.

� L’approssimazione migliora al crescere del parametro n e al diminuire del parametro p.

Page 30: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

30

Esempio: Sia X il numero di teste su 800 lanci di una moneta. Sia p la probabilità di successo.

Calcolare�(380 1 � 1 420) per * � 0,5.Non vi sono a disposizione tavole per questo calcolo.

Va usata l’approssimazione gaussiana.

Media gaussiana = media binomiale = 800 9 0,5 � 400Varianza gaussiana = varianza binomiale = 800 9 0,5 9 0,5 � 200

^ � � 2 400200a3 � 380 2 400200 � 21,41a4 � 420 2 400200 � 1,41

380 1 � 1 42021,41 1 ^ 1 1,41

� 21,41 1 ^ 1 1,41 � + 1,41 2 + 21,41 � 0,9207 2 0,0793

Fattore di correzione per continuità

L’approssimazione gaussiana alla distribuzione binomiale può non essere soddisfacentequando si va a stimare la probabilità di intervalli piccoli, anche per valori di n elevati.

Esempio: Sia �~m(400; 0,20) Si vuole calcolare � 69 1 � . 71 .Usando l’approssimazione gaussiana con Il valore esatto è 0,0703.

media 400 9 0,20 e varianza 400 9 0,20 9 0,80� 69 1 � . 71 � � 69 2 808 1 ^ 1 71 2 808 � � 21,37 1 ^ 1 21,12 =0,0461

Il grafico della densità gaussiana e della

distribuzione binomiale (sovrapposte) è:

L’area blu è più piccola.

Page 31: Variabili aleatorieold · Numero di teste nel lancio di una moneta 10 volte Numero di SI in un referendum Numero di titoli a rischio immessi nel mercato Numero di neonate in un ospedale

22/04/2015

31

Fattore di correzione per continuità

L’approssimazione gaussiana alla distribuzione binomiale può non essere soddisfacentequando si va a stimare la probabilità di intervalli piccoli, anche per valori di n elevati.

Esempio: Sia �~m(400; 0,20) Si vuole calcolare � 69 1 � . 71 .Usando l’approssimazione gaussiana con Il valore esatto è 0,0703.

media 400 9 0,20 e varianza 400 9 0,20 9 0,80� 69 2 0,5 1 � . 71 0 0,5 � � 68,5 2 808 1 ^ 1 71,5 2 808 � � 21,44 1 ^ 1 21,06

=0,0697

Il grafico della densità gaussiana e della

distribuzione binomiale (sovrapposte) è:

L’area blu è più piccola.

L’intervallo viene allargato sottraendo 0,5 all’estremo sinistro e aumentando di 0,5 l’estremo de-

stro.