Teoria della probabilità - Descrivere lo Spazio di Probabilità (ovverosia lo Spazio Campionario,la...

Post on 02-May-2015

222 views 0 download

Transcript of Teoria della probabilità - Descrivere lo Spazio di Probabilità (ovverosia lo Spazio Campionario,la...

Teoria della probabilità

- Descrivere lo Spazio di Probabilità (ovverosia lo Spazio Campionario,la Famiglia di eventi e la Distribuzione di Probabilità) del lancio contemporaneo di due dadi a quattro facce

Si definisce Spazio di probabilità una qualsiasi terna (Ω,Є,Pr) costituita da:1. Uno Spazio Campionario Ω (insiemi degli esiti di un dato fenomeno casuale)2. Una Famiglia di Eventi Є (insieme di sottoinsiemi di Ω, chiuso a tutte le

operazioni)3. Una Distribuzione di probabilità Pr (definita su ε a valori reali)

SPAZIO CAMPIONARIO: insieme che racchiude tutti gli esiti di un dato esperimento casuale. Nel caso in cui un esperimento sia composto da più operazioni dall’esito casuale, lo spazio campionario sarà composto dal prodotto cartesiano delle singole operazioni.

Ω = Ω1 x Ω2 = 1,2,3,4 x 1,2,3,4

Card (X)²= 4²= 16 X²=X x X= 1,2,3,4 x 1,2,3,4= (1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),

(4,1),(4,2),(4,3),(4,4)

FAMIGLIA DI EVENTI:simbolicamente rappresentata da Є, è un qualsiasi insieme di eventi chiuso a tutte le operazioni insiemistiche (“campo” di eventi). Ovvero è un insieme di sottoinsiemi di Ω dove, compiendo una qualsiasi operazione insiemistica tra qualsiasi due insiemi (eventi) , il risultato (evento risultante ) è presente tra gli elementi che compongono la Famiglia di Eventi.

Se non specificato si può intendere come l’insieme potenza dello spazio campionario P(Ω).

Є= P(Ω)= Ǿ,(1,1), (1,2), (1,3),(1,4), (2,1), (2,2),…, (1,1),(1,2),(1,1),(1,3),…, (1,1),(1,2),(1,3),…, (1,1),(1,2),

(1,3),(1,4),…, (1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1),(4,2),(4,3),(4,4)

DISTRIBUZIONE DI PROBABILITA’(o misura di probabilità):

Si definisce come una qualsiasi funzione Pr con dominio la famiglia di eventi Є e codominio i numeri reali R che soddisfi le tre seguenti proprietà:

1. ¥a εЄ : Pr(a) ≥ 0 (non-negatività)

2. Pr(Ω) = 1 (normatività)

3. ¥ a; b ε Є : (a/b = Ǿ ) Pr(a [ b) = Pr(a) + Pr(b) (additività)

Per determinare la probabilità di verificarsi di un evento semplice dentro uno spazio campionario considereremo soltanto l’approccio classico:

Ogni esito di un dato esperimento ha la stessa probabilità di verificarsi degli altri; si parla quindi di esiti equiprobabili.

¥ Ω : Ω è equiprobabile

¥ ω ε Ω : Pr(ω) = 1/ |Ω|

Pr(Ǿ)=0

Pr ((1,1))= 1/ |Ω|= 1/16Pr ((1,2))= 1/ |Ω|=1/16Pr ((1,3))= 1/ |Ω|=1/16Pr ((1,4))= 1/ |Ω|=1/16

Pr ((1,1),(1,2))= Pr ((1,1)) + Pr ((1,2))=1/16 +1/16= 2/16= 1/8…Pr ((1,1),(1,2),(1,3))= Pr ((1,1)) + Pr ((1,2))+ Pr ((1,3) )=1/16

+1/16+ 1/16= 3/16…Pr ((1,1),(1,2),(1,3),(1,4))= Pr ((1,1)) + Pr ((1,2))+ Pr ((1,3),(1,4))=

1/16+1/16+1/16+1/16= 4/16=1/4…

Pr((1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1), (4,2),(4,3),(4,4) = 16/16= 1

Graficamente…

Ǿ (1,1)… 1(1,1),(1,2)… …(1,1),(1,2),(1,3)… …(1,1),(1,2),(1,3),(1,4)… ……. …(1,1),(1,2),(1,3),(1,4),(2,1), … (2,2),(2,3),(2,4),(3,1),(3,2), 1/4(3,3),(3,4),(4,1), 3/16 (4,2),(4,3) 1/8,(4,4) 1/16 0

ε R

E ora???….

• 2. Partendo da tale spazio di probabilità, rappresentare con un grafico la variabile casuale X che associa ad ogni esito la somma dei valori registrati e rappresentare infine la funzione cumulativa e quella di massa della variabile casuale X.

Dobbiamo prima definire lo spazio di probabilità euclideo…

SPAZIO DI PROBABILITA’Standard- Euclideo

Spazio di probabilità euclideo

una qualsiasi terna (R;B; Pr) costituita da:

• 1. Uno Spazio Campionario R (qualsiasi numero reale `e un potenziale esito)

• 2. Una Famiglia di Eventi B (insieme di sottoinsiemi di R chiuso a tutte le operazioni)

• 3. Una Distribuzione di probabilit`a Pr (definita su B a valori reali)

è detta Spazio di Probabilità Euclideo Unidimensionale.

Similmente, una qualsiasi terna (Rn;Bn; Pr) costituita da:

• 1. Uno Spazio Campionario Rn (qualsiasi numero reale `e un potenziale esito)

• 2. Una Famiglia di Eventi Bn (insieme sottoinsiemi di R chiuso a tutte le operazioni)

• 3. Una Distribuzione di probabilità Pr definita su B a valori reali)

è detta Spazio di Probabilità Euclideo n-dimensionale.

Le Variabili casualiDati uno spazio di probabilità (Ω,Є, Pr) e spazio di probabilità euclideo (R;B; Pr), si chiama Variabile Casuale una qualsiasi funzione V con dominio Ώ e codominio R tale per cui: ¥ В εΒ Vˉ¹(B) εΒ Quindi è una funzione che associa ad ogni esito dello spazio campionario un

valore in R.

Dallo Spazio campionario

Ώ=(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1),(4,2),(4,3),(4,4)

Devo associare ad ogni esito la somma dei valori, quindi: (1,1)=2,

(1,2),(2,1)=3,

(1,3),(3,1),(2,2)=4,

(1,4),(2,3),(3,2),(4,1)=5, (2,4),(3,3),(4,2)= 6,

(3,4),(4,3)= 7,

(4,4)=8;

R

2 3 4 5 6 7 8

…(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1),(4,2),(4,3),(4,4)

Ω

FUNZIONE DI DISTRIBUZIONE CUMULATIVA Si chiama funzione di distribuzione cumulativa, ed è

genericamente indicata con la lettera F, una qualsiasi funzione a valori reali definita su ℝ che soddisfi le seguenti condizioni:

(x<y)⇒F(x)≤F(y), ∀ x,y ∈ ℝ (monotòna non decrescente)

Limxx1 + F (x) = F(x1), ∀x1 ∈ ℝ (continua da destra) Limx-∞F(x) = 0 (convergenza a 0 verso -∞)

limx+∞F(x) = 1 (convergenza a 1 verso +∞ )

Se x = Pr([-∞, x ])

F(x)=Pr([-∞, x ])=Pr(Ø)=0F(2)=Pr([-∞, 2 ])=Pr(1,1)= 1/16F(3)=Pr([-∞, 3 ])=Pr(1,2),(2,1)= 2/16F(4)=Pr([-∞, 4 ])=Pr(1,3),(3,1),(2,2)= 3/16

F(5)=Pr([-∞, 5])=Pr(1,4),(2,3),(3,2),(4,1)= 4/16=1/4F(6)=Pr([-∞, 6])=Pr(2,4),(3,3),(4,2)= 3/16F(7)=Pr([-∞, 7])=Pr(3,4),(4,3)= 2/16F(8)=Pr([-∞, 8])=Pr(4,4)= 1/16

4/16 3/16 2/16 1/16

2 3 4 5 6 7 8

FUNZIONE DI MASSA

Si chiama funzione di massa, ed è genericamente indicata con la lettera f , una qualsiasi funzione a valori reali definita su ℝ per la quale esista un insieme Mf c ℝ di cardinalità inferiore o uguale a N(|Mf | ≤ N0) tale per cui le seguenti condizioni siano soddisfatte:

1. >0 x ∈Mf

f (x) =0 x ∉ Mf ∀ x ∈ ℝ

2. Σ f(x) =1

• Gli elementi dell’insieme Mf sono detti Punti Massa.

Quindi considerando i punti massa…

• F(2)=F(2)=Pr(1,1)= 1/16• F(3)=Pr(1,2),(2,1)= 2/16• F(4)=Pr(1,3),(3,1),(2,2)= 3/16• F(5)=Pr(1,4),(2,3),(3,2),(4,1)= 4/16=1/4• F(6)=Pr(2,4),(3,3),(4,2)= 3/16• F(7)=Pr(3,4),(4,3)= 2/16• F(8)=Pr(4,4)= 1/16

4/16 3/16 2/16 1/16

2 3 4 5 6 7 8

Teoria della probabilità.. parte II

Sia X una raccolta di dati (su scala a intervalli) di un campione di 28 studenti di psicologia sul tempo mediamente impiegatone preparare un esame:

X = 15, 20, 20, 20, 30, 35, 45, 45, 50, 50, 50, 65, 75, 80, 90, 90, 90, 95, 95, 100,100, 100, 100, 100, 100, 110, 120,

120

92 %0,9228Tot.

100%287 %0,072120

92,8 %263 %0,031110

89,2 %2520 %0,26100

67,8 %197 %0,07295

60,7 %1710 %0,1390

50 %143 %0,03180

46,4 %133 %0,03175

42,8 %123 %0,03165

39,2 %1110 %0,1350

28,5 %87 %0,07245

21,4 %63 %0,031 35

17,8 %53 %0,03130

14,2 %410 %0,1320

3,5 %13 %0,03115

Freq.Cum.P.

f. c. %

Freq. Cum.

f. c.

Freq. Perc.

f %

Proporzioni

P

Frequenza f

a) compilare una tabella delle frequenze e calcolare tutte le statistiche significanti su tale scala (tra cui il 13° e il 78°

percentile).

INDICI DELLA TENDENZA CENTRALE

MODA: All’interno di un insieme di misurazioni di un dato sistema relazionale empirico è quel valore che compare con la massima frequenza

Md = 100 (frequenza = 6)

MEDIANA: All’interno di un insieme di misurazioni disposte in ordine crescente è quel valore che occupa la posizione centrale ovvero il dato al di sopra e al di sotto del quale si trovano il 50% dei dati. Se il numero n delle osservazioni è pari: i = n/2 e la successiva all’interno dei dati

i = 28/2 = 14 e la successiva ovvero 15 Mdn (X) = Mdn(15, 20, 20, 20, 30, 35, 45, 45, 50, 50, 50, 65, 75, 80, 90, 90, 90, 95, 95, 100,100, 100, 100, 100, 100, 110, 120, 120) = 85

MEDIA: è la statistica che associa all’insieme X il numero che si ottiene sommando tutti gli n dati e dividendo il valore ottenuto per n.

Media = 71.7

Indici di posizione

QUARTILI: - primo quartile (Q1),è quel valore che ha il 25% dei dati a lui uguali o inferiori:

i = ¼ (n+1)

i = ¼ (28+1) =7,25 Q1 = 45

- secondo quartile (Q2), coincide con la mediana: i = ½ (n +1)

i = ½ (28+1) =14,5 Q2 = 80

- terzo quartile (Q3),è quel valore che ha il 75% dei dati a lui inferiori: i = ¾ (n+1)

i = ¾ (28+1) =21,7 Q3 = 100

- quarto quartile (Q4) è il valore più alto della serie ordinata: i = n

i = 29 Q4 = 120

PERCENTILI (Pm): quel valore al di sotto del quale cade una percentuale di dati pari ad m:

i = (n·m)/100

i = (28 × 13) / 100 = 3,64 posizione 3 Þ 20 i = (28 × 78) / 100 = 21,84 posizione 21 Þ 100

92 %0,9228Tot.

100%287 %0,072120

92,8 %263 %0,031110

89,2 %2520 %0,26100

67,8 %197 %0,07295

60,7 %1710 %0,1390

50 %143 %0,03180

46,4 %133 %0,03175

42,8 %123 %0,03165

39,2 %1110 %0,1350

28,5 %87 %0,07245

21,4 %63 %0,031 35

17,8 %53 %0,03130

14,2 %410 %0,1320

3,5 %13 %0,03115

Freq.Cum.P.

f. c. %

Freq. Cum.

f. c.

Freq. Perc.

f %

Proporzioni

P

Frequenza f

RANGHI PERCENTILI: è quel numero che rappresenta la percentuale di dati uguali o inferiori a lui: Rp (xi) = (k/n)·100

Indici di dispersione o di variabilitàCLASSI DI EQUIVALENZA: Valore che indica il numero di classi di equivalenza

riscontrate a livello del sistema relazionale empirico• NdE = 14• GAMMA: è statistica che associa all’insieme X il numero che si ottiene

sottraendo il valore minimo al valore massimo degli elementi di X.

G = 120-15= 105• DIFFERENZA INTERQUARTILICA: è la statistica che associa all’insieme X il

numero che si ottiene sottraendo il valore del primo quartile al terzo quartile. • DI = 89 - 28 = 61SEMIDIFFERENZA INTERQUARTILICA: si ottiene dividendo a metà la

differenza interquartilica. SI = 61/2 = 30,5

VARIANZA: è la statistica che associa all’insieme X il numero che si ottiene sommando il quadrato di tutte le differenze di ogni dato dalla media di X e dividendo il risultato per n. s² = ∑ⁿ¡=1 (xi –media)² n

s² = 1082,5 (Varianza)

DEVIAZIONE STANDARD: è la radice quadrata della varianza

…………

- 0,244,89- 6,7165

- 0,6470,89- 21,7350

- 0,8712,89- 26,7245

- 1,11346,89- 36,7…135

- 1,21738,89- 41,7…130

- 1,52672,89- 51,771,7320

- 1,732,93214,89- 56,771,7115

Punti zs =√∑ⁿ¡=1 (xi - media)² √n

f·(Xi-media)²( xi – media)MediafXi

Calcoliamo:

Ω*= 15, 20, 30, 35, 45, 50, 65, 75, 80, 90, 95, 100, 110, 120 N.B. Ω * indica lo Spazio Campionario con gli eventi non ripetuti

2. La famiglia di Eventi å coincide con l’insieme potenza P(Ù*) = å

å = P(Ù*) = Ø,15, 20, 30, 35,…, 15, 20, 15, 30,…, 15, 20, 30,…

Gli esiti dello spazio campionario sono equiprobabili, ovvero l’esito di un dato

esperimento ha la stessa probabilità di verificarsi degli altri. La probabilità di accadere di un certo evento è uguale alla cardinalità

dell’insiemeche esprime tale evento diviso la cardinalità dello spazio campionario:

per ogni e Є ε Pr(e) = |e| / | Ω |

• Dunque: Pr( 15 ) = Pr( 30 ) = Pr( 35 ) = Pr( 65 ) = Pr( 75 ) = Pr( 80 ) = Pr( 110 ) = 1/28 = 0.03

• • Pr( 20) = Pr( 50 ) = Pr( 90 ) = 3/28 = 0.1• Pr( 45) = Pr( 95 ) = Pr( 120 ) = 2/28 = 0.07• Pr( 100 ) = 6/28 = 0,2

• Pr (15, 20 ) = Pr(15 ) + Pr(20 ) = 1/28 + 3/28 = 4/28 = 0,14

• Pr (15, 45 ) = Pr(15 ) + Pr(45) = 1/28 + 2/28 = 3/28 = 0,1

• Pr (15,100 ) = Pr(15 ) + Pr(100) = 1/28 + 6/28 = 7/28 = o,25

• Pr (15, 20,45 ) = Pr(15 ) + Pr(20 ) + Pr(45) = 1/28 + 3/28 + 2/28 = 6/28 = 0,2

• Pr (15, 20,45, 100 ) = Pr(15 ) + Pr(20 ) + Pr(45)+ Pr(100) = 1/28 + 3/28 + 2/28 + 6/28 = 12/28 = 0,42

15,20,30,…,

15,20, …, 15, 20,120

15, 20,45 100

15,20,45

…15,100…

15,45

15, 20

100

45

20

15

Ø

1

0,42

0,25

0,2

0,14

0,1

0,07

0,03

0

εPr

R

Distribuzione di probabilità

Teoria della probabilità..

parte III

Sia V una variabile casuale che associa ad ogni studente il tempo mediamente impiegato per preparare un esame. Descrivere la distribuzione di probabilità indotta da tale variabile casuale.

DISTRIBUZIONE DI PROBABILITA’ INDOTTA

Dati uno spazio di probabilità (Ω,ε,Pr), uno spazio di probabilità euclideo (ℝ,B,Pr), e una variabile casuale V, si chiama distribuzione di probabilità indotta da Pr mediante la variabile casuale V e indicata simbolicamente da PrV, la funzione così definita:

¥ B Є B

PrV(B) = Pr(V-1(B))

X = (15, 20, 20, 20, 30, 35, 45, 45, 50, 50, 50, 65, 75, 80, 90, 90, 90, 95, 95, 100, 100, 100, 100, 100, 100, 110, 120, 120)

0 15 20 30 35 45 50 65 75 80 90 95 100 110 120

X x x x x x x x x x x x x x x x x x x x x x x x x x x x1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

V

Spazio campionario teorico: Ω = X

Famiglia degli eventi: ε = P(Ω), | ε| = 228

Spazio campionario effettivo: Ω* = 15,20,30,35,45,50,65,75,80,90,95,100,110,120

Famiglia degli eventi: ε = P(Ω*), | ε| = 214

DISTRIBUZIONE DI PROBABILITA’ INDOTTA DA V

Per semplicità calcoliamo solo le probabilità degli intervalli punti campione in B:

PrV ([15]), ([30]), ([35]), ([65]), ([75]), ([80]), ([110]) = 1/28

PrV ([45]), ([95]), ([120]) = 2/28

PrV ([20], ([50]), ([90]) = 3/28

PrV ([100]) = 6/28

La distribuzione di probabilità indotta PrV per ognuno dei rimanenti elementi di ε si otterrà sommando le singole probabilità dei punti campione.

Esempio: PrV(15,20) = 1/28 + 3/28 = 4/28

….

Rappresentare le funzioni di distribuzione cumulative e di massa derivate dalla variabile casuale V.

F(x) = PrV((-∞,15[) = 0/28

F(x) = PrV((-∞,15]) = 1/28

F(x) = PrV((-∞,20]) = 4/28

F(x) = PrV((-∞,30]) = 5/28

F(x) = PrV((-∞,35]) = 6/28

F(x) = PrV((-∞,45]) = 8/28

F(x) = PrV((-∞,50]) = 11/28

F(x) = PrV((-∞,65]) = 12/28

F(x) = PrV((-∞,75]) = 13/28

F(x) = PrV((-∞,80]) = 14/28

F(x) = PrV((-∞,90]) = 17/28

F(x) = PrV((-∞,95]) = 19/28

F(x) = PrV((-∞,100]) = 25/28

F(x) = PrV((-∞,110]) = 26/28

F(x) = PrV((-∞,120]) = 28/28

28/28

27/28

26/28

25/28

24/28

23/28

22/28

21/28

20/28

19/28

18/28

17/28

16/28

15/28

14/28

13/28

12/28

11/28

10/28

9/28

8/28

7/28

6/28

5/28

4/28

3/28

2/28

1/28

12

0

11

5

11

0

10

5

10

0

95

90

85

80

75

70

65

60

55

50

45

40

35

30

25

20

15

10

50

FUNZIONE DI MASSA..

Limitando il calcolo ai punti massa:

f (15), (30), (35), (65), (75), (80), (110) = PrV ([15]), ([30]), ([35]), ([65]), ([75]), ([80]), ([110]) = 1/28

f (45), (95), (120) = PrV ([45]), ([95]), ([120]) = 2/28

f (20), (50), (90) = PrV ([20], ([50]), ([90]) = 3/28

f (100) = PrV ([100]) = 6/28

Si noti la differenza tra PrV ([x]) funzione di insiemi e f(x) funzione di punti.

Il medesimo risultato si sarebbe ottenuto con la formula:

f(x) = F(x) – F(x-), ∀x ∈ ℝ

28/28

27/28

26/28

25/28

24/28

23/28

22/28

21/28

20/28

19/28

18/28

17/28

16/28

15/28

14/28

13/28

12/28

11/28

10/28

9/28

8/28

7/28

6/28

5/28

4/28

3/28

2/28

1/28

12

0

11

5

11

0

10

5

10

0

95

90

85

80

75

70

65

60

55

50

45

40

35

30

25

20

15

10

50

Maiorano DorianaMontecchi GiuliaPiovesan Jessica