Coppie di variabili aleatorieold · 2014. 12. 18. · Coppie di variabili aleatorie 1 (X Y random...
Transcript of Coppie di variabili aleatorieold · 2014. 12. 18. · Coppie di variabili aleatorie 1 (X Y random...
18/12/2014
1
Coppie di variabili aleatorie
1
( ), X Y random vector
Definizione: Si definisce vettore aleatorio la coppia (X,Y) dove X,Y,
sono definite sullo stesso spazio campione
2: , : ( , ) : X S Y S X Y S→ ℜ → ℜ⇒ → ℜ
Esempio: peso-altezza di una persona
Coppie di variabili aleatorie
2
18/12/2014
2
( ) ( ) ( ){ }, / ,X x Y y S X x Y yω ω ω= = = ∈ = =
( ){ } ( ){ }/ /S X x S Y yω ω ω ω= ∈ = ∈ =∩
( )Y yω =
( )X xω =
Variabili discrete
3
massa di probabilità congiunta
massa di probabilità marginale
Esempio: ( ) ( ) ( ) ( ){ }, , , , , , ,S T T C C C T T C=
4
18/12/2014
3
5
Il grafico nel lucido precedente è stato costruito in R con le seguenti
istruzioni:
> library(scatterplot3d)
> x<-matrix(0.25,2,2)
> x
[,1] [,2]
[1,] 0.25 0.25
[2,] 0.25 0.25
> sd3.dat<-data.frame(columns=c(col(x)),rows=c(row(x)),value=c(x))
> scatterplot3d(sd3.dat,type='h',lwd=5,color='red',main='Joint pdf',
+ x.ticklabs=seq(0,1,0.20),y.ticklabs=seq(0,1,0.20))
>
( ) ( ){ } ( ){ } ( ){ }: , : :S X x Y y S X x S Y yω ω ω ω ω ω ω∈ ≤ ≤ = ∈ ≤ ∈ ≤∩
Sω ∈
yY =)(ωY
XxX =)(ω
( ) ( ){ }
,
: ,
( , )X Y
P S X x Y y
F x y
ω ω ω∈ ≤ ≤
=
Funzione di ripartizione
doppia6
18/12/2014
4
Torniamo all’esempio del lancio delle due monete….
Massa di probabilità Funzione di ripartizione
Proprietà
( ), 1XYF +∞ +∞ = ( ), 0XYF −∞ −∞ =
( ) ( ), , 0XY XYF y F x−∞ = −∞ =
7
8
Il grafico nel lucido precedente è stato costruito con le seguenti
istruzioni:
> x<-c(0,0.5,1,1.01,1.5,2)
> y=x
> z<-matrix(1,length(x),length(y))
> fix(z)
> persp(x=x,y=y,z,zlim=c(0,2),ticktype='detailed',theta=40,phi=20,
+ main='CDF')
18/12/2014
5
9
{ }
( ) ( ) ( ) ( )1 2 1 2
2 2 2 1 1 2 1 1
,
, , , ,XY XY XY XY
P x X x y Y y
F x y F x y F x y F x y
< ≤ < ≤ =
− − −
2
1
y
y
1 2 x x 10
18/12/2014
6
( ){ } ( ){ }: ( ), : ( )X Y
P S X x F x P S Y y F yω ω ω ω∈ ≤ = ∈ ≤ =
Funzioni di ripartizione marginali…
RyxyFxFyxF
YX
YXYX ∈∀= , )()(),(
se solo e se tiindipenden dicono si e v.a.Le :eDefinizion
,11
12
Esercizio: In un lotto scelto casualmente di 1000 bulloni, sia X il numero
di bulloni che non soddisfano la specifica per la lunghezza e sia Y il nu-
mero di quelli che non soddisfano la specifica per diametro. Si assuma
che la funzione di probabilità di massa congiunta di X e di Y sia quella
presente nella tabella.
Y
X 0 1 2
0 0.40 0.12 0.08
1 0.15 0.08 0.03
2 0.10 0.03 0.01
Calcolare
( )0 2P X Y= =∪ ( )0 1P X Y> ≤∪ ( )1P X ≤ ( )0P Y >
> Si calcoli la probabilità che tutti i bulloni nel lotto soddisfino la speci-
fica per la lunghezza.
> Si calcoli la probabilità che tutti i bulloni nel lotto soddisfino la speci-
fica per il diametro.
18/12/2014
7
{ }
{ } { }
( , ) / ( ) ( , ), ( ) ( , )
/ ( ) ( , ) / ( ) ( , )
f x y x y P S X x x x Y y y y
P S X x x x S Y y y y
ω ω ω
ω ω ω ω
∆ ∆ = ∈ ∈ + ∆ ∈ + ∆
= ∈ ∈ + ∆ ∈ ∈ + ∆ ∩
Variabili continueVariabili continueVariabili continueVariabili continue
( ) ( ){ } ,: , ( , )
X YP S X x Y y F x yω ω ω∈ ≤ ≤ =
Funzione di ripartizione doppiaFunzione di ripartizione doppiaFunzione di ripartizione doppiaFunzione di ripartizione doppia
( ), , X Y
F x y ? ( , ) d d
yx
f s t s t−∞ −∞
= ∫ ∫ ( , )f x y
13
Qual è la relazione fra la funzione densità congiunta e la
funzione di ripartizione?
14
x<-seq(-3,3,0.1)
y<-seq(-3,3,0.1)
fun<-function(x,y){(1/(2*pi))*exp(-(x^2+y^2)/2)}
z<-outer(x,y,fun)
output<-persp(x,y,z,theta=60,phi=15,ticktype = "detailed",
main='cdf plot',expand=0.8)
Gaussiana bidimensionale
standard
2 21( , ) exp
2 2
x yf x y
π
+= −
( ), ( ) ( )X Yf x y f x f y=2 2
1 1exp exp
2 22 2
x y
π π
= − −
18/12/2014
8
Due variabili aleatorie ass. continue sono indipendenti
se e solo se ( , ) ( ) ( )X Y
f x y f x f y=
Teorema :
( ) ( , ) dX
f x f x t t
∞
−∞
= ∫
( ) ( , ) dY
f y f s y s
∞
−∞
= ∫
In generale, le densità
marginali possono es-
sere calcolate come:
16
Ogni curva ottenuta sulla superficie fissando un valore per x o per y
è ancora gaussiana.
I grafici si riferiscono a
( ), 1.5f x −
( ),0.5f x
18/12/2014
9
17
> install.packages('mnormt')
( ), , X YF x y
( , ) d d
yx
f s t s t−∞ −∞
= ∫ ∫
> x<-seq(-3,3,0.1)
> y<-x
�appp<-matrix(0, length(x), length(x))
> fun<-function(x,y){pmnorm(c(x,y),mu,sigma)}
> for (i in 1:61) { for (j in 1:61) { appp[i,j]<-fun1(x[i],y[j])}}
>persp(x,y,appp,zlab="F(x,y)",ticktype = "detailed",
+ main='Gaussian cdf plot',expand=0.8, col=rainbow(20))
Per la funzione di ripartizione congiunta
( , ) d dB
f x y x y∫∫
18
Selezionando opportune regioni nel
dominio, si ottiene un volume.
18/12/2014
10
[ ]( , ) ,f x y x y P x X x x y Y y y∆ ∆ ≈ < ≤ + ∆ < ≤ + ∆
{ }
( ) ( ) ( ) ( )1 2 1 2
2 2 2 1 1 2 1 1
,
, , , ,XY XY XY XY
P x X x y Y y
F x y F x y F x y F x y
< ≤ < ≤ =
− − − 19
( ),XY
F x y
x y
∂=
∂ ∂( , )f x y
Assegnata la funzione di ripartizione,
come si calcola la funzione densità?
Abbiamo visto che:
[ ]( , ) ,f x y x y P x X x x y Y y y∆ ∆ ≈ < ≤ + ∆ < ≤ + ∆
( ) ( ) ( ) ( ), , , ,XY XY XY XY
F x x y y F x x y F x y y F x y= + ∆ + ∆ − + ∆ − + ∆ −
( ) ( ) ( ) ( ), , , ,?
XY XY XY XYF x x y y F x x y F x y y F x y
x y
+ ∆ + ∆ − + ∆ − + ∆ − =∆ ∆
( ) ( ) ( ) ( ), 0
, , , ,lim ?
XY XY XY XY
x y
F x x y y F x x y F x y y F x y
x y∆ ∆ →
+ ∆ + ∆ − + ∆ − + ∆ − =∆ ∆
( ),XY
F x y
x y
∂=
∂ ∂
20
18/12/2014
11
( , ) d d 1f x y x y
∞ ∞
−∞ −∞
=∫ ∫
{ }2
2? , ( , ) d d
x
P X x Y f x y x y
∞
−∞ −∞
= ≤ < ∞ = ∫ ∫
( ) { }2
2 2, ( , ) d d
y
YF y P X Y y f x y x y
∞
−∞ −∞
= < ∞ ≤ = ∫ ∫
Condizione di normalizzazione
{ }2 2
1 1
1 2 1 2( , ) d d ,
x y
x y
f x y x y P x X x y Y y= < ≤ < ≤∫ ∫
( ) { }2 2
1 1
2
, 1 2 1 2 F , d d , y
x y
X Y
x y
x y x y P x X x y Y yx
∂= < ≤ < ≤
∂ ∂∫ ∫
( ) { }2
2 2, ( , ) d d
x
XF x P X x Y f x y x y
∞
−∞ −∞
= ≤ < ∞ = ∫ ∫
21
Poichè
allora
22
( ) ( )( ) ( )2 2
2 2 22
2 2
Quando la relazione non è lineare, allora la funzione densità di probabilità diventa:
21 1( , ) exp
2(1 )2 1
per ( , ) , ( , ) , con parame
X X Y Y
XY
X X Y YX Y
X Y
x x y yf x y
x y R R
µ ρ µ µ µ
ρ σ σ σ σπσ σ ρ
µ µ
− − − − = − − + −−
∈ ∈ tri 0, 0 e (-1,1).X Y
σ σ ρ> > ∈
[ ] [ ] [ ] [ ]2 2
X Ydove , , , , ( 1,1) X Y
E X E Y Var X Var Yµ µ σ σ ρ= = = = ∈ −
Trasformazioni lineari di var. gaussiane sono ancora gaussiane, ossia
2 2 2se ( , ) allora ( , )X N Y aX b N a b aµ σ µ σ= + +∼ ∼
Pertanto i modelli di regressione lineare vengono molto usati in
presenza di popolazioni gaussiane.
0 e indipendentiX Yρ = ⇔Teorema :
18/12/2014
12
Gaussiana bidimensionale
( )( ) ( )[ ]
(-1,1). e 0,0 parametricon ,),(,),(for
2
1exp
2
1),(
:è bivariata normale una di àprobabilit di densità funzione La
22
1
2/12/
∈>>∈∈
−Σ−−
Σ= −
ρσσµµ
µµπ
YXYX
T
nXY
RRyx
xxyxf��
:Notazione
( ) ( )( ) ( )( ) ( )
2 2
1
2 2 2
2
X
2
Y
21
(1 )
cov ,
cov ,
dove
TX X Y Y
X X Y Y
X
Y
x x y yx x
x (X,Y)x
y (X Y)
µ ρ µ µ µµ µ
ρ σ σ σ σ
µ σµ
µ σ
− − − − −
− + = − Σ − −
= = Σ =
� �
�
Un diverso modo di scrivere la densità è quello di usare la matrice di
covarianza:
24
18/12/2014
13
25
Sezioni della gaussiana bidimensionale sono (contour())
( , ) 3
Consideriamo le v.a. e con densità congiunta
1 1 ( , ) exp 0, 0X Y
X Y
xf x y x y
y y
+= − ≥ ≥
Esercizio :
( )1/ / /1/
( , ) ( , ) 20 0 0
1( , ) ( , )d d d 1
1
t x t x yx y y
y
X Y X Y
e e eF x y f s t s t t e
t x
− − −−
− = = = −
+ ∫ ∫ ∫
( , )( ) lim ( , )1
X X Yy
xF x F x y
x→∞= =
+1/
( , )( ) lim ( , ) y
Y X Yx
F y F x y e−
→∞= =
26
Istruzioni in R per il grafico della distribuzione congiunta:
> x<-seq(0,15,0.5)
> y<-seq(0,4,0.5)
> fun<-function(x,y){exp(-1/y)*(1-(exp(-x/y)/(1+x)))}
> z<-outer(x,y,fun)
> output<-persp(x,y,z,theta=60,phi=15,ticktype = "detailed",
+ main='cdf plot',expand=0.3,zlim=range(0,1))
> lines (trans3d(x, y=0, z=x/(1+x), pmat = output), col = 'red',lwd=4)
> lines (trans3d(x=15, y, z=exp(-1/y), pmat = output), col = 'green',lwd=4)
18/12/2014
14
27
Mediante derivazione si ha:
1/
2 2
1 1( ) ( )
(1 )
y
X Yf x f y e
x y
−= =+
28
18/12/2014
15
29
Istruzioni in R per il grafico precedente:
> x<-seq(0,2,0.1)
> y<-seq(0,1,0.05)
> fun<-function(x,y){(1/y^3)*exp(-(1+x)/y)}
> z<-outer(x,y,fun)
> output<-persp(x,y,z,theta=40,phi=20,ticktype = "detailed",
+ main='pdf plot')
> lines (trans3d(x, y=0, z=1/(1+x^2), pmat = output), col = 'red',lwd=4)
> lines (trans3d(x=2, y, z=exp(-1/y)/y^2, pmat = output),
+ col = 'green',lwd=4)
La probabilità che la coppia (X,Y) appartenga al dominio D si può
esprimere come somma (al limite, come integrale) delle probabilità
che la coppia (X,Y) appartenga a “rettangolini” di area infinitesima
che ricoprono il dominio D.
30
Domini non
rettangolari
18/12/2014
16
Sia (X,Y) una coppia di variabili aleatorie con pdf congiunta f (x, y):
calcoliamo P(X ≥ Y).
Il dominio D da considerare in questo caso è quello definito da
Tale dominio si può riguardare come
normale sia rispetto all’asse x che all’asse y,
31
{ }2( , ) :D x y x y= ∈ℜ ≥
1 2
1 2 1 2
: Siano e tempi di vita di due sistemi indipendenti con tassi
costanti e . Calcolare ( ).
Esercizio T T
P T Tλ λ ≥
( )1
1 2 1 2 1 2( ) , d dt
P T T f t t t t∞
−∞ −∞≥ = ∫ ∫
1 1
1 2 1 2 1 2 2 1( ) ( )d d ( ) ( )d dt t
f t f t t t f t f t t t∞ ∞
−∞ −∞ −∞ −∞
= = ∫ ∫ ∫ ∫
1
1 1 1 2 2 2 2 10 0
exp( ) exp( )d dt
t t t tλ λ λ λ∞ = − −
∫ ∫
[ ]1 1 1 2 1 10
exp( ) 1 exp( ) dt t tλ λ λ∞
= − − −∫2
1 2
λ
λ λ=
+32
18/12/2014
17
2
: Calcolare ( ) quando e sono variabili aleatorie con densità
congiunta
2 0, 0 ( , )
0
x y
Esercizio P X Y X Y
e e x yf x y
altrove
− −
≥
> >=
( )( ) , d d ...x
P X Y f x y x y∞
−∞ −∞≥ = =∫ ∫
33
Una classe molto importante di trasformazioni: Somme di variabili
aleatorie
( )( ){ }, :
( ) ( , ) d dx y x y z
P Z z P X Y z f x y x y+ ≤
≤ = + ≤ = ∫
( , ) d d
z x
f x y y x
∞ −
−∞ −∞
=
∫ ∫
Se le v.a. sono indipendenti allora ( , ) ( ) ( )X Y
f x y f x f y=
( ) ( ) d d
z x
X Yf x f y y x
∞ −
−∞ −∞
=
∫ ∫ ( )( ) d
X Yf x F z x x
∞
−∞
= −∫
( )poni
( ) ( ) d d
z x
Z X YG z f x f y y x
t y x
∞ −
−∞ −∞
= =
= + ∫ ∫
( ) ( ) dt d ( ) ( )d dt
z z
X Y Y Xf x f t x x f t x f x x
∞ ∞
−∞ −∞ −∞ −∞
− = −
∫ ∫ ∫ ∫
34
18/12/2014
18
35
Spesso usate in opera-
zioni di smoothing
Convoluzione di una
legge gaussiana con
una esponenziale
(font wikimedia)
Convoluzione di una
legge di tipo Heaviside
con la bisettrice
I e III quadrante.
36
Trasformazioni di variabili aleatorie
( )Y g X=
discretaX
a) g monotona
X -1 0 1
P(X=x) 1/3 1/3 1/3
Y -1 2 5
P(Y=y) 1/3 1/3 1/3
3 2Y X= +
b) g non monotona
X -1 0 1
P(X=x) 1/3 1/3 1/3
Y 0 1
P(Y=y) 1/3 2/3
2Y X=
18/12/2014
19
37
assolutamente continuaX
a) g monotona
( ) ( ) ( ) ( ) ( )1 1( ) ( ) ( )Y XF y P Y y P g X y P X g y F g y− −= ≤ = ≤ = ≤ =
( ) ( )Y Y
df y F y
dy=
2Provare che se ( , ) allora Esempio: (?,?)X N Y aX b Nµ σ = +∼ ∼
38
Distribuzione Lognormale
2 exp( ) ha distSe ( , ), ribuzionallora loge normale. NX Y Xµ σ =∼
La distribuzione ha due parametri:
,µ σ
Usata per modellare il tempo di
vita di unità i cui guasti avvengono
per usura o per stress.
(sistemi meccanici)
La funzione di ripartizione è: 1 1 ln
2 2 2
xErf
µ
σ
− +
erf function
18/12/2014
20
39
La function è anche detta , poichè contribuisce
alla funzione di ripartizione della distribuzione gaussiana.
Erf funzione errore
( )2
0
2 1 1( ) exp d ( )
2 2 2
xx
Erf x t t x Erfπ
= − ⇒ Φ = +
∫
Si può costruire il probability plotting
paper usando la seguente trasformazione:
( )1
2 1 ln2 2
Erfinv x xµ
σ σΦ − = −
40
Altra legge molto usata in teoria dell’affidabilità è
( )log con ( )T X X Expµ β λ λ= − ≈
La v.a. così costruita prende il nome di v.a. di Gumbel (o dei valori
estremi) = max o min di campioni casuali.
Esercizio: Determinare la funzione densità della v.a. di Gumbel.
Distribuzione di Gumbel
In R la distribuzione di Gumbel è
inserita tra le functions del pac-
chetto evd. location
scale
µ
β
→
→
> dgumbel(x,loc,scale)
18/12/2014
21
41
Per il probability plotting paper
si osservi che la funzione di ripartizio-
ne risulta:
( ) exp expx
F xµ
β
−= −
Di conseguenza la trasformazione
cercata è
1 1log log
( )x
F x
µ
β β
= −
Il grafico è costruito su datiprimoesercizio.R
Distribuzione chiDistribuzione chiDistribuzione chiDistribuzione chi----quadratoquadratoquadratoquadrato
b) Se la g non è monotona…2 Sia (0,1). Si calcoli la Eserciz pdf di io: X N Y X=∼
2 2
0
1 2exp d exp d
2 22 2
y y
y
x xx x
π π−
= − = −
∫ ∫
Pertanto la funzione
densità risulta essere:
( ) ( ) ( )2
0 0( )
0Y
yF y P Y y P X y
P y X y y
<= ≤ = ≤ =
− ≤ ≤ ≥
1( ) exp
22Y
yf y
yπ
= −
> y<-dchisq(x,1)
18/12/2014
22
43
I gradi di libertà di una v.a. chi-quadrato possono assumere valori interi
maggiori di 1.
Trattandosi di una v.a. che
assume valori solo positivi,
i quantili non sono simmetrici
rispetto all’asse delle y.
Problema: etichettare gli estremi
dell’intervallo I tale che
( ) 1P X I α∈ = −
44
1 α−
? ?
/ 2α
2 2
,2
2n
nP α
αχ χ
≥ =
2 2
,12
12
nn
P α
αχ χ
−
≥ = −
> qchisq(0.975,3)
[1] 9.348404> qchisq(0.025,3)
[1] 0.2157953
18/12/2014
23
45
Oltre alla convoluzione di due v.a., è possibile calcolare il rapporto di
due variabili aleatorie.
Ne segnaliamo due che useremo nel seguito:
Distribuzione T-Student
2
2
Siano (0,1) e Chi( ) indip. La variabile aleatoria
è detta variabile aleatoria T-student/
n
n
n
Z N n
ZT
n
χ
χ
≈ ≈
=
[ ]
[ ]
0, 2
, 32
n
n
E T n
nVar T n
n
= ≥
= ≥−
William
Sealy
Gosset
46
(0,1)
(0,1)
X NXT
Y NY
=
∼
∼
Per n → ∞
(0,1)T N→
Per 1, n T Cauchy= ∼
Esercizio: Determinare il valore del quantile tale che , /2nt α
( ), /2 , /2 1n n
P t T tα α α− < < = −
18/12/2014
24
47
Bisogna determinare quel valore del range di T tale che
1 α− /2tα
5, /25 e 0.05 2.57n t αα= = ⇒ =
10, /2
10 e 0.15
1.559236
n
t α
α= =
⇒ =
> qt(0.975,5)
[1] 2.570582
> qt(0.925,10)
[1] 1.559236
> qnorm(0.925,0,1)
[1] 1.439531> qt(0.925,30)
[1] 1.477365
> qt(0.925,50)
[1] 1.461994
48
2Se è -student, allora ha legge di Fisher (1, ).n
T T F T n=
Distribuzione F-fisher
222 12 2
/1Infatti
/ /n n
ZTn n
χχ χ
= ⇒
( ) ( )( )
2 2
2 2
Siano e due var. al. con legge chi-quadrato con gradi
di libertà rispettivamente e . La var. al. / / /
ha legge di Fisher di gradi di libertà , .
m n
m nm n m n
m n
χ χ
χ χ
>df(x, m, n) Sintassi in R
18/12/2014
25
49
Al variare di m
Al variare di n