Eliciting Multivariate Probability Distributions - Dr Jeremy Oakley
Kapitel 7 Multivariate · PDF fileder Zufallsvariablen X und Y ωxy KKK 00 KKZ 01 KZK 11...
Click here to load reader
Transcript of Kapitel 7 Multivariate · PDF fileder Zufallsvariablen X und Y ωxy KKK 00 KKZ 01 KZK 11...
Kapitel 7
Multivariate Zufallsvariablen
7.1 Diskrete Zufallsvariablen
Bisher haben wir immer nur eine Zufallsvariable betrachtet. Bei vielen An-wendungen sind aber mehrere Zufallsvariablen von Interesse. So besteht einFragebogen in der Regel aus mehreren Fragen, mit denen die Auspragungenvon Merkmalen erfragt werden.
Bei einer univariaten diskreten Zufallsvariablen gehen wir von der Ergebnis-menge Ω eines Zufallsvorgangs aus und ordnen jedem Ergebnis eine reelleZahl zu. Eine p-dimensionale Zufallsvariable (X1, . . . , Xp) erhalten wir, in-dem wir jedem Ergebnis p reelle Zahlen zuordnen. Im Folgenden betrachtenwir nur bivariate Zufallsvariablen. Dabei bezeichnen wir die Zufallsvariablenmit X und Y und die bivariate Zufallsvariable mit (X,Y ). Wie bei einer uni-variaten diskreten Zufallsvariablen bestimmen wir die Wahrscheinlichkeits-funktion. Diese ist gegeben durch:
fX,Y (x, y) = P (X = x, Y = y) . (7.1)
Man nennt fX,Y (x, y) auch die gemeinsame Wahrscheinlichkeitsfunktion vonX und Y . Wir stellen diese Wahrscheinlichkeiten in einer Tabelle zusammen.Tabelle 7.1 zeigt den Aufbau dieser Tabelle, wenn die Zufallsvariable X dieMerkmalsauspragungen x1, . . . , xk und die Zufallsvariable Y die Merkmals-auspragungen y1, . . . , xl besitzt.
173
174 KAPITEL 7. MULTIVARIATE ZUFALLSVARIABLEN
Tabelle 7.1: Allgemeiner Aufbau der Wahrscheinlichkeitsfunktion einer zwei-dimensionalen diskreten Zufallsvariablen
Y y1 . . . yl
X
x1 P (X = x1, Y = y1) . . . P (X = x1, Y = yl)...
.... . .
...xk P (X = xk, Y = y1) . . . P (X = xk, Y = yl)
Beispiel 64Eine faire Munze werde dreimal hintereinander geworfen. Wir suchen dieWahrscheinlichkeitsfunktion der bivariaten Zufallsvariablen (X,Y ), wobei Xdie Anzahl ZAHL bei den ersten beiden Wurfen und Y die Anzahl ZAHLbei den beiden letzten Wurfen ist.
Die Ergebnismenge ist
Ω = KKK,KKZ,KZK,ZKK,KZZ,ZKZ,ZZK,ZZZ .
In Tabelle 7.2 sind die Ergebnisse mit den zugehorigen Werten von X undY zu finden.
Tabelle 7.2: Ergebnisse beim dreimaligen Munzwurf mit zugehorigen Wertender Zufallsvariablen X und Y
ω x y
KKK 0 0KKZ 0 1KZK 1 1ZKK 1 0KZZ 1 2ZKZ 1 1ZZK 2 1ZZZ 2 2
Da die Munze fair ist, sind alle Elementarereignisse gleich wahrscheinlich.
7.1. DISKRETE ZUFALLSVARIABLEN 175
Fur die Wahrscheinlichkeitsfunktion von (X,Y ) gilt also
P (X = 0, Y = 0) = 0.125
P (X = 1, Y = 0) = 0.125
P (X = 0, Y = 1) = 0.125
P (X = 1, Y = 1) = 0.25
P (X = 1, Y = 2) = 0.125
P (X = 2, Y = 1) = 0.125
P (X = 2, Y = 2) = 0.125
Wir stellen die Wahrscheinlichkeitsfunktion in einer zweidimensionalen Ta-belle dar.
Tabelle 7.3: Wahrscheinlichkeitsfunktion einer zweidimensionalen diskretenZufallsvariablen
Y 0 1 2X
0 0.125 0.125 01 0.125 0.250 0.1252 0 0.125 0.125
Aus der Wahrscheinlichkeitsfunktion P (X = x, Y = y) erhalt man problem-los die Wahrscheinlichkeitsfunktionen der univariaten Zufallsvariablen X undY . Es gilt
P (X = x) =∑
y
P (X = x, Y = y) (7.2)
und
P (Y = y) =∑
x
P (X = x, Y = y) . (7.3)
Man spricht auch von den Randverteilungen, da man diese Wahrscheinlich-keiten durch Summation der Wahrscheinlichkeiten in den Zeilen bzw. Spaltender Tabelle mit der Wahrscheinlichkeitsfunktion erhalt. Tabelle 7.4 zeigt dies.
176 KAPITEL 7. MULTIVARIATE ZUFALLSVARIABLEN
Tabelle 7.4: Allgemeiner Aufbau der Wahrscheinlichkeitsfunktion einer zwei-dimensionalen diskreten Zufallsvariablen mit Randverteilungen
Y y1 . . . yl
X
x1 P (X = x1, Y = y1) . . . P (X = x1, Y = yl) P (X = x1)...
.... . .
......
xk P (X = xk, Y = y1) . . . P (X = xk, Y = yl) P (X = xk)
P (Y = y1) . . . P (Y = yk) 1
Beispiel 64 (fortgesetzt)Es gilt
P (X = 0) = P (X = 0, Y = 0) + P (X = 0, Y = 1)
= 0.125 + 0.125 = 0.25
P (X = 1) = P (X = 1, Y = 0) + P (X = 1, Y = 1) + P (X = 1, Y = 2)
= 0.125 + 0.25 + 0.125 = 0.5
P (X = 2) = P (X = 2, Y = 1) + P (X = 2, Y = 2)
= 0.125 + 0.125 = 0.25
und
P (Y = 0) = P (X = 0, Y = 0) + P (X = 1, Y = 0)
= 0.125 + 0.125 = 0.25
P (Y = 1) = P (X = 0, Y = 1) + P (X = 1, Y = 1) + P (X = 2, Y = 1)
= 0.125 + 0.25 + 0.125 = 0.5
P (Y = 2) = P (X = 1, Y = 2) + P (X = 2, Y = 2)
= 0.125 + 0.125 = 0.25
In Tabelle 7.5 ist die gemeinsame Wahrscheinlichkeitsverteilung mit denRandverteilungen zu finden.
7.1. DISKRETE ZUFALLSVARIABLEN 177
Tabelle 7.5: Wahrscheinlichkeitsfunktion einer zweidimensionalen diskretenZufallsvariablen mit Randverteilung
Y 0 1 2X
0 0.125 0.125 0 0.251 0.125 0.250 0.125 0.502 0 0.125 0.125 0.25
0.250 0.500 0.250 1.00
Die Verteilungen der Zufallsvariablen X und Y im Beispiel 64 sind identisch.Wir sprechen auch von identisch verteilten Zufallsvariablen.
Aus der Wahrscheinlichkeitsfunktion P (X = x, Y = y) kann problemlosauf P (X = x) und P (Y = y) geschlossen werden. Von den Wahrschein-lichkeitfunktionen P (X = x) und P (Y = y) kann nicht eindeutig auf dieWahrscheinlichkeitsfunktion P (X = x, Y = y) geschlossen werden.
Beispiel 65In Tabelle 7.6 findet man die Wahrscheinlichkeitsfunktion P (V = v,W = w),die sich von der Wahrscheinlichkeitsfunktion P (X = x, Y = y) im Beispiel 64unterscheidet. Die Randverteilungen sind aber identisch.
Tabelle 7.6: Wahrscheinlichkeitsfunktion einer zweidimensionalen diskretenZufallsvariablen mit Randverteilung
W 0 1 2V
0 0.0625 0.125 0.0625 0.251 0.1250 0.250 0.1250 0.502 0.0625 0.125 0.0625 0.25
0.2500 0.500 0.2500 1.00
178 KAPITEL 7. MULTIVARIATE ZUFALLSVARIABLEN
7.2 Stetige Zufallsvariablen
Eine stetige univariate Zufallsvariable haben wir uber die Verteilungsfunkti-on definiert. Schauen wir uns also die Verteilungsfunktion einer zweidimen-sionalen Zufallsvariablen an. Mit der Verteilungsfunktion FX,Y (x, y) einerzweidimensionalen Zufallsvariablen (X,Y ) konnen wir folgende Wahrschein-lichkeiten bestimmen:
FX,Y (x, y) = P (X ≤ x, Y ≤ y) . (7.4)
Wir definieren eine stetige zweidimensionale Zufallsvariable wie eine univa-riate stetige Zufallsvariable uber die Verteilungsfunktion.
Definition 7.1Eine bivariate Zufallsvariable (X,Y ) heißt stetig, wenn eine reellwertige Funk-tion fX,Y : D ⊂ IR2 → IR existiert, so dass fur die VerteilungsfunktionFX,Y (x, y) von (X,Y ) gilt:
FX,Y (x, y) =
y∫−∞
x∫−∞
fX,Y (u, v) du dv
Wir nennen fX,Y (x, y) die gemeinsame Dichtefunktion von (X,Y ).
Die gemeinsame Dichtefunktion fX,Y (x, y) von (X,Y ) erfullt folgende Bedin-gungen:
1. fX,Y (x, y) ≥ 0 fur alle (x, y) ∈ IR2
2.∞∫
−∞
∞∫−∞
fX,Y (x, y) dx . . . dy = 1
Beispiel 66Wir betrachten folgende Funktion
f(x, y) =
1 fur 0 ≤ x ≤ 1, 0 ≤ y ≤ 1
0 sonst
Offensichtlich gilt
f(x, y) ≥ 0 fur alle (x, y) ∈ IR2 .
7.2. STETIGE ZUFALLSVARIABLEN 179
Außerdem gilt
∞∫−∞
∞∫−∞
f(x, y) dx dxy =
1∫0
1∫0
1 dx dy =
1∫0
[x]1
0dy
=
1∫0
1 dy =[y]1
0= 1
Also handelt es sich um eine Dichtefunktion einer zweidimensionalen Zufalls-variablen (X,Y ).
Aus der gemeinsamen Dichtefunktion konnen wir problemlos die Dichtefunk-tionen der univariaten Zufallsvariablen gewinnen. Im Fall einer zweidimen-sionalen stetigen Zufallsvariablen gilt
fX(x) =
∞∫−∞
fX,Y (x, y) dy
und
fY (y) =
∞∫−∞
fX,Y (x, y) dx .
Beispiel 66 (fortgesetzt)Es gilt
fX(x) =
∞∫−∞
fX,Y (x, y) dy =
∞∫−∞
1 dy =[y]1
0= 1
und
fY (y) =
∞∫−∞
fX,Y (x, y) dx =
∞∫−∞
1 dx =[x]1
0= 1 .
180 KAPITEL 7. MULTIVARIATE ZUFALLSVARIABLEN
7.3 Unabhangigkeit
Die Ereignisse A und B heißen unabhangig, wenn gilt
P (A ∩ B) = P (A) P (B)
Das Konzept der Unabhangigkeit lasst sich auch auf Zufallsvariablen uber-tragen.
Definition 7.2Gilt fur alle (x, y) ∈ IR2
P (X = x, Y = y) = P (X = x) · P (Y = y) ,
so heißen die diskreten Zufallsvariablen X und Y unabhangig.
Beispiel 66 (fortgesetzt)DieZufallsvariablen V und W in Tabelle 7.6 sind unabhangig, da gilt
P (V = 0,W = 0) = 0.0625 = 0.25 · 0.25 = P (V = 0) · P (W = 0)
P (V = 0,W = 1) = 0.125 = 0.25 · 0.5 = P (V = 0) · P (W = 1)
P (V = 0,W = 2) = 0.0625 = 0.25 · 0.25 = P (V = 0) · P (W = 2)
P (V = 1,W = 0) = 0.125 = 0.5 · 0.25 = P (V = 1) · P (W = 0)
P (V = 1,W = 1) = 0.25 = 0.5 · 0.5 = P (V = 1) · P (W = 1)
P (V = 1,W = 2) = 0.125 = 0.5 · 0.25 = P (V = 1) · P (W = 2)
P (V = 2,W = 0) = 0.0625 = 0.25 · 0.25 = P (V = 2) · P (W = 0)
P (V = 2,W = 1) = 0.125 = 0.25 · 0.5 = P (V = 2) · P (W = 1)
P (V = 2,W = 2) = 0.0625 = 0.25 · 0.25 = P (V = 2) · P (W = 2)
Sind die Zufallsvariablen X und Y unabhangig, so kann man aus den Wahr-scheinlichkeitsfunktionen P (X = x) und P (Y = y) die gemeinsame Wahr-scheinlichkeitsfunktion P (X = x, Y = y) bestimmen. Zieht man mehrmalsmit Zurucklegen aus einer Urne jeweils eine Kugel oder aus mehreren Urnenjeweils eine Kugel, so sind die einzelnen Ziehungen unabhangig.
Beispiel 67Ein Urne enthalt 10 Kugeln. Von diesen wiegen 4 Kugeln 10 g und die an-deren Kugeln 20 g. Es werden zwei Kugeln mit Zurucklegen gezogen. SeiX das Gewicht der ersten gezogenen Kugel und Y das Gewicht der zweitengezogenen Kugel. Es gilt
P (X = 10) = 0.4 P (X = 20) = 0.6
P (Y = 10) = 0.4 P (Y = 20) = 0.6
7.3. UNABHANGIGKEIT 181
Da wir ohne Zurucklegen ziehen,sind X und Y unabhangig. Also gilt
P (X = x, Y = y) = P (X = x) · P (Y = y) .
Wir erhalten
P (X = 10, Y = 10) = P (X = 10) · P (Y = 10) = 0.4 · 0.4 = 0.16
P (X = 10, Y = 20) = P (X = 10) · P (Y = 20) = 0.4 · 0.6 = 0.24
P (X = 20, Y = 10) = P (X = 20) · P (Y = 10) = 0.6 · 0.4 = 0.24
P (X = 20, Y = 20) = P (X = 20) · P (Y = 20) = 0.6 · 0.6 = 0.36
Die gemeinsame Wahrscheinlichkeitsfunktion ist Tabelle 7.7 zu finden.
Tabelle 7.7: Gemeinsame Wahrscheinlichkeitsfunktion
Y 10 20X
10 0.16 0.24 0.4020 0.24 0.36 0.60
0.40 0.60 1.00
Beispiel 68Eine Urne enthalt 10 Kugeln. Von diesen wiegen 2 Kugeln 10 g und dieanderen Kugeln 20 g. Ein zweite Urne enthalt ebenfalls 10 Kugeln. Von diesenwiegen 4 Kugeln 10 g und die anderen Kugeln 20 g. Aus jeder Urne wird eineKugel gzogen. Sei X das Gewicht der ersten gezogenen Kugel und Y dasGewicht der zweiten gezogenen Kugel. Es gilt
P (X = 10) = 0.2 P (X = 20) = 0.8
P (Y = 10) = 0.4 P (Y = 20) = 0.6
Da wir aus jeder Urne eine Kugel ziehen, sind X und Y unabhangig. Alsogilt
P (X = x, Y = y) = P (X = x) · P (Y = y) .
Wir erhalten
P (X = 10, Y = 10) = P (X = 10) · P (Y = 10) = 0.2 · 0.4 = 0.08
P (X = 10, Y = 20) = P (X = 10) · P (Y = 20) = 0.2 · 0.6 = 0.12
P (X = 20, Y = 10) = P (X = 20) · P (Y = 10) = 0.8 · 0.4 = 0.32
P (X = 20, Y = 20) = P (X = 20) · P (Y = 20) = 0.8 · 0.6 = 0.48
182 KAPITEL 7. MULTIVARIATE ZUFALLSVARIABLEN
Die gemeinsame Wahrscheinlichkeitsfunktion ist Tabelle 7.8 zu finden.
Tabelle 7.8: Gemeinsame Wahrscheinlichkeitsfunktion
Y 10 20X
10 0.08 0.12 0.2020 0.32 0.48 0.80
0.40 0.60 0.20
Schauen wir uns noch stetige Zufallsvariablen an. Die stetigen Zufallsvaria-blen X,Y mit gemeinsamer Dichtefunktion fX,Y (x, y) und Randdichtefunk-tionen fX(x) und fY (y) sind genau dann unabhangig, wenn gilt
fX,Y (x, y) = fX(x) · fY (y) . (7.5)
Beispiel 68 (fortgesetzt)Wir haben gesehen, dass die Randdichtefunktionen fX(x) und fY (y) von
fX,Y (x, y) =
1 fur 0 ≤ x ≤ 1, 0 ≤ y ≤ 1
0 sonst
univariate Gleichverteilungen sind. Es gilt also
fX(x) =
1 fur 0 ≤ x ≤ 1
0 sonst
und
fY (y) =
1 fur 0 ≤ y ≤ 1
0 sonst
Offensichtlich gilt
fX(x) · fY (y) =
1 fur 0 ≤ x ≤ 1, 0 ≤ y ≤ 1
0 sonst
Somit sind die Zufallsvariablen Xund Y unabhangig.
7.4. FUNKTIONEN VON ZUFALLSVARIABLEN 183
7.4 Funktionen von Zufallsvariablen
In der schließenden Statistik sind Funktionen von Zufallsvariablen von Inter-esse. Schauen wir uns dies fur eine Funktion von zwei diskreten Zufallsvaria-blen an.
Sind X und Y Zufallsvariablen mit gemeinsamer WahrscheinlichkeitsfunktionP (X = x, Y = y) und g : D ⊂ IR2 → IR eine Funktion. Dann gilt fur dieZufallsvariable V = g(X,Y ):
P (V = v) =∑
(x,y)|g(x,y)=v
P (X = x, Y = y)
Beispiel 69Wir betrachten die Zufallsvariablen X und Y aus Beispiel 68 auf Seite 181,deren gemeinsame Wahrscheinlichkeitsfunktion in Tabelle 7.8 auf Seite 182zu finden ist. Wir bestimmen die Wahrscheinlichkeitsfunktion der Zufallsva-riablen V = X + Y an. Es gilt
P (V = 20) = P (X = 10, Y = 10) = 0.08
P (V = 30) = P (X = 10, Y = 20) + P (X = 20, Y = 10) = 0.44
P (V = 40) = P (X = 20, Y = 20) = 0.48
Beispiel 70Wir betrachten die Zufallsvariablen X und Y aus Beispiel 68 auf Seite 181,deren gemeinsame Wahrscheinlichkeitsfunktion in Tabelle 7.8 auf Seite 182zu finden ist. Wir bestimmen die Wahrscheinlichkeitsfunktion der Zufallsva-riablen W = X · Y an. Es gilt
P (W = 100) = P (X = 20, Y = 20) = 0.08
P (W = 200) = P (X = 10, Y = 20) + P (X = 20, Y = 10) = 0.44
P (W = 400) = P (X = 20, Y = 20) = 0.48