Signifikanztests · Universität Augsburg 14.2/14.3 Aufbau und Klassifikation von...
Transcript of Signifikanztests · Universität Augsburg 14.2/14.3 Aufbau und Klassifikation von...
Universität Augsburg
14.1 Einführung / Einstichproben-Gaußtest
➢ Zunächst:
• G ∼ N(µ; σ) mit σ bekannt
• Einfache Stichprobe X1, . . . , Xn
• (Null-)Hypothese H0 : µ = µ0
➢ Beispiel (BB-Beispiel 75):
X1, . . . , X25 mit Xi = Füllmenge der i-ten Flasche ∼ N(µ; 1,5)
Nullhypothese H0 : µ = 500, d.h. µ0 = 500
➢ Je nach Interessenlage sind unterschiedliche Gegenhypothesen möglich:
a) H1 : µ 6= µ0
b) H1 : µ < µ0
c) H1 : µ > µ0
(110)
14. Signifikanztests 203
Universität Augsburg
Signifikanztests
➢ Vorliegen einer Hypothese über die Verteilung(en) der Grundgesamtheit(en).
➢ Z.B.
• „Der Würfel ist fair.“
• „Die Brenndauern zweier unterschiedlicher Glühbirnensorten sind gleich.“
➢ Die Hypothese soll anhand einer Stichprobe überprüft werden.
➢ Prinzip:
• Hypothese verwerfen, wenn „signifikanter“ Widerspruch zur Stichprobe.
• Ansonsten: Hypothese nicht verwerfen.
➢ Eine verworfene Hypothese gilt als statistisch widerlegt.
Nicht-Verwerfung ist dagegen ein „Freispruch aus Mangel an Beweisen“.
➠ Nicht-Verwerfung ist kein „statistischer Beweis“, dass Hypothese wahr ist!
(„Trick“: Hypothese falsch ⇐⇒ Gegenhypothese wahr!)
14. Signifikanztests 202
Universität Augsburg
14.1 Einführung / Einstichproben-Gaußtest
➢ Alternatives Kriterium: v = x−µ0σ
√n statt X − µ0.
Vorteil: Verteilung bekannt: N(0; 1) (Folie 164), falls µ = µ0, d.h. H0 wahr.
➠ Dann:H0 : µ = µ0 wird abgelehnt gegenüber
a) H1 : µ 6= µ0, wenn |v| „sehr groß“ ist
b) H1 : µ < µ0, wenn v „sehr negativ“ ist
c) H1 : µ > µ0, wenn v „sehr positiv“ ist
➢ Mögliche Fehlentscheidungen:
• Ablehnung von H0, obwohl H0 richtig ist: Fehler 1. Art
• Nicht-Ablehnung von H0, obwohl H0 falsch ist: Fehler 2. Art
14. Signifikanztests 205
Universität Augsburg
14.1 Einführung / Einstichproben-Gaußtest
➢ Aus Kapitel 12 (Folie 170) bekannt:
X ist wirksamster erwartungstreuer Schätzer für µ.
➠ Entscheidung:
H0 : µ = µ0 wird abgelehnt gegenüber
a) H1 : µ 6= µ0, wenn |x − µ0| „sehr groß“ ist
b) H1 : µ < µ0, wenn x „weit kleiner“ als µ0 ist
c) H1 : µ > µ0, wenn x „weit größer“ als µ0 ist
(111)
14. Signifikanztests 204
Universität Augsburg
14.1 Einführung / Einstichproben-Gaußtest
➢ Mithilfe von α und V kann geklärt werden, was „sehr groß“ usw. heißt:
Fehler 1. Art im Fall a): |v| > x, obwohl µ = µ0, d.h. V ∼ N(0; 1)
Wahrscheinlichkeit dafür:
P(|V | > x) = P(V > x) + P(V < −x)
= 2 · P(V > x) (Symmetrie der Normalverteilung)
= 2 · [1 − P(V 5 x)] = 2 · [1 − Φ(x)]!= α ⇐⇒
Φ(x) = 1 − α2 ⇐⇒
x = x1−α2
H0 wird demnach verworfen, wenn |v| > x1−α2
bzw. v ∈ B ist.
B = (−∞; −x1−α2) ∪ (x1−α
2; ∞) heißt Verwerfungsbereich.
14. Signifikanztests 207
Universität Augsburg
14.1 Einführung / Einstichproben-Gaußtest
H0richtig
H0 falsch
H0beibehalten
H0 ablehnen
H0beibehalten
H0 ablehnen
„Freispruch aus Mangel an Beweisen“
Fehler 1. Art
Fehler 2. Art
Bestätigung von H1
➢ Signifikanzniveau α:
Maximal erlaubte Wahrscheinlichkeit für einen Fehler 1. Art.
14. Signifikanztests 206
Universität Augsburg
14.1 Einführung / Einstichproben-Gaußtest
➠ Insgesamt: H0 ist zu verwerfen, wenn v ∈ B ist, wobei
B = (−∞; −x1−α2) ∪ (x1−α
2; ∞) im Fall a)
B = (−∞; −x1−α) im Fall b)
B = (x1−α; ∞) im Fall c)
(113)
14. Signifikanztests 209
Universität Augsburg
14.1 Einführung / Einstichproben-Gaußtest
➢A
nal
og
eVo
rgeh
ensw
eise
für
die
Fälle
b)
un
dc)
:
14. Signifikanztests 208
Universität Augsburg
14.1 Einführung / Einstichproben-Gaußtest
Hinweis:
Im Fall a) ist auch eine Entscheidung mithilfe von KI möglich (BB S. 178):
Man errechne, wenn α das vorgeschriebene Signifikanzniveau ist, ein sym-metrisches Schätzintervall [vu; vo] für ϑ zum Konfidenzniveau 1 − α undlehne H0 : ϑ = ϑ0 gegen H1 : ϑ 6= ϑ0 genau dann ab, wenn ϑ0 nichtin [vu; vo] liegt.
Hier: KI für µ gemäß 13.1.1 (Folie 188):
1. 1 − α = 1 − 0,01 = 0,99
2. N(0; 1) : c = x1−α2
= x1−0,012
= x0,995 = 2,576 (Folie 191)
3. x = 499,28
4. σc√n
= 1,5·2,576√25
= 0,77
5. KI = [499,28 − 0,77; 499,28 + 0,77] = [498,51; 500,05]
µ0 = 500 ∈ KI ⇒ H0 nicht verwerfen14. Signifikanztests 211
Universität Augsburg
14.1 Einführung / Einstichproben-Gaußtest
Beispiel (BB-Beispiel 76):
X1, . . . , X25 mit Xi ∼ N(µ; 1,5) und x = 499,28
Prüfe H0 : µ = 500, H1 : µ 6= 500 zum Signifikanzniveau α = 0,01
Lösung: Test gemäß Kapitel 14.1 (Einstichproben-Gaußtest), Fall (110 a)
1. α = 0,01
2. v = 499,28−5001,5 ·
√25 = −2,4
3. N(0; 1) : x1−α2
= x1−0,005 = x0,995 = 2,576 (Folie 191)
⇒ B = (−∞; −2,576) ∪ (2,576; ∞)
4. v /∈ B ⇒ H0 nicht verwerfen
Interpretation: Zum Signifikanzniveau 1 % kann der Brauerei keine Abwei-
chung vom Sollwert µ0 = 500 nachgewiesen werden.14. Signifikanztests 210
Universität Augsburg
14.2 / 14.3 Aufbau und Klassifikation von Signifikanztests
• den Voraussetzungen an die Verteilung/parameter (z.B. G ∼ N(µ; σ))
• den Voraussetzungen an den Stichprobenumfang (z.B. n > 30)
• Art und Anzahl der Stichproben; unterscheide:
– Signifikanztests bei einer einfachen Stichprobe (→ Fig. 48):
Eine Grundgesamtheit, ein Merkmal.
(„Ist die erwartete Füllmenge einer Abfüllanlage gleich 500 cm3?“)
– Signifikanztests bei mehreren unabhängigen Stichproben (→ Fig. 49)
Mehrere GG (od. disjunkte Stichproben aus einer GG), ein Merkmal.
(„Hängt die Abiturnote von der beruflichen Stellung des Vaters ab?“)
– Signifikanztests bei zwei verbundenen Stichproben (→ Fig. 50)
Eine Grundgesamtheit, zwei Merkmale.
(„Besteht ein Zusammenhang zwischen Mathe- und Statistiknote?“)
14. Signifikanztests 213
Universität Augsburg
14.2 / 14.3 Aufbau und Klassifikation von Signifikanztests
➢ Einheitliches Schema aller Tests:
➢ Der jeweils geeignete Test hängt ab von . . .
• dem zu testenden Hypothesenpaar H0, H1; unterscheide:
– Parametrische Hypothesen (H0 : ϑ ∈ Θ0, H1 : ϑ ∈ Θ1 = Θ − Θ0):
Beziehen sich auf unbekannte(n) Verteilungsparameter (µ, σ2, . . . )
– Nichtparametrische Hypothesen:
Beinhalten sonstige Aussagen, z.B. „Alter und Einkommen sind unabh.“14. Signifikanztests 212
Universität Augsburg
Signifikanztests bei mehreren unabh. Stichproben (Fig. 49)
14. Signifikanztests 215
Universität Augsburg
Signifikanztests bei einer einfachen Stichprobe (Fig. 48)
14. Signifikanztests 214
Universität Augsburg
14.4 Einstichproben-t-Test, approx. Gaußtest, Differenzentests
➢ Gegeben:
• Einfache Stichprobe X1, . . . , Xn mit
• E(Xi) = µ, Var(Xi) = σ2
➢ Einstichprobentests:
a) H0 : µ = µ0 H1 : µ 6= µ0
b) H0 : µ = µ0 (oder µ = µ0), H1 : µ < µ0
c) H0 : µ = µ0 (oder µ 5 µ0), H1 : µ > µ0
(115)
➢ Voraussetzungen:
1. Normalverteilung mit σ unbekannt (Einstichproben-t-Test) oder
2. Beliebige Verteilung mit n > 30 bzw. 5 5∑
xi 5 n − 5 (bei B(1; p))
(approximativer Gaußtest)
14. Signifikanztests 217
Universität Augsburg
Signifikanztests bei zwei verbundenen Stichproben (Fig. 50)
14. Signifikanztests 216
Universität Augsburg
Einstichproben-t-Test, approx. Gaußtest; Vorgehensweise
Beispiel (BB-Beispiel 80):
X1, . . . , X2000 ∼ B(1; p) mit Xi =
{1, falls i-te Person Wähler der Partei
0, sonst2000∑
i=1xi = 108
Prüfe H0 : p 5 0,05 gegen H1 : p > 0,05 zum Signifikanzniveau 2 %
Lösung:approx. Gaußtest, Fall (115 c); Voraussetzung 2 erfüllt: 5 5 108 5 2000 − 5
1. α = 0,02
2. v =108
2000−0,05√0,05·(1−0,05)
√2000 = 0,82
3. N(0; 1) : x1−α = x0,98 = 2,05 (Tab. 3) ⇒ B = (2,05; ∞)
4. v /∈ B ⇒ H0 nicht verwerfen
Zusatzfrage: Entscheidung, falls α = 0,01? → Keine Änderung!
14. Signifikanztests 219
Universität Augsburg
Einstichproben-t-Test, approx. Gaußtest; Vorgehensweise
14. Signifikanztests 218
Universität Augsburg
Binomialtest
Beispiel (BB-Beispiel 79):
X1, . . . , X20 ∼ B(1; p) mit Xi =
{1, falls das i-te geprüfte Stück defekt ist
0, sonstEntscheidung zw. H0 : p = 0,3, H1 : p < 0,3 in Abh. von
∑xi (α = 0,05)
Lösung: Binomialtest, Fall b); Voraussetzungen erfüllt
1. α = 0,05
2. –
3. B(20; 0,3) : F(2) = 0,0355 5 0,05, F(3) = 0,1071 > 0,05 ⇒ B = {0, 1, 2}
4. H0 ablehnen, falls in der Stichprobe höchstens 2 defekte Stücke
Hinweis: Falls p0 > 0,5 → Nutze den Hinweis auf Folie 93z.B. FB(11;0,6)(4) = 1 − FB(11;0,4)(6) = 1 − 0,9006 = 0,0994
14. Signifikanztests 221
Universität Augsburg
Binomialtest
➢ Geeignet, falls G ∼ B(1; p) (5 5∑
xi 5 n − 5 muss nicht erfüllt sein!)
a) H0 : p = p0 H1 : p 6= p0
b) H0 : p = p0 (oder p = p0), H1 : p < p0
c) H0 : p = p0 (oder p 5 p0), H1 : p > p0
➢ Vorgehensweise:
1. Ein Signifikanzniveau α wird festgelegt.
2. Der Testfunktionswert v =n∑
i=1xi wird errechnet.
3. Mit F der B(n; p0)-Vtlg. wird der Verwerfungsbereich festgelegt:
a) B = {0, . . . , c1} ∪ {c2, . . . , n} mit
F(c1) 5 α2 , F(c1 + 1) > α
2 , F(c2 − 1) = 1 − α2 , F(c2 − 2) < 1 − α
2
b) B = {0, . . . , c} mit F(c) 5 α, F(c + 1) > α
c) B = {c, . . . , n} mit F(c − 1) = 1 − α, F(c − 2) < 1 − α
4. H0 wird genau dann abgelehnt, wenn v ∈ B gilt.
14. Signifikanztests 220
Universität Augsburg
Änderungen gegenüber Folie 218
2) Alternativ: v = h10−h01√h10+h01
mity = 0 y = 1
x = 0 h00 h01
x = 1 h10 h11
14. Signifikanztests 223
Universität Augsburg
Differenzentests
➢ Gegeben:
• Zwei verbundene einfache Stichproben X1, . . . , Xn und Y1, . . . , Yn mit
• E(Xi) = µ1, E(Yi) = µ2
➢ Hypothesenpaare:
a) H0 : µ1 = µ2 H1 : µ1 6= µ2
b) H0 : µ1 = µ2 (oder µ1 = µ2), H1 : µ1 < µ2
c) H0 : µ1 = µ2 (oder µ1 5 µ2), H1 : µ1 > µ2
➢ „Trick“:
• Übergang zu Zi = Xi − Yi mit
• E(Zi) = µ = µ1 − µ2
➠ Teste (115) mit µ0 = 0
14. Signifikanztests 222
Universität Augsburg
Differenzentests
Lösung:
Differenzentest auf Basis des approx. Gaußtests, Fall (115 c)
Voraussetzungen gem. BB S. 190 erfüllt:
5 5 264 =∑
xi 5 495
5 5 217 =∑
yi 5 495
1. α = 0,05
2. v = 118−71√118+71
= 3,42
3. N(0; 1) : x1−α = x0,95 = 1,645 (Folie 191) ⇒ B = (1,645; ∞)
4. v ∈ B ⇒ H0 verwerfen
Interpretation: Zum Signifikanzniveau 5 % kann statistisch bestätigt werden,
dass der Anteil der KKW-Gegner größer ist als der der Spar-Befürworter.
14. Signifikanztests 225
Universität Augsburg
Differenzentests
Beispiel (BB-Aufgabe 100):
X1, . . . , X500 ∼ B(1; p1) mit Xi =
{1, falls i-te Person KKW-Bau ablehnt
0, sonst
Y1, . . . , Y500 ∼ B(1; p2) mit Yi =
{1, falls i-te Person Sparen befürwortet
0, sonst
yi = 0 yi = 1∑
xi = 0 165 71 236
xi = 1 118 146 264∑
283 217 500
Prüfe H0 : p1 = p2, H1 : p1 > p2 zum Signifikanzniveau α = 0,05
14. Signifikanztests 224
Universität Augsburg
14.5 Chi-Quadrat-Test für die Varianz
Falls µ unbekannt:
14. Signifikanztests 227
Universität Augsburg
14.5 Chi-Quadrat-Test für die Varianz
➢ Gegeben: Einfache Stichprobe X1, . . . , Xn ∼ N(µ; σ)
➢ Hypothesenpaare:
a) H0 : σ2 = σ20 H1 : σ2 6= σ2
0
b) H0 : σ2 = σ20 (oder σ2 = σ2
0), H1 : σ2 < σ20
c) H0 : σ2 = σ20 (oder σ2 5 σ2
0), H1 : σ2 > σ20
(116)
➢ Vorgehensweise, falls µ unbekannt: → Folie 227
➢ Falls µ bekannt:
• Schritt 2: Testfunktion v = 1σ2
0
n∑
i=1(xi − µ)2.
• Schritt 3: Ersetze χ2(n − 1) durch χ2(n).
14. Signifikanztests 226
Universität Augsburg
14.6 Zweistichprobentests
➢ Gegeben:
• Zwei unabhängige einfache Stichproben X1, . . . , Xn1 und Y1, . . . , Yn2 mit
• Stichprobenumfängen n1 bzw. n2
• Erwartungswerten E(Xi) = µ1 bzw. E(Yi) = µ2
• Varianzen Var(Xi) = σ21 bzw. Var(Yi) = σ2
2
• Stichprobenmittel X bzw. Y
• Stichprobenvarianzen S21 bzw. S2
2
➢ Gesucht:
• Aussagen über den Vergleich der Erwartungswerte → 14.6.1
• Aussagen über den Vergleich der Varianzen → 14.6.2
14. Signifikanztests 229
Universität Augsburg
14.5 Chi-Quadrat-Test für die Varianz
Beispiel (BB-Aufgabe 101):
G ∼ N(µ; σ)
(x1, . . . , x10) = (2100; 2130; 2150; 2170; 2210; 2070; 2230; 2150; 2230; 2200)
Prüfe H0 : σ = 40, H1 : σ 6= 40 zum Signifikanzniveau α = 0,1
Lösung: χ2-Test für die Varianz, Fall (116 a); Voraussetzungen erfüllt
1. α = 0,1
2. x = 110 (2100 + 2130 + · · · + 2200) = 2164
v = 1402 [(2100 − 2164)2 + (2130 − 2164)2 + · · · + (2200 − 2164)2] = 16,65
3. χ2(9) : xα2
= x0,05 = 3,33; x1−α2
= x0,95 = 16,92 (Tab. 5)
⇒ B = [0; 3,33) ∪ (16,92; ∞)
4. v /∈ B ⇒ H0 nicht verwerfen
14. Signifikanztests 228
Universität Augsburg
14.6.1 Vergleich zweier Erwartungswerte
Zweistichproben-Gaußtest
Zweistichpoben-t-Test
approximativerZweistichproben-Gaußtest
approximativerZweistichproben-Gaußtest
14. Signifikanztests 231
Universität Augsburg
14.6.1 Vergleich zweier Erwartungswerte
➢ Hypothesenpaare:
a) H0 : µ1 = µ2 H1 : µ1 6= µ2
b) H0 : µ1 = µ2 (oder µ1 = µ2), H1 : µ1 < µ2
c) H0 : µ1 = µ2 (oder µ1 5 µ2), H1 : µ1 > µ2
(117)
➢ Vorgehensweise:
14. Signifikanztests 230
Universität Augsburg
14.6.2 Vergleich zweier Varianzen / Zweistichproben-F-Test
Voraussetzung: Xi ∼ N(µ1; σ1), Yi ∼ N(µ2; σ2) (sonst: BB S. 195, Fußnote 1)
a) H0 : σ21 = σ2
2 H1 : σ21 6= σ2
2
b) H0 : σ21 = σ2
2 (oder σ21 = σ2
2), H1 : σ21 < σ2
2
c) H0 : σ21 = σ2
2 (oder σ21 5 σ2
2), H1 : σ21 > σ2
2
(118)
14. Signifikanztests 233
Universität Augsburg
14.6.1 Vergleich zweier Erwartungswerte
Beispiel:
X1, . . . , X80 ∼ B(1; p1) mit Xi =
{1, falls i-tes Teil Ausschuss
0, sonst,
80∑
i=1xi = 20
Y1, . . . , Y100 ∼ B(1; p2) mit Yi =
{1, falls i-tes Teil Ausschuss
0, sonst,
100∑
i=1yi = 50
Lässt sich zum Signifikanzniveau 10 % nachweisen, dass p1 < p2 ist?
Lösung:H0 : p1 = p2, H1 : p1 < p2; approx. Zweistichproben-Gaußtest, Fall (117 b)
Voraussetzungen 3 gem. Fig. 51 erfüllt: 5 5 20 5 75, 5 5 50 5 95
1. α = 0,1
2. x = 2080 = 0,25; y = 50
100 = 0,5; v = 0,25−0,5√(20+50)(80+100−20−50)
(80+100)·80·100
= −3,42
3. N(0; 1) : x1−α = x0,9 = 1,282 (Folie 191) ⇒ B = (−∞; −1,282)
4. v ∈ B ⇒ H0 verwerfen, d.h. p1 < p2 bestätigen14. Signifikanztests 232
Universität Augsburg
14.7 Einfache Varianzanalyse
➢ Voraussetzungen:
• r > 2 unabhängige einfache Stichproben Xj1, . . . , Xjnjmit
• Xji ∼ N(µj; σ) (Beachte: identische Varianzen!)
• Alle Xji unabhängig
➢ Hypothesenpaar:
H0 : µ1 = µ2 = · · · = µr gegen
H1 : mindestens zwei der µj sind verschieden(119)
➢ Hilfsgrößen:
• Gesamtstichprobenumfang:
n =r∑
j=1nj
14. Signifikanztests 235
Universität Augsburg
14.6.2 Vergleich zweier Varianzen / Zweistichproben-F-Test
Beispiel:
X1, . . . , X9 ∼ N(µ1; σ1) mit s21 = 4
Y1, . . . , Y7 ∼ N(µ2; σ2) mit s22 = 3
Kann σ21 > σ2
2 zum Signifikanzniveau 5 % bestätigt werden?
Lösung:
H0 : σ21 5 σ2
2, H1 : σ21 > σ2
2
Zweistichproben-F-Test, Fall (118 c); Voraussetzungen erfüllt
1. α = 0,05
2. v = 43
3. F(8, 6) : x1−α = x0,95 = 4,15 (Tab. 6) ⇒ B = (4,15; ∞)
4. v /∈ B ⇒ H0 nicht verwerfen, d.h. σ21 > σ2
2 kann nicht bestätigt werden
14. Signifikanztests 234
Universität Augsburg
14.7 Einfache Varianzanalyse
• Interne Stichprobenvarianz:
1
n − 1
r∑
j=1
nj∑
i=1
(Xji − Xj)2 =
1
n − 1
r∑
j=1
nj∑
i=1
X2ji −
r∑
j=1
njX2j
=Q2
n − 1
• Externe Stichprobenvarianz:
1
n − 1
r∑
j=1
nj(Xj − XGes)2 =
1
n − 1
r∑
j=1
njX2j − nX2
Ges
=Q1
n − 1
➠ Es gilt:
S2Ges =
Q1 + Q2
n − 1mit Q1 = W−nX2
Ges, Q2 =r∑
j=1
nj∑
i=1X2
ji−W, W =r∑
j=1njX
2j
➢ Variationen denkbar, z.B.: Q1, S2Ges gegeben ⇒ Q2 = (n − 1)S2
Ges − Q1
14. Signifikanztests 237
Universität Augsburg
14.7 Einfache Varianzanalyse
• Stichprobenmittel der j-ten Stichprobe:
Xj =1
nj
nj∑
i=1
Xji
• Gesamtstichprobenmittel:
XGes =1
n
r∑
j=1
njXj
• Gesamtstichprobenvarianz:
S2Ges =
1
n − 1
r∑
j=1
nj∑
i=1
(Xji − Xj)2
︸ ︷︷ ︸interne Stichprobenvarianz
+1
n − 1
r∑
j=1
nj(Xj − XGes)2
︸ ︷︷ ︸externe Stichprobenvarianz
14. Signifikanztests 236
Universität Augsburg
Klausuraufgabe 133 a) (gekürzt)
Der Hersteller des Hundefutters „Schnappi“ möchte wissen, ob von der Farbedes Etiketts ein Einfluss auf den Marktanteil (gemessen an der Preiseinschät-zung) von „Schnappi“ ausgeht. Dazu werden 18 Testpersonen in drei gleichgroße Gruppen aufgeteilt, und jeder Gruppe wird eine andersfarbig etiket-tierte Dose vorgelegt. Sodann sollen die Testpersonen einer jeden Gruppeangeben, wieviel sie für eine solche Dose Hundefutter zu zahlen bereit wä-ren. Die folgende Tabelle gibt die Antworten der Probanden wieder:
Gelb 1,5 1,3 1,8 1,6 2,5 0,9Hellblau 4,0 3,4 3,7 4,3 2,1 4,1Rosa 1,2 2,1 2,8 2,3 1,3 2,3
Betrachten Sie die Erhebung der Preiseinschätzung in jeder Gruppe als eineeinfache Stichprobe. Die Preiseinschätzung sei jeweils normalverteilt, wobeidie Varianz in allen Gruppen gleich ist.
Kann zum Signifikanzniveau 0,05 statistisch bestätigt werden, dass die Etiket-tenfarbe einen Einfluss auf die Preiseinschätzung hat?14. Signifikanztests 239
Universität Augsburg
14.7 Einfache Varianzanalyse
➢ Vorgehensweise:
➢ Bemerkungen:
➀ v ändert sich nicht, wenn man alle xji linear transformiert gemäß
yji = a + bxji a, b ∈ IR, b 6= 0
➁ r = 2 ⇒ Einfache Varianzanalyse = Zweistichproben-t-Test, Fall (117 a)
14. Signifikanztests 238
Universität Augsburg
Chi-Quadrat-Anpassungstest; Vorgehensweise für Fall (120 a)
14. Signifikanztests 241
Universität Augsburg
14.8 Chi-Quadrat-Anpassungstest
➢ Gegeben: Einfache Stichprobe X1, . . . , Xn mit Verteilungsfunktion F
➢ Hypothesenpaare:
a) H0 : F = F0, wobei F0 hypothetische Verteilungsfunktion
H1 : F 6= F0
b) H0 : F gehört zu einer Menge von Verteilungsfunktionen,
deren Elemente sich nur durch endlich viele Parameter
ϑ1, . . . , ϑr voneinander unterscheiden
H1 : F gehört nicht zu dieser Menge
(120)
➢ Grundgedanke:
Unterteile die x-Achse in „möglichst viele“ Intervalle und vergleiche für
jedes Intervall die tatsächliche mit der theoretischen (gem. F0) Häufigkeit.
14. Signifikanztests 240
Universität Augsburg
14.8 Chi-Quadrat-Anpassungstest
Beispiel:
Gegeben ist folgendes Stichprobenergebnis:
aj 0 1 2 3 4 5
hj 1 2 5 6 8 8
Prüfe zum Signifikanzniveau 5 %, ob G ∼ B(20; 0,15) gilt.
Lösung:
Chi-Quadrat-Anpassungstest, Fall (120 a)
Voraussetzung 30 pj = 5 wird in Schritt 2.3 geprüft
1. α = 0,05
2.1 Aj gegeben (sofern Voraussetzung erfüllt)
14. Signifikanztests 243
Universität Augsburg
14.8 Chi-Quadrat-Anpassungstest
➢ Bemerkungen:
➀ Test nur anwendbar, wenn npj = 5 bzw. hj = 5 ∀ j = 1, . . . , k (prüfen!)
Falls nicht erfüllt → Intervalle zuammenlegen!
➁ I.A. sinkt die Wahrscheinlichkeit für den Fehler 2. Art, wenn k steigt
➂ G diskret verteilt → pro Ausprägung ein Intervall; Schritt 2.1 entfällt
(falls nicht npj = 5 eine Zusammenlegung erzwingt)
➢ Vorgehensweise für Fall (120 b):
• Schritt 2: Schätze F0 durch F0 auf Grund von ML-Schätzwerten ϑ1, . . . , ϑr
• Schritt 3: Fraktil nun zwischen dem von χ2(k − r − 1) und χ2(k − 1)
14. Signifikanztests 242
Universität Augsburg
14.8 Chi-Quadrat-Anpassungstest
2. Aj (−∞; 1] (1; 2] (2; 3] (3; 4] (4; ∞)
hj 3 5 6 8 8
pj 0,1756 0,2293 0,2428 0,1821 0,1702
v = 130(
32
0,1756 + 52
0,2293 + 62
0,2428 + 82
0,1821 + 82
0,1702) − 30 = 4,53
3. χ2(4) : x1−α = x0,95 = 9,49 (Tab. 5) ⇒ B = (9,49; ∞)
4. v /∈ B ⇒ H0 nicht verwerfen
14. Signifikanztests 245
Universität Augsburg
14.8 Chi-Quadrat-Anpassungstest
2.2 hj gegeben (sofern Voraussetzung erfüllt)
2.3 p1 = P(X 5 0|F0) = F0(0) = 0,0388
p2 = P(0 < X 5 1|F0) = F0(1) − F0(0) = 0,1756 − 0,0388 = 0,1368
p3 = P(1 < X 5 2|F0) = F0(2) − F0(1) = 0,4049 − 0,1756 = 0,2293
p4 = P(2 < X 5 3|F0) = F0(3) − F0(2) = 0,6477 − 0,4049 = 0,2428
p5 = P(3 < X 5 4|F0) = F0(4) − F0(3) = 0,8298 − 0,6477 = 0,1821
p6 = P(X = 5|F0) = 1 − F0(4) = 1 − 0,8298 = 0,1702
aj 0 1 2 3 4 5
hj 1 2 5 6 8 8
pj 0,0388 0,1368 0,2293 0,2428 0,1821 0,1702
30 pj 1,164 4,104 6,879 7,284 5,463 5,106
Die ersten beiden Intervalle erfüllen 30 pj = 5 nicht! → Zusammenlegen!
14. Signifikanztests 244
Universität Augsburg
14.9 Kontingenztest
14. Signifikanztests 247
Universität Augsburg
14.9 Kontingenztest
➢ Gegeben: Zwei verbundene einfache Stichproben X1, . . . , Xn und Y1, . . . , Yn
➢ Hypothesenpaar:
H0 : die beiden Merkmale X und Y sind in G unabhängig
H1 : X und Y sind in G abhängig(121)
➢ Vorgehensweise entspricht dem Chi-Quadrat-Anpassungstest
➢ Basiert aber auf einer Kontingenztabelle
14. Signifikanztests 246
Universität Augsburg
14.9 Kontingenztest
Beispiel:
Gegeben ist folgende Kontingenztabelle:
@@
@@
@@@
X
Y1 2 3
1 10 31 20
2 15 20 4
Prüfe zum Signifikanzniveau 1 %, ob X und Y unabhängig sind.
Lösung:
Kontingenztest
Voraussetzung hij = 5 erfordert Zusammenlegung von Y = 2 und Y = 3
14. Signifikanztests 249
Universität Augsburg
14.9 Kontingenztest
Bemerkungen:
➀ Test nur anwendbar, wenn hij = 5 bzw. hij = 5 ∀ i = 1, j (prüfen!)
Falls nicht erfüllt → Intervalle zuammenlegen!
➁ X, Y diskret verteilt → pro Ausprägung ein Intervall; Schritt 2.1 entfällt
(falls nicht hij = 5 eine Zusammenlegung erzwingt)
➂ Falls k = l = 2:
• Schritt 2.3: Kann entfallen
• Schritt 2.4: Berechne Testfunktionswert gemäß v =n (h11h22−h12h21)
2
h1.h2.h.1h.2
➃ Falls Randw’keiten pi = P(X ∈ Ai), qj = P(Y ∈ Bj) bekannt sind:
• Schritt 2.3: Entfällt
• Schritt 2.4: Ersetze hij durch n · pi · qj
• Schritt 3: Ersetze χ2((k − 1) · (l − 1)) durch χ2(k · l − 1)
14. Signifikanztests 248
Universität Augsburg
14.10 Vorzeichentest
➢ Gegeben:
• Zwei einfache Stichproben X1, . . . , Xn, und Y1, . . . , Yn, die
• entweder verbunden
• oder unabhängig sind
(dann: künstl. Zusammenfassen gleichnummerierter Paare)
• und (in beiden Fällen) den gleichen Stichprobenumfang besitzen
➢ Hypothesenpaare:
a) H0 : P(X > Y) = P(X < Y), H1 : P(X > Y) 6= P(X < Y)
b) H0 : P(X > Y) = P(X < Y), H1 : P(X > Y) < P(X < Y)
c) H0 : P(X > Y) 5 P(X < Y), H1 : P(X > Y) > P(X < Y)
(122)
14. Signifikanztests 251
Universität Augsburg
14.9 Kontingenztest
1. α = 0,01
2.1 Ai, Bj gegeben
2.2 hij B1 B2 hi.
A1 10 51 61
A2 15 24 39
h.j 25 75 100
2.3 Entfällt (k = l = 2)
2.4 v =100·(10·24−51·15)2
61·39·25·75 = 6,18
3. χ2(1) : x1−α = x0,99 = 6,63 (Tab. 5) ⇒ B = (6,63; ∞)
4. v /∈ B ⇒ H0 nicht verwerfen
14. Signifikanztests 250
Universität Augsburg
14.10 Vorzeichentest
Bemerkungen:
➀ Bei unabhängigen Stichproben gilt: F1 = F2 ⇒ P(X > Y) = P(X < Y),
d.h. mit (122 a) wird auch
H0 : F1 = F2 gegen H1 : F1 6= F2
getestet.
➁ α wird i.d.R. nicht voll ausgeschöpft (da B(n; p) diskret)
➂ Test wird mit wachsendem n schlechter
14. Signifikanztests 253
Universität Augsburg
14.10 Vorzeichentest
14. Signifikanztests 252
Universität Augsburg
14.11 Gütefunktion
➢ Gütekriterien für einen Hypothesentest:
a) Die maximale Wahrscheinlichkeit für den Fehler 1. Art muss gleich α sein.
b) Unter Einhaltung von a) sollte die Wahrscheinlichkeit für den Fehler 2.
Art möglichst klein gehalten werden.
➢ Gütefunktion: Geeignet zur Beurteilung von parametrischen Tests
➢ Parametrischer Test:
H0 : ϑ ∈ Θ0 gegen H1 : ϑ ∈ Θ1
wobei Θ0 ∪ Θ1 = Θ ⊆ IR.
➢ Beispiel: Binomialtest: H0 : p 5 0,6 gegen H1 : p > 0,6
entspricht ϑ = p, Θ = [0; 1], Θ0 = [0; 0,6], Θ1 = (0,6; 1]
14. Signifikanztests 255
Universität Augsburg
Klausuraufgabe 149 a) (gekürzt)
Eine Studentin trinkt an den 5 Werktagen einer Woche am Morgen den Fitness-Trunk „Red Bear“. An den 5 Werktagen der nächsten Woche trinkt sie den Be-ruhigungstrunk „Blue Bull“. Die Studentin beobachtet nun, wie lange sie sichan dem jeweiligen Tag fit fühlt. Dabei ergeben sich der Reihe nach folgen-de Fitness-Dauern xi bei Einnahme von „Red Bear“ und yi bei Einnahme von„Blue Bull“ (jeweils in Stunden).
xi 4,7 9,6 7,5 6,9 7,6yi 4,7 9,5 9,4 8,9 8,5
Gehen Sie davon aus, dass die Werte xi unabhängige Realisierungen der Zu-fallsvariablen X mit Verteilungsfunktion F1 und die Werte yi unabhängigeRealisierungen der Zufallsvariablen Y mit Verteilungsfunktion F2 sind. Alle Zu-fallsvariablen seien voneinander unabhängig.
Testen Sie mit einem geeigneten Test zum Signifikanzniveau α = 0,125 dieNullhypothese H0 : F1 = F2 gegen die Alternative H1 : F1 6= F2.14. Signifikanztests 254
Universität Augsburg
14.11 Gütefunktion
➢ Ein Test erfüllt Forderung a), wenn gilt
supϑ∈Θ0
g(ϑ) = α
d.h. der Maximalwert der Gütefunktion im Bereich Θ0 ist gleich α.
Beachte: Ist Θ0 = {ϑ0} (einfache Hypothese) ⇒ g(ϑ0) = α
➢ Zur Forderung b): Wahrscheinlichkeit für den Fehler 2. Art:
P(V /∈ B|ϑ) = 1 − P(V ∈ B|ϑ) = 1 − g(ϑ) für ϑ ∈ Θ1
sollte möglichst klein sein, d.h. g(ϑ) möglichst groß (für ϑ ∈ Θ1).
➠ Merke:
Möglichst kleine g-Werte (5 α) in Θ0, möglichst große Werte in Θ1.
14. Signifikanztests 257
Universität Augsburg
14.11 Gütefunktion
➢ Bei den TestsH0 H1
ϑ = ϑ0 ϑ 6= ϑ0
ϑ (>)= ϑ0 ϑ < ϑ0
ϑ (<)= ϑ0 ϑ > ϑ0
heißt ϑ0 Hypothesendefinierender Wert.
➢ Gütefunktion:
g(ϑ) = P(V ∈ B|ϑ) (123)
(Wahrscheinlichkeit, H0 abzulehnen, wenn wahrer Parameterwert ϑ ist.)
14. Signifikanztests 256
Universität Augsburg
Klausuraufgabe 150
Die Gütefunktion eines Tests sei gegeben durch folgende Wertetabelle:
ϑ 0 0,1 0,2 0,4 0,5 0,6 0,8 0,9 1
g(ϑ) 1 0,9 0,8 0,1 0,03 0,15 0,85 0,95 1
Zwischen den gegebenen Punkten verläuft die Gütefunktion linear.
a) Zeichnen Sie die Gütefunktion.
b) Bestimmen Sie ein Signifikanzniveau α und ein Hypothesenpaar H0, H1 so,
dass der Test ein unverfälschter Signifikanztest zum Niveau α ist.
c) Der Test mit obiger Gütefunktion werde nun (bei geeignetem Signifikanz-
niveau) für das Testproblem H0 : ϑ = 0,5 gegen H1 : ϑ < 0,5 verwendet.
Halten Sie dies für sinnvoll (mit Begründung)?
d) Wie groß ist die maximale Wahrscheinlichkeit für einen Fehler 2. Art in der
Lösung von Teilaufgabe b)?
14. Signifikanztests 259
Universität Augsburg
14.11 Gütefunktion
➢ Ein Signifikanztest zum Niveau α heißt unverfälscht, wenn gilt
g(ϑ) = α für alle ϑ ∈ Θ1 (124)
(W’keit, H0 abzulehnen, ist für ϑ ∈ Θ0 nie größer als für ϑ ∈ Θ1.)
14. Signifikanztests 258
Universität Augsburg
18.2 Geschichtete Stichproben
➢ Gegeben:
• Grundgesamtheit G vom Umfang N mit
• µ unbekannt (soll geschätzt werden)
• k Teilgesamtheiten G1, . . . , Gk mit Umfängen N1, . . . , Nk und
• Stichprobenmittel X1, . . . , Xk; mittlere quadr. Abweichungen σ21, . . . , σ2
k
➢ Gesucht:
• Aufteilung n1, . . . , nk des Gesamtstichprobenumfangs n
• Schätzfunktion für µ
• deren Varianz (Gütekriterium)
➢ Unterscheide:
• Stichproben mit / ohne Zurücklegen
• Vorgabe von n / Vorgabe eines Budgets c
18. Stichprobenplanung 261
Universität Augsburg
p-Value
Abschließende Bemerkung zu Signifikanztests:
➢ Statistik-Software verlangt i.d.R. keine Vorgabe des Signifikanzniveaus α
➢ Stattdessen: Ausgabe des sog. p-Value α ′
➢ α ′ ist das kleinste Signifikanzniveau, zu dem bei dieser Stichprobe H0 ab-
gelehnt würde.
➠ Entscheidungsregel:
α = α ′ ⇒ H0 verwerfen
α < α ′ ⇒ H0 nicht verwerfen
➢ Je kleiner α ′, desto „signifikanter“!
14. Signifikanztests 260
Universität Augsburg
18.2 Geschichtete Stichproben
➢ Varianz:
Var(Θs) =
1
N2
k∑
i=1
N2i
σ2i
ni
, falls Ziehen mit Zurücklegen
1
N2
k∑
i=1
N2i
σ2i
ni
· Ni − ni
Ni − 1, falls Ziehen ohne Zurücklegen
➢ Problem: Wähle n1, . . . , nk so, dass
• Var(Θs) minimal
• n1 + · · · + nk = n
• ni = 1 (i = 1, . . . , k)
• bei Ziehen mit ohne Zurücklegen zusätzlich: ni 5 Ni (i = 1, . . . , k)
18. Stichprobenplanung 263
Universität Augsburg
18.2 Geschichtete Stichproben
➢ Konventionelle Schätzung:
Θ = X =1
n
n∑
i=1
Xi
(keine Aufteilung von n)
➢ Schichtungseffekt:
Genauigkeitsgewinn durch Verwendung einer geschichteten Stichprobe
➢ Dann: Schichtschätzfunktion
Θs =1
N
k∑
i=1
NiXi (146)
➢ E(Θs) = µ, unabhängig ob Ziehen mit / ohne Zurücklegen
18. Stichprobenplanung 262
Universität Augsburg
Optimale Aufteilung
➢ n wird vorgegeben
➢ Erhebungskosten werden nicht berücksichtigt.
➢ Falls Stichprobe mit Zurücklegen:
n∗i = n
Niσi
k∑
i=1Niσi
(i = 1, . . . , k) (150)
➢ Falls Stichprobe ohne Zurücklegen:
n∗i = n
Niσi
√Ni
Ni−1
k∑
i=1Niσi
√Ni
Ni−1
(i = 1, . . . , k) (151)
➢ Ergebnisse ggfs. runden18. Stichprobenplanung 265
Universität Augsburg
Proportionale Aufteilung
➢ Wähle ni proportional zu Ni:
ni = nNi
N
➢ Damit:
Var(Θs) 5 Var(X)
➢ Aber: Var(Θs) erreicht Minimum nicht
➠ Proportionale Aufteilung ist i.A. nicht optimal.
➢ Sinnvoll, wenn die σi unbekannt (bzw. gleich) sind.
18. Stichprobenplanung 264
Universität Augsburg
Klausuraufgabe 160 a) bis c)
Der mittlere Zeitaufwand µ für die Vorbereitung einer Statistikklausur (inStunden) in einer Grundgesamtheit von N = 350 Studierenden soll mittels
einer Stichprobe vom Umfang n = 20 mit Zurücklegen geschätzt werden.Die mittlere quadratische Abweichung des Untersuchungsmerkmals in derGrundgesamtheit betrage σ2 = 900.
a) Mit welcher Standardabweichung der Schätzfunktion X muss man beimZiehen einer einfachen Stichprobe gemäß reiner Zufallsauswahl rechnen?
Die Grundgesamtheit zerfalle nun in die drei Schichten der Genialen (N1 =
70), der Fleißigen (N2 = 210) und der Intuitiven (N3 = 70). Für die zugehöri-gen mittleren quadratischen Abweichungen der Schichten gelte: σ2
1 = σ22 =
σ23 = 1
5 σ2.
b) Wie soll n optimalerweise auf die drei Schichten aufgeteilt werden?c) Wie groß ist der Genauigkeitsgewinn bei der Schätzung von µ, der sich
durch die Berücksichtigung der Schichtung erzielen lässt?18. Stichprobenplanung 267
Universität Augsburg
Allgemeine optimale Aufteilung
➢ Gegeben: Budget c sowie Erhebungskosten ci pro Einheit in Schicht i
➠ Ersetze n1 + · · · + nk = n durch die Budgetrestriktion
c1n1 + · · · + cknk = c
➢ Falls Stichprobe mit Zurücklegen:
n∗i =
ck∑
i=1Niσi
√ci
︸ ︷︷ ︸=α
Niσi√ci
(i = 1, . . . , k) (152)
➢ Falls c1 = · · · = ck resultiert (150) mit n = cci
➢ Falls c1 = · · · = ck und σ1 = · · · = σk resultiert proportionale Aufteilung
18. Stichprobenplanung 266