Signiﬁkanztests · Universität Augsburg 14.2/14.3 Aufbau und Klassiﬁkation von...

Universität Augsburg

14.1 Einführung / Einstichproben-Gaußtest

➢ Zunächst:

• G ∼ N(µ; σ) mit σ bekannt

• Einfache Stichprobe X1, . . . , Xn

• (Null-)Hypothese H0 : µ = µ0

➢ Beispiel (BB-Beispiel 75):

X1, . . . , X25 mit Xi = Füllmenge der i-ten Flasche ∼ N(µ; 1,5)

Nullhypothese H0 : µ = 500, d.h. µ0 = 500

➢ Je nach Interessenlage sind unterschiedliche Gegenhypothesen möglich:

a) H1 : µ 6= µ0

b) H1 : µ < µ0

c) H1 : µ > µ0

(110)

14. Signifikanztests 203


Signifikanztests

➢ Vorliegen einer Hypothese über die Verteilung(en) der Grundgesamtheit(en).

➢ Z.B.

• „Der Würfel ist fair.“

• „Die Brenndauern zweier unterschiedlicher Glühbirnensorten sind gleich.“

➢ Die Hypothese soll anhand einer Stichprobe überprüft werden.

➢ Prinzip:

• Hypothese verwerfen, wenn „signifikanter“ Widerspruch zur Stichprobe.

• Ansonsten: Hypothese nicht verwerfen.

➢ Eine verworfene Hypothese gilt als statistisch widerlegt.

Nicht-Verwerfung ist dagegen ein „Freispruch aus Mangel an Beweisen“.

➠ Nicht-Verwerfung ist kein „statistischer Beweis“, dass Hypothese wahr ist!

(„Trick“: Hypothese falsch ⇐⇒ Gegenhypothese wahr!)




➢ Alternatives Kriterium: v = x−µ0σ

√n statt X − µ0.

Vorteil: Verteilung bekannt: N(0; 1) (Folie 164), falls µ = µ0, d.h. H0 wahr.

➠ Dann:H0 : µ = µ0 wird abgelehnt gegenüber

a) H1 : µ 6= µ0, wenn |v| „sehr groß“ ist

b) H1 : µ < µ0, wenn v „sehr negativ“ ist

c) H1 : µ > µ0, wenn v „sehr positiv“ ist

➢ Mögliche Fehlentscheidungen:

• Ablehnung von H0, obwohl H0 richtig ist: Fehler 1. Art

• Nicht-Ablehnung von H0, obwohl H0 falsch ist: Fehler 2. Art




➢ Aus Kapitel 12 (Folie 170) bekannt:

X ist wirksamster erwartungstreuer Schätzer für µ.

➠ Entscheidung:

H0 : µ = µ0 wird abgelehnt gegenüber

a) H1 : µ 6= µ0, wenn |x − µ0| „sehr groß“ ist

b) H1 : µ < µ0, wenn x „weit kleiner“ als µ0 ist

c) H1 : µ > µ0, wenn x „weit größer“ als µ0 ist

(111)




➢ Mithilfe von α und V kann geklärt werden, was „sehr groß“ usw. heißt:

Fehler 1. Art im Fall a): |v| > x, obwohl µ = µ0, d.h. V ∼ N(0; 1)

Wahrscheinlichkeit dafür:

P(|V | > x) = P(V > x) + P(V < −x)

= 2 · P(V > x) (Symmetrie der Normalverteilung)

= 2 · [1 − P(V 5 x)] = 2 · [1 − Φ(x)]!= α ⇐⇒

Φ(x) = 1 − α2 ⇐⇒

x = x1−α2

H0 wird demnach verworfen, wenn |v| > x1−α2

bzw. v ∈ B ist.

B = (−∞; −x1−α2) ∪ (x1−α

2; ∞) heißt Verwerfungsbereich.




H0richtig

H0 falsch

H0beibehalten

H0 ablehnen

H0beibehalten

H0 ablehnen

„Freispruch aus Mangel an Beweisen“

Fehler 1. Art

Fehler 2. Art

Bestätigung von H1

➢ Signifikanzniveau α:

Maximal erlaubte Wahrscheinlichkeit für einen Fehler 1. Art.




➠ Insgesamt: H0 ist zu verwerfen, wenn v ∈ B ist, wobei

B = (−∞; −x1−α2) ∪ (x1−α

2; ∞) im Fall a)

B = (−∞; −x1−α) im Fall b)

B = (x1−α; ∞) im Fall c)

(113)




➢A

nal

og

eVo

rgeh

ensw

eise

für

die

Fälle

b)

un

dc)

:




Hinweis:

Im Fall a) ist auch eine Entscheidung mithilfe von KI möglich (BB S. 178):

Man errechne, wenn α das vorgeschriebene Signifikanzniveau ist, ein sym-metrisches Schätzintervall [vu; vo] für ϑ zum Konfidenzniveau 1 − α undlehne H0 : ϑ = ϑ0 gegen H1 : ϑ 6= ϑ0 genau dann ab, wenn ϑ0 nichtin [vu; vo] liegt.

Hier: KI für µ gemäß 13.1.1 (Folie 188):

1. 1 − α = 1 − 0,01 = 0,99

2. N(0; 1) : c = x1−α2

= x1−0,012

= x0,995 = 2,576 (Folie 191)

3. x = 499,28

4. σc√n

= 1,5·2,576√25

= 0,77

5. KI = [499,28 − 0,77; 499,28 + 0,77] = [498,51; 500,05]

µ0 = 500 ∈ KI ⇒ H0 nicht verwerfen14. Signifikanztests 211



Beispiel (BB-Beispiel 76):

X1, . . . , X25 mit Xi ∼ N(µ; 1,5) und x = 499,28

Prüfe H0 : µ = 500, H1 : µ 6= 500 zum Signifikanzniveau α = 0,01

Lösung: Test gemäß Kapitel 14.1 (Einstichproben-Gaußtest), Fall (110 a)

1. α = 0,01

2. v = 499,28−5001,5 ·

√25 = −2,4

3. N(0; 1) : x1−α2

= x1−0,005 = x0,995 = 2,576 (Folie 191)

⇒ B = (−∞; −2,576) ∪ (2,576; ∞)

4. v /∈ B ⇒ H0 nicht verwerfen

Interpretation: Zum Signifikanzniveau 1 % kann der Brauerei keine Abwei-

chung vom Sollwert µ0 = 500 nachgewiesen werden.14. Signifikanztests 210


14.2 / 14.3 Aufbau und Klassifikation von Signifikanztests

• den Voraussetzungen an die Verteilung/parameter (z.B. G ∼ N(µ; σ))

• den Voraussetzungen an den Stichprobenumfang (z.B. n > 30)

• Art und Anzahl der Stichproben; unterscheide:

– Signifikanztests bei einer einfachen Stichprobe (→ Fig. 48):

Eine Grundgesamtheit, ein Merkmal.

(„Ist die erwartete Füllmenge einer Abfüllanlage gleich 500 cm3?“)

– Signifikanztests bei mehreren unabhängigen Stichproben (→ Fig. 49)

Mehrere GG (od. disjunkte Stichproben aus einer GG), ein Merkmal.

(„Hängt die Abiturnote von der beruflichen Stellung des Vaters ab?“)

– Signifikanztests bei zwei verbundenen Stichproben (→ Fig. 50)

Eine Grundgesamtheit, zwei Merkmale.

(„Besteht ein Zusammenhang zwischen Mathe- und Statistiknote?“)



14.2 / 14.3 Aufbau und Klassifikation von Signifikanztests

➢ Einheitliches Schema aller Tests:

➢ Der jeweils geeignete Test hängt ab von . . .

• dem zu testenden Hypothesenpaar H0, H1; unterscheide:

– Parametrische Hypothesen (H0 : ϑ ∈ Θ0, H1 : ϑ ∈ Θ1 = Θ − Θ0):

Beziehen sich auf unbekannte(n) Verteilungsparameter (µ, σ2, . . . )

– Nichtparametrische Hypothesen:

Beinhalten sonstige Aussagen, z.B. „Alter und Einkommen sind unabh.“14. Signifikanztests 212


Signifikanztests bei mehreren unabh. Stichproben (Fig. 49)



Signifikanztests bei einer einfachen Stichprobe (Fig. 48)



14.4 Einstichproben-t-Test, approx. Gaußtest, Differenzentests

➢ Gegeben:

• Einfache Stichprobe X1, . . . , Xn mit

• E(Xi) = µ, Var(Xi) = σ2

➢ Einstichprobentests:

a) H0 : µ = µ0 H1 : µ 6= µ0

b) H0 : µ = µ0 (oder µ = µ0), H1 : µ < µ0

c) H0 : µ = µ0 (oder µ 5 µ0), H1 : µ > µ0

(115)

➢ Voraussetzungen:

1. Normalverteilung mit σ unbekannt (Einstichproben-t-Test) oder

2. Beliebige Verteilung mit n > 30 bzw. 5 5∑

xi 5 n − 5 (bei B(1; p))

(approximativer Gaußtest)



Signifikanztests bei zwei verbundenen Stichproben (Fig. 50)



Einstichproben-t-Test, approx. Gaußtest; Vorgehensweise


X1, . . . , X2000 ∼ B(1; p) mit Xi =

{1, falls i-te Person Wähler der Partei

0, sonst2000∑

i=1xi = 108

Prüfe H0 : p 5 0,05 gegen H1 : p > 0,05 zum Signifikanzniveau 2 %

Lösung:approx. Gaußtest, Fall (115 c); Voraussetzung 2 erfüllt: 5 5 108 5 2000 − 5

1. α = 0,02

2. v =108

2000−0,05√0,05·(1−0,05)

√2000 = 0,82

3. N(0; 1) : x1−α = x0,98 = 2,05 (Tab. 3) ⇒ B = (2,05; ∞)


Zusatzfrage: Entscheidung, falls α = 0,01? → Keine Änderung!



Einstichproben-t-Test, approx. Gaußtest; Vorgehensweise



Binomialtest


X1, . . . , X20 ∼ B(1; p) mit Xi =

{1, falls das i-te geprüfte Stück defekt ist

0, sonstEntscheidung zw. H0 : p = 0,3, H1 : p < 0,3 in Abh. von

∑xi (α = 0,05)

Lösung: Binomialtest, Fall b); Voraussetzungen erfüllt

1. α = 0,05

2. –

3. B(20; 0,3) : F(2) = 0,0355 5 0,05, F(3) = 0,1071 > 0,05 ⇒ B = {0, 1, 2}

4. H0 ablehnen, falls in der Stichprobe höchstens 2 defekte Stücke

Hinweis: Falls p0 > 0,5 → Nutze den Hinweis auf Folie 93z.B. FB(11;0,6)(4) = 1 − FB(11;0,4)(6) = 1 − 0,9006 = 0,0994



Binomialtest

➢ Geeignet, falls G ∼ B(1; p) (5 5∑

xi 5 n − 5 muss nicht erfüllt sein!)

a) H0 : p = p0 H1 : p 6= p0

b) H0 : p = p0 (oder p = p0), H1 : p < p0

c) H0 : p = p0 (oder p 5 p0), H1 : p > p0

➢ Vorgehensweise:

1. Ein Signifikanzniveau α wird festgelegt.

2. Der Testfunktionswert v =n∑

i=1xi wird errechnet.

3. Mit F der B(n; p0)-Vtlg. wird der Verwerfungsbereich festgelegt:

a) B = {0, . . . , c1} ∪ {c2, . . . , n} mit

F(c1) 5 α2 , F(c1 + 1) > α

2 , F(c2 − 1) = 1 − α2 , F(c2 − 2) < 1 − α

2

b) B = {0, . . . , c} mit F(c) 5 α, F(c + 1) > α

c) B = {c, . . . , n} mit F(c − 1) = 1 − α, F(c − 2) < 1 − α

4. H0 wird genau dann abgelehnt, wenn v ∈ B gilt.



Änderungen gegenüber Folie 218

2) Alternativ: v = h10−h01√h10+h01

mity = 0 y = 1

x = 0 h00 h01

x = 1 h10 h11



Differenzentests

➢ Gegeben:

• Zwei verbundene einfache Stichproben X1, . . . , Xn und Y1, . . . , Yn mit

• E(Xi) = µ1, E(Yi) = µ2

➢ Hypothesenpaare:

a) H0 : µ1 = µ2 H1 : µ1 6= µ2

b) H0 : µ1 = µ2 (oder µ1 = µ2), H1 : µ1 < µ2

c) H0 : µ1 = µ2 (oder µ1 5 µ2), H1 : µ1 > µ2

➢ „Trick“:

• Übergang zu Zi = Xi − Yi mit

• E(Zi) = µ = µ1 − µ2

➠ Teste (115) mit µ0 = 0



Differenzentests

Lösung:

Differenzentest auf Basis des approx. Gaußtests, Fall (115 c)

Voraussetzungen gem. BB S. 190 erfüllt:

5 5 264 =∑

xi 5 495

5 5 217 =∑

yi 5 495

1. α = 0,05

2. v = 118−71√118+71

= 3,42

3. N(0; 1) : x1−α = x0,95 = 1,645 (Folie 191) ⇒ B = (1,645; ∞)

4. v ∈ B ⇒ H0 verwerfen

Interpretation: Zum Signifikanzniveau 5 % kann statistisch bestätigt werden,

dass der Anteil der KKW-Gegner größer ist als der der Spar-Befürworter.



Differenzentests

Beispiel (BB-Aufgabe 100):

X1, . . . , X500 ∼ B(1; p1) mit Xi =

{1, falls i-te Person KKW-Bau ablehnt

0, sonst

Y1, . . . , Y500 ∼ B(1; p2) mit Yi =

{1, falls i-te Person Sparen befürwortet

0, sonst

yi = 0 yi = 1∑

xi = 0 165 71 236

xi = 1 118 146 264∑

283 217 500

Prüfe H0 : p1 = p2, H1 : p1 > p2 zum Signifikanzniveau α = 0,05



14.5 Chi-Quadrat-Test für die Varianz

Falls µ unbekannt:




➢ Gegeben: Einfache Stichprobe X1, . . . , Xn ∼ N(µ; σ)


a) H0 : σ2 = σ20 H1 : σ2 6= σ2

0

b) H0 : σ2 = σ20 (oder σ2 = σ2

0), H1 : σ2 < σ20

c) H0 : σ2 = σ20 (oder σ2 5 σ2

0), H1 : σ2 > σ20

(116)

➢ Vorgehensweise, falls µ unbekannt: → Folie 227

➢ Falls µ bekannt:

• Schritt 2: Testfunktion v = 1σ2

0

n∑

i=1(xi − µ)2.

• Schritt 3: Ersetze χ2(n − 1) durch χ2(n).



14.6 Zweistichprobentests

➢ Gegeben:

• Zwei unabhängige einfache Stichproben X1, . . . , Xn1 und Y1, . . . , Yn2 mit

• Stichprobenumfängen n1 bzw. n2

• Erwartungswerten E(Xi) = µ1 bzw. E(Yi) = µ2

• Varianzen Var(Xi) = σ21 bzw. Var(Yi) = σ2

2

• Stichprobenmittel X bzw. Y

• Stichprobenvarianzen S21 bzw. S2

2

➢ Gesucht:

• Aussagen über den Vergleich der Erwartungswerte → 14.6.1

• Aussagen über den Vergleich der Varianzen → 14.6.2




Beispiel (BB-Aufgabe 101):

G ∼ N(µ; σ)

(x1, . . . , x10) = (2100; 2130; 2150; 2170; 2210; 2070; 2230; 2150; 2230; 2200)

Prüfe H0 : σ = 40, H1 : σ 6= 40 zum Signifikanzniveau α = 0,1

Lösung: χ2-Test für die Varianz, Fall (116 a); Voraussetzungen erfüllt

1. α = 0,1

2. x = 110 (2100 + 2130 + · · · + 2200) = 2164

v = 1402 [(2100 − 2164)2 + (2130 − 2164)2 + · · · + (2200 − 2164)2] = 16,65

3. χ2(9) : xα2

= x0,05 = 3,33; x1−α2

= x0,95 = 16,92 (Tab. 5)

⇒ B = [0; 3,33) ∪ (16,92; ∞)




14.6.1 Vergleich zweier Erwartungswerte

Zweistichproben-Gaußtest

Zweistichpoben-t-Test

approximativerZweistichproben-Gaußtest

approximativerZweistichproben-Gaußtest





a) H0 : µ1 = µ2 H1 : µ1 6= µ2

b) H0 : µ1 = µ2 (oder µ1 = µ2), H1 : µ1 < µ2

c) H0 : µ1 = µ2 (oder µ1 5 µ2), H1 : µ1 > µ2

(117)

➢ Vorgehensweise:



14.6.2 Vergleich zweier Varianzen / Zweistichproben-F-Test

Voraussetzung: Xi ∼ N(µ1; σ1), Yi ∼ N(µ2; σ2) (sonst: BB S. 195, Fußnote 1)

a) H0 : σ21 = σ2

2 H1 : σ21 6= σ2

2

b) H0 : σ21 = σ2

2 (oder σ21 = σ2

2), H1 : σ21 < σ2

2

c) H0 : σ21 = σ2

2 (oder σ21 5 σ2

2), H1 : σ21 > σ2

2

(118)




Beispiel:

X1, . . . , X80 ∼ B(1; p1) mit Xi =

{1, falls i-tes Teil Ausschuss

0, sonst,

80∑

i=1xi = 20

Y1, . . . , Y100 ∼ B(1; p2) mit Yi =

{1, falls i-tes Teil Ausschuss

0, sonst,

100∑

i=1yi = 50

Lässt sich zum Signifikanzniveau 10 % nachweisen, dass p1 < p2 ist?

Lösung:H0 : p1 = p2, H1 : p1 < p2; approx. Zweistichproben-Gaußtest, Fall (117 b)

Voraussetzungen 3 gem. Fig. 51 erfüllt: 5 5 20 5 75, 5 5 50 5 95

1. α = 0,1

2. x = 2080 = 0,25; y = 50

100 = 0,5; v = 0,25−0,5√(20+50)(80+100−20−50)

(80+100)·80·100

= −3,42

3. N(0; 1) : x1−α = x0,9 = 1,282 (Folie 191) ⇒ B = (−∞; −1,282)

4. v ∈ B ⇒ H0 verwerfen, d.h. p1 < p2 bestätigen14. Signifikanztests 232


14.7 Einfache Varianzanalyse

➢ Voraussetzungen:

• r > 2 unabhängige einfache Stichproben Xj1, . . . , Xjnjmit

• Xji ∼ N(µj; σ) (Beachte: identische Varianzen!)

• Alle Xji unabhängig

➢ Hypothesenpaar:

H0 : µ1 = µ2 = · · · = µr gegen

H1 : mindestens zwei der µj sind verschieden(119)

➢ Hilfsgrößen:

• Gesamtstichprobenumfang:

n =r∑

j=1nj



14.6.2 Vergleich zweier Varianzen / Zweistichproben-F-Test

Beispiel:

X1, . . . , X9 ∼ N(µ1; σ1) mit s21 = 4

Y1, . . . , Y7 ∼ N(µ2; σ2) mit s22 = 3

Kann σ21 > σ2

2 zum Signifikanzniveau 5 % bestätigt werden?

Lösung:

H0 : σ21 5 σ2

2, H1 : σ21 > σ2

2

Zweistichproben-F-Test, Fall (118 c); Voraussetzungen erfüllt

1. α = 0,05

2. v = 43

3. F(8, 6) : x1−α = x0,95 = 4,15 (Tab. 6) ⇒ B = (4,15; ∞)

4. v /∈ B ⇒ H0 nicht verwerfen, d.h. σ21 > σ2

2 kann nicht bestätigt werden




• Interne Stichprobenvarianz:

1

n − 1

r∑

j=1

nj∑

i=1

(Xji − Xj)2 =

1

n − 1

r∑

j=1

nj∑

i=1

X2ji −

r∑

j=1

njX2j

=Q2

n − 1

• Externe Stichprobenvarianz:

1

n − 1

r∑

j=1

nj(Xj − XGes)2 =

1

n − 1

r∑

j=1

njX2j − nX2

Ges

=Q1

n − 1

➠ Es gilt:

S2Ges =

Q1 + Q2

n − 1mit Q1 = W−nX2

Ges, Q2 =r∑

j=1

nj∑

i=1X2

ji−W, W =r∑

j=1njX

2j

➢ Variationen denkbar, z.B.: Q1, S2Ges gegeben ⇒ Q2 = (n − 1)S2

Ges − Q1




• Stichprobenmittel der j-ten Stichprobe:

Xj =1

nj

nj∑

i=1

Xji

• Gesamtstichprobenmittel:

XGes =1

n

r∑

j=1

njXj

• Gesamtstichprobenvarianz:

S2Ges =

1

n − 1

r∑

j=1

nj∑

i=1

(Xji − Xj)2

︸︷︷︸interne Stichprobenvarianz

+1

n − 1

r∑

j=1

nj(Xj − XGes)2

︸︷︷︸externe Stichprobenvarianz



Klausuraufgabe 133 a) (gekürzt)

Der Hersteller des Hundefutters „Schnappi“ möchte wissen, ob von der Farbedes Etiketts ein Einfluss auf den Marktanteil (gemessen an der Preiseinschät-zung) von „Schnappi“ ausgeht. Dazu werden 18 Testpersonen in drei gleichgroße Gruppen aufgeteilt, und jeder Gruppe wird eine andersfarbig etiket-tierte Dose vorgelegt. Sodann sollen die Testpersonen einer jeden Gruppeangeben, wieviel sie für eine solche Dose Hundefutter zu zahlen bereit wä-ren. Die folgende Tabelle gibt die Antworten der Probanden wieder:

Gelb 1,5 1,3 1,8 1,6 2,5 0,9Hellblau 4,0 3,4 3,7 4,3 2,1 4,1Rosa 1,2 2,1 2,8 2,3 1,3 2,3

Betrachten Sie die Erhebung der Preiseinschätzung in jeder Gruppe als eineeinfache Stichprobe. Die Preiseinschätzung sei jeweils normalverteilt, wobeidie Varianz in allen Gruppen gleich ist.

Kann zum Signifikanzniveau 0,05 statistisch bestätigt werden, dass die Etiket-tenfarbe einen Einfluss auf die Preiseinschätzung hat?14. Signifikanztests 239



➢ Vorgehensweise:

➢ Bemerkungen:

➀ v ändert sich nicht, wenn man alle xji linear transformiert gemäß

yji = a + bxji a, b ∈ IR, b 6= 0

➁ r = 2 ⇒ Einfache Varianzanalyse = Zweistichproben-t-Test, Fall (117 a)



Chi-Quadrat-Anpassungstest; Vorgehensweise für Fall (120 a)



14.8 Chi-Quadrat-Anpassungstest

➢ Gegeben: Einfache Stichprobe X1, . . . , Xn mit Verteilungsfunktion F


a) H0 : F = F0, wobei F0 hypothetische Verteilungsfunktion

H1 : F 6= F0

b) H0 : F gehört zu einer Menge von Verteilungsfunktionen,

deren Elemente sich nur durch endlich viele Parameter

ϑ1, . . . , ϑr voneinander unterscheiden

H1 : F gehört nicht zu dieser Menge

(120)

➢ Grundgedanke:

Unterteile die x-Achse in „möglichst viele“ Intervalle und vergleiche für

jedes Intervall die tatsächliche mit der theoretischen (gem. F0) Häufigkeit.




Beispiel:

Gegeben ist folgendes Stichprobenergebnis:

aj 0 1 2 3 4 5

hj 1 2 5 6 8 8

Prüfe zum Signifikanzniveau 5 %, ob G ∼ B(20; 0,15) gilt.

Lösung:

Chi-Quadrat-Anpassungstest, Fall (120 a)

Voraussetzung 30 pj = 5 wird in Schritt 2.3 geprüft

1. α = 0,05

2.1 Aj gegeben (sofern Voraussetzung erfüllt)




➢ Bemerkungen:

➀ Test nur anwendbar, wenn npj = 5 bzw. hj = 5 ∀ j = 1, . . . , k (prüfen!)

Falls nicht erfüllt → Intervalle zuammenlegen!

➁ I.A. sinkt die Wahrscheinlichkeit für den Fehler 2. Art, wenn k steigt

➂ G diskret verteilt → pro Ausprägung ein Intervall; Schritt 2.1 entfällt

(falls nicht npj = 5 eine Zusammenlegung erzwingt)

➢ Vorgehensweise für Fall (120 b):

• Schritt 2: Schätze F0 durch F0 auf Grund von ML-Schätzwerten ϑ1, . . . , ϑr

• Schritt 3: Fraktil nun zwischen dem von χ2(k − r − 1) und χ2(k − 1)




2. Aj (−∞; 1] (1; 2] (2; 3] (3; 4] (4; ∞)

hj 3 5 6 8 8

pj 0,1756 0,2293 0,2428 0,1821 0,1702

v = 130(

32

0,1756 + 52

0,2293 + 62

0,2428 + 82

0,1821 + 82

0,1702) − 30 = 4,53

3. χ2(4) : x1−α = x0,95 = 9,49 (Tab. 5) ⇒ B = (9,49; ∞)





2.2 hj gegeben (sofern Voraussetzung erfüllt)

2.3 p1 = P(X 5 0|F0) = F0(0) = 0,0388

p2 = P(0 < X 5 1|F0) = F0(1) − F0(0) = 0,1756 − 0,0388 = 0,1368

p3 = P(1 < X 5 2|F0) = F0(2) − F0(1) = 0,4049 − 0,1756 = 0,2293

p4 = P(2 < X 5 3|F0) = F0(3) − F0(2) = 0,6477 − 0,4049 = 0,2428

p5 = P(3 < X 5 4|F0) = F0(4) − F0(3) = 0,8298 − 0,6477 = 0,1821

p6 = P(X = 5|F0) = 1 − F0(4) = 1 − 0,8298 = 0,1702

aj 0 1 2 3 4 5

hj 1 2 5 6 8 8

pj 0,0388 0,1368 0,2293 0,2428 0,1821 0,1702

30 pj 1,164 4,104 6,879 7,284 5,463 5,106

Die ersten beiden Intervalle erfüllen 30 pj = 5 nicht! → Zusammenlegen!



14.9 Kontingenztest



14.9 Kontingenztest

➢ Gegeben: Zwei verbundene einfache Stichproben X1, . . . , Xn und Y1, . . . , Yn

➢ Hypothesenpaar:

H0 : die beiden Merkmale X und Y sind in G unabhängig

H1 : X und Y sind in G abhängig(121)

➢ Vorgehensweise entspricht dem Chi-Quadrat-Anpassungstest

➢ Basiert aber auf einer Kontingenztabelle



14.9 Kontingenztest

Beispiel:

Gegeben ist folgende Kontingenztabelle:

@@

@@

@@@

X

Y1 2 3

1 10 31 20

2 15 20 4

Prüfe zum Signifikanzniveau 1 %, ob X und Y unabhängig sind.

Lösung:

Kontingenztest

Voraussetzung hij = 5 erfordert Zusammenlegung von Y = 2 und Y = 3



14.9 Kontingenztest

Bemerkungen:

➀ Test nur anwendbar, wenn hij = 5 bzw. hij = 5 ∀ i = 1, j (prüfen!)

Falls nicht erfüllt → Intervalle zuammenlegen!

➁ X, Y diskret verteilt → pro Ausprägung ein Intervall; Schritt 2.1 entfällt

(falls nicht hij = 5 eine Zusammenlegung erzwingt)

➂ Falls k = l = 2:

• Schritt 2.3: Kann entfallen

• Schritt 2.4: Berechne Testfunktionswert gemäß v =n (h11h22−h12h21)

2

h1.h2.h.1h.2

➃ Falls Randw’keiten pi = P(X ∈ Ai), qj = P(Y ∈ Bj) bekannt sind:

• Schritt 2.3: Entfällt

• Schritt 2.4: Ersetze hij durch n · pi · qj

• Schritt 3: Ersetze χ2((k − 1) · (l − 1)) durch χ2(k · l − 1)



14.10 Vorzeichentest

➢ Gegeben:

• Zwei einfache Stichproben X1, . . . , Xn, und Y1, . . . , Yn, die

• entweder verbunden

• oder unabhängig sind

(dann: künstl. Zusammenfassen gleichnummerierter Paare)

• und (in beiden Fällen) den gleichen Stichprobenumfang besitzen


a) H0 : P(X > Y) = P(X < Y), H1 : P(X > Y) 6= P(X < Y)

b) H0 : P(X > Y) = P(X < Y), H1 : P(X > Y) < P(X < Y)

c) H0 : P(X > Y) 5 P(X < Y), H1 : P(X > Y) > P(X < Y)

(122)



14.9 Kontingenztest

1. α = 0,01

2.1 Ai, Bj gegeben

2.2 hij B1 B2 hi.

A1 10 51 61

A2 15 24 39

h.j 25 75 100

2.3 Entfällt (k = l = 2)

2.4 v =100·(10·24−51·15)2

61·39·25·75 = 6,18

3. χ2(1) : x1−α = x0,99 = 6,63 (Tab. 5) ⇒ B = (6,63; ∞)





Bemerkungen:

➀ Bei unabhängigen Stichproben gilt: F1 = F2 ⇒ P(X > Y) = P(X < Y),

d.h. mit (122 a) wird auch

H0 : F1 = F2 gegen H1 : F1 6= F2

getestet.

➁ α wird i.d.R. nicht voll ausgeschöpft (da B(n; p) diskret)

➂ Test wird mit wachsendem n schlechter






14.11 Gütefunktion

➢ Gütekriterien für einen Hypothesentest:

a) Die maximale Wahrscheinlichkeit für den Fehler 1. Art muss gleich α sein.

b) Unter Einhaltung von a) sollte die Wahrscheinlichkeit für den Fehler 2.

Art möglichst klein gehalten werden.

➢ Gütefunktion: Geeignet zur Beurteilung von parametrischen Tests

➢ Parametrischer Test:

H0 : ϑ ∈ Θ0 gegen H1 : ϑ ∈ Θ1

wobei Θ0 ∪ Θ1 = Θ ⊆ IR.

➢ Beispiel: Binomialtest: H0 : p 5 0,6 gegen H1 : p > 0,6

entspricht ϑ = p, Θ = [0; 1], Θ0 = [0; 0,6], Θ1 = (0,6; 1]



Klausuraufgabe 149 a) (gekürzt)

Eine Studentin trinkt an den 5 Werktagen einer Woche am Morgen den Fitness-Trunk „Red Bear“. An den 5 Werktagen der nächsten Woche trinkt sie den Be-ruhigungstrunk „Blue Bull“. Die Studentin beobachtet nun, wie lange sie sichan dem jeweiligen Tag fit fühlt. Dabei ergeben sich der Reihe nach folgen-de Fitness-Dauern xi bei Einnahme von „Red Bear“ und yi bei Einnahme von„Blue Bull“ (jeweils in Stunden).

xi 4,7 9,6 7,5 6,9 7,6yi 4,7 9,5 9,4 8,9 8,5

Gehen Sie davon aus, dass die Werte xi unabhängige Realisierungen der Zu-fallsvariablen X mit Verteilungsfunktion F1 und die Werte yi unabhängigeRealisierungen der Zufallsvariablen Y mit Verteilungsfunktion F2 sind. Alle Zu-fallsvariablen seien voneinander unabhängig.

Testen Sie mit einem geeigneten Test zum Signifikanzniveau α = 0,125 dieNullhypothese H0 : F1 = F2 gegen die Alternative H1 : F1 6= F2.14. Signifikanztests 254


14.11 Gütefunktion

➢ Ein Test erfüllt Forderung a), wenn gilt

supϑ∈Θ0

g(ϑ) = α

d.h. der Maximalwert der Gütefunktion im Bereich Θ0 ist gleich α.

Beachte: Ist Θ0 = {ϑ0} (einfache Hypothese) ⇒ g(ϑ0) = α

➢ Zur Forderung b): Wahrscheinlichkeit für den Fehler 2. Art:

P(V /∈ B|ϑ) = 1 − P(V ∈ B|ϑ) = 1 − g(ϑ) für ϑ ∈ Θ1

sollte möglichst klein sein, d.h. g(ϑ) möglichst groß (für ϑ ∈ Θ1).

➠ Merke:

Möglichst kleine g-Werte (5 α) in Θ0, möglichst große Werte in Θ1.



14.11 Gütefunktion

➢ Bei den TestsH0 H1

ϑ = ϑ0 ϑ 6= ϑ0

ϑ (>)= ϑ0 ϑ < ϑ0

ϑ (<)= ϑ0 ϑ > ϑ0

heißt ϑ0 Hypothesendefinierender Wert.

➢ Gütefunktion:

g(ϑ) = P(V ∈ B|ϑ) (123)

(Wahrscheinlichkeit, H0 abzulehnen, wenn wahrer Parameterwert ϑ ist.)



Klausuraufgabe 150

Die Gütefunktion eines Tests sei gegeben durch folgende Wertetabelle:

ϑ 0 0,1 0,2 0,4 0,5 0,6 0,8 0,9 1

g(ϑ) 1 0,9 0,8 0,1 0,03 0,15 0,85 0,95 1

Zwischen den gegebenen Punkten verläuft die Gütefunktion linear.

a) Zeichnen Sie die Gütefunktion.

b) Bestimmen Sie ein Signifikanzniveau α und ein Hypothesenpaar H0, H1 so,

dass der Test ein unverfälschter Signifikanztest zum Niveau α ist.

c) Der Test mit obiger Gütefunktion werde nun (bei geeignetem Signifikanz-

niveau) für das Testproblem H0 : ϑ = 0,5 gegen H1 : ϑ < 0,5 verwendet.

Halten Sie dies für sinnvoll (mit Begründung)?

d) Wie groß ist die maximale Wahrscheinlichkeit für einen Fehler 2. Art in der

Lösung von Teilaufgabe b)?



14.11 Gütefunktion

➢ Ein Signifikanztest zum Niveau α heißt unverfälscht, wenn gilt

g(ϑ) = α für alle ϑ ∈ Θ1 (124)

(W’keit, H0 abzulehnen, ist für ϑ ∈ Θ0 nie größer als für ϑ ∈ Θ1.)



18.2 Geschichtete Stichproben

➢ Gegeben:

• Grundgesamtheit G vom Umfang N mit

• µ unbekannt (soll geschätzt werden)

• k Teilgesamtheiten G1, . . . , Gk mit Umfängen N1, . . . , Nk und

• Stichprobenmittel X1, . . . , Xk; mittlere quadr. Abweichungen σ21, . . . , σ2

k

➢ Gesucht:

• Aufteilung n1, . . . , nk des Gesamtstichprobenumfangs n

• Schätzfunktion für µ

• deren Varianz (Gütekriterium)

➢ Unterscheide:

• Stichproben mit / ohne Zurücklegen

• Vorgabe von n / Vorgabe eines Budgets c

18. Stichprobenplanung 261


p-Value

Abschließende Bemerkung zu Signifikanztests:

➢ Statistik-Software verlangt i.d.R. keine Vorgabe des Signifikanzniveaus α

➢ Stattdessen: Ausgabe des sog. p-Value α ′

➢ α ′ ist das kleinste Signifikanzniveau, zu dem bei dieser Stichprobe H0 ab-

gelehnt würde.

➠ Entscheidungsregel:

α = α ′ ⇒ H0 verwerfen

α < α ′ ⇒ H0 nicht verwerfen

➢ Je kleiner α ′, desto „signifikanter“!




➢ Varianz:

Var(Θs) =

1

N2

k∑

i=1

N2i

σ2i

ni

, falls Ziehen mit Zurücklegen

1

N2

k∑

i=1

N2i

σ2i

ni

· Ni − ni

Ni − 1, falls Ziehen ohne Zurücklegen

➢ Problem: Wähle n1, . . . , nk so, dass

• Var(Θs) minimal

• n1 + · · · + nk = n

• ni = 1 (i = 1, . . . , k)

• bei Ziehen mit ohne Zurücklegen zusätzlich: ni 5 Ni (i = 1, . . . , k)




➢ Konventionelle Schätzung:

Θ = X =1

n

n∑

i=1

Xi

(keine Aufteilung von n)

➢ Schichtungseffekt:

Genauigkeitsgewinn durch Verwendung einer geschichteten Stichprobe

➢ Dann: Schichtschätzfunktion

Θs =1

N

k∑

i=1

NiXi (146)

➢ E(Θs) = µ, unabhängig ob Ziehen mit / ohne Zurücklegen



Optimale Aufteilung

➢ n wird vorgegeben

➢ Erhebungskosten werden nicht berücksichtigt.

➢ Falls Stichprobe mit Zurücklegen:

n∗i = n

Niσi

k∑

i=1Niσi

(i = 1, . . . , k) (150)

➢ Falls Stichprobe ohne Zurücklegen:

n∗i = n

Niσi

√Ni

Ni−1

k∑

i=1Niσi

√Ni

Ni−1

(i = 1, . . . , k) (151)

➢ Ergebnisse ggfs. runden18. Stichprobenplanung 265


Proportionale Aufteilung

➢ Wähle ni proportional zu Ni:

ni = nNi

N

➢ Damit:

Var(Θs) 5 Var(X)

➢ Aber: Var(Θs) erreicht Minimum nicht

➠ Proportionale Aufteilung ist i.A. nicht optimal.

➢ Sinnvoll, wenn die σi unbekannt (bzw. gleich) sind.



Klausuraufgabe 160 a) bis c)

Der mittlere Zeitaufwand µ für die Vorbereitung einer Statistikklausur (inStunden) in einer Grundgesamtheit von N = 350 Studierenden soll mittels

einer Stichprobe vom Umfang n = 20 mit Zurücklegen geschätzt werden.Die mittlere quadratische Abweichung des Untersuchungsmerkmals in derGrundgesamtheit betrage σ2 = 900.

a) Mit welcher Standardabweichung der Schätzfunktion X muss man beimZiehen einer einfachen Stichprobe gemäß reiner Zufallsauswahl rechnen?

Die Grundgesamtheit zerfalle nun in die drei Schichten der Genialen (N1 =

70), der Fleißigen (N2 = 210) und der Intuitiven (N3 = 70). Für die zugehöri-gen mittleren quadratischen Abweichungen der Schichten gelte: σ2

1 = σ22 =

σ23 = 1

5 σ2.

b) Wie soll n optimalerweise auf die drei Schichten aufgeteilt werden?c) Wie groß ist der Genauigkeitsgewinn bei der Schätzung von µ, der sich

durch die Berücksichtigung der Schichtung erzielen lässt?18. Stichprobenplanung 267


Allgemeine optimale Aufteilung

➢ Gegeben: Budget c sowie Erhebungskosten ci pro Einheit in Schicht i

➠ Ersetze n1 + · · · + nk = n durch die Budgetrestriktion

c1n1 + · · · + cknk = c

➢ Falls Stichprobe mit Zurücklegen:

n∗i =

ck∑

i=1Niσi

√ci

︸︷︷︸=α

Niσi√ci

(i = 1, . . . , k) (152)

➢ Falls c1 = · · · = ck resultiert (150) mit n = cci

➢ Falls c1 = · · · = ck und σ1 = · · · = σk resultiert proportionale Aufteilung


Signiﬁkanztests · Universität Augsburg 14.2/14.3 Aufbau und Klassiﬁkation von...

Documents

Transcript of Signiﬁkanztests · Universität Augsburg 14.2/14.3 Aufbau und Klassiﬁkation von...