1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer...
-
Upload
stephan-streifel -
Category
Documents
-
view
106 -
download
0
Transcript of 1 STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005. 2 Konfidenzintervall Ausgehend von dem Ergebnis einer...
1
STATISIK
LV Nr.: 0028
SS 2005
30. Mai 2005
2
Konfidenzintervall
• Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der zu schätzende Parameter der Grundgesamtheit mit einer bestimmten vorgegebenen Wahrscheinlichkeit (1-α) liegt.
3
Konfidenzintervall
• Bsp. Arithmetisches Mittel (ist bei N-Vt. Grundgesamtheit bzw. bei genügend großem Stichprobenumfang N-Vt.). Der wahre Parameter µ liegt mit der Wahrscheinlichkeit (1-α) im Intervall
XX
zσX;zσX
4
KonfidenzintervallKonfidenzintervall für den Parameter µ (bei N-Vt. des Stichprobenmittelwertes)
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3
Stichprobenmittelwert
Dic
hte
der
N(0
,1)
1-α = 0,95
α/2 = 0,025
Konfidenzintervall
α/2 = 0,025
x-z(α/2)σ x+z(1-α/2)σ
5
Konfidenzintervall
• Bsp. Körpergröße: – Mittelwert = 173,42– Standardabweichung = 9,54– N = 73– 2-seitiges KI zum Niveau α=0,05
Wahrscheinlichkeit, dass der wahre Parameter im KI liegt ist 0,95. Quantile der t-Vt: t = 1,99, Quantile der N(0,1)-Vt: z = 1,96
KI: [171,19 ≤ µ ≤ 175,65] t-Vt.KI: [171,23 ≤ µ ≤ 175,61] N(0,1)-Vt.
6
Statistische Tests
• Fragen: – Besteht ein Zusammenhang zw. dem
Geschlecht und dem Rauchverhalten?– Ist der Ausschussanteil kleiner als 5%?– Ist die mittlere Länge eines Werkstücks, das
von zwei verschiedenen Maschinen hergestellt wird, gleich?
– Soll ein neues Medikament zugelassen werden?– Stammen Daten aus einer N-Vt
Grundgesamtheit?– …
7
Statistische Tests
• Deskriptive Analyse der Daten– Lage- und Streuungsmassen– Kontingenztafeln – Korrelationsmaße– Verteilungsdiagramme– …
• Statistischer Test, um eine theoretisch abgesicherte Entscheidung zu treffen.
8
Statistische Tests
Einführung:
• Testen von Hypothesen (Annahmen, Behauptungen)
• Statistischer Test: Verfahren, mit dessen Hilfe sich bestimmte Hypothesen auf ihre Richtigkeit hin überprüfen lassen.
• Statistische Testverfahren basieren auf Stichprobentheorie
9
Statistische Tests
Einführung:• Ziel: Richtigkeit von Aussagen über die
Verteilung einer Zufallsvariablen überprüfen. • Entscheidungsgrundlage: Ergebnis eines
zufälligen Vorgangs.• Daher: Entscheidungen nicht immer richtig• Aber: Beim Vorliegen einiger der möglichen
Verteilungen ist die Wahrscheinlichkeit falsch zu entscheiden beschränkt.
10
Statistische Tests: Hypothesen
Hypothesen:
• Annahmen, Behauptungen, Aussagen über unbekannte Grundgesamtheit
• 2 Arten von Hypothesen:– Parameterhypothesen, Überprüfung durch
Parametertests– Verteilungshypothesen, Überprüfung durch
Verteilungstests
11
Statistische Tests: Hypothesen
Formulierung von Hypothesen:
• Nullhypothese H0 (Ausgangshypothese)
• Alternativhypothese H1 (Gegenhypothese)
12
Statistische Tests: Hypothesen
Bsp.• Anteile:
– H0: Ausschussanteil = 10%
– H1: Ausschussanteil > 10%
• Mittelwerte: – H0: Mittlere Länge eines Werkstücks = 5cm
– H1: Mittlere Länge eines Werkstücks 5cm
• Gruppenvergleich: – H0: Gruppe 1 und Gruppe 2 sind gleich
– H1: Gruppe 1 und Gruppe 2 sind ungleich
13
Statistische Tests
• Entscheidung für H0 oder H1 basiert auf einer Stichprobe x1,…,xn
• Wahrscheinlichkeitsaussage ob H0 zutrifft oder nicht.
• Frage: H0 ablehnen (verwerfen) oder H0 nicht ablehnen?
14
Statistische Tests
Mögliche Fehlentscheidungen:
• Fehler 1. Art (α-Fehler): obwohl H0 korrekt ist wird H0 abgelehnt
• Fehler 2. Art (β-Fehler): obwohl H0 falsch ist wird H0 nicht abgelehnt.
15
Statistische Tests
• Fehlentscheidungen
Trifft zu
EntscheidungH0 H1
H0Richtige
EntscheidungFehler 2. Art (β -Fehler)
H1Fehler 1. Art
(α-Fehler)Richtige
Entscheidung
16
Statistische Tests
Problem bei Fehlentscheidungen:
• Falsche Entscheidung
• Man weiß nicht, ob man in einer konkreten Situation einen Fehler macht, sondern nur welcher Art dieser ist.
17
Statistische Tests
• Signifikanzniveau eines Tests α:– Die Wahrscheinlichkeit eine Fehler 1. Art zu
machen ist höchstens α, daher „Test zum Niveau α“ - egal mit welcher Wahrscheinlichkeit ein Fehler 2. Art begangen wird.
18
Statistische Tests
• Trifft H0 zu und entscheidet man sich für H1, dann ist die Wahrscheinlichkeit dabei einen Fehler zu machen ≤ α (α bekannt, wird festgelegt).
• Trifft H1 zu und entscheidet man sich für H0, dann ist die Wahrscheinlichkeit dabei eine Fehler zu machen = β (β unbekannt).
19
Statistische TestsFehler 1. Art und Fehler 2. Art
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6
x
f(x)
N(0,1) N(3,1)
Fehler 1. Art
Fehler 2. Art
µ0=0 µ1=3
20
Statistische Tests
• D.h. durch Festlegen des α-Niveaus ist nur die Entscheidung für H1 abgesichert.
• Bei Entscheidung für H1: – H1 ist richtig, – H1 ist falsch, ich mache einen Fehler mit
Wahrscheinlichkeit ≤ α.
• Daher: Formuliere H0 so, dass sie abgelehnt werden soll. bzw. in H0 soll diejenige Annahme festgelegt werden, der die größere Bedeutung zukommt.
21
Statistische Tests
• Bsp. Medikamententest H0: Medikament ist nicht wirksam gegen H1: Medikament wirkt. – Fehler 1. Art: das Medikament wirkt nicht, man
glaubt aber dass es wirkt– Fehler 2. Art: das Medikament wirkt, man
glaubt aber dass es unwirksam ist.
Wähle α=0,01 (sehr klein), da Risiko ein nichtwirksames Medikament als wirksam einzustufen sehr groß ist.
22
Statistische Tests
• Arten von Hypothesen:
• Einseitige Hypothesen– H0: θ ≤ θ0 gegen H1: θ > θ0
– H0: θ ≥ θ0 gegen H1: θ < θ0
• Zweiseitige Hypothesen– H0: θ = θ0 gegen H1: θ ≠ θ0
• Verteilungshypothesen:– H0: bestimmten Vt. gegen H1: nicht diese Vt.
23
Statistische Tests
• Arten von Testproblemen:– Einseitige Testprobleme
• Tests für einseitige Hypothesen
– Zweiseitige Testprobleme• Tests für zweiseitige Hypothesen
– Anpassungstests• Test für Verteilungshypothesen
24
Statistische Tests
• Gütefunktion oder Macht g(θ): Wahrscheinlichkeit sich für H1 zu entscheiden, falls θ der wahre Parameter ist.
• Test zum Niveau α:– g(θ) ≤ α für alle θ H0
– g(θ) ≥ α für alle θ H1
– Ist θ H1, ist 1-g(θ) Wahrscheinlichkeit für den Fehler 2. Art.
– Funktion 1-g(θ) heißt Operationscharakteristik (OC)
25
Statistische TestsGütefunktion (einseitiger Test)
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,00
499 499,5 500 500,5 501 501,5 502
µ
g(µ
)
µ0=500
26
Statistische TestsOperationscharaktersitik OC Kurve (einseitiger Test)
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,00
499,5 500 500,5 501 501,5 502
µ
Feh
ler
2.A
rt =
1-g
(µ)
µ0=500
27
Statistische Tests
• Trennschärfe eines Tests:– Steilheit der OC Kurve 1-g(θ)– Es gilt: Je größer die Stichprobe umso besser
die Trennschärfe.
28
Statistische TestsOperationscharaktersitik OC Kurve (einseitiger Test),
unterschiedliche Stichprobengrößen n (n=9, n=100, n=10000)
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,00
499,5 500 500,5 501 501,5 502
µ
Feh
ler
2.A
rt =
1-g
(µ)
µ0=500
29
Statistische Tests
• Vorgehensweise bei statistischen Tests (I):– Formulierung von H0 und H1 und Festlegen des
Signifikanzniveaus– Festlegung einer geeigneten Prüfgröße und
Bestimmung der Testverteilung unter H0.– Bestimmung des kritischen Bereichs– Berechnung der Prüfgröße (=Teststatistik)– Entscheidung und Interpretation
30
Statistische Tests
• Vorgehensweise bei statistischen Tests (II):– Formulierung von H0 und H1 und Festlegen des
Signifikanzniveaus– Festlegung einer geeigneten Prüfgröße und
Bestimmung der Testverteilung unter H0.– Berechnung der Prüfgröße (=Teststatistik)– Bestimmung des p-Wertes der Teststatistik– Entscheidung und Interpretation
31
Statistische Tests
• p-Wert– Anstatt den kritischen Bereich bzw. die
kritischen Werte zu bestimmen, Berechnung des „p-Wertes“.
– p-Wert (p-value): Niveau, bei dem der Test gerade noch abgelehnt hätte.
– Vergleich des p-Wertes mit dem vorher festgesetzten Niveau α.
– Entscheidung: Lehne H0 ab, wenn p-Wert < α
32
Statistische Tests
• Einseitige Tests (I)– H0: θ ≤ θ0 gegen H1: θ > θ0 und α = 0,05
– Teststatistik (T) und deren Verteilung unter H0
bestimmen.– Bestimmung des kritischen Bereichs bzw. des
kritischen Werts (c)
– T > c, lehne H0 ab
– T ≤ c, lehne H0 nicht ab
33
Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3
Prüfgröße
Dic
hte
de
r T
es
tve
rte
ilun
g
1-α = 0,95
α = 0,05
Kritischer BereichH0 ablehnen
H0 nicht ablehnen
Kritischer Wert: c
34
Statistische Tests
• Einseitige Tests (II)– H0: θ ≤ θ0 gegen H1: θ > θ0 und α = 0,05
– Teststatistik (T) und deren Verteilung unter H0
bestimmen.– Bestimmung des p-Wertes
– p < α, lehne H0 ab
– p ≥ α, lehne H0 nicht ab
35
Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3
Prüfgröße
Dic
hte
der
Tes
tver
teil
un
g
1-α = 0,95
α = 0,05
Kritischer BereichH0 ablehnen
H0 nicht ablehnen
Kritischer Wert: c
Prüfgröße=1,64 p-Wert=0,05
36
Statistische Tests
• Einseitige Tests (I)– H0: θ ≥ θ0 gegen H1: θ < θ0 und α = 0,05
– Teststatistik (T) und deren Verteilung unter H0
bestimmen.– Bestimmung des kritischen Bereichs bzw. des
kritischen Werts (c)
– T < c, lehne H0 ab
– T ≥ c, lehne H0 nicht ab
37
Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3
Prüfgröße
Dic
hte
de
r T
es
tve
rte
ilun
g
1-α = 0,95
α = 0,05
Kritischer BereichH0 ablehnen
H0 nicht ablehnen
Kritischer Wert: c
38
Statistische Tests
• Einseitige Tests (II)– H0: θ ≥ θ0 gegen H1: θ < θ0 und α = 0,05
– Teststatistik (T) und deren Verteilung unter H0
bestimmen.– Bestimmung des p-Wertes
– p < α, lehne H0 ab
– p ≥ α, lehne H0 nicht ab
39
Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3
Prüfgröße
Dic
hte
der
Tes
tver
teil
un
g
1-α = 0,95
α = 0,05
Kritischer BereichH0 ablehnen
H0 nicht ablehnen
Kritischer Wert: c
Prüfgröße=-1,64 p-Wert=0,05
40
Statistische Tests
• Zweiseitige Tests (I)– H0: θ = θ0 gegen H1: θ ≠ θ0 und α = 0,05
– Teststatistik (T) und deren Verteilung unter H0
bestimmen.– Bestimmung des kritischen Bereichs bzw. der
kritischen Werte (cu und co)
– T < cu oder T > co, lehne H0 ab
– cu ≤ T ≤ co, lehne H0 nicht ab
41
Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3
Prüfgröße
Dic
hte
de
r T
es
tve
rte
ilun
g
1-α = 0,95
α/2 = 0,025
Kritischer Bereich
H0 ablehnen
H0 nicht ablehnen
Kritischer Wert: co
Kritischer Bereich
H0 ablehnen
α/2 = 0,025
Kritischer Wert: cu
42
Statistische Tests
• Zweiseitige Tests (II)– H0: θ = θ0 gegen H1: θ ≠ θ0 und α = 0,05
– Teststatistik (T) und deren Verteilung unter H0
bestimmen.– Bestimmung des p-Wertes
– p < α, lehne H0 ab
– p ≥ α, lehne H0 nicht ab
43
Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3
Prüfgröße
Dic
hte
der
Tes
tver
teil
un
g
1-α = 0,95
α/2 = 0,025
Kritischer Bereich
H0 ablehnen
H0 nicht ablehnen
Kritischer Wert: co
Kritischer Bereich
H0 ablehnen
α/2 = 0,025
Kritischer Wert: cu
Prüfgröße= -1,96, +1,96 p-Wert=0,05
44
Statistische Tests
• Kritischer Wert: Wert auf der Achse
• p-Wert: Fläche unter der Dichte
• Entscheidung: – Lehne H0 ab, wenn Prüfgröße im kritischen
Bereich
– Lehen H0 ab, wenn p-Wert der Prüfgröße < α
45
χ² Unabhängigkeitstest
Chi-Quadrat (χ²) Unabhängigkeitstest
• Teste ob 2 nominalskalierte Merkmale voneinander unabhängig sind.
• Bsp. Sind Geschlecht und Rauchverhalten voneinander unabhängig?
46
χ² Unabhängigkeitstest
Chi-Quadrat (χ²) Unabhängigkeitstest
• H0: die beiden Merkmale sind voneinander unabhängig.
• H1: die beiden Merkmale sind nicht voneinander unabhängig, d.h. sie sind voneinander abhängig
• Festlegen des Signifikanzniveaus α.
47
χ² Unabhängigkeitstest
• Kontingenztafel:– Absolute Häufigkeiten der
Merkmalsausprägungen
A \ B b1 ... bs ∑
a1 h11 … h1s h1.
: : : :
ar hr1 … hrs hr.
∑ h.1 ... h.s h.. = n
48
χ² Unabhängigkeitstest
• Bsp. 4-Felder Tafel:– Absolute Häufigkeiten der
Merkmalsausprägungen
Raucher Nichtraucherweiblich 9 32 41männlich 5 27 32
14 59 73
49
χ² Unabhängigkeitstest
Prüfgröße und Testverteilung:
• Prinzip: Vergleiche die Werte, die man unter Unabhängigkeit der Merkmale erwarten würde (he), mit den tatsächlich beobachteten Werten (ho).
• Wenn H0 gilt, welche Werte würde man erwarten?
• Berechung der unter H0 erwarteten absoluten Häufigkeiten.
50
χ² Unabhängigkeitstest
• Unter H0 erwartete absoluten Häufigkeiten
• Interpretation der relativen Häufigkeiten als Wahrscheinlichkeiten
• Dann: unter H0 erwartete absoluten Häufigkeiten
o oi je h h
h =n
51
χ² Unabhängigkeitstest
• Bsp. Geschlecht - Rauchverhalteno oi je h h
h =n
ho
Geschlecht j nw 9 32 41m 5 27 32
14 59 73
Raucher
he
Geschlecht j nw 7,9 33,1 41m 6,1 25,9 32
14 59 73
Raucher
52
χ² Unabhängigkeitstest
• Teststatistik χ²:– Abweichung der beobachteten Häufigkeiten
von den erwartete Häufigkeiten
2o er sij ij2
ei=1 j=1 ij
h hχ =
h
53
χ² Unabhängigkeitstest
Verteilung der Teststatistik χ²:
• χ²-Verteilung mit v = (r-1)·(s-1) Freiheitsgraden
54
χ² Unabhängigkeitstest
Kritischer Bereich:
• Signifikanzniveau α
• Kritischer Wert: α-Quantil der χ²(r-1)·(s-1) Verteilung
• Lehne H0 ab, wenn gilt:
Wert der Teststatistik > kritischer Wert
55
χ² Unabhängigkeitstest
Bsp. Geschlecht – Rauchverhalten: Teststatistik χ²
• Verteilung der Teststatistik: χ²1
Chi-Quadrat Verteilung mit einem Freiheitsgrad
2o e2 2ij ij2
ei=1 j=1 ij
h hχ = 0,5
h
56
χ² Unabhängigkeitstest
Bsp. Geschlecht – Rauchverhalten:
• Kritischer Wert: 0,05-Quantil der χ²1 Vt. = 3,84
• Entscheidung:
(I) Teststatistik = 0,5 < 3,84 = kritischer Wert. Also: Lehne H0 nicht ab.
(II) p-Wert = 0,496 > 0,05. Also: Lehne H0 nicht ab.
• Interpretation: Geschlecht und Rauchverhalten sind voneinander unabhängig.
57
χ² Homogenitätstest
Chi-Quadrat (χ²) Homogenitätstest
• Betrachte zwei Gruppen bzw. Stichproben.
• Teste, ob die Stichproben aus der gleichen Grundgesamtheit stammen.
58
χ² Homogenitätstest
Chi-Quadrat (χ²) Homogenitätstest
• H0: die beiden Stichproben stammen aus der gleichen Grundgesamtheit.
• H1: die beiden Stichproben stammen nicht aus der gleichen Grundgesamtheit.
• Festlegen des Signifikanzniveaus α.
59
χ² Homogenitätstest
Bsp. Geschlecht – Rauchverhalten
• H0: Das Rauchverhalten der beiden Gruppen stimmt überein.
• H1: Das Rauchverhalten der beiden Gruppen stimmt nicht überein.
60
χ² Homogenitätstest
Prüfgröße und Testverteilung:
• Prinzip: Vergleiche die Werte, die man unter H0 (gleiche Grundgesamtheit) erwarten würde (he), mit den tatsächlich beobachteten Werten (ho).
• Wenn H0 gilt, welche Werte würde man erwarten?
• Berechung der unter H0 erwarteten absoluten Häufigkeiten.
61
χ² Homogenitätstest
• Unter H0 erwartete absoluten Häufigkeiteno oi je h h
h =n
62
χ² Homogenitätstest
• Teststatistik χ²:– Abweichung beobachteten Häufigkeiten und
erwartete Häufigkeiten
• Verteilung der Teststatistik χ²:
χ²-Verteilung mit v = (r-1)·(s-1) Freiheitsgraden
2o er sij ij2
ei=1 j=1 ij
h hχ =
h
63
χ² Homogenitätstest
Bsp. Geschlecht – Rauchverhalten:• Teststatistik χ² = 0,5• Verteilung der Teststatistik: χ²1 • Entscheidung:
– (I) χ² = 0,5 < 3,84. Lehne H0 nicht ab. – (II) p-Wert = 0,496 > 0,05. Lehne H0 nicht ab.
• Interpretation: die beiden Gruppen (Männer, Frauen) stammen aus der gleichen Grundgesamtheit, sie sind homogen.
64
χ² Tests
χ² Unabhängigkeits- und Homogenitätstests:
• Teststatistik und Testverteilung sind gleich
• Nullhypothese und Interpretation sind verschieden. – Test auf Unabhängigkeit (die Merkmale sind
unabhängig voneinander)– Test auf Homogenität (die Stichproben
stammen aus der gleichen Grundgesamtheit).
65
χ² Tests
χ² Unabhängigkeits- und Homogenitätstests:
• Für die Approximation durch die χ²-Vt. sollten die erwarteten Häufigkeiten jeder Zelle 5 sein und keine der Zellen sollte unbesetzt sein.
• Sind die Voraussetzungen verletzt, kann man einen exakten Test durchführen
(siehe Hartung S. 414ff)
66
Anpassungstests
Test einer Verteilungshypothese – Nichtparametrische Testverfahren
• Betrachtet Unterschied zw. Stichproben-Vt. und theoretischer Verteilung.
• „Anpassungstest“ weil die Güte der Anpassung einer theoretischen Vt. an eine empirische Vt. überprüft wird.
67
Anpassungstests
χ² Anpassungstest:
• H0: die Grundgesamtheit gehorcht einer bestimmten Verteilung.
• Vorgehensweise: – Bestimme die unter H0 zu erwartenden
Häufigkeiten he und vergleiche sie mit den beobachteten Häufigkeiten ho.
– Abweichung groß – Entscheidung gegen H0, Abweichung klein – Entscheidung für H0.
68
Anpassungstests
χ² Anpassungstest:
• Teststatistik:
k ... Anzahl der Merkmalsausprägungen (diskrete Merkmale) bzw. Anzahl der Klassen (stetigen Merkmalen)
• Testverteilung: χ²v verteilt mit v=n-1
• Es gilt wieder: he sollten 5 sein.
k
1iei
2ei
oi2
h
)h(hχ
69
Anpassungstests
χ² Anpassungstest:
• Entscheidung: – Bestimmung des kritischen Bereichs,
χ² > kritischer Wert, lehne H0 ab
– Bestimmung des p-Wertes,
p-Wert < α lehne H0 ab
70
Anpassungstest
• Bsp. χ² Anpassungstest:– H0: Augenfarbe ist gleichverteilt
– H1: Augenfarbe ist nicht gleichverteilt
– α = 0,05
• Teststatistik: 8,583 > 5,991 (0,05 Quantil der χ²2 Verteilung) => H0 ablehnen
• p-Wert: 0,014 < 0,05 => H0 ablehnen
Merkmal ho he
1 35 242 22 243 15 24
72 72
71
Anpassungstests
Kolmogorov-Smirnov- Anpassungstest:
• Test zur Beurteilung der Güte der Anpassung einer erwarteten theoretischen Verteilung an eine beobachtete empirische Verteilung.
• H0: die Grundgesamtheit gehorcht einer bestimmten Verteilung.
• Prinzip: Abweichung empirische- von der theoretische Verteilungsfunktion.
72
Anpassungstests
Kolmogorov-Smirnov- Anpassungstest: • Prüfgröße (D):
– größte beobachtete absolute Abweichung der theoretischen von der empirischen Verteilungsfunktion.
• Testverteilung: – „Kolmogorov-Smirnov- Verteilung“, hängt nur
vom Stichproben-umfang n ab (1-α Quantile in Tabelle nachschlagen).
• Entscheidung: – D > kritischer Wert (aus Tabelle), lehne H0 ab.
73
Anteilstests
• Einstichprobentest für den Anteilswert – Hat der Anteil einen bestimmten Wert, bzw.
liegt er in einem bestimmten Bereich?– Entscheidung basiert auf dem Ergebnis einer
einzigen Stichprobe.
• Zweistichprobentest für Anteilswerte– Unterscheiden sich die Anteile zweier
unabhängiger Gruppen?– Entscheidung basiert auf zwei Stichproben
74
Anteilstest - Einstichprobentest
Einstichprobentest für den Anteilswert:
• Einseitige Hypothesen: – H0: θ ≤ θ0 gegen H1: θ > θ0
– H0: θ ≥ θ0 gegen H1: θ < θ0
• Zweiseitige Hypothesen: – H0: θ = θ0 gegen H1: θ ≠ θ0
75
Anteilstest - Einstichprobentest
Vorgehensweise:
• Teststatistik bestimmen
• Testverteilung bestimmen
• Entescheidung über Annahme oder Ablehnung von H0.
76
Anteilstest - Einstichprobentest
• Anteilswert einer Stichprobe: P = x / n
• Unter H0 ist P, wenn nθ0(1-θ0) ≥ 9, approximativ N-Vt., mit Parametern – E(P) = θ0
– Var(P) = θ0(1-θ0)/n · [(N-n)/(N-1)]• Vernachlässigung der Endlichkeitskorrektur wenn
n/N < 0,05.
77
Anteilstest - Einstichprobentest
Prüfgröße / Teststatistik:
• Standardisierte Zufallsvariable Z:
0
P
P-θZ=
σ
78
Anteilstest - Einstichprobentest
Testverteilung:
• Teststatistik Z ist unter H0 N(0,1) verteilt.
• Daher: Testverteilung ist die Standardnormalverteilung.
79
Anteilstest - Einstichprobentest
Kritischer Bereich:• α festlegen (z.B. α = 0,05) • Kritischer Wert: α – Quantil der N(0,1)-Vt. • Entscheidung: H0 ablehnen, wenn Teststatistik im
kritischen Bereich. p-Wert: • α festlegen (z.B. α = 0,05)• p-Wert: Niveau, bei dem der Test gerade noch die
H0 ablehnen würde. • Entscheidung: H0 ablehnen, wenn p-Wert < α
80
Anteilstest - Einstichprobentest
Bsp: Anteil der weiblichen Studenten
• Approximation durch N-Vt. zulässig, da unter H0 nθ0(1-θ0) = 18,25 ≥ 9.
• 1. Einseitige Tests:– H0: pw ≤ 0,5 gegen H1: pw > 0,5 und α=0,05
– H0: pw ≥ 0,5 gegen H1: pw < 0,5 und α=0,05
• 2. Zweiseitiger Test: – H0: pw = 0,5 gegen H1: pw 0,5 und α=0,05
81
Anteilstest - Einstichprobentest
Bsp: Anteil der weiblichen Studenten
• H0: pw 0,5 gegen H1: pw > 0,5 und α=0,05– Unter H0: E(P) = 0,5, Var(P) = 0,0034 und σP =
0,0585 (ohne Endlichkeitskorrektur).– Teststatistik: Z = 1,05– Testverteilung: N(0,1) => Kritischer Wert 1,64– p-Wert: 0,1461
82
Anteilstest - Einstichprobentest
Bsp: Anteil der weiblichen Studenten
• H0: pw ≥ 0,5 gegen H1: pw < 0,5 und α=0,05– Unter H0: E(P) = 0,5, Var(P) = 0,0034 und σP =
0,0585 (ohne Endlichkeitskorrektur).– Teststatistik: Z = 1,05– Testverteilung: N(0,1) => Kritischer Wert -1,64– p-Wert: 0,8539
83
Anteilstest - Einstichprobentest
Bsp: Anteil der weiblichen Studenten
• H0: pw = 0,5 gegen H1: pw 0,5 und α=0,05– Unter H0: E(P) = 0,5, Var(P) = 0,0034 und σP =
0,0585 (ohne Endlichkeitskorrektur).– Teststatistik: Z = 1,05– Testverteilung: N(0,1) => Kritische Werte -1,96
und +1,96 – p-Wert: 0,2922
84
Anteilstest - Zweistichprobentest
Test für die Differenz zweier Anteilswerte
• Stichprobe 1: Anteil P1 = x / n1
• Grundgesamtheit 1: Anteil θ1
• Stichprobe 2: Anteil P2 = x / n2
• Grundgesamtheit 2: Anteil θ2
• H0: Anteilswerte der beiden Grundgesamtheiten sind gleich.
H0: θ1 = θ2 (=θ) gegen H1: θ1 ≠ θ2
85
Anteilstest - Zweistichprobentest
Teststatistik:
(Unter Vernachlässigung der Endlichkeitskorrektur und wenn Voraussetzungen für eine N-Vt. erfüllt sind)
• Verteilung der Teststatistik unter H0:
Z ~ N(0,1)
1 2
1 2
1 2
(P -P )Z=
n +nθ(1-θ)
n n
86
Anteilstest - Zweistichprobentest
Entscheidung:
• Bestimmung des kritischen Bereichs. – Z > |c| lehne H0 ab
• Bestimmung des p-Wertes– p-Wert < α lehne H0 ab
• Interpretation: Wird H0 abgelehnt, dann sind die Anteile in den beiden Gruppen signifikant verschieden.
87
Test für arithmetisches Mittel
• Einstichprobentest für das arithm. Mittel: – Hat das arithm. Mittel einen bestimmten Wert,
bzw. liegt es in einem bestimmten Bereich?– Entscheidung basiert auf dem Ergebnis einer
einzigen Stichprobe.
• Zweistichprobentest für das arithm. Mittel– Unterscheiden sich die Mittelwerte zweier
Gruppen?– Entscheidung basiert auf zwei Stichproben
88
Test für arithmetisches Mittel
• Einstichprobentest für das arithm. Mittel: – Varianz der Grundgesamtheit ist bekannt.– Varianz der Grundgesamtheit ist unbekannt.
89
Test für arithmetisches Mittel
• Einstichprobentest für das arithm. Mittel:
• Zweiseitige Hypothese:
H0: µ = µ0 gegen H1: µ ≠ µ0
• Festlegen des Signifikanzniveaus
90
Test für arithmetisches Mittel
• Varianz der Grundgesamtheit ist bekannt.
• Unter H0 ist das arithm. Mittel der Stichprobe N-Vt. mit E=µ und Var=σ²/n
• Teststatistik:
• Testverteilung: N(0,1)n
σμX
σ
μXZ
X
91
Test für arithmetisches Mittel
• Bestimmung des kritischen Bereichs bzw. Berechung des p-Wertes
• Entscheidung
• Interpretation
92
Test für arithmetisches Mittel
• Varianz der Grundgesamtheit ist unbekannt.
• Schätzwert für unbekanntes σ²: Stichprobenvarianz s².
• Teststatistik:
• Testverteilung: tn-1
• t-Test
n
sμX
T
93
Test für arithmetisches Mittel
• Bestimmung des kritischen Bereichs: kritische Werte: α/2-Quantile der t-Vt., symmetrische Vt. daher tc
u = -tco
• Berechung des p-Wertes:
• Entscheidung:
|t| > tc, lehne H0 ab
p-Wert < α, lehne H0 ab
• Interpretation
94
Test für arithmetisches Mittel
Bsp. mittlere Körpergröße (n = 73)
• H0: µ = 170 gegen H1: µ 170, α = 0,05
• Arithm. Mittel der Stpr: 173,4
• Standardabweichung der Stichprobe: 9,5
• Teststatistik T = (173,4-170) / 9,5/73 = 3,1
• Kritische Werte: -1,96 und +1,96
• p-Wert: 0,0021
• Mittlere Körpergröße ist signifikant 170
95
Test für arithmetisches Mittel
• Zweistichprobentest für die Differenz zweier arithmetischer Mittel– Unterscheiden sich die Mittelwerte zweier
Grundgesamtheiten?– Unterscheiden sich die Mittelwerte zweier
verbundener Stichproben?
96
Test für arithmetisches Mittel
• Differenz zweier arithmetischer Mittel die aus 2 Grundgesamtheiten stammen.
• Voraussetzung: – Stichproben unabhängig– Stichproben stammen aus einer N-vt.
Grundgesamtheiten bzw. Approximation durch N-Vt. ist zulässig
– Endlichkeitskorrektur ist vernachlässigbar
97
Test für arithmetisches Mittel
• Unterscheide, ob die Varianzen der beiden Grundgesamtheiten homogen sind oder nicht.
• Varianzen verschieden, σ1² σ2² :
• Teststatistik:
• Testverteilung: Z asymptotisch N(0,1)-vt.
2
22
1
21
21
n
S
n
S
)XX(Z
98
Test für arithmetisches Mittel
• Varianzhomogenität, σ1² = σ2² = σ²:
• Teststatistik:
wobei
• Testverteilung: T ~ tv mit v=n1+n2-2 Freiheitsgarden
21
21
21
nn
nnS
)XX(T
2nn
1)S(n1)S(nS
21
222
211
99
Test für arithmetisches Mittel
• Verbundene Stichproben (abhängige oder gepaarte Stpr.)– Tritt auf, wenn z.B. die Merkmalsausprägungen
der ersten Stpr. und die der zweiten jeweils an demselben Merkmalsträger erhoben werden. Bsp: vorher – nachher Untersuchungen.
• Test für die Differenz arithmetischer Mittel bei verbundenen Stichproben.
100
Test für arithmetisches Mittel
• Differenzen der Wertepaare: Di = X2i – X1i sind N-vt. mit E(Di) = µ2i - µ1i = δ und Var(Di) =σD²
• Teststatistik:
• Testverteilung: T~tv mit v=n-1
n
SδD
TD
n
1i
2iD
n
1ii )D(D
1n
1SundD
n
1X
101
Test für Varianz
• Einstichprobentest für die Varianz: – Hat die Varianz einen bestimmten Wert, bzw.
liegt er in einem bestimmten Bereich?– Entscheidung basiert auf dem Ergebnis einer
einzigen Stichprobe.
• Zweistichprobentest für die Varianz– Unterscheiden sich die Varianzen zweier
Gruppen?– Entscheidung basiert auf zwei Stichproben
102
Test für Varianz
Einstichprobentest für die Varianz:• Annahme: Grundgesamtheit normalverteilt• H0: σ² = σ0² gegen H1: σ² σ0²• Teststatistik:
• Testverteilung: χ²v mit v=n-1• Entscheidung:
– χ² > χ²co oder χ² < χ²c
u, lehnen H0 ab – p-Wert < α, lehne H0 ab
2
22
σ
1)s(nχ
103
Test für Varianz
Zweistichprobentest für den Quotienen zweier Varianzen:
• Annahme: Grundgesamtheit normalverteilt• H0: σ1² = σ2² gegen H1: σ1² σ2²• Teststatistik:
• Testverteilung: Fv1,v2 mit v1=n1-1 und v2=n2-1• Entscheidung:
– F > Fco oder F < Fc
u, lehnen H0 ab – p-Wert < α, lehne H0 ab
22
21
S
SF