Post on 04-Feb-2016
description
Non-parametrische Testverfahren
11_nonpara 1
Gliederung • Definition• Der χ² Test• Kolmogorov-Smirnov-Test• Überblick weitere Verfahren:
– Der Fisher-Yates-Test – Der McNemar-Test– Cochran-Test (Q-Test)– Der Mediantest– Der U-Test (Mann-Whitney Test)– Vorzeichentest und Vorzeichenrangtest– Der Friedman-Test– Binominal-Test
Non-parametrische Testverfahren
11_nonpara 2
Definition:
• Nonparametrische (verteilungsfreie) Testverfahren setzen nicht eine bestimmte Verteilungsformen des erfassten Merkmals (z.B. Normalverteilung) voraus.
• Nonparametrische Verfahren werden eingesetzt… für die Analyse von Ordinal- oder Nominalskalierten Variablen
Wenn die Normalverteilungsannahme verletzt ist.
• Parametrische Verfahren dürfen nur verwendet werden, wenn die beteiligten Variablen die gefordert Verteilungsform ausweisen (z.B. Normalverteilung für den t-Test). Sie haben in der Regel eine höher statistische Power.
Der χ² -Test
11_nonpara 3
• Der χ²-Test („Chi-Quadrat-Test“) dient dem Vergleich von beobachteten und erwarteten Häufigkeiten. Er kann eingesetzt werden, wenn 1 oder 2 nominalskalierte unabhängige Variablen vorliegen.
Beispiele:
• Leiden Männer und Frauen gleich häufig an einer bestimmten Erkrankung?
• Leisten hoch-ängstlich und gering-ängstliche Personen gleich häufig Hilfe in einer Notsituation?
Der χ² -Test
11_nonpara 4
Voraussetzung für den χ² -Test (Faustregeln)
(1) Weniger als 1/5 aller Zellen hat ein erwartete Häufigkeit kleiner als 5.
(2) Keine Zelle weist eine erwartete Häufigkeit kleiner als 1 auf.
Wenn diese Voraussetzungen nicht erfüllt sind, sollte alternativ der Fisher-Yates-Test verwendet werden.
Der χ² -Test
11_nonpara 5
χ² -Test – Beispiel 1
• Es soll geprüft werden, ob die Verteilung von Männern und Frauen in einer Gruppe signifikant von einer Gleichverteilung abweicht.
• N = 76 (Frauen: 56; Männer: 20)
• Statistische Hypothesen– H0: π(Frau) = π(Mann) – H1: π(Frau) ≠ π(Mann)
Der χ² -Test
11_nonpara 6
Schritt 1:
• Zunächst werden die nach der H0 zu erwarteten Häufigkeiten berechnet:
• Beobachtet: NF = 56; NM=20
• Erwartet: ???– Gesamtzahl: 76– Bei einer Gleichverteilung wären also 38 Männer und 38 Frauen zu
erwarten.
Der χ² -Test
11_nonpara 7
Schritt 2:
• Nun wird der (empirische) χ²-Wert berechnet:
mit:• k: Anzahl der Stufen der beiden Variablen • fb,i: Beobachtete Häufigkeit in der Zelle (i) • fe,i: Erwartete Häufigkeit in der Zelle (i)
k
i ie
ieibkdf f
ff
1 ,
2,,2
1
Der χ² -Test
11_nonpara 8
Geschlecht
Frau Mann
Beobachtet 56 20 76
Erwartet 38 38 76
58 20 78
05.1753.853.8
38
18
38
18
38
3820
38
3856 22222
1
df
k
i ie
ieibkdf f
ff
1 ,
2,,2
1
Der χ² -Test
11_nonpara 9
• Schritt 3: Vergleich des empirischen χ²-Werts mit dem kritischen χ²-Wert.
• Der kritische χ²-Wert wird in Abhängigkeit von den Freiheits-graden und dem gewählten α-Niveau aus einer Tabelle zur χ²-Verteilung abgelesen (Leonhart, S.448f).
• Für α=.05 ergibt sich bei df=1:
• Die H0 muss verworfen werden; folglich kann ein Unterschied nachgewiesen werden.
02.5
05.172
2
krit
emp
Der χ² -Test
11_nonpara 10
χ² -Test – Beispiel 2
• Frage: Ist die (relative) Häufigkeit hoher bzw. geringer Ängstlichkeit bei Männern und Frauen gleich?
• Statistische Hypothesen– H0: π(Angst | Frau) = π(Angst | Mann) – H1: π(Angst | Frau) ≠ π(Angst | Mann)
Geschlecht
Angst Frau Mann
gering 25 14 39
hoch 33 6 39
58 20 78
Der χ² -Test
11_nonpara 11
Schritt 1: Zunächst werden aus den Randsummen die nach der H0 zu erwarteten Häufigkeiten geschätzt:
Beobachtet:
Erwartet:
Geschlecht
Angst Frau Mann
gering 25 14 39
hoch 33 6 39
58 20 78 N
ff
NN
f
N
ff
jbib
jbibjie
)(..)(
)(..)(),(
Geschlecht
Angst Frau Mann
gering 29 10 39
hoch 29 10 39
58 20 78
Der χ² -Test
11_nonpara 12
Schritt 2: Nun wird der (empirische) χ²-Wert berechnet:
mit:• k, l: Anzahl der Stufen der beiden Variablen • fb(i,j): Beobachtete Häufigkeit in der Zelle (i,j) • fe(i,j): Erwartete Häufigkeit in der Zelle (i,j)
k
i
l
j jie
jiejiblikdf f
ff
1 1 ),(
2),(),(2
1
Der χ² -Test
11_nonpara 13
Beobachtet: Erwartet:Geschlecht
Angst Frau Mann
gering 25 14 39
hoch 33 6 39
58 20 78
Geschlecht
Angst Frau Mann
gering 29 10 39
hoch 29 10 39
58 20 78
k
i
l
j jie
jiejiblkdf f
ff
1 1 ),(
2),(),(2
11
30.460.160.155.055.010
106
10
1014
29
2933
29
2925 22222
1
df
Der χ² -Test
11_nonpara 14
• Schritt 3: Vergleich des empirischen χ²-Werts mit dem kritischen χ²-Wert.
• Der kritische χ²-Wert wird in Abhängigkeit von den Freiheits-graden und dem gewählten α-Niveau aus einer Tabelle zur χ²-Verteilung abgelesen (Leonhart, S.448f).
• Für α=.05 ergibt sich bei df=1:
• Die H0 muss verworfen werden; folglich kann ein Unterschied nachgewiesen werden.
84.3
30.42
2
krit
emp
Der χ² -Test in SPSS
11_nonpara 15
Der χ² -Test in SPSS
11_nonpara 16
NPAR TEST /CHISQUARE=sex /EXPECTED=EQUAL
• SPSS-Ausgabe:
sexBeobachtetes N Erwartete Anzahl Residuum
1 56 38,0 18,02 20 38,0 -18,0Gesamt 76
Der χ² -Test in SPSS
11_nonpara 17
Statistik für Testsex
Chi-Quadrat 17,053a
df 1Asymptotische Signifikanz ,000a. Bei 0 Zellen (.0%) werden weniger als 5 Häufigkeiten erwartet. Die kleinste erwartete Zellenhäufigkeit ist 38.0.
Der Kolmogorov-Smirnov-Test
• Der Kolmogorov-Smirnov-Test vergleicht eine empirische Verteilung mit einer vorgegebenen theoretischen Verteilung (z.B. Normalverteilung).
• Damit ist es möglich, die Voraussetzung parametrischer Testverfahren (z.B. für den t-Test) zu überprüfen.
• Statistische Hypothesen:- H0: Die Variable ist normalverteilt- H1: Die Variable ist nicht normalverteilt
Der Kolmogorov-Smirnov-Test
11_nonpara 18
Der Kolmogorov-Smirnov-Test in SPSS
11_nonpara 19
Der Kolmogorov-Smirnov-Test in SPSS
11_nonpara 20
NPAR TESTS/K-S(NORMAL)=freiburg psycho stat.
Der Kolmogorov-Smirnov-Test in SPSS
11_nonpara 21
Kolmogorov-Smirnov-Anpassungstestfreiburg psycho stat
N 98 98 98Parameter der Normalverteilunga
Mittelwert 20,8163 19,7908 16,5204Standardabweichung 1,89055 3,04428 3,15650
Extremste Differenzen Absolut ,182 ,124 ,111Positiv ,104 ,063 ,057Negativ -,182 -,124 -,111
Kolmogorov-Smirnov-Z 1,797 1,225 1,098Asymptotische Signifikanz (2-seitig) ,003 ,099 ,179a. Die zu testende Verteilung ist eine Normalverteilung.
Wenn p<.05 ist die Normalverteilungsannahme verletzt.
Überblick weitere Verfahren:
11_nonpara 22
Stichproben Nominaskalen OrdinalskalenUnabhängig • χ² Test
• Fisher-Yates-Test• Mediantest• U-Test (Mann-Whitney) • H-Test (Kruskal & Wallis)
Abhängig • McNemar-Test• Cochran-Test
• Vorzeichen-Test• Vorzeichen-Rang-Test
(Wilkoxon)• Friedman-Test
Der Fisher-Yates-Test
Der Fisher-Yates-Test • Der Fisher-Yates Test wird eingesetzt, um Kontingenztabellen
auszuwerten, wenn die Voraussetzungen des χ²-Test verletzt sind (d.h. bei geringen erwarteten Häufigkeiten).
• Beispiel:
• Berechnung: Siehe Leonhart (2004), Seite 162f
11_nonpara 23
Raucher Nichtraucher
Frauen 20 40
Männer 3 5
McNemar-Test
Der McNemar-Test• Der McNemar-Test wird für nominalskalierten Daten in zwei
abhängigen Stichproben (z.B. Messwiederholung) verwendet . • Die erwarteten Häufigkeiten sollten nicht kleiner als 5 sein.• Beispiel: Veränderung des Rauchverhaltens von der Jugend bis ins
Erwachsenenalter.
• Berechnung: Siehe Leonhart (2004), Seite 163f
11_nonpara 24
Erwachsene
Jugend Nichtraucher Raucher Σ
Nichtraucher 33 3 36
Raucher 18 21 39
Σ 51 24 75
Cochran-Test (Q-Test)
Der Cochran-Test (Q-Test)• Der Cochran-Test dient der Auswertung von nominalskalierten
Daten in mehr als zwei abhängigen Stichproben. • Beispiel: (NR=Nichtraucher; R=Raucher)
• Berechnung: Siehe Leonhart (2004), Seite 165f
11_nonpara 25
Alter (Jahre)
Vp 12 16 20 24 28
1 NR R R R NR
2 NR R R R R
3 R R R R R
4 NR NR NR NR NR
5 NR NR R R R
Mediantest
Der Mediantest• Der Der Mediantest dient dem Vergleich der zentralen Tendenz
ordinalskalierter Variablen, wenn zwei unabhängige Stichproben vorliegen.
• Beispiel: Die Reaktionszeit bei einer Aufgabe soll zwischen Männern und Frauen verglichen werden (Da die Zeiten nicht normalverteilt sind, soll kein t-Test gerechnet werden)
• Berechnung: Siehe Leonhart (2004), Seite 162f
11_nonpara 26
U-Test (Mann-Whitney-Test)
Der U-Test (Mann-Whitney-Test)
• Der U-Test vergleicht die zentrale Tendenz eines ordinalskalierten Merkmals zwischen zwei unabhängigen Zufallsstichproben.
• Anmerkung: Der U-Test hat einer höhere Power als der Mediantest, jedoch ist er empfindlicher gegenüber Ausreißerwerten.
• Beispiel: Der Therapieerfolg (Rating 1 bis 5) soll zwischeneiner Therapiegruppe und einer „Wartekontrollgruppe“ verglichen werden.
• Berechnung: Siehe Leonhart (2004), Seite 169f
11_nonpara 27
U-Test (Mann-Whitney-Test)
11_nonpara 28
U-Test (Mann-Whitney-Test)
11_nonpara 29
NPAR TESTS/M-W= freiburg BY sex(1 2) .
U-Test (Mann-Whitney-Test)
11_nonpara 30
RängeGeschlecht N Mittlerer Rang Rangsumme
freiburg männlich 21 41,57 873,00weiblich 75 50,44 3783,00Gesamt 96
Statistik für Testa
freiburgMann-Whitney-U 642,000Wilcoxon-W 873,000Z -1,312Asymptotische Signifikanz (2-seitig) ,189a. Gruppenvariable: Geschlecht
Weil p>.05 besteht also kein bedeutsamer Rangunterschied.
H-Test (Kruskal & Wallis -Test)
Der H-Test (Kruskal & Wallis -Test)
• Der U-Test vergleicht die zentrale Tendenz eines ordinalskalierten Merkmals zwischen zwei unabhängigen Zufallsstichproben.
• Beispiel: Der Therapieerfolg soll zwischen drei Therapie-verfahren sowie einer „Wartekontrollgruppe“ verglichenwerden.
• Berechnung: Siehe Leonhart (2004), Seite 175ff
11_nonpara 31
Therapie A Therapie B Therapie CWartekontroll-
gruppe
Therapie-erfolg
4342
2423
4433
2213
Vorzeichentest und Vorzeichenrangtest
Vorzeichentest und Vorzeichenrangtest
• Der Vorzeichentest und der Vorzeichenrangtest nach Wilcoxon vergleichen, wie sich die Merkmalsausprägung eines ordinalskalierten Merkmals zwischen zwei abhängigen Stichproben unterscheiden.
• Anmerkung: Der Vorzeichenrangtest nach Wilcoxon hat die höhere Power und ist daher generell zu bevorzugen.
• Beispiel: Es wird überprüft, ob sich die Arbeitsfähigkeit im Laufe einer Reha-Maßnahme verbessert hat. Dabei wird die Arbeitsfähigkeit als 5-stufiges Rating vor und nach der Maßnahme erfasst.
• Berechnung: Siehe Leonhart (2004), Seite 172ff
11_nonpara 32
Friedman-Test
Der Friedman-Test• Der Friedman-Test vergleicht die Merkmalsausprägung eines
ordinalskalierten Merkmals zwischen mehr als zwei abhängigen Stichproben.
• Beispiel: Es wird überprüft, ob sich die Arbeitsfähigkeit im Laufe einer Reha-Maßnahme verbessert hat. Dabei wird die Arbeitsfähigkeit als 5-Stufiges Rating zu 3 Messzeitpunkten erfasst (prä-, post-, follow-up - Erhebung).
• Berechnung: Siehe Leonhart (2004), Seite 177f
11_nonpara 33
Zusammenfassung
• Nonparametrische Testverfahren können eingesetzt werden, wenna) die vorliegenden Daten kein Intervallskalenniveau aufweisen oderb) die Normalverteilungsannahme der parametrischen Tests verletzt ist.
• Der χ²-Test überprüft ob beobachtete und erwartete Häufigkeiten signifikant voneinander abweichen.
• Der Kolmogorov-Smirnov-Test prüft, ob eine empirische Verteilung mit einer theoretisch vorgegebenen Verteilungsform (Normalverteilung) übereinstimmt.
• Der U-Test vergleicht die mittleren Rangplätze zwischen 2 Gruppen.
• Weitere Testverfahren können je nach Skalenniveau, Abhängigkeit der Stichprobe und Anzahl der Gruppen ausgewählt werden
11_nonpara 34