p-Wert im Uberblicksemwiso.userweb.mwn.de/stat3nf/blaetter/blatt8/pWertZusatz.pdf · p-Wert beim...
Click here to load reader
Transcript of p-Wert im Uberblicksemwiso.userweb.mwn.de/stat3nf/blaetter/blatt8/pWertZusatz.pdf · p-Wert beim...
p-Wert im Uberblick
Gegeben:
• Testproblem mit Nullhypothese H0 und Alternative H1
• Theoretische Teststatistik, z.B. w oder T• Theoretische Verteilung der Teststatistik unter H0
• Ablehnbereich (und damit Richtung der Alternative)• Signifikanzniveau α
• Beobachteter Wert der Teststatistik bei konkreten Daten, z.B. wobs oder Tobs
Definition p-Wert:
Der p-Wert ist definiert als diejenige Wahrscheinlichkeit, unter H0 den beobachtetenWert der Teststatistik oder einen in Richtung der Alternative extremeren Wert zuerhalten.
Entscheidungsregel:
Zu einem vorgegebenen Signifikanzniveau α gilt:
p ≤ α ⇒ H0 ablehnen
p > α ⇒ H0 beibehalten
Beispiel 1: Wald-Test beim linearen Modell
• Testproblem
H0 : Cβ = d vs. H1 : Cβ 6= d
• Theoretische Teststatistik
w = (Cβ − d)′[CCov(β)C ′
]−1(Cβ − d)
• Theoretische Verteilung der Teststatistik unter H0
wn→∞∼ χ2(r) mit r = dim(d)
• Ablehnbereich
w > χ21−α(r)
wobei χ21−α(r) das (1− α)-Quantil der χ2-Verteilung mit r Freiheitsgraden bezeichnet
Damit: Je großer w wird, desto mehr bewegt sich die Teststatistik in Richtung derAlternative.
Seite 1
• p-Wert beim Wald-TestGegeben sei ein beobachteter Wert der Teststatistik wobs bei konkreten Daten – wielasst sich der p-Wert beim Wald-Test berechnen?
Laut Definition ist der p-Wert diejenige Wahrscheinlichkeit, unter H0 – also hier unterVoraussetzung der χ2(r)-Verteilung – den beobachteten Wert der Teststatistik – alsohier wobs – oder einen in Richtung der Alternative extremeren Wert – also hier einengroßeren Wert als wobs – zu erhalten.
Damit:
p = P (w ≥ wobs) = 1− P (w ≤ wobs)
wobei P (w ≤ wobs) die Verteilungsfunktion der χ2(r)-Verteilung an der Stelle wobsbezeichnet.
• Veranschaulichung mit Dichte der χ2(3)-Verteilung
0 5 10 15
0.00
0.05
0.10
0.15
0.20
0.25
w
f(w
)
wobs
In der Abbildung entspricht der p-Wert der schraffierten Flache unter der Dichte derχ2(r)-Verteilung.
Beispiel 2: t-Test bei der linearen Regression
• Testproblem
H0 : βj = 0 vs. H1 : βj 6= 0
• Theoretische Teststatistik
T =βjσβj
• Theoretische Verteilung der Teststatistik unter H0
T ∼ t(n− k − 1)
mit n=Anzahl der Beobachtungen und k = Anzahl der Kovariablen ohne Intercept
Seite 2
• Ablehnbereich
|T | > t1−α2(n− k − 1)
wobei t1−α2(n−k−1) das (1− α
2 )-Quantil der t-Verteilung mit n−k−1 Freiheitsgradenbezeichnet
Damit: Je großer |T | ist, desto mehr bewegt sich die Teststatistik in Richtung derAlternative.
• p-Wert beim t-TestGegeben sei ein beobachteter Wert der Teststatistik Tobs bei konkreten Daten – wielasst sich der p-Wert beim vorliegenden t-Test berechnen?
Laut Definition ist der p-Wert diejenige Wahrscheinlichkeit, unter H0 – also hier unterVoraussetzung der t(n − k − 1)-Verteilung – den beobachteten Wert der Teststatistik– also hier Tobs – oder einen in Richtung der Alternative extremeren Wert – also hiereinen betragsmaßig großeren Wert als |Tobs| – zu erhalten.
Damit:
p = P (|T | ≥ |Tobs|)= P (T ≥ |Tobs|) + P (T ≤ −|Tobs|)︸ ︷︷ ︸
=P (T≥|Tobs|) wegen Symmetrie
= 2 P (T ≥ |Tobs|)= 2 (1− P (T ≤ |Tobs|))
wobei P (T ≤ Tobs) die Verteilungsfunktion der t(n−k−1)-Verteilung an der Stelle Tobsbezeichnet.
• Veranschaulichung mit Dichte der t(2)-Verteilung
−6 −4 −2 0 2 4 6
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0.35
T
f(T
)
Tobs− Tobs
In der Abbildung entspricht der p-Wert der schraffierten Flache unter der Dichte dert(n− k − 1)-Verteilung.
Seite 3