Statistik: 16.11.04

14
Statistik: 16.11.04 Mehr zum Testen von Hypothesen

description

Statistik: 16.11.04. Mehr zum Testen von Hypothesen. Beispiel 1: Ausgaben für Literatur. Ausgaben der WU-Studierenden für Skripten und Bücher je Semester Test von H 0 : μ = 200 € gegen H 1 : μ > 200 Stichprobe ( n = 25): = 204.7 €, s = 20.5 € Bei a = 0.05 wird H 0 verworfen!. - PowerPoint PPT Presentation

Transcript of Statistik: 16.11.04

Page 1: Statistik: 16.11.04

Statistik: 16.11.04

Mehr zum Testen von Hypothesen

Page 2: Statistik: 16.11.04

16.11.04 PI Statistik, WS 2004/05 (9) 2

Beispiel 1: Ausgaben für Literatur

Ausgaben der WU-Studierenden für Skripten und Bücher je Semester Test von H0: μ = 200 € gegen H1: μ > 200 Stichprobe (n = 25): = 204.7 €, s = 20.5 €

Bei = 0.05 wird H0 verworfen!

x204.7 2001 60 0.03820.5

p Wert P

Page 3: Statistik: 16.11.04

16.11.04 PI Statistik, WS 2004/05 (9) 3

Wahl des Stichprobenumfanges

Breite c (maximaler Schätzfehler) des Konfidenzintervalls für μ (bei gegebenem ) ist bestimmt von

Konfidenzzahl Stichprobenumfang n

2(1 ) / 2z

nc

Beispiel 1: Wieviele Studierende müssen befragt werden, damit das 95%ige Konfidenzintervall die Länge von höchstens 10 € hat? n = [(1.96)(20.5)/5]^2 = 64.58 Stichprobenumfang: 65 (IMMER AUFRUNDEN!)

Page 4: Statistik: 16.11.04

16.11.04 PI Statistik, WS 2004/05 (9) 4

Wahl von n bei Anteilsschätzung

2

(1 ) / 2 (1 )zn

c

ist nicht bekannt!

durch Schätzer pn ersetzen durch 0.5 ersetzen gibt eine obere Schranke für n 2

(1 ) / 20.5 zn

c

0.2 0.4 0.6 0.8 1

0.05

0.1

0.15

0.2

0.25

(1-)

Page 5: Statistik: 16.11.04

16.11.04 PI Statistik, WS 2004/05 (9) 5

Beispiel 2: BefragungFolgende Gründe wurden für

die Wahl der Bankverbindung angegeben

95%iges Konfidenzintervall für die Anteil der Kunden, für die Preisgünstigkeit entscheidend ist, soll halbe Breite von 2% haben:{1.96√[(0.402)(0.598)]/0.02}^2 = 2308.7{(1.96)(0.5)/0.02}^2 = 2401.0

Service:{1.96√[(0.197)(0.803)]/0.02}^2 = 1519.3

AnteilPreisgünstigkeit 40.2Qualität des Angebots 27.3

Service 19.7Erreichbarkeit 12.8

Ergebnisse einer Umfrage

Page 6: Statistik: 16.11.04

16.11.04 PI Statistik, WS 2004/05 (9) 6

Test-Verfahren

Hypothese betrifft

Parameter Beziehung

1 Merkmal 2 Merkmale1 Population 2 Populationen

z - oder t -Test Test derDifferenzen

Test derKorrelation Regression*)

*) ein unabhängiges, ein abhängiges Merkmal

Page 7: Statistik: 16.11.04

16.11.04 PI Statistik, WS 2004/05 (9) 7

Beispiel 3: Vergleich WU - TUSind die Ausgaben der Studierenden für Skripten und Bücher je Semester an der WU geringer als an der TU?Test von H0: μWU = μTU gegen H1: μWU < μTU, = 0.05 Test-Statistik

mit

Stichproben: nWU = 60, =204.7 €, sWU = 20.5 €; nTU = 45, =212.2 €, sTU = 19.5 € d = 204.7-212.2=-7.5; sd = 3.93p-Wert = P{D ≤-7.5 | μWU = μTU} = 0.0282

2( , )WU TU WU TU dD x x N 2 2

2 WU TUd

WU TUn n

WUxTUx

Page 8: Statistik: 16.11.04

16.11.04 PI Statistik, WS 2004/05 (9) 8

Vergleich von MittelwertenEin Merkmal XPopulation 1: 1, 1; Stichprobe 1: n1, Population 2: 2, 2; Stichprobe 2: n2,

Test-Statistik

mit

Test von H0: μ1 = μ2 gegen H1: μ1 < μ2, = 0.05 p-Wert = P{D ≤d | μ1 = μ2}Achtung! Unabhängige Stichproben!

21 2 1 2( , )dD x x N

2 22 1 2

1 2d n n

1x2x

Page 9: Statistik: 16.11.04

16.11.04 PI Statistik, WS 2004/05 (9) 9

Konfidenzintervall für μ1-μ2

Konfidenzintervall zur Konfidenzzahl

Bei unbekannten Standardabweichungen Ersetzen durch s1, s2 (wenn n1 und n2 groß;

Faustregel: mindestens 30) Annahme: =1=2, Schätzung von nach

1 2 (1 ) / 2 dx x z

2 21 1 2 2

1 2

( 1) ( 1)2

n s n ssn n

Page 10: Statistik: 16.11.04

16.11.04 PI Statistik, WS 2004/05 (9) 10

Beispiel 4: Vergleich WU - TU

Schätzen von sd:1. Ersetzen der Standardabweichungen WU

und TU durch sWU, sTU: sd = 3.932. Annahme einer gemeinsamen

Standardabweichung: sd = 3.96

Einsetzen gibt 1. -15.4 ≤ WUTU ≤ 0.02. -15.5 ≤ WUTU ≤ 0.1

Page 11: Statistik: 16.11.04

16.11.04 PI Statistik, WS 2004/05 (9) 11

Konfidenzintervall für 1-2

Beispiel 5: Befragung unter 600 Personen (147 mit, 453 ohne Matura): Raucher sind 31 (mit) bzw 136 (ohne Matura); 95%iges KI für Differenz der Anteile

-0.09 ± 0.08 oder -0.17 ≤ 1-2 ≤ -0.01

(0.21)(0.79) (0.30)(0.70)0.21 0.30 1.96147 453

1 1 2 21 2 (1 ) / 2

1 2

(1 ) (1 )p p p pp p zn n

Page 12: Statistik: 16.11.04

16.11.04 PI Statistik, WS 2004/05 (9) 12

Vergleich von AnteilenTest von H0: mM = oM (gegen unbestimmte Alternative)Chiquadrat Statistik: T = 4.41

p-Wert: 0.036Bei = 0.05 wird H0 verworfen

MaturaRaucher

ja nein

ja 31 136 167nein 116 317 433

147 453 600Matura

Raucher

ja nein

ja 40.9 126.1 167

nein 106.1

326.9 433

147 453 600

beobachteterwartet

Page 13: Statistik: 16.11.04

16.11.04 PI Statistik, WS 2004/05 (9) 13

Test auf UnabhängigkeitAnalog kann die Unabhängigkeit von Merkmalen überprüft werden(r x s) –Tafel: Chiquadrat Statistik ist unter H0: „die Merkmale sind unabhängig“ Chiquadrat-verteilt mit (r-1)(s-1) Freiheitsgraden

Beispiel 6: Luftdruck und Unfälle Passieren an Tagen mit geringem Luftdruck (mit

schlechtem Wetter) mehr Unfälle?

Page 14: Statistik: 16.11.04

16.11.04 PI Statistik, WS 2004/05 (9) 14

AnpassungstestVergleich von beobachteten Häufigkeiten mit Häufigkeiten, die bei Zutreffen einer bestimmten Verteilung erwartet werdenChiquadrat Statistik

Beispiel 7: Ein Würfel wird 120 Mal geworfen Ist der Würfel unverzerrt?