Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den...

33
Einf¨ uhrung Konfidenzintervall f¨ ur den Mittelwert μ Konfidenzintervall f¨ ur den Anteilswert θ Konfidenzintervalle Jost Reinecke Universit¨ at Bielefeld 13. Juni 2005 Jost Reinecke Konfidenzintervalle

Transcript of Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den...

Page 1: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

Konfidenzintervalle

Jost Reinecke

Universitat Bielefeld

13. Juni 2005

Jost Reinecke Konfidenzintervalle

Page 2: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

Einfuhrung

Konfidenzintervall fur den Mittelwert µ

Konfidenzintervall fur den Anteilswert θ

Jost Reinecke Konfidenzintervalle

Page 3: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

Einfuhrung

Wie kann die Kenntnis der Wahrscheinlichkeitsverteilung derParameter einer Stichprobe dazu verhelfen auf die wahren Werteder Grundgesamtheit zu schließen?

Bekannte Große: Stichprobenergebnis

Unbekannte Große: Wahrer Wert der Grundgesamtheit

Beispiel Wahlprognose: Bei einem Teil der Wahler werden dieStimmenanteile fur die Parteien ermittelt, die Stimmenanteile beiallen Wahlern ist unbekannt.

Jost Reinecke Konfidenzintervalle

Page 4: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

I Die Schatzung der Populationsparameter kann alsPunktschatzung oder als Intervallschatzung vorgenommenwerden.

I Eine Punktschatzung ist von der zufalligen Zusammensetzungder Stichprobe abhangig.

I Eine Intervallschatzung bedeutet, daß derPopulationsparameter sich in einem Intervall mit einer Unter-und Obergrenze befindet.

Die Intervalle werden als Konfidenzintervalle oderVertrauensintervalle bezeichnet. Sie konnen fur alle moglichenParameter der Grundgesamtheit (Mittelwert, Varianz,Regressionskoeffizienten) berechnet werden.

Jost Reinecke Konfidenzintervalle

Page 5: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

Konfidenzintervall fur den Mittelwert µ

Zentraler Grenzwertsatz: Mittelwerte aus beliebigen Verteilungenfolgen mit zunehmendem Stichprobenumfang einerNormalverteilung.

I Bei Kenntnis der Parameter der Grundgesamtheit (µ, σ2)kann berechnet werden, wieviel Prozent derStichprobenmittelwerte x in bestimmten Grenzen liegen

I Bei Kenntnis der Parameter der Grundgesamtheit (µ, σ2) kannberechnet werden, in welchen Grenzen sich ein bestimmterProzentsatz der Stichprobenmittelwerte x befindet.

I Dieser Prozentsatz gibt die Wahrscheinlichkeit an, mit der einStichprobenmittelwert in diesem Intervall zu erwarten ist.

I Wahrscheinlichkeitsintervalle: Bereiche, in denenStichprobenmittelwerte mit einer gewissen Wahrscheinlichkeitliegen.

Jost Reinecke Konfidenzintervalle

Page 6: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

95%-Wahrscheinlichkeitsintervall einer Standardnormalverteilung

0.0

0.1

0.2

0.3

0.4

z0-1.96 1.96

95%

2.5% 2.5%

I Links vom u. Grenzwert sind 2,5% der Flache: z0,025 = −1, 96

I Links vom o. Grenzwert sind 97,5% der Flache:z0,975 = +1, 96

Jost Reinecke Konfidenzintervalle

Page 7: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

Wahrscheinlichkeitsintervall einer Standardnormalverteilung

0.0

0.1

0.2

0.3

0.4

z0zα/2 z1-α/2

1-α

α/2 α/2

I Die Wahrscheinlichkeit, daß ein Wert nicht in dasWahrscheinlichkeitsintervall fallt, wird mit α bezeichnet.

I Zweiseitige Intervalle mit den Grenzen zα/2 und z1−α/2Jost Reinecke Konfidenzintervalle

Page 8: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

Bei der Stichprobenmittelwerteverteilung handelt es sich um einebeliebige Normalverteilung. Daher mussen die Grenzen zα/2 undz1−α/2 destandardisiert werden:

zα/2 → z =x − µ

σx

x = µ + zα/2 · σx (1)

z1−α/2 → z =x − µ

σx

x = µ + z1−α/2 · σx (2)

Da die Verteilung symmetrisch ist, ist zα/2 = −z1−α/2 und dieuntere Grenze dann µ − z1−α/2 · σx .Das Wahrscheinlichkeitsintervall fur eineStichprobenmittelwerteverteilung lautet dann:

µ − z1−α2· σx ≤ x ≤ µ + z1−α

2· σx (3)

Jost Reinecke Konfidenzintervalle

Page 9: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

Wahrscheinlichkeitsintervall einer Stichprobenmittelwerteverteilung

0.0

0.1

0.2

0.3

0.4

xµµ-z1-α/2 · σ x µ+z1-α/2 · σ x

1-α

α/2 α/2

Jost Reinecke Konfidenzintervalle

Page 10: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

Beispiel: Altersverteilung der bundesrepublikanischen Bevolkerung

Bekannte Parameter der Grundgesamtheit: µ = 37, 27 Jahre undσ = 22, 46 Jahre

Fragestellung: Wenn Stichproben mit n = 1000 gezogen werden, inwelchem Intervall befinden sich 95% der Stichprobenmittelwerte(d. h. Altersdurchschnitte)?

α = 0, 05

1 − α = 0, 95

µ − z1−α2·

σ√n

≤ x ≤ µ + z1−α2·

σ√n

Jost Reinecke Konfidenzintervalle

Page 11: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

37,27 − z1− 0,052

·22,46√1000

≤ x ≤ 37,27 + z1− 0,052

·22,46√1000

37,27 − z0,975 ·22,46√1000

≤ x ≤ 37,27 + z0,975 ·22,46√1000

37,27 − 1,96 · 0,71 ≤ x ≤ 37,27 + 1,96 · 0,71

35,88 ≤ x ≤ 38,66

Der Altersdurchschnitt liegt zwischen 35,88 und 38,66 Jahren fur95% aller Stichproben.

Jost Reinecke Konfidenzintervalle

Page 12: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

Fazit: Bei bekannter Grundgesamtheit konnenWahrscheinlichkeitsintervalle fur Stichprobenmittelwerte berechnetwerden.

Frage: Kann man auf der Basis eines Stichprobenmittelwertes x einIntervall angeben, in dem der Mittelwert der Grundgesamtheit µmit einer bestimmten Wahrscheinlichkeit liegt?

I Weichen 95% der Stichprobenmittelwerte nicht weiter als±1, 96 · σx von µ ab, dann ist µ auch nicht weiter als±1, 96 · σx von 95% der Stichprobenmittelwerte entfernt.

I Intervalle, in denen ein unbekannter Parameter derGrundgesamtheit mit einer bestimmten Wahrscheinlichkeitvermutet wird, werden als Konfidenzintervalle bezeichnet.

Jost Reinecke Konfidenzintervalle

Page 13: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

I Mit Hilfe der bekannten Grenzen z1−α/2 und −z1−α/2 kanndas Konfidenzintervall gebildet werden:

x − z(1−α2) · σx

︸ ︷︷ ︸

untere Grenze

≤ µ ≤ x + z(1−α2) · σx

︸ ︷︷ ︸

obere Grenze

(4)

I Setzt man die Standardabweichung derStichprobenmittelwerte σ

√n

fur σx ein, dann ergibt sich

folgendes Konfidenzintervall:

x − z(1−α2) ·

σ√n

︸ ︷︷ ︸

untere Grenze

≤ µ ≤ x + z(1−α2) ·

σ√n

︸ ︷︷ ︸

obere Grenze

(5)

Jost Reinecke Konfidenzintervalle

Page 14: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

Beispiel: Altersverteilung der bundesrepublikanischen Bevolkerung

Stichprobe mit 1000 Personen und folgenden Parametern:x = 38, 11 Jahre und σ = 22, 46 JahreDie Intervallgrenzen berechnen sich folgendermaßen:

38,11 − z(1− 0,052

) ·22,46√1000

≤ µ ≤ 38,11 + z(1− 0,052

) ·22,46√1000

38,11 − 1,96 · 0,71 ≤ µ ≤ 38,11 + 1,96 · 0,71

36,72 ≤ µ ≤ 39,50

Mit einer Wahrscheinlichkeit von 95% liegt das Durchschnittsalterder bundesdeutschen Bevolkerung zwischen 36,72 und 39,50Jahren.

Jost Reinecke Konfidenzintervalle

Page 15: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

Konfidenzintervalle bei unterschiedlichen Stichprobenmittelwerten

unterschiedliche Stichproben → unterschiedlicheAltersdurchschnitte → unterschiedliche Konfidenzintervalle fur µDa der Mittelwert der Grundgesamtheit hier bekannt ist, kann hierbeurteilt werden, ob der Altersdurchschnitt der Stichprobe imberechneten Konfidenzintervall liegt oder nicht.

Jost Reinecke Konfidenzintervalle

Page 16: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

I Der Mittelwert µ ist normalerweise unbekannt.

I In 95% der Stichproben aus einer Grundgesamtheit wird dasKonfidenzintervall den Mittelwert der Grundgesamtheitenthalten.

I In 5% der Stichproben wird das um den Stichprobenmittelwertgelegte Konfidenzintervall den Mittelwert derGrundgesamtheit µ nicht einschließen.

α = 0,05 → Irrtumswahrscheinlichkeit1 − α = 0, 95 → Vertrauenswahrscheinlichkeit

Jost Reinecke Konfidenzintervalle

Page 17: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

Die Vertrauenswahrscheinlichkeit kann erhoht bzw. dieIrrtumswahrscheinlichkeit kann gesenkt werden:

α = 0,01 → Irrtumswahrscheinlichkeit1 − α = 0, 99 → Vertrauenswahrscheinlichkeit

Neue Berechnung des Konfidenzintervalls:

38,11 − z(1− 0,012

) ·22,46√1000

≤ µ ≤ 38,11 + z(1− 0,012

) ·22,46√1000

38,11 − 2,58 · 0,71 ≤ µ ≤ 38,11 + 2,58 · 0,71

36,28 ≤ µ ≤ 39,94

Mit einer Wahrscheinlichkeit von 99% liegt das Durchschnittsalterder bundesdeutschen Bevolkerung zwischen 36,28 und 39,94Jahren.

Jost Reinecke Konfidenzintervalle

Page 18: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

I Die Standardabweichung der Stichprobenmittelwerteverteilungσx = σ/

√n kann nur berechnet werden, wenn die Varianz σ2

bzw. die Standardabweichung σ bekannt ist.

I Wenn σ2 bzw. σ nicht bekannt sind, wird die Varianz s2 bzw.die Standardabweichung der Stichprobe s verwendet.

I Die Unterschatzung der Varianz in der Grundgesamtheiterfordert die Korrektur von s2 um den Faktor n/(n − 1):

σ2 = s2 ·n

n − 1=

n∑

i=1

(xi − x)2

n

n − 1=

n∑

i=1

(xi − x)2

n − 1(6)

I Der Schatzwert fur die Stichprobenvarianz s2 unterscheidetsich vom Schatzwert fur die Varianz der Grundgesamtheit σ2

nur durch den Nenner (einmal dividiert durch n − 1, einmaldividiert durch n). Bei großen Stichproben nahern sich beideWerte an.

Jost Reinecke Konfidenzintervalle

Page 19: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

I Zur Bestimmung der Konfidenzintervalle wird nicht diez-Verteilung, sondern die t-Verteilung herangezogen.

I t-Verteilungen haben wie Normalverteilungen einenglockenformigen Verlauf, sind aber flacher und breiter.

I Man erhalt eine t-verteilte Zufallsvariable, wenn die Differenzaus Stichproben- und Populationsmittelwert durch die Wurzelaus der Varianz der Stichprobe geteilt wird:

T =x − µx

√Pn

i=1(xi−x)2

n·(n−1)

(7)

I Der zweite Nenner n − 1 wird auch als Freiheitsgrad (degrees

of freedom) bezeichnet und mit df abgekurzt.

I Die Form der t-Verteilung ist demnach abhangig vomStichprobenumfang bzw. vom Freiheitsgrad.

Jost Reinecke Konfidenzintervalle

Page 20: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

t-Verteilungen in Abhangigkeit vom Freiheitsgrad

-4 -3 -2 -1 0 1 2 3 40

0.1

0.2

0.3

0.4 t(df=1)t(df=4)t(df=29)N(0;1)

Je großer n ist, desto naher liegt die t-Verteilung an derNormalverteilung.

Jost Reinecke Konfidenzintervalle

Page 21: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

Das Konfidenzintervall erhalt man durch Einsetzen der t-Werte:

x − t(1−α2;n−1) ·

σ√n

︸ ︷︷ ︸

untere Grenze

≤ µ ≤ x + t(1−α2;n−1) ·

σ√n

︸ ︷︷ ︸

obere Grenze

(8)

Beispiel: Stichprobe n = 81 mit x=38,75 Jahre und s2 = 423, 1249Nach Gleichung 6 erhalt man als Schatzer fur dieStandardabweichung in der Grundgesamtheit:

σ =

423, 1249 ·81

80= 20, 7Jahre

Frage: Wie hoch ist das Konfidenzintervall fur denAltersdurchschnitt der Bevolkerung in der Grundgesamtheit, wenndie Irrtumswahrscheinlichkeit α = 0, 05 betragt?

Jost Reinecke Konfidenzintervalle

Page 22: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

38,57 − t(1− 0,052

;81−1) ·20,7√

81≤ µ ≤ 38,57 + t(1− 0,05

2;81−1) ·

20,7√81

38,57 − t(0,975;80) ·20,7√

81≤ µ ≤ 38,57 + t(0,975;80) ·

20,7√81

38,57 − 1,990 · 2,3 ≤ µ ≤ 38,57 + 1,990 · 2,3

33,99 ≤ µ ≤ 43,15

Mit einer Wahrscheinlichkeit von 95% liegt der Altersdurchschnittin der Grundgesamtheit zwischen 33,99 und 43,15 Jahren. AufGrund der geringen Fallzahl ist das Konfidenzintervall groß.

Jost Reinecke Konfidenzintervalle

Page 23: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

Beispiel: ALLBUS 1994: n = 745 ostdeutsche Befragte mitEinkommensangaben, Mittelwert x=1431,24 DM und geschatzterStreuung von σ = 755, 72 DMFrage: Wie hoch ist das Konfidenzintervall fur denEinkommensdurchschnitt in der ostdeutschen Grundgesamtheit,wenn die Irrtumswahrscheinlichkeit α = 0, 01 betragt?

1431,24 − z(1− 0,012

) ·755,72√

745≤ µ ≤ 1431,24 + z(1− 0,01

2) ·

755,72√745

1431,24 − 2,58 · 27,69 ≤ µ ≤ 1431,24 + 2,58 · 27,69

1359,95 ≤ µ ≤ 1502,54

Mit einer Wahrscheinlichkeit von 99% liegt derEinkommensdurchschnitt in der ostdeutschen Grundgesamtheitzwischen 1359,95 DM und 1502,54 DM.

Jost Reinecke Konfidenzintervalle

Page 24: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

Konfidenzintervall fur den Anteilswert θ

I Der Anteilswert θ bezieht sich auf die Binomialverteilung inStichproben.

I Die Bildung eines Konfidenzintervalls fur Anteilswerteentspricht der Vorgehensweise bei den Mittelwerten.

I Werden viele Stichproben vom Umfang n gezogen, dannerhalten wir fur die Anteilswerte naherungsweise eineBinomialverteilung, die bei einem genugend großen n in eineNormalverteilung ubergeht.

I Die Faustregel fur ein genugend großes n lautet:

n ·p · (1 − p) ≥ 9

Beispiel: Bei einem Anteilswert von p = 0, 07 und einer Stichprobevon n = 1250 erhalt man 81,375.

Jost Reinecke Konfidenzintervalle

Page 25: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

I Der Mittelwert in der Grundgesamtheit ist der Anteilswert θ.

I Die Standardabweichung in der Grundgesamtheit wird durchden Standardfehler des Anteilswertes σp bestimmt.

Zu bestimmen ist das Konfidenzintervall fur den unbekanntenAnteilswert θ der Grundgesamtheit:

1. z-Transformation fur die Anteilswerteverteilung:

z =p − θ

σp

(9)

2. Einsetzen von −z1−α/2 als untere Grenze und z1−α/2 als obereGrenze der Verteilung (hier exemplarisch fur −z1−α/2

demonstriert):

−z1−α/2 = p−θσp

−z1−α/2 · σp = p − θ

−p − z1−α/2 · σp = −θ

p − z1−α/2 · σp = θ

Jost Reinecke Konfidenzintervalle

Page 26: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

3. Das Konfidenzintervall kann demnach folgendermaßenberechnet werden:

p − z(1−α2) · σp

︸ ︷︷ ︸

untere Grenze

≤ θ ≤ p + z(1−α2) · σp

︸ ︷︷ ︸

obere Grenze

(10)

Der Standardfehler des Stichprobenanteilswertes σp errechnet sichfolgendermaßen:

σp =

θ · (1 − θ)

n(11)

I Je großer die Streuung in der Grundgesamtheit, um so breiterwir die Verteilung der Anteilswerte.

I Je großer der Stichprobenumfang, desto enger liegen dieStichprobenanteilswerte beieinander.

Jost Reinecke Konfidenzintervalle

Page 27: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

Da der Anteilswert der Grundgesamtheit θ nicht bekannt ist, wirdσp durch den Anteilswert in der Stichprobe geschatzt:

σp =

p · (1 − p)

n(12)

Wird σp statt σp in die Gleichung 10 eingesetzt, erhalt man:

p − z(1−α2) ·

p · (1 − p)

n︸ ︷︷ ︸

untere Grenze

≤ θ ≤ p + z(1−α2) ·

p · (1 − p)

n︸ ︷︷ ︸

obere Grenze

(13)Jost Reinecke Konfidenzintervalle

Page 28: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

Beispiel: Wenn der Stimmenanteil einer Partei (FDP) 7% betragtund die Stichprobe n = 1250 betragt, dann laßt sich dasKonfidenzintervall bei α = 0, 05 folgendermaßen berechnen:

0,07 − z(1− 0,052

) ·√

0,07 · 0,931250

≤ θ ≤ 0,07 + z(1− 0,052

) ·√

0,07 · 0,931250

0,07 − 1,96 · 0,0072 ≤ θ ≤ 0,07 + 1,96 · 0,0072

0,0559 ≤ θ ≤ 0,0841

Der Stimmenanteil liegt mit einer Wahrscheinlichkeit von 95%zwischen 5,6% und 8,4%.

Jost Reinecke Konfidenzintervalle

Page 29: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

Einfluß des Stichprobenumfangs (µ)

I Ist das berechnete Konfidenzintervall zu breit (und damit zuungenau), dann sollte der Stichprobenumfang erhoht werden.

I Wie groß muß ein Stichprobenumfang sein, um einebestimmte Genauigkeit der Schatzung zu erhalten?

Fur die Stichprobenmittelwerteverteilung betragt dieKonfidenzintervallbreite (KIB):

KIB = 2 · z1−α2· σx

= 2 · z1−α2·

σ√n

(14)

Jost Reinecke Konfidenzintervalle

Page 30: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

Wird diese nach der Stichprobengroße n aufgelost, erhalt man:

KIB√n

= 2 · z1−α2· σ

√n =

2 · z1−α2· σ

KIB

n =4 · z2

1−α2· σ2

KIB2

(15)

Frage: Wie groß muß die Stichprobe der ostdeutschen Befragtensein, um den Mittelwert µ des Einkommens mit einerIrrtumswahrscheinlichkeit von 1% und einer KIB von 100/50 DMzu schatzen?

Bekannte Großen: z1−0,01/2 = 2,58 und σ = 755,72 DMJost Reinecke Konfidenzintervalle

Page 31: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

Fur KIB = 100 DM erhalt man:

n =4 · 2,582 · 755,722

1002= 1520,62

Fur KIB = 50 DM erhalt man:

n =4 · 2,582 · 755,722

502= 6082,49

Fur eine Konfidenzintervallbreite von 100 DM/50 DM liegt dernotwendige Stichprobenumfang bei 1521/6082 Personen.

Allgemein gilt: Die Stichprobengroße muß viermal hoher sein, wenndie Genauigkeit verdoppelt werden soll.

Jost Reinecke Konfidenzintervalle

Page 32: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

Einfluß des Stichprobenumfangs (θ)Fur die Verteilung der Anteilswerte betragt dieKonfidenzintervallbreite (KIB):

KIB = 2 · z1−α2· σp

= 2 · z1−α2·√

θ · (1 − θ)

n

(16)

Wird diese nach der Stichprobengroße n aufgelost, erhalt man:

n =4 · z2

1−α2· θ(1 − θ)

KIB2(17)

Ist der Anteilswert in der Grundgesamtheit θ nicht bekannt, wirdder Anteilswert der Stichprobe p zur Schatzung herangezogen.

Jost Reinecke Konfidenzintervalle

Page 33: Universit˜at Bielefeld SS05/Folien/KONF.pdf · Einf˜uhrung Konfldenzintervall f˜ur den Mittelwert „ Konfldenzintervall f˜ur den Anteilswert µ Konfldenzintervalle Jost Reinecke

EinfuhrungKonfidenzintervall fur den Mittelwert µKonfidenzintervall fur den Anteilswert θ

Frage: Wie groß muß die Stichprobe der Wahler sein, um denAnteilswert θ mit einer Irrtumswahrscheinlichkeit von 1% und einerKIB von 0,02/0,01 Prozentpunkte zu schatzen?

Bekannte Großen: z1−0,01/2 = 2,58 und Anteilswert p = 0,07(bezogen auf die FDP-Wahler)

Fur KIB = 0,02 erhalt man:

n =4 · 2,582 · 0,07 · (1 − 0,93)

0.022= 326,16

Fur KIB = 0,01 erhalt man:

n =4 · 2,582 · 0,07 · (1 − 0,93)

0.012= 1304,65

Fur eine Konfidenzintervallbreite von 0,02/0,01 Prozentpunkteliegt der notwendige Stichprobenumfang bei 326/1305 Personen.

Jost Reinecke Konfidenzintervalle