Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger...

22
Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 - LÖSUNGEN 1. Konfidenzintervall für den Mittelwert einer normalverteilten Grundgesamt- heit bei gegebener Varianz a. Gegeben sind Stichprobenumfang n = 36 > 30 Stichprobenmittel 4 , 18 = x Varianz 69 , 1 2 = σ Das arithmetische Mittel der Stichproben aus einer normalverteilten Grundge- samtheit ist unabhängig vom Stichprobenumfang normalverteilt ) / ; ( ) ; ( n N N X X σ μ σ μ = Bestimmung eines 95%-Konfidenzintervalls für μ : [1] Festlegung der Konfidenzzahl: 99 , 0 1 = α (hier gegeben) [2] Bestimmung der Quantile für die Standardnormalverteilung aus der N (0;1)-Tabelle 576 , 2 ) 995 , 0 ( 2 1 2 = = = c c c α α [3] Berechnung des Stichprobenmittels aus den Stichprobenwerten (gegeben) 4 , 18 36 1 36 1 = = = i i x x [4] Berechnung des Zufallsfehlers 558 , 0 6 3 , 1 576 , 2 36 3 , 1 576 , 2 = = = = Δ n c σ μ [5] Angabe des Konfidenzintervalls n c x n c x σ μ σ +

Transcript of Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger...

Page 1: Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 -

Senger – Induktive Statistik

Dr. Jürgen Senger

INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren

ÜBUNG 10 - LÖSUNGEN

1. Konfidenzintervall für den Mittelwert einer normalverteilten Grundgesamt-heit bei gegebener Varianz

a. Gegeben sind

Stichprobenumfang n = 36 > 30

Stichprobenmittel 4,18=x

Varianz 69,12 =σ

Das arithmetische Mittel der Stichproben aus einer normalverteilten Grundge-samtheit ist unabhängig vom Stichprobenumfang normalverteilt

)/;();( nNN XX σμσμ =

Bestimmung eines 95%-Konfidenzintervalls für μ :

[1] Festlegung der Konfidenzzahl: 99,01 =−α (hier gegeben)

[2] Bestimmung der Quantile für die Standardnormalverteilung aus der N(0;1)-Tabelle

576,2)995,0(2

12

==⎟⎠⎞

⎜⎝⎛ −=⎟

⎠⎞

⎜⎝⎛− ccc αα

[3] Berechnung des Stichprobenmittels aus den Stichprobenwerten (gegeben)

4,18361 36

1== ∑

=iixx

[4] Berechnung des Zufallsfehlers

558,063,1576,2

363,1576,2 =⋅=⋅==Δ

nc σμ

[5] Angabe des Konfidenzintervalls

ncx

ncx σμσ

+≤≤−

Page 2: Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 -

ÜBUNG 10 - LÖSUNGEN 2

Senger – Induktive Statistik

96,1884,17

558,04,18558,04,18

≤≤

+≤≤−

Δ+≤≤Δ−

μ

μ

μμμ xx

[6] Interpretation:

Mit der Wahrscheinlichkeit von 99% liegt der wahre Parameterwert μ der Grundgesamtheit zwischen 17,84 und 18,96.

Analog ergibt sich für die Konfidenzzahl 95,01 =−α das Konfidenzintervall

825,18975,17425,04,18425,04,18

363,196,14,18

363,196,14,18

≤≤+≤≤−

⋅+≤≤⋅−

Δ+≤≤Δ−

μμ

μ

μμμ xx

Bei gegebenem Stichprobenumfang führt die Reduktion der Sicherheitswahr-scheinlichkeit 1–α von 99 auf 95% zu einem kleineren Zufallsfehler und zu ei-nem kleineren Konfidenzintervall, d.h. zu einer genaueren Schätzung. Offenbar besteht ein Konflikt zwischen Sicherheit und Genauigkeit.

b. Es wurde eine Stichprobe im Umfang n = 225 aus einer normalverteilten Grundgesamtheit gezogen. Das Stichprobenmittel (Punktschätzung) beträgt

26,7=x

Es soll ein Konfidenzintervall für μ bestimmt werden:

[1] Festlegung der Konfidenzzahl: 99,01 =−α (hier gegeben)

[2] Bestimmung der Quantile für die Standardnormalverteilung aus der N(0;1)-Tabelle

576,2)995,0(2

12

==⎟⎠⎞

⎜⎝⎛ −=⎟

⎠⎞

⎜⎝⎛− ccc αα

[3] Berechnung des Stichprobenmittels aus den Stichprobenwerten (gegeben)

26,72251 225

1== ∑

=iixx

[4] Berechnung des Zufallsfehlers

412,015

4,12576,2225

4,2576,2 =⋅=⋅==Δn

c σμ

Page 3: Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 -

ÜBUNG 10 - LÖSUNGEN 3

Senger – Induktive Statistik

[5] Angabe des Konfidenzintervalls

672,7848,6

412,026,7412,026,7

≤≤

+≤≤−

Δ+≤≤Δ−

μ

μ

μμμ xx

[6] Interpretation:

Mit der Wahrscheinlichkeit von 99% liegt der Mittelwert μ der Grundge-samtheit zwischen 6,848 und 7,672.

Analog ergibt sich für die Konfidenzzahl 95,01 =−α das Konfidenzintervall

574,7946,6

314,026,7314,026,7

2254,296,126,7

2254,296,126,7

≤≤

+≤≤−

⋅+≤≤⋅−

μ

μ

μ

c. Mit Hilfe einer Stichprobe soll der Mittelwert einer normalverteilten Grundge-samtheit geschätzt werden. Eine Stichprobe im Umfang n = 100 hat den fol-genden Schätzwert 5ˆ == xμ ergeben.

Es soll die Punktschätzung nun durch eine Intervallschätzung ergänzt werden, die Aufschluß über die Zuverlässigkeit der Schätzung gibt.

Bestimmung eines Konfidenzintervalls für μ:

[1] Festlegung der Konfidenzzahl: 99,01 =−α (hier gegeben)

[2] Bestimmung der Quantile für die Standardnormalverteilung aus der N(0;1)-Tabelle

576,2)995,0(2

12

==⎟⎠⎞

⎜⎝⎛ −=⎟

⎠⎞

⎜⎝⎛− ccc αα

[3] Berechnung des Stichprobenmittels aus den Stichprobenwerten (gegeben)

5100

1 100

1== ∑

=iixx

[4] Berechnung des Zufallsfehlers

773,0103576,2

1003576,2 =⋅=⋅==Δ

nc σμ

Page 4: Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 -

ÜBUNG 10 - LÖSUNGEN 4

Senger – Induktive Statistik

[5] Angabe des Konfidenzintervalls

773,5227,4

773,05773,05

≤≤

+≤≤−

Δ+≤≤Δ−

μ

μ

μμμ xx

[6] Interpretation

Mit der Wahrscheinlichkeit von 99% liegt der wahre Parameterwert μ, also der Mittelwert der Grundgesamtheit, zwischen 4,227 und 5,773.

Analog ergibt sich für die Konfidenzzahl 95,01 =−α das Konfidenzintervall

588,5412,4

588,05588,05

100396,15

100396,15

≤≤

+≤≤−

⋅+≤≤⋅−

μ

μ

μ

2. Überprüfung einer Maschineneinstellung mit Hilfe einer Stichprobe

Durch eine Stichprobe soll die durchschnittliche Länge der Bleche, die auf einer bestimmten Maschine zugeschnitten werden, geschätzt werden.

Gegeben sind

Stichprobenumfang n = 40 > 30

Stichprobenmittel 5,80=x cm

Standardabweichung σ = 2,2 cm (Maschinenkonstante)

Obwohl keine Angaben über die Verteilung der Grundgesamtheit, d.h. der Länge der geschnittenen Bleche, gemacht werden, wissen wir, daß das Stichprobenmittel asymptotisch normalverteilt ist, da der Stichprobenumfang größer als 30 ist.

Bestimmung eines Konfidenzintervalls für μ :

[1] Konfidenzzahl 95,01 =−α (gegeben)

[2] Quantile für die Standardnormalverteilung aus der N(0;1)-Tabelle

96,1)975,0(2

12

==⎟⎠⎞

⎜⎝⎛ −=⎟

⎠⎞

⎜⎝⎛− ccc αα

Page 5: Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 -

ÜBUNG 10 - LÖSUNGEN 5

Senger – Induktive Statistik

[3] Stichprobenmittel

5,80401 40

1== ∑

=iixx

[4] Zufallsfehler

682,0402,296,1 =⋅==Δ

nc σμ

[5] Konfidenzintervall

182,81818,79

682,05,80682,05,80

≤≤

+≤≤−

Δ+≤≤Δ−

μ

μ

μμμ xx

[6] Interpretation:

Mit der Wahrscheinlichkeit von 95% liegt die durchschnittliche Länge μ aller Bleche, die auf dieser Maschine zugeschnitten werden, zwischen 79,818 und 81,182 cm.

3. Schätzung der spezifischen Kilometerleistung eines PKW

Gegeben sind

Stichprobenumfang n = 50 > 30

Stichprobenmittel 50=x km/Füllmenge

Standardabweichung s = 7 km/Füllmenge

Das Stichprobenmittel ist näherungsweise normalverteilt, da der Stichprobenum-fang größer als 30 ist. Da die Standardabweichung der Grundgesamtheit nicht be-kannt ist, sondern durch die Standardabweichung der Stichprobe geschätzt werden muß, ist die t-Verteilung anzuwenden. Für n > 30 ist aber die N(0;1)-Verteilung ei-ne gute Approximation der t-Verteilung und kann anstelle der t-Verteilung verwen-det werden.

Bestimmung eines Konfidenzintervalls für μ :

[1] Festlegung der Konfidenzzahl: 95,01 =−α (gegeben)

[2] Bestimmung der Quantile für die Standardnormalverteilung aus der N(0;1)-Tabelle

96,1)975,0(2

12

==⎟⎠⎞

⎜⎝⎛ −=⎟

⎠⎞

⎜⎝⎛− ccc αα

Page 6: Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 -

ÜBUNG 10 - LÖSUNGEN 6

Senger – Induktive Statistik

[3] Berechnung des Stichprobenmittels (gegeben)

50501 50

1== ∑

=iixx

und der Stichprobenvarianz aus den Stichprobenwerten (gegeben)

49)(491 50

1

22 =−= ∑=i

i xxs

[4] Berechnung des Zufallsfehlers

940,150796,1 =⋅==Δ

nscμ

[5] Angabe des Konfidenzintervalls

94,5106,48

94,15094,150

≤≤

+≤≤−

Δ+≤≤Δ−

μ

μ

μμμ xx

Mit der t-Verteilung ergibt sich zum Vergleich

99,5101,48 ≤≤ μ

[6] Interpretation:

Mit der Wahrscheinlichkeit von 95% liegt die durchschnittliche spezifi-sche km-Leistung μ aller PKW dieses Typs zwischen 48,01 und 51,99 km/Füllmenge.

4. Konfidenzintervall für den mittleren Durchmesser von Schrauben

Gegeben sind

Stichprobenumfang n = 200 > 30

Stichprobenmittel 824,0=x cm

Standardabweichung s = 0,042 cm

Das Stichprobenmittel ist näherungsweise normalverteilt, da der Stichprobenum-fang größer als 30 ist. Da die Standardabweichung der Grundgesamtheit durch die Standardabweichung der Stichprobe geschätzt werden muß, ist die t-Verteilung an-zuwenden. Für n > 30 ist aber die N(0;1)-Verteilung eine gute Approximation der t-Verteilung und kann anstelle der t-Verteilung verwendet werden.

Page 7: Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 -

ÜBUNG 10 - LÖSUNGEN 7

Senger – Induktive Statistik

Bestimmung eines Konfidenzintervalls für μ :

[1] Festlegung der Konfidenzzahl: 95,01 =−α (gegeben)

[2] Bestimmung der Quantile für die Standardnormalverteilung aus der N(0;1)-Tabelle

96,1)975,0(2

12

==⎟⎠⎞

⎜⎝⎛ −=⎟

⎠⎞

⎜⎝⎛− ccc αα

[3] Berechnung des Stichprobenmittels (gegeben)

824,02001 200

1== ∑

=iixx

und der Stichprobenvarianz aus den Stichprobenwerten (gegeben)

2200

1

22 042,0)824,0(199

1=−= ∑

=iixs

[4] Berechnung des Zufallsfehlers

0058,0200042,096,1 =⋅==Δ

nscμ

[5] Angabe des Konfidenzintervalls

8298,08182,00058,0824,00058,0824,0

≤≤+≤≤−

Δ+≤≤Δ−

μμ

μμμ xx

8299,08181,0 ≤≤ μ (zum Vergleich mit t-Verteilung)

[6] Interpretation:

Mit der Wahrscheinlichkeit von 95% liegt der mittlere Durchmesser μ al-ler Schrauben, die auf dieser Maschine hergestellt werden, zwischen 0,8182 und 0,8298 cm.

Analog ergibt sich für 99,01 =−α das Konfidenzintervall

8317,08163,0

00765,0824,000765,0824,0

200042,0576,2824,0

200042,0576,2824,0

≤≤

+≤≤−

⋅+≤≤⋅−

μ

μ

μ

Page 8: Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 -

ÜBUNG 10 - LÖSUNGEN 8

Senger – Induktive Statistik

5. Konfidenzintervall für das Durchschnittseinkommen von Studenten

Gegeben sind

Stichprobenumfang n = 81 > 30

Stichprobenmittel 543=x Euro

Standardabweichung s = 72 Euro

Das Stichprobenmittel ist näherungsweise normalverteilt, da die Grundgesamtheit näherungsweise normalverteilt ist. Da die Varianz der Grundgesamtheit durch die Varianz der Stichprobe geschätzt werden muß, ist die t-Verteilung anzuwenden. Wegen des großen Stichprobenumfangs n > 30, kann die N(0;1)-Verteilung anstel-le der t-Verteilung verwendet werden.

Bestimmung eines Konfidenzintervalls für μ :

[1] Festlegung der Konfidenzzahl: 90,01 =−α (gegeben)

[2] Bestimmung der Quantile für die Standardnormalverteilung aus der N(0;1)-Tabelle

645,1)95,0(2

12

==⎟⎠⎞

⎜⎝⎛ −=⎟

⎠⎞

⎜⎝⎛− ccc αα

[3] Berechnung des Stichprobenmittels (gegeben)

543811 81

1== ∑

=iixx

und der Stichprobenvarianz aus den Stichprobenwerten (gegeben)

281

1

22 72)543(801

=−= ∑=i

ixs

[4] Berechnung des Zufallsfehlers

16,138645,181

72645,1 =⋅=⋅==Δnscμ

[5] Angabe des Konfidenzintervalls

16,55684,529

16,1354316,13543

≤≤

+≤≤−

Δ+≤≤Δ−

μ

μ

μμμ xx

Page 9: Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 -

ÜBUNG 10 - LÖSUNGEN 9

Senger – Induktive Statistik

[6] Interpretation:

Mit der Wahrscheinlichkeit von 90% liegt das mittlere Monatseinkommen μ aller Studenten der UNI Kassel zwischen 529,84 und 556,16 Euro.

6. Konfidenzintervalle der Aufgabe 1 bei unbekannter Varianz

Wenn die Varianz der normalverteilten Grundgesamtheit nicht gegeben ist, sondern durch die Stichprobenvarianz geschätzt werden muß, ist grundsätzlich die t-Verteilung anzuwenden. Da die t-Verteilung aber schnell gegen die N(0;1)-Verteilung konvergiert, kann die N(0;1)-Verteilung bereits ab n > 30 anstelle der t-Verteilung verwendet werden.

In den Aufgaben 1a bis 1c ist der Stichprobenumfang größer als 30. Daher kann die N(0;1)-Verteilung auch dann verwendet werden, wenn die Varianz der Grundge-samtheit aus der Stichprobe geschätzt wird.

Zur Übung und zum Vergleich sollen die Konfidenzintervalle noch einmal mit der t-Verteilung berechnet werden.

a. 4,18=x ; 69,12 =s ; n = 36

Konfidenzzahl: 99,01 =−α

Quantile: 7238,2)35;995,0(1;2

11;2

==⎟⎠⎞

⎜⎝⎛ −−=⎟

⎠⎞

⎜⎝⎛ −− tntnt αα (t-Tabelle)

Konfidenzintervall:

99,1881,17

59,04,1859,04,18

363,172,24,18

363,172,24,18

≤≤

+≤≤−

⋅+≤≤⋅−

+≤≤−

μ

μ

μ

μnstx

nstx

Und alternativ für 95%

Konfidenzzahl: 95,01 =−α

Quantile: 0301,2)35;975,0(1;2

11;2

==⎟⎠⎞

⎜⎝⎛ −−=⎟

⎠⎞

⎜⎝⎛ −− tntnt αα aus t-Tabelle

Page 10: Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 -

ÜBUNG 10 - LÖSUNGEN 10

Senger – Induktive Statistik

Konfidenzintervall:

nstx

nstx +≤≤− μ

84,1896,17

44,04,1844,04,18

363,103,24,18

363,103,24,18

≤≤

+≤≤−

⋅+≤≤⋅−

μ

μ

μ

b. 26,7=x ; 76,52 =s ; n = 225

Konfidenzzahl: 99,01 =−α

Quantile: 598,2)224;995,0(1;2

11;2

==⎟⎠⎞

⎜⎝⎛ −−=⎟

⎠⎞

⎜⎝⎛ −− tntnt αα (t-Tabelle)

Konfidenzintervall:

676,7844,6

416,026,7416,026,7

22576,56,226,7

22576,56,226,7

≤≤

+≤≤−

⋅+≤≤⋅−

+≤≤−

μ

μ

μ

μnstx

nstx

Und alternativ für 95%

Konfidenzzahl: 95,01 =−α

Quantile: 9706,1)224;975,0(1;2

11;2

==⎟⎠⎞

⎜⎝⎛ −−=⎟

⎠⎞

⎜⎝⎛ −− tntnt αα (t-Tabelle)

Konfidenzintervall:

575,7945,6

315,026,7315,026,7

22576,597,126,7

22576,597,126,7

≤≤

+≤≤−

⋅+≤≤⋅−

μ

μ

μ

Page 11: Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 -

ÜBUNG 10 - LÖSUNGEN 11

Senger – Induktive Statistik

c. 5=x ; 92 =s ; n = 100

Konfidenzzahl: 99,01 =−α

Quantile: 6264,2)99;995,0(1;2

11;2

==⎟⎠⎞

⎜⎝⎛ −−=⎟

⎠⎞

⎜⎝⎛ −− tntnt αα (t-Tabelle)

Konfidenzintervall:

789,5211,4

789,05789,05

100963,25

100963,25

≤≤

+≤≤−

⋅+≤≤⋅−

+≤≤−

μ

μ

μ

μnstx

nstx

und alternativ für 95%

Konfidenzzahl: 95,01 =−α

Quantile: 9842,1)99;975,0(1;2

11;2

==⎟⎠⎞

⎜⎝⎛ −−=⎟

⎠⎞

⎜⎝⎛ −− tntnt αα (t-Tabelle)

Konfidenzintervall:

594,5406,4

594,05594,05

100998,15

100998,15

≤≤

+≤≤−

⋅+≤≤⋅−

μ

μ

μ

Der Vergleich mit den Ergebnissen in Aufgabe 1 zeigt, daß der Zufallsfehler und die Länge des Konfidenzintervalls geringfügig kleiner sind, wenn wir die N(0;1)-Verteilung anstelle der t-Verteilung verwenden. Diese Ungenauigkeit, ist die Folge der Approximation der t-Verteilung durch die N(0;1)-Verteilung.

Die t-Verteilung führt generell zu längeren Konfidenzintervallen also ungenaueren Schätzungen, weil sie auf einer Schätzung der unbekannten Standardabweichung

s=≈σσ ˆ beruht.

Die t-Werte der Student-Verteilung liegen über den entsprechenden c-Werten der Normalverteilung, wie der Tabellenvergleich zeigt. Der Unterschied ist um so grö-ßer, je kleiner die Stichprobe und damit die Zahl der Freiheitsgrade n – 1 ist und kann für n > 30 vernachlässigt werden.

Page 12: Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 -

ÜBUNG 10 - LÖSUNGEN 12

Senger – Induktive Statistik

7. Schätzung des durchschnittlichen Gewichts von Schokoriegeln

Gegeben sind

Stichprobenumfang n = 5 < 30

Stichprobenwerte xi : 55, 57, 53, 56, 54 g

Das Stichprobenmittel ist näherungsweise normalverteilt, da die Grundgesamtheit näherungsweise normalverteilt ist. Da die Varianz der Grundgesamtheit nicht be-kannt ist, sondern durch die Varianz der Stichprobe geschätzt werden muß, ist die t-Verteilung anzuwenden.

Bestimmung eines Konfidenzintervalls für μ :

[1] Festlegung der Konfidenzzahl: 95,01 =−α (gegeben)

[2] Bestimmung der Quantile aus der Tabelle für die t-Verteilung mit n–1 Freiheitsgraden

7764,2)4;975,0(1;2

11;2

==⎟⎠⎞

⎜⎝⎛ −−=⎟

⎠⎞

⎜⎝⎛ −− tntnt αα

[3] Berechnung des Stichprobenmittels

55)5456535755(51

51 5

1=++++== ∑

=iixx

und der Stichprobenvarianz aus den Stichprobenwerten

5,2)11440(41))1()1()2()2()0((

41

))5554()5556()5553()5557()5555((41

)(41

22222

22222

5

1

22

=++++=−++−++=

−+−+−+−+−=

−= ∑=i

i xxs

[4] Berechnung des Zufallsfehlers

963,155,278,2 =⋅==Δ

nstμ

[5] Angabe des Konfidenzintervalls

963,56037,53

963,155963,155

≤≤

+≤≤−

Δ+≤≤Δ−

μ

μ

μμμ xx

Page 13: Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 -

ÜBUNG 10 - LÖSUNGEN 13

Senger – Induktive Statistik

[6] Interpretation:

Mit der Wahrscheinlichkeit von 95% liegt das durchschnittliche Gewicht μ aller Schokoriegel, die auf dieser Maschine hergestellt werden, zwischen 53 und 57g.

8. Schätzung des durchschnittlichen Füllgewichts von Müsli-Paketen

Gegeben sind

Stichprobenumfang n = 10 < 30

Stichprobenwerte xi : 1004, 1010, 1001, 1005, 1007,

998, 1012, 1005, 1008, 1010 g.

Das Stichprobenmittel ist näherungsweise normalverteilt, da die Grundgesamtheit näherungsweise normalverteilt ist. Da die Varianz der Grundgesamtheit nicht be-kannt ist, sondern durch die Varianz der Stichprobe geschätzt werden muß, ist die t-Verteilung anzuwenden.

a. Bestimmung eines Konfidenzintervalls für μ :

[1] Festlegung der Konfidenzzahl: 95,01 =−α (gegeben)

[2] Bestimmung der Quantile aus der Tabelle für die t-Verteilung mit n–1 Freiheitsgraden

26,2)9;975,0(1;2

11;2

==⎟⎠⎞

⎜⎝⎛ −−=⎟

⎠⎞

⎜⎝⎛ −− tntnt αα

[3] Berechnung des Stichprobenmittels

1006) 1010100810051012998

10071005100110101004(101

101 10

1

=+++++

++++== ∑=i

ixx

und der Stichprobenvarianz aus den Stichprobenwerten

222

2222

222

10

1

22

)10061010()10061008()10061005(

)10061012()1006998()10061007()10061005(

)10061001()10061010()10061004((91

)(91

−+−+−+

−+−+−+−+

−+−+−=

−= ∑=i

i xxs

Page 14: Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 -

ÜBUNG 10 - LÖSUNGEN 14

Senger – Induktive Statistik

67,18

)164136641125164(91

))4()2()1()6()8(

)1()1()5()4()2((91

22222

222222

=

+++++++++=

++−++−+

+−+−++−=s

[4] Berechnung des Zufallsfehlers

087,31032,426,2

1067,1826,2 =⋅=⋅==Δ

nstμ

[5] Angabe des Konfidenzintervalls

1,10099,1002

1,310061,31006

≤≤

+≤≤−

Δ+≤≤Δ−

μ

μ

μμμ xx

[6] Interpretation:

Mit der Wahrscheinlichkeit von 95% liegt das durchschnittliche Füllge-wicht μ aller Müslipakete, die auf dieser Maschine abgefüllt werden, zwi-schen 1002,9 und 1009,1g.

b. Berechnung des notwendigen Stichprobenumfangs

Der Zufallsfehler beträgt

nstt X ==Δ σμ ˆ

daraus ergibt sich durch Umformung der notwendige Stichprobenumfang

248,232

67,1826,2)( 2

22

22 ≈==Δ

=μstn

Der Stichprobenumfang einer erneuten Stichprobe müßte mindestens n = 24 betragen, wenn der Schätzfehler höchstens 2g sein soll.

Page 15: Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 -

ÜBUNG 10 - LÖSUNGEN 15

Senger – Induktive Statistik

9. Schätzung des Anteils der Einheimischen bei einem Open-air-Konzert

Durch eine Zufallsstichprobe soll der Anteil der einheimischen Besucher eines O-pen-air-Konzerts geschätzt werden.

Die Zufallsvariable X ist die Anzahl der Einheimischen in einer Stichprobe vom Umfang n.

Gegeben sind

n = 196 (N = 31.763) x = 49

Daraus ergibt sich der Anteilswert in der Stichprobe

25,019649

===nxp

und die Stichprobenvarianz

000957,01961875,0

19675,025,0)1(

1)1(ˆ 2 ==

⋅=

−≈

−−

=n

ppn

ppPσ

Es soll ein 98%-Konfidenzintervall für π berechnet werden.

[1] Konfidenzzahl: 98,01 =−α

[2] Quantile:

Die Anwendungsvoraussetzungen für die Normalverteilung (Approximati-on der Binomialverteilung durch die Normalverteilung) sind erfüllt:

514775,0196)1(54925,0196

>=⋅=−>=⋅=

pnnp

Aus der N(0;1)-Tabelle entnehmen wir die Werte der Quantile

326,2)99,0(2

12

==⎟⎠⎞

⎜⎝⎛ −=⎟

⎠⎞

⎜⎝⎛− ccc αα

[3] Stichprobenanteil:

p = 0,25

Standardabweichung

031,00309,01961875,0

19675,025,0)1(ˆ ≈==

⋅=

−=

npp

Page 16: Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 -

ÜBUNG 10 - LÖSUNGEN 16

Senger – Induktive Statistik

[4] Zufallsfehler:

0719,00309,0326,2000957,0326,2)1(=⋅=⋅=

−=Δ

nppcπ

[5] Konfidenzintervall:

322,0178,0

0719,025,00719,025,0

≤≤

+≤≤−

Δ+≤≤Δ−

π

π

πππ pp

[6] Interpretation:

Mit der Wahrscheinlichkeit von 98% lag der Anteil π aller einheimischen Besucher bei diesem Open-air-Konzert zwischen 17,8% und 32,2%.

10. Konfidenzintervall für den Anteil aller Wähler eines Kandidaten

Durch eine Stichprobe wird der Anteil der Wahlberechtigten, die für einen be-stimmten Kandidaten sind, geschätzt.

Die Zufallsvariable X ist die Anzahl der Wähler in einer Stichprobe vom Umfang n, die für den Kandidaten sind.

Gegeben sind

n = 100 x = 55

Daraus ergibt sich der Anteilswert in der Stichprobe

55,010055

===nxp

und die Stichprobenvarianz

002475,01002475,0

10045,055,0)1(

1)1(ˆ 2 ==

⋅=

−≈

−−

=n

ppn

ppPσ

Bestimmung eines Konfidenzintervalls für π :

a. [1] Konfidenzzahl: 95,01 =−α (gegeben)

[2] Quantile:

Die Anwendungsvoraussetzungen für die Normalverteilung (Approximati-on der Binomialverteilung durch die Normalverteilung) sind erfüllt:

Page 17: Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 -

ÜBUNG 10 - LÖSUNGEN 17

Senger – Induktive Statistik

54545,0100)1(55555,0100

>=⋅=−>=⋅=

pnnp

Aus der N(0;1)-Tabelle entnehmen wir die Werte der Quantile

96,1)975,0(2

12

==⎟⎠⎞

⎜⎝⎛ −=⎟

⎠⎞

⎜⎝⎛− ccc αα

[3] Stichprobenanteil

55,0=p

Standardabweichung

05,004975,0104975,0

10045,055,0)1(ˆ ≈==

⋅=

−=

npp

[3] Zufallsfehler:

098,005,096,10025,096,1)1(=⋅=⋅=

−=Δ

nppcπ

[4] Konfidenzintervall:

648,0452,0098,055,0098,055,0

≤≤+≤≤−Δ+≤≤Δ−

ππ

πππ pp

[5] Interpretation:

Mit der Wahrscheinlichkeit von 95% liegt der Anteil π aller Wahlberech-tigten des Wahlkreises, die für diesen Kandidaten sind, zwischen 45,2% und 64,8%.

Für die Konfidenzzahl 99,01 =−α ergibt sich analog das Konfidenzintervall

6788,04212,01288,055,01288,055,0

10045,055,0576,2

10045,055,0576,2

)1()1(

≤≤+≤≤−

⋅+≤≤

⋅−

−+≤≤

−−

ππ

π

π

pp

nppcp

nppcp

Page 18: Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 -

ÜBUNG 10 - LÖSUNGEN 18

Senger – Induktive Statistik

Für die Konfidenzzahl 9973,01 =−α ergibt sich das Konfidenzintervall

70,040,015,055,015,055,0

10045,055,00,3

10045,055,00,3

)1()1(

≤≤+≤≤−

⋅+≤≤

⋅−

−+≤≤

−−

ππ

π

π

pp

nppcp

nppcp

Die Schätzung des Anteilswerts ist bei einem so kleinen Stichprobenumfang sehr ungenau. Die Schätzung des Anteilswerts ist bei gegebenem Stichprobenumfang um so genauer, je kleiner die Sicherheitswahrscheinlichkeit ist.

11. Konfidenzintervall für die Wahrscheinlichkeit eine 5 oder 6 zu würfeln.

Durch eine Stichprobe soll die Wahrscheinlichkeit, bei einem einzelnen Wurf eine 5 oder 6 zu würfeln, geschätzt werden. Beim Werfen des Würfels handelt es sich, wie wir wissen, um ein Laplace-Experiment. Die Laplace-Wahrscheinlichkeit, eine 5 oder 6 zu würfeln, entspricht dem Verhältnis der Zahl der günstigen 2 zur Zahl der möglichen Fälle 6 und kann berechnet werden, ohne den Würfel zu werfen.

Diese Wahrscheinlichkeit soll nun durch eine Stichprobe geschätzt werden. Die Zu-fallsvariable X ist die Anzahl der Würfe in einer Stichprobe vom Umfang n, bei de-nen die 5 oder 6 fällt. Bei 30 Würfen des Würfels seien die 5 und die 6 insgesamt 11 mal gefallen.

Gegeben sind dann

n = 30 x = 11

Daraus ergibt sich der Anteilswert in der Stichprobe

367,03011

===nxp

und die Stichprobenvarianz

007741,030

223,030

)63,01(63,0)1(

008008,029

223,029

36,063,0130

)63,01(63,01

)1(ˆ 2

==−

=−

==⋅

=−−

=−−

=

npp

npp

Die Näherung ist bei diesem niedrigen Stichprobenumfang zwar noch sehr unge-nau, kann aber verwendet werden.

Page 19: Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 -

ÜBUNG 10 - LÖSUNGEN 19

Senger – Induktive Statistik

Es soll ein 90%-Konfidenzintervall für π berechnet werden.

[1] Konfidenzzahl: 90,01 =−α

[2] Quantile:

Die Anwendungsvoraussetzungen für die Normalverteilung (Approximati-on der Binomialverteilung durch die Normalverteilung) sind erfüllt:

519301930)1(

511301130

>=⋅=−

>=⋅=

pn

np

Aus der N(0;1)-Tabelle entnehmen wir die Werte der Quantile

645,1)95,0(2

12

==⎟⎠⎞

⎜⎝⎛ −=⎟

⎠⎞

⎜⎝⎛− ccc αα

[3] Stichprobenanteil

p = 0,367

Standardabweichung

08798,0007741,030

)63,01(63,0)1(ˆ ==−

=−

=n

ppPσ

[4] Zufallsfehler:

1447,0007741,0645,1)1(=⋅=

−=Δ

nppcπ

mit n–1:

1472,0008008,0645,11

)1(=⋅=

−−

=Δn

ppcπ

[5] Konfidenzintervall:

512,0222,0

145,0367,0145,0367,0

≤≤

+≤≤−

Δ+≤≤Δ−

π

π

πππ pp

Page 20: Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 -

ÜBUNG 10 - LÖSUNGEN 20

Senger – Induktive Statistik

[6] Interpretation:

Mit der Wahrscheinlichkeit von 90% liegt die Wahrscheinlichkeit π, eine 5 oder 6 zu würfeln, zwischen 22,2% und 51,2%.

Auch in diesem Beispiel sehen wir, daß ein so kleiner Stichprobenumfang zu unge-nauen Schätzungen führt. Wegen der großen Standardabweichung von 9% ist nicht nur die Punktschätzung selbst ungenau (große Abweichungen vom wahren Parame-terwert sind wahrscheinlich), sondern auch das Konfidenzintervall sehr lang.

12. Berechnung des notwendigen Stichprobenumfangs

Durch eine Stichprobe soll der Marktanteil eines Softwareprodukts geschätzt wer-den.

Gegeben sind

Δπ = 0,02 maximaler Schätzfehler

1–α = 0,95 Sicherheitswahrscheinlichkeit

3,0ˆ == pπ Marktanteil bei früherer Erhebung

a. Berechnung des notwendigen Stichprobenumfangs

Der Zufallsfehler beträgt

nppcc P

)1(ˆ −==Δ σπ

daraus ergibt sich durch Umformung der notwendige Stichprobenumfang

201784,201652596,102,0

7,03,096,1)(

)1( 22

22

2 ≈=⋅=⋅

−=

πppcn

Der Stichprobenumfang müßte mindestens n = 2017 betragen, wenn der Schätzfehler höchstens 2% sein soll.

b. Wenn der Stichprobenumfang aus Kostengründen auf n = 1000 reduziert wer-den müßte, dann wäre der Schätzfehler:

0284,00145,096,11000

7,03,096,1)1(ˆ =⋅=⋅

⋅=−

==Δn

ppcc Pσπ

Der Schätzfehler würde also von 2% auf 2,84% steigen.

c. Wenn der Stichprobenumfang bei unveränderter Sicherheitswahrscheinlichkeit von 95% reduziert werden würde, dann würde sich die Irrtumswahrscheinlich-keit nicht verändern. Die Irrtumswahrscheinlichkeit läge also unverändert bei 5%.

Page 21: Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 -

ÜBUNG 10 - LÖSUNGEN 21

Senger – Induktive Statistik

13. Konfidenzintervall für die Varianz der Brenndauer von Glühbirnen

Die Brenndauer der Glühbirnen ist annahmegemäß näherungsweise normalverteilt.

In einer Stichprobe von 50 Glühbirnen betrage die Standardabweichung der Brenn-dauer 120 Stunden.

Gegeben sind also

Stichprobenumfang n = 50

Standardabweichung s = 120

Bestimmung eines Konfidenzintervalls für σ 2 und σ

a. Sicherheitswahrscheinlichkeit 95%

[1] Festlegung der Konfidenzzahl: 95,01 =−α (gegeben)

[2] Bestimmung der Quantile aus der Tabelle der Chiquadrat-Verteilung für n – 1 = 49 Freiheitsgrade. Da die Chiquadrat-Verteilung asymmetrisch ist, müssen das untere und das obere Quantil gesondert ermittelt werden.

2,70)49;975,0()1,2

1

6,31)49;025,0(1,2

22

222

21

211

==⎟⎠⎞

⎜⎝⎛ −−=

==⎟⎠⎞

⎜⎝⎛ −=

χαχ

χαχ

nc

nc

[3] Berechnung der Stichprobenvarianz:

400.14120)(491 22

50

1

2 ==−= ∑=

xxsi

i

[4] Berechnung der Konfidenzgrenzen:

223296,31

1440049)1(

100512,70

1440049)1(

1

22

2

=⋅=−

=⋅=−

csn

csn

[5] Angabe des Konfidenzintervall:

1491002232910048

)1()1(

21

22

2

2

≤≤≤≤

−≤≤−

σσ

σcsn

csn

Page 22: Dr. Jürgen Senger INDUKTIVE STATISTIK · Senger – Induktive Statistik Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜBUNG 10 -

ÜBUNG 10 - LÖSUNGEN 22

Senger – Induktive Statistik

[6] Interpretation:

Mit der Wahrscheinlichkeit von 95% liegt die Varianz der Brenndauer al-ler Glühbirnen zwischen 10.051 und 22.329 Quadratstunden.

Mit der Wahrscheinlichkeit von 95% liegt die Standardabweichung der Brenndauer aller Glühbirnen zwischen 100 und 149 Stunden.

b. Sicherheitswahrscheinlichkeit 99%

[1] Konfidenzzahl: 99,01 =−α

[2] Quantile aus der Tabelle der Chiquadrat-Verteilung für n – 1 = 49 Frei-heitsgrade:

23,78)49;995,0()1,2

1

27,27)49;005,0(1,2

22

222

21

211

==⎟⎠⎞

⎜⎝⎛ −−=

==⎟⎠⎞

⎜⎝⎛ −=

χαχ

χαχ

nc

nc

[3] Stichprobenvarianz: 144002 =s

[4] Konfidenzgrenzen:

6,2587427,27

1440049)1(

6,901923,78

1440049)1(

1

22

2

=⋅=−

=⋅=−

csn

csn

[5] Konfidenzintervall:

16195258759020

)1()1(

21

22

2

2

≤≤≤≤

−≤≤−

σσ

σcsn

csn

[6] Interpretation:

Mit der Wahrscheinlichkeit von 99% liegt die Varianz der Brenndauer al-ler Glühbirnen zwischen 9020 und 25875 Quadratstunden und die Stan-dardabweichung zwischen 95 und 161 Stunden.

Erwartungsgemäß ergibt sich bei der höheren Sicherheitswahrscheinlich-keit ein längeres Konfidenzintervall, d.h. eine ungenauere Schätzung.