Download - Angewandte Statistik II - TU Wienalgebra.tuwien.ac.at/bioeng/Stat/AngStat_Bioengineering_II.pdf1-α einschließt, d.h., P(U ≤ π ≤ O) = 1-α gilt. Zusätzlich wird meist die die

Transcript
  • 1

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    Angewandte Statistik II

    Lernziele: 3 Parameterschätzung

    3.1 Den Zweck der Parameterschätzung erklären können. 3.2 Den Mittelwert µ einer N(µ, σ2)-verteilten Zufallsvariablen X

    schätzen können. 3.3 Die Varianz einer N(µ, σ2)-verteilten Zufallsvariablen X schätzen

    können. 3.4 Zweiseitige Konfidenzintervalle erklären und interpretieren

    können. 3.5 (1-α)-Konfidenzintervalle für die Varianz einer N(µ, σ2)- verteilten

    Zufallsvariablen X berechnen können. 3.6 (1-α)-Konfidenzintervalle für den Mittelwert einer N(µ, σ2)-

    verteilten Zufallsvariablen berechnen können. 3.7 (1-α)-Konfidenzintervalle für den Parameter p

    (Wahrscheinlichkeit) berechnen können. 4 Testen von Hypothesen: 1-Stichprobenprobleme

    4.1 Das Prinzip der Signifikanzprüfung an Hand des Gauß-Tests erklärenkönnen.

    4.2 Signifikante und nichtsignifikante Testergebnisse interpretieren können.

    4.3 Mit dem 1-Stichproben-t-Test entscheiden können, ob der Mittelwert einer normalverteilten Zufallsvariablen X von einem vorgegebenen Sollwert abweicht bzw. diesen unter- oder überschreitet.

    4.4 Mit dem Binomialtest prüfen können, ob eine unbekannte Wahrscheinlichkeit von einem vorgegebenen Sollwert abweicht bzw. diesen über- oder unterschreitet.

    4.5 Mit dem χ2-Test prüfen können, ob die beobachteten Häufigkeiten einer mehrstufig skalierten Zufallsvariablen von einem vorgegebenen Verhältnis abweichen.

    4.6 Mit dem Normal-QQ-Plot die Annahme normalverteilter Stichprobenwerte beurteilen können.

    4.7 Mit dem Grubbs-Test einen Ausreißer in einer normalverteilten Zufallsstichprobe identifizieren können.

    5 Zweistichprobenprobleme mit metrischen Untersuchungsmerkmalen

    5.1 Die Versuchsanlagen „Parallelversuch“ und „Paarvergleich“ zum Vergleich von zwei Merkmalen unterscheiden können.

  • 2

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    5.2 Mit dem F-Test entscheiden können, ob die Varianzen von zwei unabhängigen Stichproben normalverteilter Variablen voneinander abweichen bzw. die eine Varianz die andere überschreitet/ unterschreitet.

    5.3 Mit dem Zwei-Stichproben-t-Test die Mittelwerte von zwei mit gleichen Varianzen normalverteilten Untersuchungsmerkmalen vergleichen können.

    5.4 Mit dem Welch-Test die Mittelwerte von zwei normalverteilten Untersuchungsmerkmalen vergleichen können.

    5.5 Mit dem Differenzen-t-Test (paired t-test) die Mittelwerte von zwei normalverteilten Untersuchungsmerkmalen mit abhängigen Stichproben vergleichen können.

    6 Zweistichprobenprobleme mit binären Untersuchungsmerkmalen

    6.1 Zwei Wahrscheinlichkeiten im Rahmen eines Parallelversuchs mit großen Stichproben vergleichen können.

    6.2 Zwei Wahrscheinlichkeiten mit abhängigen Stichproben vergleichen können.

    7 Korrelation und Regression bei metrischen Variablen

    7.1 Den Korrelationskoeffizienten ρ als Parameter der 2-dimensionalen Normalverteilung interpretieren können.

    7.2 Einen Schätzwert und ein Konfidenzintervall für den Korrelationskoeffizienten ρ bestimmen können.

    7.3 Die Abhängigkeit der zweidimensional-normalverteilten Variablen X und Y mit einem geeigneten Test prüfen können.

    7.4 Die Parameter der Regression von Y auf X im Modell A mit zweidimensional-normalverteilten Variablen schätzen und die Abhängigkeitsprüfung durchführen können.

    7.5 Die Parameter der Regression von Y auf X im Modell B (mit zufallsgestörter linearer Regressionsfunktion) schätzen und die Abhängigkeitsprüfung durchführen können.

    7.6 Linearisierende Transformationen anwenden können, um nichtlineare Abhängigkeiten (allometrische, exponentielle bzw. gebrochen lineare) mit Hilfe von linearen Regressionsmodellen erfassen zu können.

    7.7 Regressionsgeraden durch den Nullpunkt bestimmen können. 7.8 Probenmesswerte mit Hilfe von linearen Kalibrationsfunktionen

    schätzen können. 8 Einfaktorielle Varianzanalyse (ANOVA)

    8.1 Den Einfluss eines k-stufigen Faktors auf den Mittelwert einer auf jeder Faktorstufe mit gleicher Varianz normalverteilten Zielvariablen feststellen können.

  • 3

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    8.2 Die Voraussetzungen des Modells der einfaktoriellen ANOVA überpüfen können.

    8.3 Nach signifikantem Ausgang des Globaltests der einfaktoriellen ANOVA die Mittelwertpaare mit voneinander verschiedenen Mittelwerten feststellen können.

  • 4

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    3 PARAMETERSCHÄTZUNG Lernziel 3.1 Den Zweck der Parameterschätzung erklären können? Die Merkmalsvariation wird i. Allg. durch Wahrscheinlichkeitsverteilungen (Wahrscheinlichkeitsfunktionen bzw. Dichtefunktionen) mit unbekannten Parametern modelliert. Für diese Parameter sind - mit Hilfe von Zufallsstichproben - Schätzwerte zu ermitteln und die Genauigkeit der Schätzung durch Konfidenzintervalle anzugeben. Lernziel 3.2 Den Mittelwert µ einer N(µ, σ2)-verteilten Zufallsvariablen X schätzen können. Es sei X1, X2, ..., Xn eine Zufallsstichprobe, in der die Variablen Xi (i = 1, 2, …, n) die Ergebnisse von n Beobachtungen ausdrücken. Die Schätzung des Mittelwerts einer normalverteilten Zufallsvariablen erfolgt mit Hilfe des Stichprobenmittels

    ( ).1 21 nXXXnX +++= L

    Grundgesamtheit X

    Wah

    rsch

    einl

    ichk

    eits

    dich

    te

    Xµ2 σ

    N(µ, σ2)

    x1, x2, ..., xnZufallsauswahl

    Zufallsstichprobe

    Stichprobenmittel

    Parameterschätzung:Schätzwert Konfidenzintervall

    Stichprobenfunktionen

    Stichproben-standardabweichung

  • 5

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    Das Stichprobenmittel hängt von den Werten x1, x2, …, xn der Zufallsstichprobe X1, X2, ..., Xn ab und wird daher auch als eine Schätzfunktion bezeichnet. Setzt man die Werte x1, x2, …, xn für die Zufallsvariablen ein, erhält man einen Schätzwert x für den Mittelwert µ. Es gilt:

    • X möge den Mittelwert µ und die Varianz σ2 besitzen; dann ist der Mittelwert des Stichprobenmittels X gleich dem Mittelwert µ, die die Varianz des Stichprobenmittels aber um den Faktor 1/n verkleinert (für n>1).

    • Bei normalverteiltem X ist auch X normalverteilt. • Wenn X nicht normalverteilt ist, dann ist X für großes n (etwa ab

    n=30) näherungsweise normalverteilt (Zentraler Grenzwertsatz). 3.3 Die Varianz einer N(µ, σ2)-verteilten Zufallsvariablen X schätzen können. Die Schätzung der Varianz σ2 einer normalverteilten Zufallsvariablen erfolgt mit Hilfe der Stichprobenvarianz Setzt man die Werte x1, x2, …, xn einer Zufallsstichprobe für die Zufallsvariablen X1, X2, ..., Xn ein, erhält man einen Schätzwert s

    2 für die Varianz σ2. Es gilt:

    • Die Größe (n-1)S2/σ2 - also die mit dem Faktor (n-1)/σ2 multiplizierte Stichprobenvarianz - ist eine chiquadratverteilte Zufallsvariable mit f = n - 1 Freiheitsgraden.

    Beispiel 3.3: Man zeichne unter Verwendung der R-Funktion dchisq() die Dichtekurven der Chiquadratverteilungen mit den Freiheitsgraden 1, 3 und 5. R-Console: > # Dichtekurven von ausgewählten Chiquadrat-Verteilungen > curve(dchisq(x, 1), from=0, to=4, ylim=c(0, 0.5), xlab ="X", + ylab="Dichte", col="red", main="Dichtekurven der Chiquadratverteilung") > curve(dchisq(x, 3), add=T, lty=2, col="blue") > curve(dchisq(x, 5), add=T, lty=3, col="black") > text(0.8, 0.4, col="red", expression("f=1")) > text(0.4, 0.15, col="blue", expression("f=3")) > text(1, 0.04, col="black", expression("f=5"))

    ( ) ( ) ( )[ ] 1

    1 222

    2

    12 XXXXXX

    nS n −++−+−−

    = L

  • 6

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    R-Grafik:

    3.4 Zweiseitigen Konfidenzintervalle erklären und interpretieren können. Es sei π ein unbekannter Parameter (z.B. der Mittelwert µ) der Verteilung einer Zufallsvariablen X. Wir bezeichnen das Intervall [U, O] der Zahlengeraden als (1-α)-Konfidenzintervall für π, wenn es den Parameter π mit der vorgegebenen hohen Wahrscheinlichkeit 1-α einschließt, d.h., P(U ≤ π ≤ O) = 1-α gilt. Zusätzlich wird meist die die Symmetrieforderung P(U > π) = P(O < π) = α/2 vorgeschrieben. Zur Bestimmung der Grenzen U und O benötigt man eine Zufallsstichprobe von X. Setzt man die Werte x1, x2, …, xn einer Zufallsstichprobe ein, erhält man für U und O die konkreten Zahlenwerte u bzw. o. Das (konkrete) Intervall [u, o] ist so zu interpretieren, dass eine Zufallsstichprobe mit der Wahrscheinlichkeit 1-α auf ein Intervall [u, o] führt, das den unbekannten Parameter π überdeckt. Für 1-α wird meist 95% angenommen (α=5%). 3.5 (1-α)-Konfidenzintervalle für die Varianz einer N(µ, σ2)- verteilten Zufallsvariablen X berechnen können.

    0 1 2 3 4

    0.0

    0.1

    0.2

    0.3

    0.4

    0.5

    Dichtekurven der Chiquadratverteilung

    X

    Dic

    hte

    f=1

    f=3

    f=5

  • 7

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    Es sein s2 die Varianz einer Stichprobe x1, x2, …, xn der Zufallsvariablen X. Die Grenzen eines (1-α)-Konfidenzintervalls für σ2 berechnet man mit den Formeln

    22/,1

    2

    22/1,1

    2 )1( und

    )1(

    αα χχ −−−

    −=−=nn

    sno

    snu

    Zieht man aus den Grenzen u und o die Quadratwurzel, erhält man ein (1-α)-Konfidenzintervall für die Standardabweichung σ. Beispiel 3.5: Es sei X normalverteilt mit dem Mittelwert µ und der Varianz σ2. Von einer Stichprobe sei bekannt: n =30, s2 = 7.93. Man bestimme ein 95%iges Konfidenzintervall (CI) für σ. Lösung mit R: R-Console: > # R-Funktion mit Übergabeparameter: > # n (Stichprobenumfang), var (Varianz), alpha (Irrtumsrisiko) > CI_var # > # CI für die Standardabweichung > CI_sd CI_sd ug og [1,] 2.243 3.786

    3.6 (1-α)-Konfidenzintervalle für den Mittelwert einer N(µ, σ2)- verteilten Zufallsvariablen X berechnen können. Ein konkretes (1-α)-Konfidenzintervall für den Mittelwert µ von X erhält man, indem man um das arithmetische Mittel x einer Zufallsstichprobe x1, x2, …, xn von X das symmetrische Intervall [ ]dxdx +− , mit der halben Intervallbreite nstd an /2/,1 α−−= bildet. Die Größe tn-1,1-α/2 ist das (1-α/2)-Quantil der t-Verteilung mit n-1 Freiheitsgraden, s ist die Standradabweichung der n Stichprobenwerte. Beispiel 3.6a:

  • 8

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    Man zeichne unter Verwendung der R-Funktion dt() die Dichtekurven der t-Verteilungen mit den Freiheitsgraden 1und 5 und stelle sie gemeinsam mit der Standardnormalverteilung in einem Diagramm dar. R-Console: # Dichtekurven von ausgewählten t-Verteilungen curve(dt(x, 1), from=-3, to=3, ylim=c(0, 0.5), xlab ="X", ylab="Dichte", col="red", main="Dichtekurven der t-Verteilung") curve(dt(x, 5), add=T, lty=2, col="blue") curve(dnorm(x), add=T, lty=3,lw=2, col="black") text(0, 0.42, col="black", expression("N(0,1)")) text(0, 0.34, col="blue", expression("t(f=5)")) text(0, 0.27, col="red", expression("t(f=1)"))

    R-Grafik:

    Beispiel 3.6b: Es sei X normalverteilt mit dem Mittelwert µ und der Varianz σ2. Für den Mittelwert und die Standardabweichung von X wurden mit Hilfe einer Stichprobe vom Umfang n=20 die Schätzwerte 25 bzw. 5 bestimmt. Man bestimme zum Niveau 1-α =0.95 ein Konfidenzintervall (CI) für den Mittelwert von X.

    Lösung mit R: R-Console: > # Beachte: ß-Quantil t_(f, ß) = qt(ß, f) > # > # Funktion mit Übergabeparameter: > # mw (Mittelwert, n (Stichprobenumfang, std (Standardabweichung), alpha (Irrtumsrisiko) > CI_mittel

  • 9

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    Für „große“ Stichproben gilt die Approximation:

    [ ]n

    szddxdx 2/1mit , α−=+−

    Hier ist z1-α/2 das (1-α/2)-Quantil der N(0,1)-Verteilung. Folgerung: Faustformel für den Mindeststichprobenumfang zur Schätzung eines Mittelwerts mit der vorgegebenen Genauigkeit ±d und der vorgegebenen Sicherheit 1-α : Beispiel 3.6c: Der Mittelwert µ einer N(µ, σ2)-verteilten Zufallsvariablen soll mit einer Genauigkeit von ±0,25 und einer Sicherheit von 99% bestimmt werden. Von einer Voruntersuchung sei bekannt, dass σ ≤ 1,5 ist. a) Wie groß ist der erforderliche Mindeststichprobenumfang n zu planen? b) Man stelle n in Abhängigkeit von d (0,1 ≤ d≤ 0,3) für 1- α=0.95 und 0.99 dar!

    Lösung mit R: R-Console: > # Aufgabe a) > # R-Funktion mit Übergabeparameter: > # genauigkeit (d), sicherheit (1-alpha), sigma > n_mindest # Funktionsaufruf mit genauigkeit=0.25, sichheit=0.99, sigma=1.5 > n_mindest(0.25, 0.99, 1.5) [1] 238.9 > # Aufgabe b) > # Erzeugen der Folge der d-Werte von 0,1 bis 0,3 in Schritten von 0,01 > d d [1] 0.10 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18 0.19 0.20 0.21 0.22 0.23 0.24 [16] 0.25 0.26 0.27 0.28 0.29 0.30 > # > # Berechnen der den d-Werten entsprechenden Mindeststichprobenumfänge > n_mindest_95 n_mindest_95 [1] 864.33 714.32 600.23 511.44 440.98 384.15 337.63 299.08 266.77 239.43 [11] 216.08 195.99 178.58 163.39 150.06 138.29 127.86 118.56 110.25 102.77 [21] 96.04 > n_mindest_99 n_mindest_99 [1] 1492.9 1233.8 1036.7 883.3 761.7 663.5 583.1 516.6 460.8 413.5 [11] 373.2 338.5 308.4 282.2 259.2 238.9 220.8 204.8 190.4 177.5 [21] 165.9 > # > # Grafische Darstellung der Abhängigkeit der Mindeststichprobenumfänge von d > plot(d, n_mindest_95, type="p", col="blue", xlab="Genauigkeit", + ylab="n", main="Mindest-n bei Mittelwertschätzung") > lines(d, n_mindest_95, col="blue", lty=1, lwd=2) > lines(d, n_mindest_99, col="red", lty=2, lwd=2) > text(0.15, 200, col="blue", expression("Sicherheit = 95%")) > text(0.25, 400, col="red", expression("Sicherheit = 99%"))

    22/1

    ≈ −d

    zn

    σα

  • 10

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    R-Grafik:

    3.7 (1-α)-Konfidenzintervalle für den Parameter p (Wahrscheinlichkeit) einer Zweipunktverteilung/Binomialverteilung berechnen können. • Ein approximatives (1-α)-Konfidenzintervall für den Parameter p

    (Wahrscheinlichkeit) einer Zweipunktverteilung ist das Agresti-Coull-Intervall. Es sei X eine zweistufig skalierte Zufallsvariable mit den Werten 1 und 0, p = P(X =1) bzw. q = 1-p = P(X=0) die Wahrscheinlichkeiten, mit denen diese Werte angenommen werden. Ferner seien x1, x2, ..., xn eine Zufallsstichprobe vom Umfang n und m die Anzahl der Wiederholungen mit xi = 1 und yn = m/n der Anteil der Wiederholungen mit xi = 1. Dann sind die untere und obere Grenze uA bzw. oA eines (1-α) - Konfidenzintervalls für p gegeben durch

    22/1

    2/122/1

    22/1 )1( und

    2/

    mit ,

    αα

    α

    α

    −−

    +−

    =+

    +=

    +=−=

    zn

    mmzl

    zn

    zmm

    lmolmu

    WWAW

    AWAAWA

    0.10 0.15 0.20 0.25 0.30

    200

    400

    600

    800

    Mindest-n bei Mittelwertschätzung

    Genauigkeit

    n

    Sicherheit = 95%

    Sicherheit = 99%

  • 11

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    Voraussetzung für die Approximation: nyn(1-yn) > 9 • Ein exaktes (1-α)-Konfidenzintervall für den Parameter p ist das

    Clopper-Pearson-Intervall mit den Grenzen

    2/1),(2),1(2

    2/),1(2,2

    ,)1(

    )1(

    ,1

    α

    α

    −−+

    +−

    =++−

    +=

    =++−

    =

    mnmoo

    oC

    mnmuu

    uC

    Fqqmmn

    qmo

    Fqmqmn

    mqu

    Die Größen Ff1, f2, α/2 und Ff1, f2, 1-α/2 sind das α/2- bzw. (1-α/2)-Quantil der F-Verteilung mit den Freiheitsgraden f1 und f2. Beispiel 3.7a: Man zeichne unter Verwendung der R-Funktion df() die Dichtekurven der F-Verteilungen mit den Freiheitsgraden 5 und 2 sowie 10 und 40.

    R-Console: # Dichtekurven von ausgewählten F-Verteilungen curve(df(x, 5, 2), from=0, to=3, ylim=c(0, 1), xlab ="X", ylab="Dichte", col="red", main="Dichtekurven der F-Verteilung") curve(df(x, 10, 40), add=T, lty=2, col="blue") text(1.8, 0.42, col="blue", expression("F(f=10,40)")) text(1, 0.42, col="red", expression("F(f=5,2)"))

    0.0 0.5 1.0 1.5 2.0 2.5 3.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    Dichtekurven der F-Verteilung

    X

    Dic

    hte

    F(f=10,40)F(f=5,2)

  • 12

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    Beispiel 3.7b: Es soll die Erfolgsrate p einer neuen Behandlungsmethode, also die Wahrscheinlichkeit, dass bei einer mit der neuen Methode behandelten Person eine Verbesserung eintritt, geschätzt und ein 95%iges Konfidenzintervall für p bestimmt werden. In einer Studie mit n=50 Probanden erwies sich die neue Methode bei m=35 Personen erfolgreich.

    Lösung mit R:

    R-Console: > # Approximatives Konfidenzintervall (Agresti-Coull-Intervall) > m n alpha y # Voraussetzung: > n*y*(1-y) # muss größer als 9 sein! [1] 10.5 > zq mW lA uA # > # Exakte Rechnung (Pearson/Clopper – Intervall) > CI_pexakt # Aufruf: binom.test(m, n, 1-alpha) > binom.test(35, 50, conf.level=0.95) Exact binomial test data: 35 and 50 number of successes = 35, number of trials = 50, p-value = 0.0066 alternative hypothesis: true probability of success is not equal to 0.5 95 percent confidence interval: 0.5539 0.8214 sample estimates: probability of success 0.7 > # > # Hinweis 2: Beide CI können mit der R-Funktion binom.confint() > # im Paket "binom" bestimmt werden > library(binom) > binom.confint(m, n, methods=c("agresti-coull", "exact")) method x n mean lower upper 1 agresti-coull 35 50 0.7 0.5617 0.8097 2 exact 35 50 0.7 0.5539 0.8214

    Hinweis: Aus dem approximativen Intervall ergibt sich eine grobe Faustformel für den Mindeststichprobenumfang zur Schätzung einer Wahrscheinlichkeit mit der vorgegebenen Genauigkeit ±d und der vorgegebenen Sicherheit 1-α:

    22/1

    2

    ≈ −d

    zn α

  • 13

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    Beispiel 3.7c: Die Keimfähigkeit p von Blumenzwiebeln (d.h. die Wahrschein-lichkeit, dass ein ausgesetzter Zwiebel keimt) soll in einem Feldversuch mit der Genauigkeit ±0,1 und der Sicherheit 1-α= 0,95 geschätzt werden. Welcher Stichprobenumfang ist zu planen?

    Lösung mit R: R-Console: > # Approximativer Mindeststichprobenumfang für die Schätzung einer > # Wahrscheinlichkeit zur vorgegebenen Genauigkeit d und Sicherheit S = 1-alpha > # R-Funktion mit Übergabeparameter: > # d (Genauigkeit=halbe Intervallbreite), S (Sicherheit) > n_approx

  • 14

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    5. Von einer Messstelle wurden die folgenden Werte der Variablen X (SO2-

    Konzentration der Luft in mg/m3) gemeldet: 29, 110, 47, 35, 65, 69, 9, 10. a) Man bestimme ein 95%-Konfidenzintervall für den Mittelwert und die Standardabweichung von X. b) Welcher Mindest-Stichprobenumfang müsste geplant werden, um bei gleicher Sicherheit die Mittelwertschätzung mit einer Genauigkeit von +/-5 durchführen zu können? (a) [18.39, 75.11]; [22.43, 69.05], b) 177)

    6. In einer Studie wurden 33 Personen mit einem Präparat behandelt. Der

    Behandlungserfolg wurde auf einer 2-stufigen Skala mit den Skalenwerten "Verbesserung" und "keine Verbesserung" dargestellt. Es ergab sich bei 13 Personen eine Verbesserung. Man bestimme ein 95%iges Konfidenzintervall für die Wahrscheinlichkeit p einer Verbesserung. Welcher Stichprobenumfang müsste geplant werden, um die Wahrscheinlichkeit p mit einer Genauigkeit von +/- 0,1 und einer Sicherheit von 95% schätzen zu können? ([0.227, 0.561]; 97)

    7. In einem Supermarkt wurden 100 Milchpackungen überprüft und dabei

    festgestellt, dass in 15 Fällen die Milch im Begriffe war, sauer zu werden. Man bestimme ein Konfidenzintervall zum Niveau 1-α=95% für den Anteil der sauren Milchpackungen. ([0.08, 0.22])

    8. Die Wahrscheinlichkeit für das Auftreten einer Erkrankung soll in einer

    Risikogruppe mit einer Sicherheit von 95% und einer vorgegebenen Genauigkeit von ± 0.05 bestimmt werden. Wie viele Probanden benötigt man für die Studie? (385)

    9. Von einer Pflanze erhielt Mendel insgesamt 62 Samen, von denen 44 gelb und 18

    grün gefärbt waren. Man bestimme ein 95%iges Konfidenzintervall für die Wahrscheinlichkeit p dafür, dass ein gelber Same gebildet wird. Welcher Stichprobenumfang müsste geplant werden, um die Wahrscheinlichkeit p mit einer Genauigkeit von +/- 0,05 und einer Sicherheit von 90% schätzen zu können? ([0.597, 0.823]; 271)

    10. In einer Studie über die Behandlung von akuten Herzinfarktpatienten wurden 151

    Patienten mit Heparin therapiert, von denen 19 innerhalb von 28 Tagen verstarben. a) Man schätze die Wahrscheinlichkeit p, dass ein Patient innerhalb von 28 Tagen nach Herzinfarkt stirbt, und bestimme für p ein 95%-Konfidenzintervall. b) Welcher Mindeststichprobenumfang ist notwendig, um bei gleicher Sicherheit ein halb so großes Konfidenzintervall fü p zu erhalten? (a) approx. 0.0729, 0.1787; exakt: 0.0775, 0.1895; b) 1373)

  • 15

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    4 TESTEN VON HYPOTHESEN I: EINSTICHPROBENPROBLEME 4.1 Das Prinzip der Signifikanzprüfung an Hand des Gauß-Tests erklärenkönnen. Im Folgenden wird das Prinzip der Signifikanzprüfung am Beispiel des Gauß-Tests (z-Test) erklärt. Mit dem Gauß-Test kann man feststellen, ob der Mittelwert einer mit bekannter Varianz normalverteilten Zufallsvariablen X von einem vorgegebenen Sollwert abweicht bzw. diesen unter- oder überschreitet . Beispiel 4.1: Bei der Herstellung von Injektionsnadeln ist für den Außendurchmesser X der Sollwert µ0=0.8mm vorgegeben. Im Zuge der Überwachung des Prozesses wird aus der laufenden Produktion eine Prüfstichprobe von n=10 Nadeln entnommen und die Außendurchmesser

    0.88, 0.77, 0.77, 0.84, 0.87, 0.81, 0.75, 0.87, 0.87, 0.84 gemessen. Die Frage ist, ob das arithmetische Mittel x =0.827 dieser 10 Außendurchmesser "`signifikant"' von µ0=0.8 abweicht. Dabei wird angenommen, dass X die bekannte Varianz σ2 =0.0025 besitzt. Schema der Problemlösung:

    • Beobachtungsdaten und Modell: Es liegen n Beobachtungswerte x1, x2,…, xn mit dem arithmetischen Mittel x vor. Jedes xi ist die Realisierung einer N(µ, σ2)-verteilten Zufallsvariablen Xi (i=1,2,…,n). Der Mittelwert µ ist unbekannt, die Varianz σ2 jedoch bekannt. Das Stichprobenmittel X ist normalverteilt mit dem Mittelwert µ und der Varianz σ2/n.

    • Hypothesen und Testgröße:

    Der Vergleich des Parameters µ mit einem vorgegebenen Sollwert µ0 erfolgt nach einer der folgenden Testvarianten:

    - H0: µ = µ0 gegen H1 : µ ≠ µ0 (Variante II, 2-seitiger Test) - H0: µ ≤ µ0 gegen H1 : µ > µ0 (Variante Ia, 1-seitiger Test auf

    Überschreitung) - H0: µ ≥ µ0 gegen H1 : µ < µ0 (Variante Ib, 1-seitiger Test auf

    Unterschreitung)

    Als Testgröße wird das standardisierte Stichprobenmittel

  • 16

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    n

    XTG

    /0

    σµ−=

    verwendet, das bei Gültigkeit von H0 (d.h. für µ=µ0) N(0, 1)-verteilt ist. Ersetzt man X durch das arithmetische Mittel x , erhält man die Realisierung TGs der Testgröße.

    • Entscheidung: Entscheidungssituation beim 2-seitigen Test:

    Testentscheidung mit dem P-Wert: Der P-Wert ist die Wahrscheinlichkeit, dass eine Zufallsstichprobe vom Umfang n ein Stichprobenmittel X besitzt, das zumindest gleich weit von µ0 im Sinne von H1 abweicht, wie die beobachtete Realisierung x . Bei vorgegebenem Signifikanzniveau α wird H0 abgelehnt, wenn der P-Wert kleiner als α ist. Die Berechnung des P-Wertes erfolgt für die Testvariante Ia mit der Formel ( )sTGP Φ−= 1 , für die Variante Ib mit der Formel ( )sTGP Φ= bzw. für die zweiseitige Testvariante II mit ( )[ ]||12 sTGP Φ−= . Testentscheidung über die Bestimmung des Ablehnungsbereiches (siehe Abb. 4.1): H0 wird abgelehnt, wenn

    α−> 1zTGs (Variante Ia) bzw.

    α−−< 1zTGs (Variante Ib) bzw.

    2/1|| α−> zTGs (Variante II) gilt. Dabei bezeichnen α−1z und 2/1 α−z das (1-α)- bzw. das (1-α/2)- Quantil der N(0, 1)-Verteilung.

    • Planung des Stichprobenumfangs: Um auf dem Niveau α mit der Sicherheit 1-β eine Entscheidung für H1 herbeizuführen, wenn µ von µ0 um ∆ =|µ-µ0|>0 im Sinne der

  • 17

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    Alternativhypothese abweicht, ist im Falle der 1-seitigen Testvarianten Ia und Ib ein Stichprobenumfang

    ( )21122

    βασ

    −− +∆≥ zzn

    erforderlich (Herleitung: siehe Ergänzung 1). Für die 2-seitige Testvariante II gibt es die in typischen Anwendungssituationen brauchbare Näherungsformel

    ( ) .212/122

    βασ

    −− +∆≈ zzn

    Abb. 4.1 Gauß-Test: Ablehnungsbereich |TG|>z1-α/2 für das zweiseitige Testproblem H0: µ = µ0 gegen H1 : µ ≠ µ0 (obere Grafik) und Ablehnungsbereich TG > z1-α für das einseitige Testproblem H0: µ ≤ µ0 gegen H1 : µ > µ0 (untere Grafik).

    Beispiel 4.1 (Fortsetzung): 2-seitige Prüfung auf Abweichung vom Sollwert

    • Beobachtungsdaten und Modell: X = Außendurchmesser; X ~ N(µ, σ2) mit σ=0.05; x1=0.88, x2=0.77, …, x10 =0.84; n=10; x =0.827.

  • 18

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    • Hypothesen und Testgröße: Sollwert: µ0=0.8; H0: µ = µ0 gegen H1 : µ ≠ µ0, Testniveau α=5%; Realisierung der Testgröße: TGs=1.71.

    • Testentscheidung mit dem P-Wert: P=2[1-Φ(1.71)]=0.088 ≥ 0.05 � H0 (Mittelwert µ entspricht dem Sollwert) kann nicht abgelehnt werden!

    • Alternative: Testentscheidung über die Bestimmung des Ablehnungsbereiches: z1-α/2=z0.975 = 1.96; Ablehnungsbereich: TG > 1.96 TGs =1.71 nicht im Ablehnungsbereich � H0 wird beibehalten!

    1-seitige Prüfung auf Überschreitung des Sollwerts • Beobachtungsdaten und Modell: wie oben • Hypothesen und Testgröße:

    Sollwert: µ0=0.8; H0: µ ≤ µ0 gegen H1 : µ > µ0, α=5%; Realisierung der Testgröße: TGs=1.71.

    • Testentscheidung mit dem P-Wert1: P=1-Φ(1.71)=0.044 < 0.05 � H1 (Mittelwert µ überschreitet den Sollwert)

    • Alternative: Testentscheidung über die Bestimmung des Ablehnungsbereiches: z1-α=z0.95 = 1.645; Ablehnungsbereich: TG > 1.645 TGs =1.71 im Ablehnungsbereich � H1 (H0 wird abgelehnt)

    Ergänzungen:

    1. Herleitung der Formel für den P-Wert (2-seitiger Test) Der P-Wert ist die Wahrscheinlichkeit, dass eine Zufallsstichprobe vom Umfang n ein Stichprobenmittel X besitzt, das zumindest gleich weit von µ0 entfernt ist, wie die beobachtete Realisierung x , für das also gilt dX −≤ 0µ oder dX +≥ 0µ mit nTGxd s /0 σµ =−= :

    [ ])(12)(1)()|()|(

    )|()|(

    00

    0000

    sss

    ss

    TGTGTG

    TGTGPTGTGP

    dXPdXPP

    Φ−=Φ−+−Φ=

    =≥+=−≤==+≥+=−≤=

    µµµµµµµµµµ

    2. Gütefunktion des 1-seitigen Gauß-Tests auf Überschreitung (Hypothesenpaar

    H0: µ ≤ µ0 gegen H1 : µ > µ0 ): Fehlerrisken beim Alternativtest: Fehler 1. Art (α-Fehler, irrtümliche Ablehnung der Nullhypothese) Fehler 2. Art (β-Fehler, falsche Nullhypothese wird beibehalten) Die Wahrscheinlichkeiten

    1 Man beachte, dass der P-Wert des 1-seitigen Gauß-Tests halb so groß ist wie der P-Wert des 2-seitigen. Mit 1-seitigen Hypothesen erreicht man daher eher eine Ablehnung der Nullhypothese als mit 2-seitigen. Der Umstand darf nicht dazu verleiten, auf 1-seitige Hypothesen umzusteigen, wenn mit dem 2-seitigen Testproblem kein signifikantes Ergebnis erreicht wird. Die Verwendung von 1- seitigen Hypothesen muss jedenfalls durch die Problemstellung begründet sein.

  • 19

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    für einen Fehler 1. und 2. Art werden in der Gütefunktion G zusammengefasst. Diese gibt - in Abhängigkeit vom unbekannten Erwartungswert µ - die Wahrscheinlichkeit

    G(µ) = P(Ablehnung von H0 | µ) an, dass der Test auf Grund einer Zufallsstichprobe zu einer Entscheidung gegen H0 führt. Durch die Testentscheidung (mit dem P-Wert oder mit Hilfe des Ablehnungsbereichs) ist sichergestellt, dass die Wahrscheinlichkeit eines Fehlers 1. Art höchstens gleich dem vorgegebenen α ist. Wenn z.B. das 1-seitige Testproblem H0: µ ≤ µ0 gegen H1 : µ > µ0 vorliegt und H0 zutrifft, gilt also G(µ) ≤ α. Trifft dagegen H1 : µ > µ0 zu, so ist die Güte des Tests umso besser, je näher G(µ) bei 1 liegt, oder anders ausgedrückt, je kleiner die Wahrscheinlichkeit β(µ) = 1-G(µ) eines Fehlers zweiter Art ist. Da die Nullhypothese H0: µ ≤ µ0 des 1-seitigen Gauß-Tests auf Überschreitung genau dann abgelehnt wird, wenn TG > c1=z1-α ist, kann die Gütefunktion wie folgt berechnet werden:

    ( )

    −+−Φ=

    =

    −+−

    −+−=

    =

    >

    −=>=

    −n

    z

    nc

    n

    XPc

    n

    XP

    cn

    XPcTGPG

    /

    |//

    |/

    |/

    |)(

    01

    011

    0

    10

    1

    σµµ

    µσ

    µµσ

    µµσ

    µµµ

    µσ

    µµµ

    α

    Die Gütefunktion ist streng monoton wachsend, geht für −∞→µ asymptotisch gegen 0, für +∞→µ asymptotisch gegen 1 und nimmt an der Stelle µ=µ0 den Wert a an. Für µ ≤ µ0 ist also G(µ)≤α. Für µ >µ0 gilt G(µ)>α und G(µ) wird in diesem Fall als Trennschärfe oder Power an der µ bezeichnet. Auf analoge Weise findet man die Gütefunktion des 2-seitigen Gauß-Tests:

    −+−Φ+

    −−−Φ= −−n

    zn

    zG//

    )( 02/10

    2/1 σµµ

    σµµµ αα

  • 20

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    Abb. 4.2: Gütefunktionen des 1- seitigen Gauß-Tests H0: µ ≤ µ0 gegen H1 : µ > µ0 für die Stichprobenumfänge n=5, 10, 20 (obere Grafik) und des 2-seitigen Gauß-Tests H0: µ = µ0 gegen H1 : µ ≠ µ0 für die Stichprobenumfänge n=10 und n=50 (untere Grafik). Horizontal ist die auf σ bezogene Abweichung δ=(µ-µ0)/σ des Mittelwerts vom Sollwert µ0 aufgetragen, vertikal kann man die entsprechenden Gütefunktionswerte G*(δ)=G((µ-µ0)/σ) ablesen.

    Beispiel 4.1 (Fortsetzung): Berechnung des Werts der Gütefunktion an der Stelle µ=0.827 für den 1-seitigen Gauß-Test: Eingangsdaten: α=0.05, c1=z0.95=1.645, µ=0.827, µ0=0.8, σ=0.05, n=10

    ( ) %5.520628.010/05.0

    8.0827.0645.1

    /1)827.0( 0

    =Φ=

    −+−Φ=

    =

    −+−−Φ= nzG

    σµµ

    α

    3. Herleitung der Formel für den Mindeststichprobenumfang beim Gauß-Test auf

    Überschreitung eines Sollwertes (d.h. um mit dem auf dem Testniveau α=5% geführten Gauß-Test eine Überschreitung des Sollwerts µ0 um ∆ mit der Sicherheit (Power) 1-β erkennen zu können):

  • 21

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    Die Fehlerrisken α und β, die Abweichung ∆=µ-µ0 und der Stichprobenumfang n sind beim 1-seitigen Gauß-Test mit den H0: µ ≤ µ0 gegen H1 : µ > µ0 über die Beziehung

    βσ

    µ α −=

    ∆+−Φ= − 1/

    )( 1n

    zG

    miteinander verknüpft. Löst man nach n auf, ergibt sich

    ( )21122

    *βα

    σ−− +∆

    = zzn

    Um eine kritische Überschreitung ∆=µ-µ0 des Sollwertes µ zumindest mit der Sicherheit 1-β als signifikant erkennen zu können, benötigt man einen Stichprobenumfang n≥ n*.

    Beispiel 4.1 (Fortsetzung): Berechnung des erforderlichen n, um mit dem 1-seitigen Gauß-Test auf 5%igem Testniveau die vorgegebene Überschreitung ∆=0.027 mit einer Sicherheit von mindestens 90% als signifikant zu erkennen: Eingangsdaten: α=0.05, 1-β=0.9, ∆=0.027, σ=0.05

    ( ) ( ) 38.29282.1645.1027.0

    05.0

    027.0

    05.0 22

    22

    9.095.02

    2* =+=+= zzn

    Beispiel 4.1 (Lösung mit R): > # beispiel 4.1 > options(digits=4) > x xquer # 2-seitiger Gauß-Test auf Abweichung von einem Sollwert > mu0 z.test(x, mu=mu0, stdev=sigma, alternative="two.sided", conf.level=0.95) One Sample z-test data: x z = 1.708, n = 10.000, Std. Dev. = 0.050, Std. Dev. of the sample mean = 0.016, p-value = 0.08771 alternative hypothesis: true mean is not equal to 0.8 95 percent confidence interval: 0.796 0.858 sample estimates: mean of x 0.827 > > # Gauß-Test auf Überschreitung > q1

  • 22

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    xquer sigma s mu0 tgs q P [1,] 0.827 0.05 0.04877 0.8 1.708 1.645 0.04385 > z.test(x, mu=mu0, stdev=sigma, alternative = "greater", conf.level=0.95) One Sample z-test data: x z = 1.708, n = 10.000, Std. Dev. = 0.050, Std. Dev. of the sample mean = 0.016, p-value = 0.04385 alternative hypothesis: true mean is greater than 0.8 95 percent confidence interval: 0.801 Inf sample estimates: mean of x 0.827 > # > # Gütefunktionswert (1-seitiger Gauß-Test) an der Stelle mu=xquer > alpha=0.05; mu delta power print(cbind(alpha, delta, sigma, power)) alpha delta sigma power [1,] 0.05 0.54 0.05 0.525 > # > # Lösung mit R-Funktion pwr.norm.test() > library(pwr) > pwr.norm.test(d=delta,n=n, sig.level=alpha, alternative="greater") Mean power calculation for normal distribution with known variance d = 0.54 n = 10 sig.level = 0.05 power = 0.525 alternative = greater > # > # Planung des Mindest-n beim 1-seitigen Gauß-Test (Überschreitung) > alpha=0.05; power=0.9 # power=1-beta > mu qa # Lösung mit R-Funktion pwr.norm.test() > library(pwr) > pwr.norm.test(d=delta, power=power, sig.level=alpha, alternative="greater") Mean power calculation for normal distribution with known variance d = 0.54 n = 29.37 sig.level = 0.05 power = 0.9 alternative = greater

    4.2 Signifikante und nichtsignifikanten Testergebnisse erkennen und interpretieren können.

    • Schlussweise der Signifikanzprüfung am Beispiel des 1-seitigen Gauß-Tests auf Überschreitung:

  • 23

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    Wenn H0 gilt, dann ist ein P-Wert kleiner als α unwahrscheinlich. Aus einer Zufallsstichprobe ergibt sich P < α. Daher: H0 gilt nicht (genauer: ist unwahrscheinlich).

    Dieses Schema erinnert an die Beweisführung „reductio ad absurdum“ (Widerspruchsbeweis): Um eine Aussage A indirekt zu beweisen, wird die Annahme gemacht, die Aussage ist falsch, und aus der Negation der Aussage etwas abgeleitet, was offensichtlich falsch ist. Es folgt, dass A richtig ist.

    • Signifikante und nichtsignifikante Testergebnisse

    Abb. 4.3: Schema der Entscheidungsfindung beim Signifikanztest. Vorgegeben sind die Fehlerschranken α (z.B. 5%) und β (z.B. 10%). Ist der P-Wert kleiner als α, wird H0 abgelehnt, also für H1 entschieden. Andernfalls, d.h. für P ≥ α wird eine Poweranalyse (oder die Berechnung des Mindest-n) angeschlossen. Wenn die Power größer oder gleich 1-β ist (oder der Mindest-n ≥ dem Umfang der verwendeten Zufallsstichprobe ist), wird H0 angenommen.

    4.3 Mit dem 1-Stichproben-t-Test kann feststellen können, ob der Mittelwert einer normalverteilten Zufallsvariablen X von einem vorgegebenen Sollwert abweicht bzw. diesen unter- oder überschreitet. Ablaufschema:

    • Beobachtungsdaten und Modell: Es liegen n Beobachtungswerte x1, x2,…, xn mit dem arithmetischen Mittel x vor. Jedes xi ist die Realisierung einer

  • 24

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    N(µ, σ2)-verteilten Zufallsvariablen Xi (i=1,2,…,n), mit denen das Stichprobenmittel X sowie die Stichprobenvarianz S2 gebildet werden.

    • Hypothesen und Testgröße: Der Vergleich des Parameters µ mit einem vorgegebenen Sollwert µ0 erfolgt nach einer der folgenden Testvarianten:

    - H0: µ = µ0 gegen H1 : µ ≠ µ0 (Variante II, 2-seitiger Test) - H0: µ ≤ µ0 gegen H1 : µ > µ0 (Variante Ia, 1-seitiger Test auf

    Überschreitung) - H0: µ ≥ µ0 gegen H1 : µ < µ0 (Variante Ib, 1-seitiger Test auf

    Unterschreitung)

    Als Testgröße wird das studentisierte Stichprobenmittel

    nS

    XTG

    /0µ−=

    verwendet, das bei Gültigkeit von H0 (d.h. für µ=µ0) t-verteilt mit dem Freiheitsgrad f=n-1 ist. Ersetzt man X durch das arithmetische Mittel x und S durch die empirische Standardabweichung s, erhält man die Realisierung TGs der Testgröße.

    • Entscheidung: Testentscheidung mit dem P-Wert: Bei vorgegebenem Signifikanzniveau α wird H0 abgelehnt, wenn der P-Wert kleiner als α ist. Die Berechnung des P-Wertes erfolgt für die Testvariante Ia mit der Formel P=1 - Fn-1(TGs), für die Variante Ib mit der Formel P= Fn-1 (TGs), bzw. für die zweiseitige Testvariante II mit P= 2 Fn-1(-|TGs|). Fn-1 bezeichnet die Verteilungsfunktion der tn-1 -Verteilung Testentscheidung über die Bestimmung des Ablehnungsbereiches: H0 abgelehnt, wenn TGs > tn-1, 1-α (Variante Ia) bzw. TGs < - tn-1, 1-α (Variante Ib) bzw. |TGs| > tn-1, 1-α/2 (Variante II) gilt. Dabei bezeichnen tn-1, 1-α und tn-1, 1-α/2 das (1-α)- bzw. das (1-α/2)- Quantil der tn-1 - Verteilung.

    • Planung des Stichprobenumfangs Um auf dem Niveau α mit der Sicherheit 1- β eine Entscheidung für H1 herbeizuführen, wenn µ von µ0 um ∆ ≠ 0 im Sinne der

  • 25

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    Alternativhypothese abweicht, kann im Falle der 1-seitigen Testvarianten Ia und Ib der erforderliche Mindeststichprobenumfang näherungsweise aus

    ( ) 21122

    βασ

    −− +∆≈ zzn

    bestimmt werden. Im Falle der 2-seitigen Testvariante II ist α durch α/2 zu ersetzen. Bei Anwendung dieser Formeln muss ein Schätzwert für σ zur Verfügung stehen. Die Formeln stimmen mit den entsprechenden Formeln beim Gauß-Test überein, ergeben aber auf Grund der Näherungen nur Richtwerte für den erforderlichen Mindeststichprobenumfang.

    Beispiel 4.3: In einem Experiment wurde die Selbstentladung von wiederaufladbaren NiMH-Gerätezellen mit einer Kapazität (in mAh) von 2000 überprüft. Laut Hersteller soll die Kapazität X nach 12 Monaten 85% des Anfangswertes, also µ0=1700, betragen.

    a) Es ist zu zeigen, dass das Experiment mit 30 Zellen durchgeführt werden müsste, damit der t-Test auf 5%igem Niveau eine Sollwertabweichung in der Höhe von ∆=60 mit einer Sicherheit von 90% feststellen kann. Dabei möge die Annahme zutreffen, dass die Kapazität X normalverteilt sei und für σ der Schätzwert 100ˆ =σ zur Verfügung steht.

    b) Die Ausführung des Experimentes hat die folgenden Messwerte ergeben: 1590, 1620, 1670, 1790, 1670, 1580, 1470, 1690, 1680, 1890, 1560, 1610, 1670, 1450, 1690, 1710, 1670, 1810, 1580, 1560, 1680, 1730, 1680, 1550, 1760, 1750, 1530, 1540, 1690, 1730. Es ist mit dem 2-seitigen t-Test zu zeigen, dass das arithmetische Mittel der Prüfstichprobe signifikant (α=5%) vom Sollwert µ0=1700 abweicht.

    Lösung mit R: > # Beispiel 4.2 > # a) Planung des Stichprobenumfangs > mu0

  • 26

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    > x n

  • 27

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    Testgröße: Anzahl TG=H= Xn der Beobachtungen in der Klasse 1; TG ~ Bn,p0 für p=p0. Normalverteilungsapproximation (Voraussetzung: np0(1-p0)>9):

    00

    00

    0 :Hfür )1,0(~)1(

    * ppNpnp

    npHTG =

    −−

    =

    Für die konkrete Beobachtungsreihe ist H=h.

    • Entscheidung:

    Testentscheidung mit dem P-Wert: Bei vorgegebenem Signifikanzniveau α wird H0 abgelehnt, wenn der P-Wert kleiner als α ist. Exakter Binomialtest: Testvariante Ia: P=1 - FB(h-1) Testvariante Ib: P= FB(h) Testvariante II: P= FB (np0-d)+1- FB (np0+d-1) FB bezeichnet die Verteilungsfunktion der Bn,p0-Verteilung, d=|h-np0|. Approximativer Binomialtest (mit Stetigkeitskorrektur) Testvariante Ia: P≈ 1-FN(h-0.5) Testvariante Ib: P≈ FN(h+0.5) Testvariante II: P≈ 2FN(np_0-d+0.5) FN ist die Verteilungsfunktion der N(µ, σ2)-Verteilung mit µ=np0 und σ02=np0(1-p0); d=|h-np0| ist die Abweichung der beobachteten Anzahl vom Mittelwert2.

    (Approximative) Testentscheidung mit dem Ablehnungsbereich: H0 wird abgelehnt, wenn TG*s-p0>0.5+z1-α σ0 (Variante Ia) bzw. TG*s-p0>0.5-z1-α σ0 (Variante Ib) bzw. |TG*s-p0|> 0.5+ z1-α/2 σ0 (Variante II) gilt. z1-α und z1-α/2 sind das (1-α)- bzw. das (1-α/2)- Quantil der N(0, 1)-Verteilung und σ02=np0(1-p0).

    • Planung des Stichprobenumfangs

    Um auf dem Niveau α mit der Sicherheit 1- β eine Entscheidung für H1 herbeizuführen, wenn p von p0 um ∆ ≠ 0 im Sinne der

    2 Den P-Wert des exakten Binomialtests erhält man in R mit der Funktion binom.test(), den P-Wert des approximativen Binomialtests (mit und ohne Stetigkeitskorrektur) mit prop.test().

  • 28

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    Alternativhypothese abweicht, kann im Falle der 1-seitigen Testvarianten Ia und Ib das erforderliche Mindest-n näherungsweise aus

    ( )( ) ;arcsin2arcsin2 20

    211

    pp

    zzn

    +≈ −− βα

    Bestimmt werden; im Falle der 2-seitigen Testvariante II ist z1-α durch z1-α/2 zu ersetzen

    3. Beispiel 4.4: Mit einer neuen Behandlungsmethode will man die Erfolgsrate p (d.h. die Wahrscheinlichkeit, dass bei einer mit der neuen Methode behandelten Person eine Verbesserung eintritt) von mehr als p0=0.7 erreichen. In einer Studie mit 100 Probanden ist die neue Methode bei h=80 Personen erfolgreich, der beobachtete Stichprobenanteil h/n=0.8 überschreitet also den Sollwert p0=0.7. Es ist a) zu zeigen, dass die Überschreitung auf 5%igem Niveau signifikant ist, und b) der erforderliche Mindeststichprobenumfang zu berechnen, damit der (approximative) Binomialtest mit 90%iger Sicherheit ein auf 5%igem Testniveau signifikantes Ergebnis liefert, wenn der Sollwert um den Betrag ∆=0.1 überschritten wird. Lösung mit R: > # Beispiel 4.3 > options(digits=4) > p0 binom.test(h, n, p=p0, alternative="greater") Exact binomial test data: h and n number of successes = 80, number of trials = 100, p-value = 0.01646 alternative hypothesis: true probability of success is greater than 0.7 95 percent confidence interval: 0.7228 1.0000 sample estimates: probability of success

    3 Der Näherung liegt die sogenannte Arcus-Sinus-Transformation zugrunde, mit der der

    Stichprobenanteil H/n (die Anzahl H ist Bn, p-verteilt) in die Zufallsvariable nHY /arcsin2* = .

    Wie man zeigen kann, nähert sich mit wachsendem n die Verteilung von Y* einer Normalverteilung mit

    dem Mittelwert pY arcsin2* =µ und der konstanten Varianz σ2Y*=1/n. Die Näherung ist in der R-Funktion pwr.p.test() im Paket "pwr" implementiert, mit der erforderliche Mindeststichprobenumfangs geplant und Gütefunktionswerte berechnet werden können.

  • 29

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    0.8 > # P-Wert (approximativer Binomialtest) > n*p0*(1-p0) # Voraussetzung für Approximation >9! [1] 21 > d prop.test(h, n, p=p0, alternative="greater") 1-sample proportions test with continuity correction data: h out of n, null probability p0 X-squared = 4.298, df = 1, p-value = 0.01908 alternative hypothesis: true p is greater than 0.7 95 percent confidence interval: 0.7212 1.0000 sample estimates: p 0.8 > # > # b) Mindesstichprobenumfang > # Lösung mit Näherungsformel im Skriptum > beta ES pwr.p.test(h = ES, sig.level = 0.05, power = 0.9, + alternative = "greater") proportion power calculation for binomial distribution (arcsine transformation) h = 0.232 n = 159.1 sig.level = 0.05 power = 0.9 alternative = greater

    4.5 Die Annahme normalverteilter Stichprobenwerte überprüfen können.

    • Grafische Überprüfung der Normalverteilungsannahme mit dem Normal-QQ-Plot: Mit dem Normal-Quantil-Quantil-Diagramm (kurz Normal-QQ-Plot) kann man an Hand der Werte x1, x2, …, xn einer Zufallsstichprobe von X auf grafischem Wege beurteilen, ob die Daten gegen die Annahme „X ist normalverteilt“ sprechen (vgl. Abb. 4.4).

    Theoretische Grundlage: - Wenn X N(µ, σ2) – verteilt ist, besteht zwischen dem p-Quantil xp von X

    und dem entsprechenden Quantil zp der N(0, 1)-verteilten Zufallsvariablen Z=(X-µ)/σ der lineare Zusammenhang xp = σ zp + µ. Die Punkte P(zp, xp) mit den für verschiedene Werte von p (0

  • 30

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    < p < 1) berechneten Quantilen von Z und X als Koordinaten) liegen im (Z, X)-Koordinatensystem auf einer Geraden mit dem Anstieg σ und dem y-Achsenabschnitt µ.

    Abb. 4.4: Normal-QQ-Plots für zwei Zufallsstichproben (jeweils vom Umfang n=30). Die QQ-Plots enthalten auch die Orientierungsgeraden durch die den unteren und oberen Quartilen entsprechenden Punkte. Links sind die Dichtekurven der Grundgesamtheiten dargestellt, aus denen die Stichproben generiert wurden (oben: Normalverteilung mit µ=5 und σ=0.25, unten: logarithmische Normalverteilung mit µ=-0.2 und σ=1). Man erkennt, dass im oberen QQ-Plot die Punkte angenähert entlang der Orientierungsgeraden angeordnet sind; die Abweichung von der Normalverteilung zeigt sich im unteren QQ-Plot in den (vor allem an den Enden) von der Orientierungsgeraden wegdriftenden Punkten. Bei kleineren Stichprobenumfängen kann es auch bei normalverteilter Grundgesamtheit zu deutlichen Abweichungen von der Orientierungsgeraden kommen.

    - Mit den unteren Quartilen z0.25 und x0.25 sowie den oberen Quartilen

    z0.75 und x0.75 von Z bzw. X können die Geradenparameter ausgedrückt werden durch:

    25.075.0

    25.075.075.025.0

    25.075.0

    25.075.0 ,zz

    zxzx

    zz

    xx

    −−

    =−−

    = µσ

    - Die (nach aufsteigender Größe angeordneten) Stichprobenwerte x(i)

    werden als (empirische) Quantile von X gedeutet, die entsprechenden

  • 31

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    „Unterschreitungswahrscheinlichkeiten“ pi ermittelt und dazu die Quantile zpi=φ-1(pi) der N(0, 1)-Verteilung berechnet.

    - Nach Definition des p-Quantils xp einer Beobachtungsreihe muss der Anteil der Werte kleinergleich xp mindestens p und der Anteil der Werte größergleich xp mindestens 1-p betragen, d.h. von pi ist zu verlangen:

    i/n ≥ pi und (n-i+1)/n ≥ 1-pi d.h. (i-1)/n ≤ pi ≤ i/n.

    - Zur Fixierung von pi auf einen Wert des Intervalls verwenden wir die

    Festlegung: Für n>10 ist pi einfach die Intervallmitte (i-0.5)/n, für n ≤ 10 wird pi aus der Formel pi = (i- 3/8)(n + ¼) bestimmt4.

    Beispiel 4.5a: Dem Normal-QQ-Plot von Abb. 4.4 liegt die folgende Zufallsstichprobe von n=30 Realisierungen der mit µ=5 und σ=0.25 normalverteilten Zufallsvariablen X zugrunde:

    4.50, 4.51, 4.61, 4.68, 4.72, 4.72,, 4.78, 4.80, 4.81, 4.82, 4.85, 4.85, 4.94, 4.95, 4.98, 5.01, 5.02, 5.06, 5.12, 5.15, 5.16, 5.16, 5.17, 5.20, 5.21, 5.23, 5.27, 5.32, 5.56, 5.62.

    Man erzeuge das Normal-QQ-Plot mit R; ferner berechne man die Koordinaten des ersten Punktes P1=(φ-1(p1), x(1)) und die Parameter der Orientierungsgeraden durch (z025, Q1) und (z075, Q3). Lösung mit R: > # Beispiel 4.5 > x # Normal-QQ-Plot > qqnorm(x, xlab = "N(0,1)-Quantile", ylab = "empirische Quantile") > qqline(x, probs = c(0.25, 0.75)) > # Berechnung der Koordinaten von P1: > sort(x); > n p1 x025

  • 32

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    -2 -1 0 1 2

    4.6

    4.8

    5.0

    5.2

    5.4

    5.6

    Normal Q-Q Plot

    N(0,1)-Quantile

    empi

    risch

    e Q

    uant

    ile

    • Prüfung der Normalverteilungsannahme mit dem Shapiro-Wilk-Test

    Der Shapiro-Wilk-Test wurde speziell zur Überprüfung der Annahme (=Nullhypothese) entwickelt, dass eine metrische Zufallsvariable X normalverteilt ist. Die Nullhypothese wird auf dem Niveau α abgelehnt, wenn der P-Wert kleiner als α ist.

    Theoretischer Hintergrund: Die Teststatistik W des Shapiro-Wilk-Tests ist als Quotient von zwei Schätzfunktionen für die Varianz σ2 der hypothetischen Normalverteilung konstruiert. Die eine Schätzfunktion (im Nenner) ist die Stichprobenvarianz, die andere (im Zähler) hängt mit dem Anstieg der Orientierungsgeraden im QQ-Plot zusammen. Die Berechnung der Teststatistik ist aufwendig und praktisch nur mit einschlägiger Software zu bewältigen5. Für die Interpretation ist wichtig zu wissen, dass W nichtnegativ ist und den Wert 1 nicht überschreiten kann. Wenn H0 (Normalverteilungsannahme) gilt, dann nimmt W Werte nahe bei 1 an, kleinere Werte von W sprechen gegen H0. Z.B. ist bei einem Stichprobenumfang n=10 die Nullhypothese auf 5%igem Signifikanzniveau abzulehnen, wenn W den kritischen Wert 0.842 unterschreitet.

    Beispiel 4.5b: Es soll gezeigt werden, dass die Stichprobewerte von Aufgabe 4.5 mit der Annahme einer normalverteilten Grundgesamtheit X vereinbar sind.

    5 Z.B. mit der R-Funktion shapiro.test(), die die Teststatistik und den P-Wert anzeigt.

  • 33

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    Lösung mit R: > # Beispiel 4.6 > x # Hypothesen: > # H0: X ist normalverteil gegen H1: X ist nicht normalverteilt > shapiro.test(x) Shapiro-Wilk normality test data: x W = 0.9756, p-value = 0.7014

    Wegen p-value = 70.14% ≥ 5% kann H0 (Stichprobenwerte nicht in Widerspruch zur Normalverteilungsannahme) nicht abgelehnt werden. 4.6 Einen Ausreißer in einer normalverteilten Zufallsstichprobe identifizieren können.

    • Theoretischer Grundlage: - X ~ N(µ, σ2) � P(X < µ-4σ)+P(X > µ+4σ)= 0.0063%

    Tritt ein Wert außerhalb des 4-fachen Sigma-Bereichs auf, so steht er im Verdacht, dass er keine Realisierung von X ist, sondern z.B. durch einen Datenfehler oder einen Störeinfluss bei der Messung zustande gekommen ist.

    - Mutmaßliche Ausreißer sollten jedenfalls dokumentiert und nur dann aus der Stichprobe entfernt werden, wenn es dafür einen sachlogischen Grund gibt.

    - Zur Identifizierung eines Stichprobenwerts als Ausreißer gibt es einfache Kriterien - z.B. die Unter- bzw. Überschreitung der mit dem Interquartilabstand IQR gebildeten robusten Grenzen Q1-1.5 IQR bzw. Q3+1.5 IQR (Boxplot!) - oder spezielle Testverfahren.

    • Grubbs-Test zur Identifizierung eines einzelnen Ausreißers:

    - Voraussetzung: X ~ N(µ, σ2); Überprüfung mit einem Normal-QQ-Plot

    - Testentscheidung: H0: „Der Wert mit dem größten Abstand vom arithmetischen Mittel ist kein Ausreißer“ wird auf dem Testniveau α abgelehnt, wenn

    2

    2

    ,,...,1

    2

    1

    max

    cn

    c

    n

    ng

    s

    xxG n

    ini

    s +−−=>

    −= = α

    gilt; dabei ist c das α/(2n)-Quantil der t-Verteilung mit f=n-2 Freiheitsgraden.

  • 34

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    Beispiel 4.6: Durch einen Eingabefehler möge der zehnte Wert x10=5.17 der Stichprobe im vorangehenden Beispiel auf 1.17 verfälscht. Man zeige, dass dieser Wert mit dem Grubbs-Test auf 5%igem Niveau als Ausreißer identifiziert werden kann. Lösung mit R: > # Beispiel 4.7 > options(digits=4) > x # Prüfung der Normalverteilungsannahme mit dem Normal-QQ-Plot > qqnorm(x, xlab = "N(0,1)-Quantile", ylab = "empirische Quantile") > qqline(x, probs = c(0.25, 0.75)) > # Grubbs-Test: > # H0: extremer Wert ist Ausreißer, wenn Gs > Gkrit > n mw Gs alpha

  • 35

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    12. An Hand einer Stichprobe mit dem Umfang n=10 und dem arithmetischen Mittel

    x =0.827 soll mit dem Gauß-Test geprüft werden, ob der Mittelwert eines N(µ, σ2)-verteilten Untersuchungsmerkmals X den Sollwert µ0=0.8 überschreitet. Dabei sei σ=0.05 und α=1%. Ist die Überschreitung signifikant? Man bestimme ferner die Wahrscheinlichkeit einer Testentscheidung für H1, wenn die Überschreitung ∆=0.027 beträgt.

    13. Es soll die Abweichung einer Messgröße X von einem vorgegebenen Sollwert µ0=1.5 geprüft werden. Da X als normalverteilt angenommen werden kann und überdies ein genauer Schätzwert für die Standardabweichung, nämlich σ̂ =0.3, bekannt ist, wird die Prüfung mit dem 2-seitigen Gauß-Test vorgenommen und dabei das Signifikanzniveau α=5% vereinbart. Wie groß ist der Stichprobenumfang zu planen, damit man mit dem Test eine kritische Abweichung von 10% des Sollwerts mit 80%iger Sicherheit als signifikant erkennen kann.

    14. Von einer Messstelle wurden die folgenden Werte der Variablen X (SO2-Konzentration der Luft in mg/m3) gemeldet: 32, 41, 33, 35, 34. a) Weicht die mittlere SO2-Konzentration signifikant vom Wert µ0=30 ab? Als Testniveau sei α=5%$ vereinbart. b) Welcher Mindeststichprobenumfang müsste geplant werden, um mit dem Test eine Abweichung vom Referenzwert m0 um 5% (des Referenzwertes) mit einer Sicherheit von 95% erkennen zu können?

    15. Bei einer Untersuchung der Cd-Belastung von Forellen in einem Fließgewässer

    wurden n=10 Forellen gefangen und der Cd-Gehalt X (in µg/g Frischgewicht) bestimmt. Die Auswertung ergab den Mittelwert x =62 und die Standardabweichung s=7. a) Kann aus den Angaben geschlossen werden, dass der mittlere Cd-Gehalt signifikant (α=5%) über dem vorgegebenen Referenzwert µ0=60 liegt? b) Wie groß ist die Wahrscheinlichkeit, dass man mit dem Test eine Überschreitung des Referenzwerts in der Höhe der beobachteten Überschreitung als signifikant erkennt?

    16. Bei der Inbetriebnahme einer Anlage zur Abfüllung einer Lösung in Flaschen mit

    der Nennfüllmenge von 0.5l wurden in einem Probebetrieb die folgenden Füllmengen X (in l) gemessen: 0.491, 0.488, 0.493, 0.538, 0.493, 0.478, 0.506, 0.459, 0.471, 0.480. a) Kann man aus den Daten schließen, dass die Nennfüllmenge nicht erreicht wird? Das Testniveau sei mit α=0.01 festgelegt. b) Ist der Stichprobenumfang ausreichend groß, um eine Unterschreitung in der Höhe von 10ml mit einer Sicherheit von 90% feststellen zu können?

    17. Die Verpackung einer bestimmten Zigarettensorte weist einen mittleren Nikotingehalt von 15 mg pro Zigarette aus. Es wird eine Zufallsstichprobe von 100 Zigaretten getestet. Dabei ergaben sich ein mittlerer Nikotingehalt von 16.5 mg und eine Standardabweichung von 4 mg. Kann aus dem Ergebnis der Stichprobe auf 1%igem Signifikanzniveau der Schluss gezogen werden, dass der tatsächliche Nikotingehalt im Mittel über 15 mg liegt? (Überschreitung sign.)

  • 36

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    18. Es sei X eine normalverteilte Umweltmessgröße mit dem (unbekannten) Mittelwert µ und der Standardabweichung σ=10. Mit Hilfe einer Stichprobe soll geprüft werden, ob eine Überschreitung des Grenzwertes K vorliegt, wobei das α-Risiko mit 5% vorgegeben ist und eine kritische Überschreitung von 6.5 mit 90%iger Sicherheit erkannt werden soll. Welcher Stichprobenumfang ist zu planen? (21)

    19. Von einer Messstelle wurden die folgenden Werte der Variablen X (SO2-

    Konzentration der Luft in mg/m3) gemeldet: 32, 41, 33, 35, 34. a) Weicht die mittlere SO2-Konzentration signifikant vom Wert µo=30 ab? (α=5%) b) Welcher Mindeststichprobenumfang müsste in 6 geplant werden, um mit dem Test eine Abweichung vom Referenzwert µo um 5% (des Referenzwertes) mit einer Sicherheit von 95% erkennen zu können? (sign. Abweichung; 73)

    20. Es sei X eine normalverteilte Messgröße mit der Varianz 0,25; für X ist der

    Nennwert 1,75 vorgegeben. Zur Prüfung auf eine allfällige Abweichung vom Nennwert wird der t-Test eingesetzt; als Testniveau ist 5% vorgesehen. Wie groß muss der Stichprobenumfang geplant werden, um eine kritische Abweichung um 0,15 Einheiten mit 90%iger Sicherheit erkennen zu können? (117)

    21. Die Messung der Ozonkonzentration während der Sommermonate ergab für eine

    Großstadt die in der folgenden Tabelle enthaltenen Werte (Angaben in 10-2 ppm). a) Liegt die mittlere Ozonkonzentration signifikant über dem Wert µo=5? b) Welcher Mindeststichprobenumfang müsste geplant werden, um mit dem Test eine Überschreitung von µo um 10% mit einer Sicherheit von 90% erkennen zu können? (α = 5%) (Überschreitung n. sign.; 93)

    2.5 3.0 5.6 4.7 6.5

    6.7 1.7 5.3 4.6 7.4

    5.4 4.1 5.1 5.6 5.4

    6.1 7.6 6.2 6.0 5.5

    5.8 8.2 3.1 5.8 2.6

    22. In einer Studie wurde u.a. das Ges. Eiweiß i.S. am Beginn und am Ende einer

    Behandlung bestimmt. Bei 40 Probanden war eine Veränderung zu beobachten: 27 Probanden, bei denen der Eiweißwert vorher im Normbereich lag, wiesen nachher einen Wert außerhalb des Normbereichs auf; bei 13 Probanden lag der Eiweißwert vorher außerhalb und nachher im Normbereich. a) Man prüfe auf 5%igem Niveau, ob der Anteil der Probanden, bei denen der Eiweißwert vorher außerhalb und nachher innerhalb des Normbereichs lag, signifikant von 0.5 abweicht. b) Welcher Stichprobenumfang müsste geplant werden, damit der approximative) Binomialtest mit 90%iger Sicherheit ein signifikantes (a=5%) Ergebnis liefert, wenn p=p0+0.15 ist?

    23. Im Rahmen einer Untersuchung des Ernährungsstatus von Schulkindern wurde

    u.a. das Gesamtcholesterin erfasst. In einer Stichprobe aus den Kindern der Volksschule einer bestimmten Region war der Cholesterinwert bei 45 von 75 Kindern im Normbereich. a) Man prüfe auf 5%igem Niveau, ob der Anteil der Schulkinder im Normbereich signifikant über 50% liegt.

  • 37

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    b) Man bestimme die Wahrscheinlichkeit (Power), mit dem Test eine berschreitung von p0 um ∆=0.1 als signifikant zu erkennen.

    24. Von einer Abfüllanlage sei bekannt, dass die abgefüllten Einheiten nur mit 5%iger

    Wahrscheinlichkeit nicht eine vorgegebene Mindestmenge aufweisen. Nach einer Neueinstellung der Anlage wurden im Probelauf 150 Packungen zufällig ausgewählt und dabei festgestellt, dass in 4 Fällen die Mindestmenge nicht erreicht wurde. Die Frage ist, ob dieses Ergebnis eine signifikante Unterschreitung des Sollwertes p0=5% anzeigt (α=5%).

    25. Für eine Blumenzwiebelsorte wird eine Keimfähigkeit von mindestens 75%

    garantiert. In einer Stichprobe von n=60 keimten 35 Zwiebeln. a) Liegt eine signifikante Abweichung vom garantierten Ergebnis vor? Man prüfe diese Frage auf dem Signifikanzniveau α=5%. b) Welche Fallzahl ist notwendig, um eine Unterschreitung des garantierten Anteils um 0.1 mit einer Sicherheit von 90% feststellen zu können? (Unterschreitung sign.; 214)

    26. In einer Studie über die Behandlung von akuten Herzinfarktpatienten wurde einer

    Standardtherapie mit einer neuen Therapie verglichen. Es wurden 160 Patienten mit der neuen Therapie behandelt, von denen 20 innerhalb von 4 Wochen verstarben. Bei Anwendung der Standardtherapie muss eine Sterbewahrscheinlichkeit von po =0,2 angenommen werden. Man prüfe mit dem Binomialtest, ob die neue Therapie ein signifikant unter po =0,2 liegendes Sterberisiko ergibt (α=5%). (Unterschr. sign.)

    27. In sogenannten Fall-Kontroll-Studien werden Vierfeldertafeln verwendet, um die

    Verteilung eines (zweistufigen) Risikofaktors (Raucher/Nichtraucher) in einer Testgruppe und einer Kontrollgruppe darzustellen. Die Tabelle zeigt die (hypothetische) Vierfeldertafel einer Fall-Kontroll-Studie.

    Testgruppe Kontrolle

    Raucher Nichtraucher

    87 60

    78 45

    a) Man prüfe für die Testgruppe, ob der Anteil der Raucher signifikant über

    p0=0,5 liegt. (α=5%)? (Überschr. sign.) b) Welcher Mindeststichprobenumfang müsste geplant werden, um mit dem

    Binomialtest eine Überschreitung von p0 =0,5 um 0,05 Einheiten mit einer Sicherheit von 80% erkennen zu können? (700)

    28. Es soll gezeigt werden, dass die Stichprobewerte 210, 199, 195, 210, 217, 226,

    220, 221, 182 mit der Annahme einer normalverteilten Grundgesamtheit X vereinbar sind. Man führe den Nachweis auf 5%igem Testniveau.

    29. Von einer Pflanze erhielt Mendel (1866) insgesamt 62 Samen von denen 44 gelb

    und 18 grün gefärbt waren. Man zeige, dass das Verhältnis 44:18 der beobachteten Anzahlen nicht "signifikant" vom theoretischen Aufspaltungsverhältnis 3:1 abweicht ( = 5%)?

  • 38

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    30. In einer Studie mit 5 Probanden wurde eine bestimmte Zielgröße X am Studienbeginn (Xb) und – nach erfolgter Behandlung - am Studienende (Xe) gemessen.

    a) Man erfasse die Wirkung der Behandlung durch die Differenz Y= Xe - Xb und prüfe, ob der Mittelwert von Y signifikant von Null abweicht (α=5%). (nein)

    b) Was kann über die Versuchsplanung in a) gesagt werden? Welcher Mindeststichprobenumfang müsste geplant werden, um mit dem Test eine Abweichung von Null in der Höhe von 50% des Mittelwerts von Y mit einer Sicherheit von 90% als signifikant erkennen zu können? (50)

    31. Mit einem statistischen Test soll geprüft werden, ob die Alternativhypothese H1

    (z.B. Messgröße überschreitet im Mittel einen vorgegebenen Grenzwert) zutrifft, also die Nullhypothese H0 abgelehnt werden kann. Als Testniveau sei 5% vorgegeben, d.h. für die Wahrscheinlichkeit einer irrtümlichen Entscheidung gegen H0 soll gelten: P(Entscheidung für H1|H0) = 5%. Der Versuch wurde mit der Power P(Entscheidung für H1|H1) = 90% geplant. Wie groß ist die posteriori Wahrscheinlichkeit P(H1|Entscheidung für H1), wenn die a-priori Wahrscheinlichkeit dafür, dass H1 zutrifft, gleich 5% ist? (48,6%)

    32. Die folgende Tabelle enthält Produktivitätsdaten von 60 Kohorten von je 15

    weiblichen Tsetsefliegen. Als Produktivitätsmaß wird die Anzahl Y der Puparien verwendet, die in einer Kohorte bis zum 78ten Lebenstag abgelegt werden. a) Man vergleiche den Mittelwert von Y mit dem Wert 55; liegt eine signifikante Abweichung vor?

    Liegt die Standardabweichung signifikant über dem Wert 10? (jeweils 5%-Testniveau) (Mittelwert: Abw. nicht sign., Standardabweichung: Überschr. sign.)

    b) Welcher Stichprobenumfang müsste geplant werden, um eine Abweichung des Mittelwerts (vom Referenzwert) in der beobachteten Höhe mit 90%iger Sicherheit erkennen zu können? (162)

    c) Man stelle fest, ob die Werte der Variablen Y im Einklang mit der Annahme „H0: Y ist normalverteilt“ stehen (α = 5%).

    33. Zur Untersuchung der Frage, welchen Anteil die Skelettmasse an der

    Körpermasse bei Vögeln bzw. Säugetieren hat, wurden für verschiedene Vögel und Säugetiere die Skelettmasse Y und die Körpermasse X (alle Angaben in kg) bestimmt. Jemand behauptet, dass die Skelettmasse 5% der Körpermasse ausmacht. Stehen die folgenden Daten in Widerspruch zu dieser Aussage? Man

    Nr. Y Nr. Y Nr. Y Nr. Y Nr. Y Nr. Y 1 72 11 54 21 67 31 51 41 59 51 58 2 81 12 57 22 59 32 69 42 65 52 58 3 55 13 69 23 49 33 64 43 60 53 60 4 55 14 62 24 51 34 68 44 43 54 66 5 50 15 73 25 65 35 73 45 52 55 75 6 53 16 58 26 56 36 81 46 57 56 41 7 70 17 46 27 58 37 54 47 37 57 40 8 79 18 50 28 67 38 65 48 39 58 51 9 42 19 27 29 66 39 58 49 49 59 37

    10 69 20 68 30 74 40 61 50 51 60 38

    Xb 57 73 44 27 32 Xe 59 74 46 26 35

  • 39

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    nehme eine Überprüfung auf 5%igem Niveau für Vögel und Säugetiere vor. (Vögel: ja, Säugetiere: ja)

    Vögel Säugetiere Y X Y X

    1,995 40,667 0,193 3,35 0,072 1,225 0,227 3,915 0,0054 0,163 0,0003 0,0063 0,203 2,504 0,039 0,79 0,043 0,701 0,027 0,82 0,027 0,416 0,244 4,836 0,186 2,379 0,002 0,03 0,0058 0,124 0,015 0,275 0,028 0,427 0,02 0,365

    0,00174 0,031 0,0025 0,03 0,00182 0,029 0,0076 0,115 0,00102 0,02 1,146 22,7 0,024 0,383 0,748 11,95

    0,00618 0,144 0,25 3,395 0,00184 0,038 0,107 2,46 0,00297 0,069 0,224 4,26 0,00183 0,045 0,233 4,21 0,00076 0,013 0,0173 0,35 0,00128 0,023 0,27 4,45 0,00049 0,0087 0,448 6,725 0,00062 0,0126 0,135 1,56

  • 40

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    5 ZWEISTICHPROBENVERGLEICHE MIT METRISCHEN UNTERSUCHUNGSMERKMALEN

    5.1 Die Versuchsanlagen „Parallelversuch“ und „Paarvergleich“ zum Vergleich von zwei Merkmalen unterscheiden können. Parallelversuch:

    • grundlegende Versuchsanlage, um unter kontrollierten Bedingungen zwei Gruppen hinsichtlich eines interessierenden Untersuchungsmerkmals X (z.B. Präparatwirkung) zu vergleichen. Bei einem metrischen Untersuchungsmerkmal geht es dabei meist um einen Vergleich von Mittelwerten unter zwei Versuchsbedingungen, bei einem alternativ skalierten Untersuchungsmerkmal erfolgt der Vergleich der Gruppen in der Regel an Hand der relativen Häufigkeiten einer Merkmalsausprägung.

    • Aus einer "Zielpopulation" wird eine bestimmte Anzahl von Untersuchungseinheiten (Probanden, Patienten, Proben) ausgewählt und damit zwei (möglichst gleich große) Gruppen, sogenannte "Parallelgruppen" gebildet. Die eine Gruppe ist die Testgruppe (z.B. zur Erprobung eines neuen Präparates), die andere Gruppe in der Regel eine Kontrollgruppe (z.B. eine Placebogruppe oder eine mit einem herkömmlichen Präparat behandelte Gruppe). Durch eine zufällige Zuordnung der Untersuchungseinheiten erreicht man, dass die Gruppen "strukturgleich" sind. Das bedeutet, dass es in den Gruppen - außer den angewendeten Behandlungen - keine weiteren systematischen Einflussfaktoren gibt.

    • Organisation der Beobachtungsdaten beim Parallelversuch:

    Die Variablen X1 und X2 bezeichnen das Untersuchungsmerkmal in den Parallelgruppen; x11, x21, …, xn1,1 und x12, x22, …, xn2,2 sind die an den Untersuchungseinheiten der jeweiligen Gruppe

  • 41

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    beobachteten Werte von X1 bzw. X2. Man beachte, dass zwischen den Untersuchungseinheiten der Parallelgruppen keinerlei Beziehung besteht, die eine Anordnung in Paaren rechtfertigen würde. Vielmehr können die Untersuchungseinheiten (und entsprechend die Stichprobenwerte) der Testgruppe unabhängig von jenen der Kontrollgruppe angeordnet werden. Es ist daher üblich, den Parallelversuch auch als einen Versuch mit unabhängigen Stichproben zu bezeichnen. Die Unabhängigkeit der Stichproben kommt auch darin zum Ausdruck, dass die Stichprobenumfänge n1 und n2 der Parallelgruppen grundsätzlich verschieden sein können; dennoch sollten symmetrische Versuchsanlagen mit n1=n2 angestrebt werden, weil sie i. Allg. eine höhere Testgüte aufweisen.

    Paarvergleich (oder 2-Stichprobenproblem mit abhängigen (oder verbundenen) Stichproben:

    • Auf Grund eines sachlogischen Zusammenhangs kann jeder Wert der einen Stichprobe mit einem Wert der anderen Stichprobe zu einem Wertepaar zusammengefasst werden kann. Ein solcher Zusammenhang ist z.B. gegeben, wenn die Stichprobenwerte durch zweimaliges Beobachten an ein und derselben Untersuchungseinheit gewonnen wurden.

    • Typische Anwendungsfälle sind die sogenannten selbst-kontrollierten Versuche zur Prüfung eines allfälligen Behandlungseffektes: Um die Auswirkung einer Behandlung auf eine Zielvariable zu prüfen, werden aus einer Zielpopulation n Probanden ausgewählt und an jedem Probanden die Zielvariable vor der Behandlung (Variable X1) sowie nach erfolgter Behandlung (Variable X2) beobachtet. Von jedem Probanden liegt also ein Paar von Beobachtungswerten vor. Die aus einem Paarvergleich resultierenden Stichproben sind daher als Spalten einer Datenmatrix zu sehen, in der jede Zeile einem "Block" (z.B. einem Probanden) entspricht, über den die Stichprobenwerte zu Wertepaaren verbunden werden.

    • Organisation der Beobachtungsdaten beim Paarvergleich:

  • 42

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    Übersicht über grundlegende 2-Stichproben-Tests im Rahmen von Parallelversuchen (mit unabhängigen Stichproben) und Paarvergleichen (mit abhängigen Stichproben) für normalverteilte Untersuchungsmerkmale:

    Die Grafik enthält zusätzlich den Rangsummen-Test von Wilcoxon, den Wilcoxon-Test für Paardifferenzen sowie den Vorzeichen-Test als nichtparametrische Alternativen zum 2-Stichproben-t-Test bzw.

  • 43

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    zum Differenzen-t-Test. Den Testbezeichnungen sind die entsprechenden R-Funktionen beigefügt.

    5.2: Mit dem F-Test entscheiden können, ob die Varianzen von zwei unabhängigen Stichproben normalverteilter Variablen voneinander abweichen bzw. die eine Varianz die andere überschreitet/ unterschreitet. Ablaufschema:

    • Beobachtungsdaten und Modell: Es liegen die (voneinander unabhängigen) Stichproben x11, x21, …, xn1,1 und x12, x22, …, xn2,2 mit den Varianzen σ12 bzw. σ22 vor; die xi1 (i=1,2,…,n1) sind Realisierungen der (unabhängigen und identisch verteilten) Zufallsvariablen Xi1 ~ N(µ1, σ12); analog sind die xi2 (i=1,2,…,n2) Realisierungen der Zufallsvariablen Xi2 ~ N(µ2, σ22). Aus den Zufallsvariablen Xi1 und Xi2 werden die Stichprobenvarianzen S1

    2 bzw. S22 gebildet.

    • Hypothesen und Testgröße:

    Der Vergleich der Varianzen σ12 und σ22 erfolgt nach einer der folgenden Testvarianten: H0 : σ12 = σ22 gegen H1 : σ12 ≠ σ22 (Variante II) H0 : σ12 ≤ σ22 gegen H1 : σ12 > σ22 (Variante Ia), H0 : σ12 ≥ σ22 gegen H1 : σ12 < σ22 (Variante Ib), Als Testgröße wird das Varianzverhältnis TG=S1

    2/S22 verwendet,

    das unter H0 F-verteilt ist mit den Freiheitsgraden f1=n1-1 und f2=n2-1. Setzt man für S1

    2 und S22 die aus den beiden Stichproben

    berechneten Varianzen s12 bzw. s2

    2 ein, ergibt sich die Realisierung TGs=s1

    2/s22 der Testgröße6.

    • Entscheidung mit dem P-Wert7: P < α ⇒ H0 ablehnen; dabei ist P=1-Fn1-1, n2-1(TGs) + Fn2-1, n1-1(1/TGs)=2[1-Fn1-1, n2-1(TGs)] für die zweiseitige Testvariante II,

    6 Im Falle der Testvarianten Ia und Ib möge TGs ≥ 1 bzw. TGs ≤ 1 gelten. Im Falle der 2-seitigen Testvariante nehmen wir TGs ≥ 1 an, was durch entsprechende Bezeichnung der Stichproben stets erreicht werden kann. 7 Der P-Wert wurde als Wahrscheinlichkeit definiert, dass - bei Gültigkeit von H0 - die Testgröße einen Wert annimmt, der zumindest so extrem (in Richtung der Alternativhypothese) liegt, wie die beobachtete Realisierung. In R werden die P-Werte des F-Tests mit der Funktion var.test() bestimmt.

  • 44

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    P=1-Fn1-1, n2-1(TGs) für die Variante Ia, P=Fn1-1, n2-1(TGs) für die Variante Ib; Fn1-1, n2-1 und Fn2-1, n1-1 bezeichnen die Verteilungsfunktionen der F-Verteilung mit den Freiheitsgraden f1=n1-1, f2=n2-1 bzw. f1=n2-1, f2=n1-1.

    • Entscheidung mit dem Ablehnungsbereich: H0 wird abgelehnt, wenn TGs < Fn1-1, n2-1, α/2 oder TGs > Fn1-1, n2-1,1-α/2 (Variante II) bzw. TGs>Fn1-1, n2-1, 1-α (Variante Ia) bzw. TGs # Beispiel 5.1 (F-Test) > x1 x2 options(digits=4) > # H0: sigma1^2 = sigma2^2 gegen H1: sigma1^2 sigma2^2 > alpha Fn1-1, n2-1, 1-α/2.

  • 45

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    1.85 29.99 sample estimates: ratio of variances 7.45 Wegen P = 0.63% < 5% wird H0 abgelehnt.

    5.3 Mit dem Zwei-Stichproben-t-Test die Mittelwerte von zwei mit gleichen Varianzen normalverteilten Untersuchungsmerkmalen vergleichen können. Ablaufschema:

    • Beobachtungsdaten und Modell: Es liegen zwei (unabhängige) Beobachtungsreihen x11, x21, ..., xn1,1 bzw. x12, x22, ..., xn2,2 vor. Die Mittelwerte und Varianzen der Stichproben seien 1x und 2x bzw. s1

    2 und s22. Die

    unter der ersten Versuchsbedingung beobachteten Merkmalswerte xi1 sind Realisierungen der (unabhängigen und identisch verteilten) Zufallsvariablen Xi1 ~ N(µ1, σ21) (i=1,2,...,n1); das mit diesen Variablen gebildete Stichprobenmittel sei 1X , die Stichprobenvarianz sei S1

    2. Entsprechend sind die xi2 Realisierungen der Zufallsvariablen Xi2 ~ N(µ2, σ22) (i=1,2,...,n2), aus denen wir das Stichprobenmittel 2X sowie die Stichprobenvarianz S2

    2 bilden. Es gelte: σ21 = σ22 (Varianzhomogenität ).

    • Hypothesen: Der Vergleich der Mittelwerte µ1 und µ2 erfolgt nach einer der folgenden Testvarianten: H0: µ1 = µ2 gegen H1: µ1 ≠ µ2 (Variante II) H0: µ1 ≤ µ2 gegen H1: µ1 > µ2 (Variante Ia) H0: µ1 ≥ µ2 gegen H1: µ1 < µ2 (Variante Ib)

    • Testgröße:

    21 2

    21

    2

    21 für ~11 21

    µµ =+

    −= −+nnp

    t

    nnS

    XXTG

    mit

    2)1()1(

    21

    222

    211

    −+−+−=

    nn

    SnSnSp

  • 46

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    Ersetzt man 1X und 2X durch die arithmetischen Mittel 1x bzw. 2x sowie S1

    2 und S22 durch die Varianzen s1

    2 bzw. s22, so erhält man

    die Realisierung TGs der Testgröße. Im Falle der Testvarianten Ia und Ib möge TGs ≥ 0 bzw. TGs ≤ 0 gelten.

    • Entscheidung mit dem P-Wert9:

    P < α ⇒ H0 ablehnen; dabei ist P=2Fn1+ n2-2(-|TGs|) für die zweiseitige Testvariante II, P=1-Fn1+ n2-2(TGs) für die Variante Ia, P=Fn1+ n2-2(TGs) für die Variante Ib; Fn1+ n2-2 bezeichnet die Verteilungsfunktionen der t-Verteilung mit dem Freiheitsgrad f=n1+ n2-2.

    • Entscheidung mit dem Ablehnungsbereich:

    H0 wird auf dem Testniveau α abgelehnt, wenn |TGs | > tn1+ n2-2,1-α/2 (Variante II) bzw. TGs > tn1+ n2-2, 1-α (Variante Ia) bzw. TGs < - tn1+ n2-2,1- α (Variante Ib) gilt; Dabei bezeichnet tn1+ n2-2,γ das γ-Quantil der t-Verteilung mit dem Freiheitsgrad f=n1+n2-2.

    • Planung des Stichprobenumfangs:

    Um auf dem Niveau α mit der Sicherheit 1- β eine Entscheidung für H1 herbeizuführen, wenn µ1 von µ2 um ∆ ≠ 0 im Sinne der Alternativhypothese abweicht, kann für symmetrische Versuchsanlagen mit n1=n2=n im Falle der 2-seitigen Testvariante II der erforderliche Mindeststichprobenumfang10 näherungsweise aus

    ( ) 2 212/122

    βασ

    −− +∆≈ zzn

    Bestimmt werden. Im Falle der 1-seitigen Testvarianten Ia und Ib ist α/2 durch α zu ersetzen. Bei der Anwendung dieser Formeln muss ein Schätzwert für σ2 zur Verfügung stehen, z.B. eine Realisierung der gewichteten Stichprobenvarianz Sp

    2. 9 Die P-Werte für die Varianten des 2-Stichproben-t-Tests erhält man z.B. mit der R-Funktion t.test(), wenn der Parameter var.equal=TRUE gesetzt wird. Mit der Festlegung var.equal=FALSE (Voreinstellung) führt die R-Funktion t.test() den im folgenden behandelten Welch-Test zum Vergleich zweier Mittelwerte bei ungleichen Varianzen aus. 10 Eine exakte Bestimmung des erforderlichen Mindeststichprobenumfangs kann wie im Falle des 1-Stichproben-t-Tests z.B. mit der R-Funktion power.t.test() vorgenommen werden. Wenn man n1=n2=n, ∆, σ und α vorgibt, liefert diese Funktion die entsprechenden Werte der Gütefunktion des 2-Stichproben-t-Tests.

  • 47

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    Beispiel 5.3: Die Konzentration (in µg/dl) von Eisen im Blutserum wurde bei 15- bis 18-jährigen Schülern (Variable X1) und Schülerinnen (Variable X2) bestimmt. Die verwendeten Zufallsstichproben haben jeweils den Umfang n1=n2=20, die Mittelwerte sind 1x =102.1, 2x =81.4 und die Standardabweichungen s1=39.1, s2=42.5.

    a) Unter der Annahme von mit gleichen Varianzen normalverteilten Grundgesamtheiten X1 ~ N(µ1, σ2) und X2 ~ N(µ2, σ2) zeigen wir, dass die beobachteten Mittelwerte 1x und 2x sich auf 5%igem Niveau nicht signifikant unterscheiden.

    b) Anschließend bestimmen wir den erforderlichen Mindeststichprobenumfang, der geplant werden müsste, um mit dem Test bei einem Mittelwertunterschied von ∆=µ1- µ2=20 mit 90%iger Sicherheit ein signifikantes Ergebnis zu erhalten. Lösung mit R: > # Beispiel 5.2 > options(digits=4) > xquer1 Delta power.t.test(delta=20, sd=sp, sig.level=0.05, power=0.9, + type="two.sample", alternative="two.sided") Two-sample t test power calculation n = 88.58 delta = 20 sd = 40.84 sig.level = 0.05 power = 0.9 alternative = two.sided NOTE: n is number in *each* group

    Hinweis: Wird der F-Test in Verbindung mit dem 2-Stichproben t-Test als „Vortest“ zum Nachweis der Varianzhomogenität eingesetzt, kann das Gesamtirrtumsrisiko αg für beide Testentscheidungen bis knapp 2α ansteigen. Diesen nicht erwünschten

  • 48

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    Nebeneffekt vermeidet man, wenn als Alternative zum Mittelwertvergleich mit dem 2-Stichproben t-Test und dem F-Test als Vortest der folgende, nicht ganz so „scharfe“ Welch-Test eingesetzt wird. 5.4 Mit dem Welch-Test können die Mittelwerte von zwei normalverteilten Untersuchungsmerkmalen (bei gleichen oder ungleichen Varianzen) vergleichen können. Ablaufschema:

    • Beobachtungsdaten und Modell, Hypothesen: wie beim Zwei-Stichproben-t-Test bis auf die Voraussetzung σ21 = σ22 (Varianzhomogenität ).

    • Testgröße:

    ( )( ) ( ) Zahl)ganze auft (abgerunde )1/(/)1/(/

    //mit

    für weise)(näherungsverteilt -t~//

    2

    2

    2221

    2

    121

    2

    2221

    21

    21f

    2221

    21

    21

    −+−+=

    =+

    −=

    nnsnns

    nsnsf

    nSnS

    XXTG µµ

    • Entscheidung:

    analog zur Vorgangsweise beim Zwei-Stichproben-t-Test mit dem P-Wert bzw. mit Hilfe des Ablehnungsbereichs; der dortige Freiheitsgrad n1+n2-2 ist durch f zu ersetzen.

    Beispiel 5.4: Mit den Daten von Aufgabe 5.2 soll geklärt werden, ob der mittlere Cd-Gehalt an der Stelle 1 auf 5%igem Testniveau signifikant über dem entsprechenden Wert an der Stelle 2 liegt. Lösung mit R: > # Beispiel 5.3 (Welch-Test) > x1 x2 # H0: mu1 mu2 > xquer1

  • 49

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    > print(cbind(tgs, f, alpha, tq, P), digits=4) tgs f alpha tq P [1,] 2.62 11.37 0.05 1.791 0.01163 > t.test(x1, x2, alternative="greater") Welch Two Sample t-test data: x1 and x2 t = 2.6199, df = 11.373, p-value = 0.01163 alternative hypothesis: true difference in means is greater than 0 95 percent confidence interval: 2.646589 Inf sample estimates: mean of x mean of y 67.15 58.79 Wegen P = 1.16% < 5% wird H0 abgelehnt.

    5.5 Mit dem Differenzen-t-Test (paired t-test) die Mittelwerte von zwei normalverteilten Untersuchungsmerkmalen an Hand von abhängigen Stichproben (d.h. im Rahmen eines Paarvergleichs) vergleichen können. Ablaufschema:

    • Beobachtungsdaten und Modell: n Wertepaare (x11, x12), (x21, x22), ..., (xn,1, xn,2) durch Messung der Variablen X1 (Mittelwert µ1) und X2 (Mittelwert µ2) an n Untersuchungseinheiten � Differenzenstichprobe d1=x12 - x11, d2=x22 - x21, ..., dn=xn2 - xn1 mit Mittelwert d und Varianz sd

    2. Jedes di ist Realisierung einer Zufallsvariablen Di ~N(µD, σD2) mit µD=µ2-µ1 �Stichprobenmittel D ~ N(µD, σD2/n), Stichprobenvarianz SD2

    • Hypothesen und Testgröße:

    Fall II: H0: µD = 0 gegen H1: µD ≠ 0 Fall Ia: H0: µD ≤ 0 gegen H1: µD > 0 Fall IIb: H0: µD ≥ 0 gegen H1: µD < 0

    • Entscheidung mit dem P-Wert:

    P < α ⇒ H0 ablehnen; dabei ist P=2Fn-1(-|TGs|) für die zweiseitige Testvariante II, P=1-Fn-1(TGs) für die Variante Ia, P=Fn-1(TGs) für die Variante Ib;

    0für ~/

    1 == − DnD

    tnS

    DTG µ

  • 50

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    Fn-1 bezeichnet die Verteilungsfunktionen der t-Verteilung mit dem Freiheitsgrad f=n-1.

    • Entscheidung mit dem Ablehnungsbereich:

    H0 wird auf dem Testniveau α abgelehnt, wenn |TGs | > tn-1,1-α/2 (Variante II) bzw. TGs > tn-1, 1-α (Variante Ia) bzw. TGs < - tn-1,1- α (Variante Ib) gilt; Dabei bezeichnet tn-1,γ das γ-Quantil der t-Verteilung mit dem Freiheitsgrad f=n-1.

    • Planung des Stichprobenumfangs:

    Um auf Niveau α mit der Sicherheit 1-β eine Entscheidung für H1 herbeizuführen, wenn µD von 0 um ∆ ≠ 0 im Sinne der Alternativhypothese abweicht, ist das dafür notwendige n näherungsweise im Fall II:

    in den Fällen Ia und Ib ist z1-α/2 durch z1-α zu ersetzen. Bei Anwendung dieser Formeln muss ein Schätzwert für σD zur Verfügung stehen.

    Beispiel 5.5: Ein einfaches Maß für die Wirkung W eines Präparats auf ein Untersuchungsmerkmal ist die Differenz W=Xn-Xv aus dem Untersuchungsmerkmal Xn nach und dem Untersuchungsmerkmal Xv vor Gabe des Präparats. Es soll festgestellt werden, ob ein Testpräparat B im Mittel eine größere Wirkung zeigt als ein Kontrollpräparat A. Die Untersuchung wird als Paarvergleich so geplant, dass 10 Probanden zuerst mit dem Kontrollpräparat und dann (nach einer angemessenen Zeitdauer zur Vermeidung von Übertragungseffekten) mit dem Testpräparat behandelt werden. Die mit den Präparaten A und B erzielten (fiktiven) Wirkungen WA bzw. WB sind: A: 9.45, 8.50, 7.46, 10.10, 11.81, 9.70, 12.76, 7.03, 10.49, 5.01 B: 11.56, 12.50, 7.15, 13.97, 9.35, 12.67, 13.14, 8.13, 11.64, 9.73 Lösung mit R: > # Beispiel 5.5 (Differenzen t-Test) > wA wB xquerA

  • 51

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    [1,] 9.231 10.98 2.31 2.274 10 10 > d alpha t.test(d, alternative="greater") One Sample t-test data: d t = 2.4896, df = 9, p-value = 0.01722 alternative hypothesis: true mean is greater than 0 95 percent confidence interval: 0.4622372 Inf sample estimates: mean of x 1.753 Ergebnis: P=1.72% < 5% � H1

    Übungsbeispiele zu den 2-Stichprobenvergleichen mit normalverteilten Untersuchungsmerkmalen 1. a) Es soll untersucht werden, ob die mittlere Menge (in mg) eines Wirkstoffes in

    mit der Anlage A hergestellten Produkten (Wirkstoffmenge XA) sich von jener unterscheidet, die mit der Anlage B (Wirkstoffmenge XB) hergestellt werden. Die Werte der Prüfstichproben sind:

    Anlage A: 16.1, 15.4, 16.1, 15.6, 16.2, 16.2, 15.9, 16.2, 16.1, 16.0 Anlage B: 16.5, 15.9, 16.3, 16.4, 15.9, 15.9, 16.3, 16.2, 16.0, 16.2 Aus Voruntersuchungen sei bekannt, dass die Wirkstoffmengen XA und XB mit guter Näherung als normalverteilt betrachtet werden können und die Varianzen nicht von der Anlage abhängen. Als Signifikanzniveau nehme man 5% an. b) Ferner stelle man fest, ob der Umfang der Prüfstichproben ausreichend groß geplant wurde, um den als relevant angesehenen Mittelwertunterschied ∆=0.25 mit 90%iger Sicherheit erkennen zu können.

    2. Das Wachstum einer Kultur (Gewicht in g) wird in Abhängigkeit von 2

    Nährlösungen 1 und 2 gemessen. Es ergaben sich die folgenden Messwerte:

    Nährlösung 1: 8.17, 7.92, 8.02, 7.97, 6.42, 8.16, 7.32, 7.35 Nährlösung 2: 6.98, 6.94, 6.92, 6.93, 6.62, 7.17, 7.42, 6.95 a) Man überprüfe auf 5%igem Signifikanzniveau, ob die Nährlösung einen signifikanten Einfluss auf das mittlere Wachstum hat? b) Ist die Annahme gleicher Varianzen gerechtfertigt?

  • 52

    W. Timischl: AngStat_Bioengineering_II.doc 06.01.2014

    3. In einem Versuch wurde auf 10 Parzellen eine Getreidesorte ausgesät und in einer Hälfte einer jeden Parzelle das Bewässerungssystem A und in der anderen Hälfte das System B angewendet. Die unter den Versuchsbedingungen erzielten Erträge (in kg/ha) sind im Folgenden angeführt. Sind die unter der Bedingung B erzielbaren Erträge im Mittel größer als die Erträge unter der Bedingung A? Man prüfe die Fragestellung auf 5%igem Signifikanzniveau. A: 7400 5740 5530 6190 3740 5050 4180 6520 4910 4690 B: 8450 6400 6410 7010 3690 6040 4060 6730 4760 5770 .

    4. Diffusionstests werden angewendet, um die Wirksamkeit bestimmter Antibiotika auf Mikroorganismen (Krankheitserreger) festzustellen. Diese werden auf einem festen Nährboden zusammen mit dem Antibiotikum aufgebracht. Ist das Antibiotikum wirksam, entsteht eine Hemmzone, in der der Testorganismus nicht wachsen konnte. Bei der Wirksamkeitsprüfung von 2 Antibiotika A und B wurden in je 15 Versuchen Hemmzonen mit den im Folgenden angeführten Durchmessern (in mm) beobachtet. Kann an Hand der Daten auf 5%igem Testniveau ein Unterschied in der Wirksamkeit der Antibiotika (d.h. ein Unterschied der mittleren Durchmesser) festgestellt werden? A: 19.5, 14.0, 12.0, 19.0, 23.0, 28.0, 24.5, 26.0, 25.0, 16.0, 27.5, 17.0, 17.5, 20.0, 18.5 B: 18.0, 21.0, 30.5, 24.0, 20.5, 29.0, 25.5, 27.0, 40.5, 26.5, 22.5, 40.0, 16.5, 21.5, 23.5

    5. Die Eisenkonzentration im Serum (in µg/dl) wurde bei 15- bis 18-jährigen

    Schülerinnen (Variable X1) und Schülern (Variable X2) bestimmt. Der Stichprobenumfang, der Mittelwert und die Standardabweichung sind 20, 81.4, 42.5 (Schülerinnen) bzw. 20, 102.1, 39.1 (Schüler). a) Unter der Voraussetzung normalverteilter Grundgesamtheiten (mit

    übereinstimmenden Varianzen) zeige man, dass der Mittelwert der Schülerinnen sich auf 5%igem Niveau nicht signifikant vom entsprechenden Schülermittelwert unterscheidet.

    b) Welcher Umfang der Zufallsstichproben müsste geplant werden, um mit dem Test einen Mittelwertunterschied in der Höhe der beobachteten Mittelwertdifferenz mit 90%iger Sicherheit als signifikant zu erkennen? (82)

    c) Man überzeuge sich, dass die Voraussetzung der Varianzhomogenität (auf 5%igem Testniveau) erfüllt ist.

    6. Die folgende Tabelle zeigt die Änderung des (systolischen) Blutdrucks (in mm Hg)

    bei zehn einer gewissen Behandlung unterworfenen Patienten. Xb und Xe be