Varianzanalyse -...

16
Berghold, IMI, MUG Einfaktorielle Varianzanalyse … Vergleich mehrerer Mittelwerte

Transcript of Varianzanalyse -...

Page 1: Varianzanalyse - user.medunigraz.atuser.medunigraz.at/andrea.berghold/StatSS/Varianzanalyse_11.pdf · und MQ innerhalb größer als der kritische Wert der F-Verteilung (bestimmt durch

Berghold, IMI, MUG

Einfaktorielle Varianzanalyse

… Vergleich mehrerer Mittelwerte

Page 2: Varianzanalyse - user.medunigraz.atuser.medunigraz.at/andrea.berghold/StatSS/Varianzanalyse_11.pdf · und MQ innerhalb größer als der kritische Wert der F-Verteilung (bestimmt durch

Berghold, IMI, MUG

Es wurden die anorganischen Phosphatwerte im Serum (mg/dl) eine Stunde nach einem Glukosetoleranztest bei übergewichtigen Personen mit Hyperinsulinämie, nicht-Hyperinsulinämie und Kontrollen gemessen.

Gibt es Unterschiede zwischen den 3 Gruppen?

Beispiel

Page 3: Varianzanalyse - user.medunigraz.atuser.medunigraz.at/andrea.berghold/StatSS/Varianzanalyse_11.pdf · und MQ innerhalb größer als der kritische Wert der F-Verteilung (bestimmt durch

Berghold, IMI, MUG

Hypothesen

• Nullhypothese:

H0: μ1 = μ2 = μ3 = … = μk

• Alternativhypothese:

H1: wenigstens ein μi unterscheidet sich von den anderen

Globaltest

Page 4: Varianzanalyse - user.medunigraz.atuser.medunigraz.at/andrea.berghold/StatSS/Varianzanalyse_11.pdf · und MQ innerhalb größer als der kritische Wert der F-Verteilung (bestimmt durch

Berghold, IMI, MUG

Voraussetzungen

• Voraussetzungen:

• Daten aller Stichproben entstammen normalverteiltenGrundgesamtheiten

• Varianzhomogenität(Faustregel: Verhältnis größter zu kleinster Standardabweichung muss kleiner 2:1 sein; Levene-Test, …)

• Die Messwerte bzw. Faktorstufen sind voneinander unabhängig

Page 5: Varianzanalyse - user.medunigraz.atuser.medunigraz.at/andrea.berghold/StatSS/Varianzanalyse_11.pdf · und MQ innerhalb größer als der kritische Wert der F-Verteilung (bestimmt durch

Berghold, IMI, MUG

Modellbetrachtung

yij ist die jte Beobachtung (j=1,2,…,ni) in Gruppe i (i=1,2,…,k)

µ ist das Gesamtmittel

αi ist die Differenz zwischen Mittelwert von Gruppe i und demGesamtmittel

εij ist der Fehlerterm

ijiijy εαμ ++=

Page 6: Varianzanalyse - user.medunigraz.atuser.medunigraz.at/andrea.berghold/StatSS/Varianzanalyse_11.pdf · und MQ innerhalb größer als der kritische Wert der F-Verteilung (bestimmt durch

Berghold, IMI, MUG

Varianzanalyse

Vergleicht die Variation zwischen den Gruppen mit derVariation innerhalb der Gruppen.

• Gesamtvariabilität wird in 2 Komponenten aufgeteilt:

• Variabilität “zwischen” Gruppen, und

• Variabilität “innerhalb” Gruppen

• Varianzanalysetafel (ANOVA Tafel)

Page 7: Varianzanalyse - user.medunigraz.atuser.medunigraz.at/andrea.berghold/StatSS/Varianzanalyse_11.pdf · und MQ innerhalb größer als der kritische Wert der F-Verteilung (bestimmt durch

Berghold, IMI, MUG

( ) ( ) ( )∑∑ ∑∑∑∑ −+−=−i j i j iijii j ij yyyyyy 2

.2

...2

..

SST SSB SSW

Quadratsummen

SST: Gesamt-Quadratsumme

SSB: Quadratsumme der Behandlungen

SSW: Fehler-Quadratsumme

Page 8: Varianzanalyse - user.medunigraz.atuser.medunigraz.at/andrea.berghold/StatSS/Varianzanalyse_11.pdf · und MQ innerhalb größer als der kritische Wert der F-Verteilung (bestimmt durch

Berghold, IMI, MUG

Varianzanalyse

ONEWAY ANOVA

y

56,000 2 28,000 42,000 ,0006,000 9 ,667

62,000 11

Between groupsWithin groupsTotal

Sum ofSquares df

MeanSquare F

Significance

Wir können die Nullhypothese verwerfen.

Page 9: Varianzanalyse - user.medunigraz.atuser.medunigraz.at/andrea.berghold/StatSS/Varianzanalyse_11.pdf · und MQ innerhalb größer als der kritische Wert der F-Verteilung (bestimmt durch

Berghold, IMI, MUG

• df = (n – 1) = (n – k) + (k – 1)

• SS / df = mittlere Quadrate (MQ)

• Entstammen alle Gruppen derselben Grundgesamtheit, dann sollten die Varianzen, also die Mittleren Quadrate, MQzwischenund MQinnerhalb, gleich groß sein.

Varianzanalyse

( )

( )∑∑

= =

=

−−

=

−−

=

k

i

n

jiijinnerhalb

k

iiizwischen

i

yyk

MQ

yynk

MQ

1 1

2.

1

2...

11

11

Page 10: Varianzanalyse - user.medunigraz.atuser.medunigraz.at/andrea.berghold/StatSS/Varianzanalyse_11.pdf · und MQ innerhalb größer als der kritische Wert der F-Verteilung (bestimmt durch

Berghold, IMI, MUG

• Sind diese nicht gleich groß, d.h. ist der Quotient aus MQzwischenund MQinnerhalb größer als der kritische Wert der F-Verteilung (bestimmt durch df1, df2 und α), so wird die Nullhypothese verworfen.

• df1 = k – 1; df2 = n - k

• D.h. Es gibt Gruppen mit unterschiedlichen Mittelwerten, mindestens zwei µi sind voneinander verschieden.

Varianzanalyse

( ) verwerfen Hˆ0;;1 →> −− αknkFF

Page 11: Varianzanalyse - user.medunigraz.atuser.medunigraz.at/andrea.berghold/StatSS/Varianzanalyse_11.pdf · und MQ innerhalb größer als der kritische Wert der F-Verteilung (bestimmt durch

Berghold, IMI, MUG

Multiple Vergleiche, p-Werte müssen korrigiert werden.

• Bonferroni

Die Unsicherheit (Irrtumswahrscheinlichkeit α=0,05) wird zu gleichen Teilen auf alle Paarvergleiche aufgeteilt. Bei 4 Gruppen gibt es 3+2+1=6 Vergleiche; jeder dieser Tests wird mit α/6 durchgeführt. Die Bonferroni-Korrektur ist konservativ, d.h. sie hält lange an der Nullhypothese fest

Alternativen

• Bonferroni-Holm-Korrektur

• LSD – Least-Signifikant-Difference

• HSD – Honest-Significant-Difference (Tukey)

• SNK – Student-Newman-Keuls …

Post-hoc Tests

Page 12: Varianzanalyse - user.medunigraz.atuser.medunigraz.at/andrea.berghold/StatSS/Varianzanalyse_11.pdf · und MQ innerhalb größer als der kritische Wert der F-Verteilung (bestimmt durch

Berghold, IMI, MUG

Untersucht wurde die Gerinnungszeit von Plasma, das mit vier verschiedenen Methoden behandelt wurde. Von 8 zufällig ausgewählten Patienten einer Population werden je 4 Blutproben genommen und zufällig den 4 Behandlungsmethoden zugeteilt. Die Gerinnungszeiten (min) von diesen 8x4 Plasmen wurden bestimmt.

Gibt es Unterschiede zwischen den Behandlungen.

Beispiel – randomisiertes Blockexperiment

Page 13: Varianzanalyse - user.medunigraz.atuser.medunigraz.at/andrea.berghold/StatSS/Varianzanalyse_11.pdf · und MQ innerhalb größer als der kritische Wert der F-Verteilung (bestimmt durch

Berghold, IMI, MUG

Daten – randomisiertes Blockexperiment

Subject treat1 treat2 treat3 treat41 8,4 9,4 9,8 12,22 12,8 15,2 12,9 14,43 9,6 9,1 11,2 9,84 9,8 8,8 9,9 125 8,4 8,2 8,5 8,56 8,6 9,9 9,8 10,97 8,9 9 9,2 10,48 7,9 8,1 8,2 10

Page 14: Varianzanalyse - user.medunigraz.atuser.medunigraz.at/andrea.berghold/StatSS/Varianzanalyse_11.pdf · und MQ innerhalb größer als der kritische Wert der F-Verteilung (bestimmt durch

Berghold, IMI, MUG

Analyse – randomisiertes Blockexperiment

Tests der Zwischensubjekteffekte

Abhängige Variable: clot_time

92,005a 10 9,201 14,027 ,0003196,001 1 3196,001 4872,749 ,000

78,989 7 11,284 17,204 ,00013,016 3 4,339 6,615 ,00313,774 21 ,656

3301,780 32

105,779 31

QuelleKorrigiertes ModellKonstanter TermsubjectstreatmentsFehlerGesamtKorrigierteGesamtvariation

Quadratsumme vom Typ III df

Mittel derQuadrate F Signifikanz

R-Quadrat = ,870 (korrigiertes R-Quadrat = ,808)a.

Page 15: Varianzanalyse - user.medunigraz.atuser.medunigraz.at/andrea.berghold/StatSS/Varianzanalyse_11.pdf · und MQ innerhalb größer als der kritische Wert der F-Verteilung (bestimmt durch

Berghold, IMI, MUG

• Kruskal Wallis Test

• Friedman Test

Nichtparametrische Methoden

Page 16: Varianzanalyse - user.medunigraz.atuser.medunigraz.at/andrea.berghold/StatSS/Varianzanalyse_11.pdf · und MQ innerhalb größer als der kritische Wert der F-Verteilung (bestimmt durch

Berghold, IMI, MUG

• Zweifaktorielle ANOVA (die Varianz wird zwei Faktoren und Wechselwirkung zugeschrieben)

• Mehrfaktorielle ANOVA (MANOVA)

• ANOVA mit Messwiederholungen (Repeated Measurement –mehrere Messungen am gleichen Objekt, häufig ein zeitlicher Verlauf)

• GLM, ANCOVA, GEE, Mixed Models,…..

Weiterführende Methoden