Analýza rozptylu ANOVA

28
V. Analýza rozptylu ANOVA

description

V. Analýza rozptylu ANOVA. ANOVA. F = (vážený rozptyl mezi průměry skupin)/(rozptyl mezi jedinci v téže skupině) Pevné (fixed effect model) = model I normalita reziduí, y Náhodné (random effect model) = model II normalita reziduí, y a faktory. One-way ANOVA (jednoduché třídění). - PowerPoint PPT Presentation

Transcript of Analýza rozptylu ANOVA

Page 1: Analýza rozptylu ANOVA

V.

Analýza rozptylu

ANOVA

Page 2: Analýza rozptylu ANOVA

ANOVA

F = (vážený rozptyl mezi průměry skupin)/(rozptyl mezi jedinci v téže skupině)

• Pevné (fixed effect model) = model I

normalita reziduí, y• Náhodné (random effect model) = model II

normalita reziduí, y a faktory

iij

ijijijy

Page 3: Analýza rozptylu ANOVA

One-way ANOVA(jednoduché třídění)

H0: μ1 = μ2 = … =μk

α1 = α2 = ... = αk = 0

H1: alespoň jeden průměr se liší od ostatních

= omnibus test,

sleduje pouze

porušení globální

hypotézy

rovnosti průměrů.

Page 4: Analýza rozptylu ANOVA

Neprůkazný výsledek testu znamená:

1) střední hodnoty se neliší (αj = 0)

2) důsledek chyby II. Druhu

ANOVA pro k=2

odpovídá oboustranné variantě t-testu

One-way ANOVA(jednoduché třídění)

Page 5: Analýza rozptylu ANOVA

One-way ANOVA

ST = Se + SA

ST = celkový součet čtvercůSe = součet čtverců odchylek uvnitř výběrůSA = součet čtverců rozdílů mezi výběry

Page 6: Analýza rozptylu ANOVA

One-way ANOVA

Velikost účinku

eT

eA

MSS

MSmS

)1(2

T

A

S

S2

mn

SMS e

e

Poměr vysvětlené variability k celkové variabilitě

Page 7: Analýza rozptylu ANOVA

Základní předpoklady• Nezávislost měření uvnitř i mezi skupinami.

• Měření mají normální rozdělení s průměrem μi.

• Ve všech skupinách mají měření stejný rozptyl kolem průměru.

• Aditivita efektů hladin jednotlivých faktorů (vlivy se sčítají, odchylky od součtu = interakce)

(pomocí testů, graficky)

Page 8: Analýza rozptylu ANOVA

Grafy

Page 9: Analýza rozptylu ANOVA

Efekty v analýze rozptylu

Aditivní účinek:

Pozorování = vliv faktoru A + celkový průměr + náhod. variabilita

(formální podobnost s lineární regresí!!!)

Multiplikativní účinek:

Pozorování = celkový průměr x vliv faktoru A x náhod. variabilita

Log(pozorování) = log(celkový průměr) + log(vliv faktoru A) + log(náhod. variabilita)

(Tukeyův test neaditivity)

Page 10: Analýza rozptylu ANOVA

Analýza reziduálních hodnot• Výpočet reziduí

• Grafické znázornění reziduí a jejich absolutních hodnot proti hodnotám faktorů a hodnotám závisle proměnné, zjišťování změn, trendů a konfigurací bodů.

• Ověření normality reziduí: graficky či testem

jij xx

Page 11: Analýza rozptylu ANOVA

Analýza reziduálních hodnot

• Transformace dat:

– Logaritmická (rozptyl se zvětšuje úměrně s průměrem).

– Arcsinová (pro relativní četnosti)

– Druhá odmocnina (pro četnosti)

– Box – Coxova transformace

• Přítomnost odlehlých hodnot = nutno použít neparametrický postup (Kruskal – Wallisův test)

pp arcsin

5,0 XX

)1log( XX

Page 12: Analýza rozptylu ANOVA

Bartlettův test homogenity rozptylů

Testuje shodu několika rozptylů, měl by předcházet analýzu rozptylu.

2

1

1

2

log)1()1(

log)(3026,2

i

k

ii

k

iii

snkn

snkn

CB

k

i i knnkC

1

1

1

1

)1(3

11

Hrubý odhad shody rozptylů

3minmax

i

i

ss

Page 13: Analýza rozptylu ANOVA

Simultánní porovnávání

Plánované srovnání

t-test (modifikace hladiny významnosti podle Bonferroniho): α’ = 0,05/k k = počet porovnávání

nepříliš vhodný = rostou šířky intervalu spolehlivosti a pravděpodobnost chyby II. druhu!! Aby bylo možno spočítat korekci, už musíme předem vědět které dvojice chceme srovnávat.

Post hoc testy

Fisherův LSD test

Scheffeho test

Page 14: Analýza rozptylu ANOVA

Simultánní porovnávání

Tukey(ho) test

SNK (Student-Newnam-Keuls) test (modifikace Tukeyho testu, silnější x větší pravděpodobnost chyby I. Druhu)

Duncanův test (vyšší pravděpodobnost chyby I. Druhu, ta se vztahuje na

konkrétní pozorování)

Dunnettův test (více pokusů vs. 1 kontrola, podobný Tukeyho testu)

Page 15: Analýza rozptylu ANOVA

POZOR!!!!

Simultánní porovnávání lze použít pouze pro model I (pevné efekty) !!!!!!!

Pro model II (náhodné efekty) se někdy odhadují podíly vlivu na varianci (poměr variability uvnitř tříd a mezi třídami)

Simultánní porovnávání

Page 16: Analýza rozptylu ANOVA

Kruskal-Wallisův test= neparametrická varianta jednoduché analýzy rozptylu, kritérium je

založeno na rozptylu standardizovaných pořadí.

)1(3)1(

12

1

2

nn

R

nnH

k

i i

i 2/)1(1

nnRk

ii

nn

tt

HH

jjj

rko

3

3 )

1

tj označuje kolikrát se ve smíchaném výběru opakuje j-té pozorování

Korigovaná hodnota(není-li H signifikantní)

Simultánní srovnávání: modifikace testu podle Bonferroniho

Jednostranné testování: test Jonckheere - Terpstra

Page 17: Analýza rozptylu ANOVA

Two-way ANOVA(dvojné třídění)

H0:

• α1 = α2 = ... = αi = 0• β1 = β2 = ... = β i = 0• α1 β1 = α2 β2= ... = αi β i = 0

model I (pevné efekty)

model II (náhodné efekty)

model III (smíšené efekty)

Page 18: Analýza rozptylu ANOVA

Two-way ANOVA(dvojné třídění)

Blok = faktor s náhodným efektem

Page 19: Analýza rozptylu ANOVA

Two-way ANOVA bez opakování

Jedna hodnota pro každou kombinaci faktorů = není žádná variabilita, tudíž nelze testovat interakcí.

K odhadu celkové variance lze použít pouze odchylky od aditivity.

Page 20: Analýza rozptylu ANOVA

Friedmanův test= neparametrická varianta dvoufaktorové analýzy rozptylu, určuje se pořadí

hodnot v každém bloku, shodným hodnotám přiřazujeme průměrné pořadí skupiny.

)1(3)1(

12

1

2

knRknk

Hk

ii

2/)1(1

knkRk

ii

Pro malý rozsah výběru – speciální tabulky

Page 21: Analýza rozptylu ANOVA

• Vyvážený model

Stejný počet opakování pro každou kombinaci faktorů, nejjednodušší výpočet, největší síla testu pro daný počet pozorování.

• Nevyvážený model

Two-way ANOVA s opakováním

Page 22: Analýza rozptylu ANOVA

Two-way ANOVA

ST = Se + SA + SB + SIST = celkový součet čtvercůSe = součet čtverců odchylek uvnitř výběrůSA, B = hlavní efekty faktorůSI = efekt interakce

Page 23: Analýza rozptylu ANOVA

Interakce mezi faktory

Hlavní efekt = přímý efekt faktoru na závisle proměnnou

Interakční efekt = spojený efekt kombinace dvou a více faktorů na závisle proměnnou

Vliv faktorů je neaditivní:

= vliv náhodné variability (pokud interakci a priori zamítáme)

= vliv interakce

Page 24: Analýza rozptylu ANOVA

Two-way ANOVA

• Podmínky:• shoda rozptylů

• shoda kovariancí v kovarianční matici různých úrovní faktorů

Podmínka sféricity kovarianční matice(nárůst chyby I. druhu)

1) F test s Greenhouse-Geisserovou korekcí2) MANOVA

Page 25: Analýza rozptylu ANOVA

Two-way ANOVA

• Mnohonásobné porovnání

Tukeyův test

Dunnettův test

Page 26: Analýza rozptylu ANOVA

Analysis of means (ANOM)Hybrid analýzy rozptylu a regulačních diagramů, překročení konfidenčních pásů indikuje statisticky významný vliv daného faktoru. Lze testovat:

Shodu průměrů

Shodu rozptylů

Shodu korelačních koeficientů

Page 27: Analýza rozptylu ANOVA

Analysis of means (ANOM)

• HANOM – pro heteroskedastická data

• ANOMR – pro pořadové hodnoty

• Compass plot

Page 28: Analýza rozptylu ANOVA

Analýza kovariance (ANCOVA)• Na závisle proměnnou může mít vliv i rušivá proměnná

(na intervalové škále), ANCOVA eliminuje její vliv.

• Kombinuje ANOVU s regresní analýzou