Plan na dziś

Post on 07-Jan-2016

35 views 0 download

description

Plan na dziś. Ogólny model liniowy (GLM) Model mieszany (MIXED). Ogólny model liniowy. OML ł ączy zalety ANOVA i analizy regresji. gr. słoniny = stado + masa półtuszy + reszta. zm. klasyfikująca. zm. ciągła. Parametry modelu. β 0 = efekt wspólny β 1 = efekt stada A - PowerPoint PPT Presentation

Transcript of Plan na dziś

Plan na dziś

• Ogólny model liniowy (GLM)• Model mieszany (MIXED)

Ogólny model liniowy

• OML łączy zalety ANOVA i analizy regresji

gr. słoniny = stado + masa półtuszy + reszta

zm. klasyfikująca

zm. ciągła

β0 = efekt wspólny

β1 = efekt stada Aβ2 = efekt stada B efekt stada C = 0

β3 = regr. na masę półtuszy

Parametry modelu

Jeden poziom efektu stałego jest zawsze wyzerowany!

24 = 1β0 + 0β1 + 1β2 + 40β3 + e2

22 = 1β0 + 0β1 + 0β2 + 41β3 + e3

23 = 1β0 + 1β1 + 0β2 + 42β3 + e1

23 mmstado A42 kg

24 mmstado B40 kg

22 mmstado C41 kg

2324 =22

1 1 0 421 0 1 40 1 0 0 41

β0 β1

β2

β3

e1

+ e2

e3

y = X + e

Zapis macierzowy

General Linear Model

data swinie ; infile “C:\...\mojplik.txt” ; input slonina stado $ waga ;proc GLM data=swinie; class stado ; model slonina = stado waga ;run ;

Sumy kwadratów

• Typu I-ego: zależą od pozycji efektu w modelu! Oszacowany efekt masy półtuszy uzględnia wpływ stada, ale nie odwrotnie.

• Typu III-ego: nie zależne od pozycji efektu w modelu! Każdy efekt jest poprawiony względem pozostałych.

Rozwiązania

proc GLM data=swinie; class stado ; model slonina = stado waga / solutions;run ;

Testowanie efektów: H0 1 = 0 H1 1 0 (test dwustronny) poziom istotności w kolumnie Pr > |t|

Jeden poziom wyzerowany!

Średnie NK

stado

rok

A B C średniebrzegow

e

2005 5 5 5 4

2006 5 5 1 5

średnie 1 2 3

Układ niezbalanowany

Tu brakuje obserwacji

Średnie najmniejszych kwadratów to średnie jakich byśmy oczekiwali dla zbalansowanych danych.

Średnie NK

proc GLM data=swinie; class stado ; model slonina = stado waga ; lsmeans stado / stderr ;run ;

Oblicza błąd standardowy i testuje hipotezę średnia=0

Oblicza średnie least-squares

Interakcja

A1 A2 B1 B2 A1B1 A1B2 A2B1 A2B2

Interakcja

Y = A B A*B

Efekty zagnieżdżone

A1 A2 B1 B2 A1B1 A1B2 A2B1 A2B2

B nie występuje jako efekt główny.

A1 A2

B1 B2

B1 B2

Y = A B(A)

Porównania wielokrotneproc GLM data=swinie; class stado ; model slonina = stado waga ;

means stado / opcja;run ;Means oblicza nie poprawione średnie,

DUNCAN

LSD – najmniejsza istotna różnica

TUKEY

SNK Student-Newman-Keuls

Porównania średnich NK

lsmeans stado / pdiff=all adjust=tukey;

Testuje hipotezęH0: LSM(i)=LSM(j)

23 mm23 mm22 mmstado A42 kg

19 mm18 mm17 mmstado B40 kg

22 mm21 mm22 mmstado C41 kg

Pomiary powtarzane

Pomiary wykonywane na tych samych obiektach (świniach) mogą być skorelowane!

Pomiary powtarzane – c.d

y1 y2 y3 stado waga

• 23 22 A 4219 18 17 B 4022 21 22 C 41

proc GLM; class stado ; model y1-y3 = stado waga ;

repeated czas ; run ;

Dowolna nazwa dla czynnika wewnątrz-

obiektowego

Model mieszany

y = X + Zu + eZawiera zarówno efekty

stałe jak i losowe u

Kiedy efekt losowy?Efekt jest losowy, jeżeli po powtórzeniu

próbkowania możemy wylosować inne jego poziomy.

Np. losowanie 30 koniI próbkowanie:

umaszczenie gniade 20 koni.umaszczenie pstrokate 10 koni

II próbkowanieumaszczenie gniade 15umaszczenie myszate 15

Kiedy efekt losowy?

Gdy chcemy wnioskować o czynniku, ale nie mamy wszystkich jego poziomów.

Np. Analizujemy wpływ pór roku, ale

mamy dane tylko z lata i jesieni.

Kiedy efekt losowy?

Gdy chcemy uwględnić fakt, że obserwacje są skorelowane

...lub gdy efekty skorelowane są naszym przedmiotem zainteresowania.

Np. Wartość hodowlana świni A jest skorelowana z w.h. świni B, bo A i B są spokrewnione.

Zależności między efektami

y = X + Zu + e

Zależności między efektami

zdefiniowane w macierzy GZależności między resztamizdefiniowane w

macierzy R

Przykładbuhaj 1

krowa 1 krowa 2stado A stado B

y=9 y=12

buhaj 2

krowa 3 krowa 4stado A stado B

y=11 y=6

buhaj 3

krowa 5 krowa 6stado A stado B

y=7 y=14

V = R = 6

1 0 0 0 0 00 1 0 0 0 00 0 1 0 0 00 0 0 1 0 00 0 0 0 1 00 0 0 0 0 1

1 00 11 01 01 00 1

= stado Astado B

912116714

Y = X =

y = X + e

Zakładamy, że obserwacje nie są skorelowane, ale to nieprawda!

Przykładbuhaj 1

krowa 1 krowa 2stado A stado B

y=9 y=12

buhaj 2

krowa 3 krowa 4stado A stado B

y=11 y=6

buhaj 3

krowa 5 krowa 6stado A stado B

y=7 y=14

V = ZGZ`+ R =

8 2 0 0 0 02 8 0 0 0 00 0 8 2 0 00 0 2 8 0 00 0 0 0 8 20 0 0 0 2 8

y = X + Zu + e

Teraz obserwacje są skorelowane, ale błędy nie!

1 0 01 0 00 1 00 1 00 0 10 0 1

Z =

buhaj 1buhaj 2buhaj 3

u =

1 0 00 1 00 0 1

G = 2

Poziomy efektów losowych mogą być także skorelowane

ojciec matka córka ojciec 1 0 1/2

matka 0 1 1/2

córka 1/2 1/2 1

np. zależności między efektami proporcjonalne do spokrewnień (Animal Model)

ojciec matka

córkaG=A 2

A

Model mieszany w SASie

proc MIXED ; class A B ; model Y = A B ; random C ;run ;

BLUP AM

Krowa 1 Buhaj 2

Córka 3 Córka 4

stado Ay=3,1

stado By=3,5

stado By=3,3

Założenia:•wariancja add. 2

A = 1,0•wariancja reszt 2

E = 1,5

...czyliG = A×1,0R = I×1,5

Y = stado + animal + reszta

krowa 1 1 0 0,5 0buhaj 2 0 1 0,5 0,5córka 3 0,5 0,5 1 0,25córka 4 0 0,5 0,25 1

data G ;input Row Col1-Col4 ;cards ;1 1 0 0.5 02 0 1 0.5 0.53 0.5 0.5 1 0.254 0 0.5 0.25 1

;

data G ;input Row Col Value ;cards ;1 1 0 1 3 0.52 2 12 3 0.5itd.

BLUP AM

data mleko ; input stado $ animal $ Y ; cards ; A 1 3.1 A 2 . B 3 3.5 B 4 3.3;proc mixed data=mleko ; class stado animal ; model Y = stado ; random animal / type=un gdata=G s ; parms 1.5 / hold=1 ;run ;

BLUP AM

Zadanie 1

1 1 42 44 36 13 19 221 2 33 . 26 . 33 211 3 31 -3 . 25 25 242 1 28 . 23 34 42 132 2 . 34 33 31 . 362 3 3 26 28 32 4 163 1 . . 1 29 . 193 2 . 11 9 7 1 -63 3 21 1 . 9 3 .4 1 24 . 9 22 -2 154 2 27 12 12 -5 16 154 3 22 7 25 5 12 .

data a; input lek choroba @; do i=1 to 6; input y @; output; end; cards ;

Zbadaj wpływ leku (1-4) i choroby (1-3) oraz interakcji między nimi na wskaźnik wydajnościowy organizmu. Czy układ jest zbalansowany? Który efekt jest istotny? Porównaj średnie najmniejszych kwadratów w parach.

Dane: Procedura wczytania danych:

Zadanie 2

a 11 6 a 8 0 a 5 2 a 14 8 a 19 11a 6 4 a 10 13 a 6 1 a 11 8 a 3 0d 6 0 d 6 2 d 7 3 d 8 1 d 18 18d 8 4 d 19 14 d 8 9 d 5 1 d 15 9f 16 13 f 13 10 f 11 18 f 9 5 f 21 23f 16 12 f 12 5 f 12 16 f 7 1 f 12 20

Zbadaj skuteczność antybiotyku (a-f) na stopień zakażenia pacjentów (po) uwzględniając stopień zakażenia przed leczeniem (przed) jako drugi efekt w modelu. Wytłumacz różnicę między wynikiem dla antybiotyku obliczonym wg sum kw. typu I i III.

data AB; input anty $ przed po @@; cards;

Zadanie 3Analizowano wpływ mutacji w genie leptyny (CC, CG, GG) na ekspresję tego genu (poziom mRNA). Zbadano 14 świń i dla każdej wykonano 3 pomiary ekspresji genu. Zbadaj wpływ genu.

dane22.txtkol 1: genotyp Leptynykol 2: pomiar 1kol 3: pomiar 2kol 4: pomiar 3

http://jay.au.poznan.pl/~mcszyd/dyda/pakiety/index.html

Zadanie 4Analizowano wpływ genotypu w genie leptyny (CC, CG) na średnią grubość słoniny. Wykonaj obliczenia (a) ignorując wpływ ojca i (b) traktując wpływ ojca jako efekt losowy. Uwzględnij wiek uboju i masę półtuszy.

dane23.txtkol 1: kod rasykol 2: numer próbykol 3: numer ojcakol 4: genotyp RYRkol 5: genotyp Leptynykol 6: średnia gr. słoniny (cm)kol 7: wiek uboju (dni)kol 8: masa półtuszy (kg)

http://jay.au.poznan.pl/~mcszyd/dyda/pakiety/index.html

Zadanie dla chętnych

krowa stado %tłuszczu2 A 3,33 A 3,15 B 3,06 B 2,98 B 3,49 A 3,510 B 3,2

1 2 3 4 5

6 7 8

9 10

Oceń wartość hodowlaną buhajów i krów wzg. zawartości tłuszczu w mleku przyjmując, że wariancja genetyczna addytywna = 0,75, a wariancja reszt = 1,3.

zwierzęta ponumerowane rosnąco od najstarszych do najmłodszych