Analise de Variancia Simples

6
1 III- ANÁLISE DE VARIÂNCIA SIMPLES - Modelo de Efeitos Fixos : (Aplica-se na comparação dos valores médios de uma v.a. para k populações escolhidas à priori). Grupos 1 2 k x 11 x 21 x k 1 x 12 x 22 x k 2 x 1n 1 x 2n 2 x kn k Modelo : x ij = μ i + ε ij , i = 1,, k ; j = 1,, n i ou Modelo : x ij = μ + α i + ε ij , i = 1,, k ; j = 1,, n i em que ε ij medem o erro experimental (englobam todos os factores externos que não influenciam, mas alteram os resultados, ε ij = x ij μ i ), μ representa a média global da v.a. em estudo, e α i mede o efeito do grupo i (população i) α i = μ i μ . Existe um único factor que é o factor grupo. Tem-se : n i α i i =1 k = 0 ε ij são v.as. i.i .d. N 0,σ 2 ( ) ou x ij N μ i , σ 2 ( ) , i = 1,, k [ e as k amostras são independentes]. Hipótese de interesse: H 0 : μ 1 = μ 2 = = μ k ou H 0 : α 1 = α 2 = = α k = 0 Tem-se que: x ij x .. ( ) 2 j =1 n i i =1 k = x ij x i. ( ) 2 j=1 n i i =1 k + n i x i. x .. ( ) 2 i=1 k ou seja, obtém-se a decomposição da variabilidade total das observações da variável em estudo (SQT), numa componente devida ao erro experimental (variabilidade dentro das amostras individuais, SQE) e numa componente devida ao factor grupo (reflecte a variabilidade das k médias amostrais, SQF),

Transcript of Analise de Variancia Simples

Page 1: Analise de Variancia Simples

1

III- ANÁLISE DE VARIÂNCIA SIMPLES

- Modelo de Efeitos Fixos: (Aplica-se na comparação dos valores médios de uma v.a. para k populações escolhidas à priori).

Grupos 1 2 kx11 x21 xk1x12 x22 xk2 x1n1 x2n2 xknk

Modelo : xij = µi + ε ij , i = 1,…,k ; j = 1,…,ni ou Modelo : xij = µ +α i + ε ij , i =1,…, k ; j =1,…,ni em que ε ij medem o erro experimental (englobam todos os factores externos que não influenciam, mas alteram os resultados, ε ij = xij − µi ),µ representa a média global da v.a. em estudo, e αi mede o efeito do grupo i (população i) αi = µi − µ . Existe um único factor que é o factor grupo.

Tem-se : niαii=1

k

∑ = 0

ε ij são v.as. i.i.d.N 0,σ 2( ) ou→ xij ∩ N µi ,σ2( ), i =1,…,k[ e as k amostras são

independentes]. Hipótese de interesse:

H0 : µ1 = µ2 = = µ k ou

H0 :α1 = α 2 = = α k = 0 Tem-se que:

xij − x ..( )2j=1

ni

∑i=1

k

∑ = xij − x i.( )2j=1

ni

∑i=1

k

∑ + ni x i. − x ..( )2i=1

k

ou seja, obtém-se a decomposição da variabilidade total das observações da variável em estudo (SQT), numa componente devida ao erro experimental (variabilidade dentro das amostras individuais, SQE) e numa componente devida ao factor grupo (reflecte a variabilidade das k médias amostrais, SQF),

Page 2: Analise de Variancia Simples

2

SQT = SQE + SQF .

Note-se que: x i. =xij

j=1

ni

∑ni

x .. =xij

j=1

ni

∑i=1

k

∑n

Sob H0 ,

SQEσ 2 ∩ χ 2 n − k( )

SQFσ 2 ∩ χ 2 k −1( )

SQE e SQF são independentes. Então, sob H0 ,

SQF k −1( )SQE n − k( )

∩ F k −1,n − k( )

Logo, se F > Fα rejeita-se H0 .

ANOVA TABLE Fonte de Variação

Graus de Liberdade

Soma de Quadrados

Quadrado Médio Valor de F

Entre Grupos

k -1 SQF = ni x i. − x ..( )2i=1

k

∑ MQF = SQFk −1( )

Residual

n − k SQE = xij − x i.( )2

j=1

ni

∑i=1

k

S2 = MSE =SQEn − k

F = MQFMSE

Total

n −1 SQT = xij − x ..( )2

j=1

ni

∑i=1

k

Se H0 é rejeitada há outras hipóteses de interesse a serem analisadas: • por exemplo, se os grupos i e j diferem no seu efeito médio? Isto equivale a testar

µi = µ j ? Para testar esta hipótese a estatística de teste é:

Page 3: Analise de Variancia Simples

3

x i. − x j.

S2 1ni

+1nj

⎝ ⎜ ⎜

⎠ ⎟ ⎟

∩ tn− k com S2 =SQEn − k

.

Note-se que i e j devem ser escolhidos antes da experiência.

• podíamos também estar interessados em testar (se G1 for grupo de controle) todos os µi (i>2), com µ1 . Mas, como já sabemos, se fizermos vários testes, o erro de tipo I aumenta e não podemos saber qual o nível de significância da experiência como um todo.

Vejamos métodos para resolver o problema das COMPARAÇÕES MÚLTIPLAS: As comparações múltiplas podem ser representadas por contrastes entre os parâmetros µ1,…,µk . Um contraste é uma combinação linear dos µi tais que:

L = λiµii=1

k

∑ com λii=1

k

∑ = 0 .

Os λi são conhecidos e o contraste L é estimado por: ˆ L = λix i.

i=1

k

∑ .

Tem-se :

E ˆ L ( ) = L e var ˆ L ( ) = σ 2 λi2

nii=1

k

∑ .

Exemplos de contrastes:

• L = 12µB + µC( ) − µA → L=0 significa que os grupos B e C têm médias idênticas à

média do grupo A. • L = µ2 + µ 3 + µ4( ) 1

3− µ 5 → L=0 significa que as médias dos grupos 2, 4 e 3 não

diferem significativamente da média do grupo 5. (1) Método de Tukey: amostras de iguais dimensões

Seja n = ni , i = 1,…,k . Com probabilidade 1 −α tem-se que:

ˆ L − T SQEn − k

12

λii=1

k

∑⎛

⎝ ⎜ ⎜

⎠ ⎟ ⎟ ≤ L ≤ ˆ L + T SQE

n − k12

λii =1

k

∑⎛

⎝ ⎜ ⎜

⎠ ⎟ ⎟

Page 4: Analise de Variancia Simples

4

em que T =1nqα n − k( ) , sendo qα o valor da v.a. “Studentized range” que deixa

para a direita uma área de α . Esta expressão verifica-se simultaneamente para todos os contrastes possíveis, obtendo-se um conjunto de intervalos de confiança.

(2) Método de Scheffé: Com probabilidade 1 −α todos os possíveis contrastes são capturados pelo conjunto de intervalos de confiança dado por:

ˆ L − S ˆ σ ˆ L ≤ L ≤ ˆ L + S ˆ σ ˆ L (*) onde

S2 = k −1( )F1−α k −1,n − k( ) e ˆ σ ˆ L 2 = MSE λi

2

nii =1

k

∑ .

Dizemos que L é significativamente diferente de zero se o intervalo (*) exclui L=0. O teste F rejeita H0 sse alguns dos ˆ L são significativamente diferentes de zero. Neste caso, o método de Scheffé encontra contrastes significativamente diferentes de zero. Este método é pouco afectado se as variâncias não forem iguais, ou a hipótese de Normalidade não for satisfeita. Uma vantagem de usar todas as amostras com a mesma dimensão é que as consequências das variâncias serem diferentes não são tão sérias. Outra consequência é que minimiza a probabilidade do erro de tipo II.

(3) Método de Bonferroni: Utilizamos o intervalo de confiança obtido a partir da estatística apresentada no início da página 3, mas, para nos protegermos de um α muito elevado, temos em conta que :

P(Cometer pelo menos 1 erro de tipo I) ≤ pα

em que p representa o número de testes ou de intervalos que vamos calcular Basta, então, utilizarmos

αTotal ≤ pαindividual .

(4) Método de Duncan (Duncan’s Multiple Range Test) Seja n = ni , i = 1,…, p e seja qα ,v , p o valor crítico para o teste “multiple range” de Duncan. Este teste para detectar diferenças significativas entre grupos ao nível de significância global de α consiste em:

- definir Qt = qα, t ,p( n−1)

s2

npara t = 2,3,…, p ;

- colocar as médias amostrais por ordem crescente; - comparar a amplitude de cada subconjunto de t , t = 2,3,…, p , médias

amostrais na lista ordenada com Qt (isto é, o número de médias amostrais na

Page 5: Analise de Variancia Simples

5

lista ordenada, entre as duas que quer comparar, incluindo estas duas). Se a amplitude de um subconjunto é inferior a Qt , então as médias nesse subconjunto de médias ordenadas não são significativamente diferentes entre si.

Se nem todas as amostras tiverem a mesma dimensão, a estimativa do desvio-padrão que

se usa é s 2

21nA

+1nB

⎝ ⎜ ⎜

⎠ ⎟ ⎟ , sendo A e B os grupos a comparar.

(5) Método de Dunnett Seja n = ni , i = 1,…, p , e seja dα , p( n−1), p o valor crítico para o teste de Dunnett e seja O o grupo de controle. O teste de Dunnett para testar a existência de diferenças significativas entre cada grupo e o grupo de controle ao nível de significância global de α , é dado por: - H0 : µ0 = µi i = 1,…, p

- Hipótese alternativa:

µ0 > µiµ0 < µi i = 1,2,…, pµ0 ≠ µ i

- Estatística de teste: Di =Y i − Y 02s2 n

- Região de rejeição:

Di ≥ dα ,p n−1( ), p

Di ≤ dα ,p n−1( ), p i = 1, 2,…, pDi ≥ dα 2, p n−1( ) , p

Quando as amostras têm dimensões diferentes, substitui-se o denominador por

s 2 1ni

+1no

⎝ ⎜ ⎜

⎠ ⎟ ⎟ .

- Modelo de Efeitos Aleatórios: Aplica-se no caso de as k populações (grupos) referidos em A) serem seleccionados aleatoriamente de entre as possíveis populações em que se pode observar a v.a. em estudo. Neste caso podemos tirar conclusões relativamente ao próprio factor que origina a distinção entre as k populações. No caso do modelo de efeitos fixos, só se podem tirar conclusões para aquelas populações (grupos) especificamente. No modelo de efeitos aleatórios não estamos interessados em fazer inferências sobre os grupos, uma vez que estes foram seleccionados aleatoriamente de entre os possíveis grupos, mas sim sobre o próprio factor em estudo.

Page 6: Analise de Variancia Simples

6

Modelo : xij = µi + ε ij , i = 1,…,k ; j = 1,…,ni ou Modelo : xij = µ +α i + ε ij , i =1,…, k ; j =1,…,ni em que : αi , i = 1,…,k , são v.as i.i.d.N 0,σ1

2( ) ε ij são v.as. i.i.d.N 0,σ 2( ) αi{ } e ε ij{ } são independentes. Estamos interessados em testar:

H0 :σ12 = 0 vs H1 :σ1

2 ≠ 0 em que H0 significa que o factor não tem efeitos sobre as observações. A análise deste modelo faz-se do mesmo modo que para o modelo de efeitos fixos.