: Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ......

25
Exemplo 1: Variáveis padronizadas Z t = ( Z 1 (1) , Z 2 (1) , Z 1 (2) , Z 2 (2) ) Z (1) = Z 1 (1) Z (2) = Z 1 (2) Z 2 (1) Z 2 (2) Matriz de correlações: 22 21 12 11 Ρ Ρ Ρ Ρ Ρ 1.0 0.4 0.5 0.6 0.4 1.0 0.3 0.4 0.5 0.3 1.0 0.2 0.6 0.4 0.2 1.0 De onde se obtém: 0681 . 1 2229 . 0 2229 . 0 0681 . 1 1/2 11 Ρ 0417 . 1 2083 . 0 2083 . 0 0417 . 1 22 1 Ρ 1096 . 0 2178 . 0 2178 . 0 4371 . 0 1/2 11 21 1 22 12 1/2 11 Ρ Ρ Ρ Ρ Ρ Com autovalores: 0.5458 e 0.0009, e, cujo primeiro autovetor é: 4466 . 0 8947 . 0 1 e . Assim, o vetor de coeficientes da 1 a variável canônica é dado por: 2776 . 0 8561 . 0 4466 . 0 8947 . 0 0681 . 1 2229 . 10 2229 . 0 0681 . 1 1 1/2 11 1 e Ρ a . Desta forma, a primeira variável canônica é: ) 1 ( 2 ) 1 ( 1 1 2776 . 0 8561 . 0 Z Z U

Transcript of : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ......

Page 1: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

Exemplo 1: Variáveis padronizadas Z t = ( Z1

(1), Z2

(1), Z1

(2), Z2

(2) )

Z(1)

= Z1

(1)

Z(2)

= Z1

(2)

Z2(1)

Z2(2)

Matriz de correlações:

2221

1211

ΡΡ

ΡΡΡ

1.0 0.4 0.5 0.6

0.4 1.0 0.3 0.4

0.5 0.3 1.0 0.2

0.6 0.4 0.2 1.0

De onde se obtém:

0681.12229.0

2229.00681.11/211Ρ

0417.12083.0

2083.00417.122

1096.02178.0

2178.04371.01/21121

12212

1/211 ΡΡΡΡΡ

Com autovalores: 0.5458 e 0.0009,

e, cujo primeiro autovetor é:

4466.0

8947.01e .

Assim, o vetor de coeficientes da 1a variável canônica é dado por:

2776.0

8561.0

4466.0

8947.0

0681.12229.10

2229.00681.11

1/2111 eΡa .

Desta forma, a primeira variável canônica é:

)1(

2)1(

11 2776.08561.0 ZZU

Page 2: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

Para 11/2

221 fΡb temos que:

11/2

11211/2

221 eΡΡΡf

Substituindo 1f em 1b e, considerando que 11/2

111 eΡa , tenos

1211

221211/2

221/2

221 aΡΡaΡΡΡb

Fazendo as contas:

5443.0

4026.01b .

Como 1)( 1 122t1 bΡbVVar

e como: 5460.05443.0

4026.05443.04026.0

22Ρ ,

vamos padronizar 1b fazendo:

7366.0

5448.0

5443.0

4026.0

5460.0

11b .

Consequentemente:

)2(

2)2(

11 7366.05448.0 ZZV

Page 3: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

Finalmente, as variáveis canônicas são dadas por:

)2(2

)2(11

)1(2

)1(11

7366.05448.0

2776.08561.0

ZZV

ZZU

Cuja correlação é: 1* 7388.05458.0),( 11 VUCorr .

Page 4: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

Desenvolvimento Matricial

Seja o vetor de variáveis X , de dimensão )( qp , dividido em dois

grupos e, com matriz de covariâncias XΣ .

(2)

(1)

X

XX e

2221

1211

XΣΣ

ΣΣXΣ )(Cov

Então, os p pares de variáveis canônicas são definidos por:

(2)

(1)

XBV

XAU ,

em que A e B são as matrizes cujas linhas são formadas pelos

coeficientes das combinações lineares que definem as variáveis canônicas.

Como a k-ésima combinação linear tem coeficientes

k

1/2

11k ePa , pk ,,2,1 ,

sendo ke o k-ésimo autovetor de 1/2

1121

1

2212

1/2

11 ΡΡΡΡΡ

, escrevendo os

p autovetores como colunas de uma matriz E , temos:

p21 e||e|eE ,

logo, t

p21

1/2

11 Aa||a|aEP .

Portanto, temos 1/2

11

t

1/2

11

t

p

t

2

t

1

t1/2

11 PE

P

e

e

e

EPA

.

Page 5: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

Da mesma forma 1/2

22

t

1/2

22

t

p

t

2

t

1

PF

P

f

f

f

B

,

em que kf , pk ,,2,1 , são autovetores de 1/2

2212

1

1121

1/2

22 ΡΡΡΡΡ

.

Portanto, temos: 1/2

11

tPEA

e 1/2

22

tPFB

.

Das relações acima, definindo

V

UY e

B0

0AC , as

variáveis canônicas podem se escritas por:

(2)

(1)

(2)

(1)

XB

XA

X

X

B0

0A

V

UY ,

ou seja, XCY

Nessa representação, fica fácil calcular as correlações das variáveis

canônicas Y com as variáveis originais X .

)(),( XCXCXΣYX CovCov

2221

1211

XYXΣΣ

ΣΣ

B0

0AΣCΣ

Page 6: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

(2)XV,

(1)XV,

(2)XU,(1)XU,

2221

1211

YX ΣΣ

ΣΣ

ΣBΣB

ΣAΣAΣ

Vamos definir as matrizes diagonais 1/2

11V e 1/2

22V , cujos elementos

são dados pelas raízes quadradas das diagonais de 11Σ e 22Σ , ou seja,

pelos desvios padrões das variáveis de (1)

X e (2)

X .

Desta forma, fazendo

1/2

22

1/2

111/2

XV0

0VV e como, IVY ,

temos que IV1/2

Y e,

1/2

XYX

1/2

YYX VΣVXY,P )(Corr

1/2

22

1/2

11

2221

1211

YXV0

0V

ΣBΣB

ΣAΣAP

1/2

2222

1/2

1121

1/2

2212

1/2

1111

YXVΣBVΣB

VΣAVΣAP

(2)XV,

(1)XV,

(2)XU,(1)XU,

YX PP

PPP

Page 7: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

Caso as variáveis originais estejam padronizadas, as expressões são as

mesmas, com uma simplificação no cálculo da matriz de correlações das

variáveis canônicas com as variáveis originais (agora padronizadas), uma

vez que IVX .

(2)

(1)

Z

ZZ e

2221

1211

PP

PPXZ )()( CorrCov

As variáveis canônicas, nesse caso, serão:

(2)

Z

(1)

Z

ZBV

ZAU ,

em que ZA e ZB são as matrizes de coeficientes no caso em que as

variáveis originais estão padronizadas.

Desta forma, temos

(2)

Z

(1)

Z

(2)

(1)

Z

Z

ZB

ZA

Z

Z

B0

0A

V

U,

ou seja, ZCY Z

Nesse caso, teremos XZPCZY,ZY, )()( CorrCov

22Z21Z

12Z11Z

2221

1211

Z

Z

XZYXPBPB

PAPA

PP

PP

B0

0APCP

Page 8: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

Matrizes de erros de aproximações

Da definição de variáveis canônicas, temos que:

VBx

UAx(2)

(1)

1

1

ˆ

ˆ

E também as matrizes de covariâncias:

t111(1)

11 AUAUAxS )ˆ)(()ˆ()ˆ()( CovCovCov

t11

11 AAS )ˆ)(ˆ(

Da mesma forma, temos:

t11

BBS )ˆ)(ˆ(22

t11

1 B0AS )ˆ(

00

00

00

)ˆ(

*

*

2

*

1

2

p

.

Assim, se escolhemos os r (r < p) primeiros pares canônicos, então:

r

2

1

(r)(2)(1)(1)

U

U

U

a||a|ax

ˆ

ˆ

ˆ

ˆˆˆ~

Page 9: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

e,

r

2

1

(r)(2)(1)(2)

V

V

V

b||b|bx

ˆ

ˆ

ˆ

ˆˆˆ~

,

em que: (1)

x~ e (2)

x~ são os dois grupos de variáveis amostrais

aproximados pelos r pares canônicos e, (i)

a e (i)

b são as i-ésimas

colunas de 1

Aˆ e

1B

ˆ , respectivamente.

Desta forma, as matrizes 11S , 22S e 12S são aproximadas por:

t(r)(r)t(2)(2)t(1)(1)t11(1)

11 aaaaaaAAxS ˆˆˆˆˆˆ)ˆ)(ˆ()(~

Cov

t(r)(r)t(2)(2)t(1)(1)t11(2)

22 bbbbbbBBxS ˆˆˆˆˆˆ)ˆ)(ˆ()(~

Cov

t(r)(r)t(2)(2)t(1)(1)(2)(1)

12 bababaxxS ˆˆˆˆˆˆ);(~ **

2*1 rCov

As matrizes de erros de aproximações são, portanto, definidas por:

121212

222222

111111

SSε

SSε

SSε

~

~

~

e, assim, a matriz de erros de aproximações é dada por:

2221

1211

εε

εεε

Page 10: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

Nota: Como no cálculo das matrizes de covariâncias aproximadas foram

consideradas apenas os r primeiros pares de variáveis canônicas, então os

(p − r) pares restantes serão responsáveis pelas diferenças referentes aos

valores originais, ou seja, serão, de fato, as matrizes de erros:

t(p)(p)t11)(r1)(r

111111 aaaaSSε ˆˆˆˆ~

t(q)(q)t1)(r1)(r

222222 bbbbSSε ˆˆˆˆ~

t(p)(p)t1)(r1)(r

121212 babaSSε ˆˆˆˆ~ **

1 pr

Exemplo 2: No exemplo (1) temos:

0551.16766.0

2777.28560.0zA e

7064.08630.0

7366.05448.0zB

Resultando em:

7845.06201.0

2546.09671.01zA e

5338.08456.0

7218.06921.01zB

Desta forma, retendo r = 1 par de variáveis canônicas, temos as

seguintes matrizes de correlações aproximadas

3846.05997.0

5997.09352.06201.09671.0

6201.0

9671.0~11P ;

Page 11: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

7151.05853.0

5853.04791.08456.06921.0

8456.0

6921.0~22P ;

3874.03171.0

6041.04945.08456.06921.0

6201.0

9671.0)7387.0(

~12P .

Matriz de correlações aproximadas

7151.05853.03874.06041.0

5853.04791.03171.04945.0

3874.03171.03846.05997.0

6041.04945.05997.09352.0

~P

E a matriz de erros de aproximações:

2849.03853.00126.00041.0

3853.05209.00171.00055.0

0126.00171.06154.01997.0

0041.00055.01997.00648.0

~PPε

lembrando que:

Ρ

1.0 0.4 0.5 0.6

0.4 1.0 0.3 0.4

0.5 0.3 1.0 0.2

0.6 0.4 0.2 1.0

Page 12: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

Proporção de variação explicada

Considere a retenção de r variáveis canônicas, então, a proporção da

variância amostral do 1o grupo explicada por U é dada por:

)tr(

)~

tr(

11

11

U|X S

S(1) .

Se considerarmos as variáveis padronizadas, temos

p

)~

tr(

)tr(

)~

tr( 11

11

11

U|Z

R

R

R(1) .

De forma análoga, a proporção da variância amostral do 2o grupo

explicada por V é dada por:

)tr(

)~

tr(

22

22

V|X S

S(2) .

Se considerarmos as variáveis padronizadas, temos

q

)~

tr(

)tr(

)~

tr( 22

22

22

V|Z

R

R

R(2) .

Exemplo 3: No exemplo (2), com r = 1, temos as matrizes de correlações

aproximadas

3846.05997.0

5997.09352.0~11P e

7151.05853.0

5853.04791.0~22P ,

Page 13: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

as proporções de variações explicadas em cada um dos grupos são dadas

por:

6599.02

3846.09352.0

U|Z(1)

5971.02

7151.04791.0

V|Z(2)

Page 14: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

Exemplo 4: Estudo do efeito da estrutura organizacional na satisfação

profissional - n = 784.

X(1)

=

X1(1)

feedback

X(2)

=

X1(2)

satisfação com a supervisão

X2(1)

significância das

tarefas

X2

(2) satisfação com a carreira

X3(1)

variedades das

tarefas

X3

(2) satisfação financeira

X4(1)

identificação com as

tarefas

X4

(2)

satisfação com a carga de

trabalho

X5(1)

autonomia

X5(2)

identificação com a

empresa

X6(2)

satisfação com o tipo de

trabalho

X7(2)

satisfação geral

X(1)

= grupo características do trabalho;

X(2)

= grupo satisfação com o trabalho

Matriz de correlações:

2221

1211

RR

RRR

1.0 0.49 0.53 0.49 0.51 0.33 0.32 0.20 0.19 0.30 0.37 0.21

0.49 1.0 0.57 0.46 0.53 0.30 0.21 0.16 0.08 0.27 0.35 0.20

0.53 0.57 1.0 0.48 0.57 0.31 0.23 0.14 0.07 0.24 0.37 0.18

0.49 0.46 0.48 1.0 0.57 0.24 0.22 0.12 0.19 0.21 0.29 0.16

0.51 0.53 0.57 0.57 1.0 0.38 0.32 0.17 0.23 0.32 0.36 0.27

0.33 0.30 0.31 0.24 0.38 1.0 0.43 0.27 0.24 0.34 0.37 0.40

0.32 0.21 0.23 0.22 0.32 0.43 1.0 0.33 0.26 0.54 0.32 0.58

0.20 0.16 0.14 0.12 0.17 0.27 0.33 1.0 0.25 0.46 0.29 0.45

0.19 0.08 0.07 0.19 0.23 0.24 0.26 0.25 1.0 0.28 0.30 0.27

0.30 0.27 0.24 0.21 0.32 0.34 0.54 0.46 0.28 1.0 0.35 0.59

0.37 0.35 0.37 0.29 0.36 0.37 0.32 0.29 0.30 0.35 1.0 0.31

0.21 0.20 0.18 0.16 0.27 0.40 0.58 0.45 0.27 0.59 0.31 1.0

Page 15: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

Matrizes de Coeficientes (obtidas pelo SAS)

0.4217 0.3429 -0.8577 -0.7884 0.0308

0.1951 -0.6683 0.4434 -0.2691 0.9832

t

A = 0.1676 -0.8532 -0.2592 0.4688 -0.9141

-0.0229 0.3561 -0.4231 1.0423 0.5244

0.4597 0.7287 0.9799 -0.1682 -0.4392

0.4252 -0.088 0.4918 -0.1284 -0.4823

0.2089 0.4363 -0.7832 -0.3405 -0.7499

t

B = -0.0359 -0.0929 -0.4778 -0.6059 0.3457

0.0235 0.926 -0.0065 0.4044 0.3116

0.2903 -0.1011 0.2831 -0.4469 0.7030

0.5157 -0.5543 -0.4125 0.6876 0.1796

-0.1101 -0.0317 0.9285 0.2739 -0.0145

Page 16: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

Matrizes de Correlações

Correlações do vetor U com o grupo X(1)

RU.1

U1 U2 U3 U4 U5

X1(1)

0.829 0.109 -0.485 -0.247 0.061

X2(1)

0.730 -0.437 0.200 0.002 0.486

X3(1)

0.753 -0.466 -0.106 0.302 -0.336

X4(1)

0.616 0.223 -0.205 0.661 0.303

X5(1) 0.861 0.266 0.389 0.148 -0.125

Correlações do vetor U com o grupo X(2)

RU.2

U1 U2 U3 U4 U5

X1(2)

0.419 0.011 0.041 -0.009 -0.019

X2(2)

0.357 0.085 -0.021 -0.026 -0.019

X3(2) 0.214 0.009 -0.021 -0.039 0.024

X4(2)

0.209 0.187 -0.001 0.029 0.019

X5(2)

0.362 0.026 0.025 -0.032 0.025

X6(2)

0.445 -0.057 -0.028 0.029 0.011

X7(2) 0.278 0.039 0.059 -0.014 0.004

Page 17: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

Correlações do vetor V com o grupo X(1)

RV.1

V1 V2 V3 V4 V5

X1(1)

0.459 0.026 -0.058 -0.018 0.004

X2(1)

0.404 -0.103 0.024 0.000 0.028

X3(1)

0.417 -0.110 -0.013 0.022 -0.019

X4(1)

0.341 0.053 -0.025 0.048 0.017

X5(1) 0.477 0.063 0.046 0.011 -0.007

Correlações do vetor V com o grupo X(2)

RV.2

V1 V2 V3 V4 V5

X1(2)

0.756 0.045 0.340 -0.129 -0.337

X2(2)

0.644 0.358 -0.172 -0.353 -0.334

X3(2) 0.387 0.037 -0.177 -0.535 0.415

X4(2)

0.377 0.792 -0.005 0.289 0.334

X5(2)

0.653 0.108 0.209 -0.438 0.435

X6(2)

0.804 -0.242 -0.235 0.405 0.196

X7(2) 0.502 0.163 0.493 -0.189 0.068

Testes parciais para as correlações canônicas

k * 1 – 2* 5 * )ˆ1(

2

ki i T

gl Valor p

1 0.5537 0.6934 0.6399 346.68 35 0

2 0.2364 0.9441 0.9228 62.38 24 0.000029

3 0.1192 0.9858 0.9774 17.72 15 0.277557

4 0.0722 0.9948 – – –

5 0.0573 0.9967 – – –

Page 18: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

Matrizes de aproximações: considerando p = 2 variáveis canônicas

(as matrizes 1

Aˆ e

1Bˆ são apresentadas truncadas)

0.8294 0.1093

0.7564 0.0446

0.7304 -0.4366

0.6439 0.3582

1Aˆ =

0.7533 -0.4661

1Bˆ = 0.3872 0.0373

0.6160 0.2225

0.3772 0.7919

0.8606 0.2660

0.6532 0.1084

0.8040 -0.2416

0.5024 0.1629

Matriz aproximada:

2221

1211

RR

RRR ~~

~~~

0.6998 0.5580 0.5738 0.5352 0.7428 0.3485 0.3049 0.1788 0.1937 0.3028 0.3630 0.2349

0.5580 0.7240 0.7537 0.3527 0.5124 0.3013 0.2234 0.1528 0.0708 0.2530 0.3501 0.1864

0.5738 0.7537 0.7848 0.3603 0.5243 0.3106 0.2291 0.1574 0.0701 0.2605 0.3620 0.1916

0.5352 0.3527 0.3603 0.4289 0.5893 0.2603 0.2384 0.1340 0.1703 0.2285 0.2615 0.1799

0.7428 0.5124 0.5243 0.5893 0.8115 0.3633 0.3294 0.1869 0.2295 0.3181 0.3679 0.2497

0.3485 0.3013 0.3106 0.2603 0.3633 0.5741 0.5030 0.2946 0.3206 0.4989 0.5974 0.3873

0.3049 0.2234 0.2291 0.2384 0.3294 0.5030 0.5429 0.2627 0.5265 0.4594 0.4311 0.3818

0.1788 0.1528 0.1574 0.1340 0.1869 0.2946 0.2627 0.1513 0.1756 0.2570 0.3023 0.2006

0.1937 0.0708 0.0701 0.1703 0.2295 0.3206 0.5265 0.1756 0.7694 0.3322 0.1119 0.3185

0.3028 0.2530 0.2605 0.2285 0.3181 0.4989 0.4594 0.2570 0.3322 0.4385 0.4990 0.3459

0.3630 0.3501 0.3620 0.2615 0.3679 0.5974 0.4311 0.3023 0.1119 0.4990 0.7048 0.3646

0.2349 0.1864 0.1916 0.1799 0.2497 0.3873 0.3818 0.2006 0.3185 0.3459 0.3646 0.2789

Page 19: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

Matriz de erros: RRεε

εεε

2221

1211 ~

0.3002 -0.0680 -0.0438 -0.0452 -0.2328 -0.0185 0.0151 0.0212 -0.0037 -0.0028 0.0070 -0.0249

-0.0680 0.2760 -0.1837 0.1073 0.0176 -0.0013 -0.0134 0.0072 0.0092 0.0170 -0.0001 0.0136

-0.0438 -0.1837 0.2152 0.1197 0.0457 -0.0006 0.0009 -0.0174 -0.0001 -0.0205 0.0080 -0.0116

-0.0452 0.1073 0.1197 0.5711 -0.0193 -0.0203 -0.0184 -0.0140 0.0197 -0.0185 0.0285 -0.0199

-0.2328 0.0176 0.0457 -0.0193 0.1885 0.0167 -0.0094 -0.0169 0.0005 0.0019 -0.0079 0.0203

-0.0185 -0.0013 -0.0006 -0.0203 0.0167 0.4259 -0.0730 -0.0246 -0.0806 -0.1589 -0.2274 0.0127

0.0151 -0.0134 0.0009 -0.0184 -0.0094 -0.0730 0.4571 0.0673 -0.2665 0.0806 -0.1111 0.1982

0.0212 0.0072 -0.0174 -0.0140 -0.0169 -0.0246 0.0673 0.8487 0.0744 0.2030 -0.0123 0.2494

-0.0037 0.0092 -0.0001 0.0197 0.0005 -0.0806 -0.2665 0.0744 0.2306 -0.0522 0.1881 -0.0485

-0.0028 0.0170 -0.0205 -0.0185 0.0019 -0.1589 0.0806 0.2030 -0.0522 0.5615 -0.1490 0.2441

0.0070 -0.0001 0.0080 0.0285 -0.0079 -0.2274 -0.1111 -0.0123 0.1881 -0.1490 0.2952 -0.0546

-0.0249 0.0136 -0.0116 -0.0199 0.0203 0.0127 0.1982 0.2494 -0.0485 0.2441 -0.0546 0.7211

Proporção de variação explicada:

0.6905

3.4489)~

( 11)1( p

traço R

0.4947

3.4599)~

( 22)2( q

traço R

Page 20: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

Exemplo 5: Waugh (1942), apresenta medidas de n = 138 mostras de

trigo duro vermelho canadense de primavera, sendo que as medidas foram

obtidas dos grãos de trigo e da farinha produzida. As variáveis

padronizadas são: (1)

Z = variáveis referentes aos grãos:

)1(

1Z = textura dos grãos;

)1(

2Z = peso dos grãos;

)1(

3Z = grãos danificados;

)1(

4Z = sujeira/corpos estranhos;

)1(

5Z = proteína bruta no trigo.

(2)

Z = variáveis referentes à farinha produzida:

)2(

1Z = trigo por barril de farinha;

)2(

2Z = cinzas na farinha;

)2(

3Z = proteína bruta na farinha;

)2(

4Z = índice de qualidade do glúten.

Matriz de correlações:

2221

1211

RR

RRR

1 0.754 -0.690 -0.446 0.692 -0.605 -0.479 0.780 -0.152

0.754 1 -0.712 -0.515 0.412 -0.722 -0.419 0.542 -0.102

-0.690 -0.712 1 0.323 -0.444 0.737 0.361 -0.546 0.172

-0.446 -0.515 0.323 1 -0.334 0.527 0.461 -0.393 -0.019

0.692 0.412 -0.444 -0.334 1 -0.383 -0.505 0.737 -0.148

-0.605 -0.722 0.737 0.527 -0.383 1 0.251 -0.490 0.250

-0.479 -0.419 0.361 0.461 -0.505 0.251 1 -0.434 -0.079

0.780 0.542 -0.546 -0.393 0.737 -0.490 -0.434 1 -0.163

-0.152 -0.102 0.172 -0.019 -0.148 0.250 -0.079 -0.163 1

Page 21: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

Testes parciais para as correlações canônicas

k * 1 – 2* 5 * )ˆ1(

2

ki i T

gl Valor p

1 0.9092 0.1733 0.0955 310.0 20 0.000

2 0.6364 0.5950 0.5512 78.63 12 0.000

3 0.2559 0.9345 0.9263 10.11 6 0.120

4 0.0939 0.9912 0.9912 1.168 2 0.558

Pelo teste quiquadrado, r = 2 correlações canônicas são significativas.

Matrizes de Coeficientes

Z1.1 Z1.2 Z1.3 Z1.4 Z1.5

A =

U1

U2

0.2146 0.1719 -0.3297 -0.2638 0.2976

0.9232 -0.5848 0.6526 0.3415 0.5508

Z2.1 Z2.2 Z2.3 Z2.4

B = V1

V2

-0.5350 -0.2877 0.4569 0.0250

1.0102 0.0274 0.9782 -0.1796

Page 22: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

Matriz de correlações aproximadas

R~

=

0.8696 0.6616 -0.6543 -0.5183 0.8149

0.6616 0.7753 -0.7661 -0.6187 0.4567

-0.6543 -0.7661 0.7570 0.6114 -0.4521

-0.5183 -0.6187 0.6114 0.4941 -0.3510

0.8149 0.4567 -0.4521 -0.3510 0.8616

-0.5897 -0.5280 0.7667 -0.1453

-0.7150 -0.4430 0.5352 -0.1036

0.7065 0.4380 -0.5294 0.1025

0.5713 0.3488 -0.4173 0.0809

-0.3926 -0.4700 0.7474 -0.1404

-0.5897 -0.7150 0.7065 0.5713 -0.3926

-0.5280 -0.4430 0.4380 0.3488 -0.4700

0.7667 0.5352 -0.5294 -0.4173 0.7474

-0.1453 -0.1036 0.1025 0.0809 -0.1404

0.9233 0.4495 -0.4460 0.0886

0.4495 0.4039 -0.5873 0.1113

-0.4460 -0.5873 0.9559 -0.1792

0.0886 0.1113 -0.1792 0.0336

Matriz de erros de aproximações:

ε =

0.1304 0.0924 -0.0357 0.0723 -0.1229

0.0924 0.2247 0.0541 0.1037 -0.0447

-0.0357 0.0541 0.2430 -0.2884 0.0081

0.0723 0.1037 -0.2884 0.5059 0.0170

-0.1229 -0.0447 0.0081 0.0170 0.1384

-0.0153 0.0490 0.0133 -0.0067

-0.0070 0.0240 0.0068 0.0016

0.0305 -0.0770 -0.0166 0.0695

-0.0443 0.1122 0.0243 -0.0999

0.0096 -0.0350 -0.0104 -0.0076

-0.0153 -0.0070 0.0305 -0.0443 0.0096

0.0490 0.0240 -0.0770 0.1122 -0.0350

0.0133 0.0068 -0.0166 0.0243 -0.0104

-0.0067 0.0016 0.0695 -0.0999 -0.0076

0.0767 -0.1985 -0.0440 0.1614

-0.1985 0.5961 0.1533 -0.1903

-0.0440 0.1533 0.0441 0.0162

0.1614 -0.1903 0.0162 0.9664

Com r = 2 pares de variáveis canônicas, as proporções de variações

explicadas em cada um dos grupos são:

752.05

8616.04941.07570.07753.08996.0ˆ

U|Z(1)

579.04

0336.09559.04039.09233.0ˆ

V|Z(2)

Page 23: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

Exemplo 5: Medidas de ossos e do crânio de n = 276 frangos brancos de

granja. )1(

1X = comprimento do crânio;

)1(2X = amplitude do crânio;

)2(1X = comprimento do fêmur;

)2(2X = comprimento da tíbia.

Variáveis padronizadas Z t = ( Z1

(1), Z2

(1), Z1

(2), Z2

(2) )

Matriz de correlações amostrais:

2221

1211

RR

RRR

1.0 0.505 0.569 0.602

0.505 1.0 0.422 0.467

0.569 0.422 1.0 0.926

0.602 0.467 0.926 1.0

De onde se obtém:

1062.18560.0

034457808.0ˆ

zA e

4749.26482.2

9439.00603.0ˆ

zB ,

cujas inversas são:

6739.07388.0

2974.09548.0ˆ 1

zA e

0227.09997.0

3564.09343.0ˆ 1

zB

Testes parciais para as correlações canônicas

k * 1 – 2* 2 * )ˆ1(

2

ki i T

gl Valor p

1 0.6311 0.6017 0.5998 139.3 4 0

2 0.0568 0.9968 0.9968 0.8804 1 0.767

Page 24: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

Desta forma, retendo r = 1 par de variáveis canônicas, temos as

seguintes matrizes de correlações aproximadas

6739.07054.0

7054.09116.03445.07808.0

3445.0

7808.0~11R ;

9995.09341.0

9341.08730.09439.00603.0

9439.0

0603.0~22R ;

4661.04356.0

6024.05630.09439.00603.0

3445.0

7808.0)6311.0(

~12R .

Matriz de correlações aproximadas

9995.09341.04661.06024.0

9341.08730.04356.05630.0

4661.04356.05458.07054.0

6024.05630.07054.09116.0

~R

E a matriz de erros de aproximações:

0005.00081.00009.00004.0

0081.01270.00136.00060.0

0009.00136.04542.02004.0

0004.00060.02004.00884.0

~RRε

Page 25: : Variáveis padronizadas Z t = ( Z (1) Z (1) (2) Z(1) Z(2) Z · YX Y, X Y V Corr ( ) ... Proporção de variação explicada Considere a retenção de r variáveis canônicas, então,

Considerando r = 1 par de variáveis canônicas, as proporções de

variações explicadas em cada um dos grupos são:

729.02

5458.09116.0ˆ

U|Z(1)

936.02

9995.08730.0ˆ

V|Z(2)