curs 3 2015 (1)

11
1 REGRESIA LINIARĂ SIMPLĂ C3. 1. Estimarea indicatorilor de corelaţie 2. Testarea indicatorilor de corelaţie 3. Testarea modelului de regresie

Transcript of curs 3 2015 (1)

Page 1: curs 3 2015 (1)

11

REGRESIA LINIARĂ SIMPLĂ

C3.

1. Estimarea indicatorilor de corelaţie

2. Testarea indicatorilor de corelaţie

3. Testarea modelului de regresie

Page 2: curs 3 2015 (1)

2

1. Estimarea indicatorilor de corelaţie (1)

1.Coeficientul de corelaţie (se foloseşte doar pentru modelul liniar):

, -1≤ρ≤+1

Legătura dintre estimația coeficientului de corelație (r) și estimația coeficientului de regresie liniară (b1) se realizează prin relația:

, unde reprezintă estimațiile varianțelor

variabilelor X și Y.

yx

N

iyixi

yx N

yxYX

YX

1

))((),cov(

),(

n

1i

2i

n

1i

2i

n

1i

n

1i

2i

2i

n

1ii

n

1ii

n

1iii

yx

n

1iii

])y(yn][)x(xn[

yxyxn

sns

)yy)(xx(r)Y,X(

2

2

1y

x

s

sbr

2y

2x s si s

Page 3: curs 3 2015 (1)

3

Estimarea indicatorilor de corelaţie (2)

2. Raportul de determinaţie:

, cu 0<η2<1

O estimaţie a raportului de determinaţie se obţine prin relaţia:

T

R

T

E

ii

ii

V

V

V

V

yy

yy

1)(

)ˆ(

2

2

2

TSS

RSS

TSS

ESS

yy

yxbb= R

ii

i

1)(

)(

2

210

2

Page 4: curs 3 2015 (1)

Descompunerea variaţiei totale a variabilei Y

4

Page 5: curs 3 2015 (1)

5

Estimarea indicatorilor de corelaţie (3)

, reprezintă variaţia totală (TSS);

, reprezintă variaţia explicată (ESS);

, reprezintă variaţia reziduală (RSS).

Variaţia totală este egală cu suma celorlalte două variaţii

componente: VT=VE +VR

3. Raportul de corelaţie:2 =

)y - y( = V 2iT

i

2iE )y - y( =V ˆ

)y - y( =V 2iiR ˆ

Page 6: curs 3 2015 (1)

66

Testarea indicatorilor de corelaţie (I) Testarea indicatorilor de corelaţie (I)

1. Testarea coeficientului de corelaţie1. Testarea coeficientului de corelaţie• Ipoteze: Ipoteze: (între variabile nu există o legătură semnificativă)(între variabile nu există o legătură semnificativă)

(variabilele sunt corelate semnificativ)(variabilele sunt corelate semnificativ)

• Test: Test:

– tt este o statistică Student cu este o statistică Student cu (n-2)(n-2) grade de libertate. grade de libertate.– este estimatorul abaterii medii pătratice a lui este estimatorul abaterii medii pătratice a lui

(estimatorul lui (estimatorul lui )): :

• La nivelul eşantionului: La nivelul eşantionului:

0:H 0 0:H1

ˆ-1

2-nˆ=

ˆ

ˆ = t

ˆˆ

2-n

ˆ-1=ˆ

2

ˆ

r - 1

2 - nr =

s

r = t

2r 2-n

r-1=s xy

2

Page 7: curs 3 2015 (1)

77

Testarea indicatorilor de corelaţie (II)Testarea indicatorilor de corelaţie (II)2. 2. Testarea raportului de corelaTestarea raportului de corelaţie ţie

•Formularea ipotezelor:Formularea ipotezelor:

HH00: : ηη=0=0 (între variabile nu există o legătură semnificativă) (între variabile nu există o legătură semnificativă)

HH11: : ηη>0>0 (variabilele sunt corelate semnificativ) (variabilele sunt corelate semnificativ)

• Testarea se face utilizând statistica FTestarea se face utilizând statistica F:: unde: k – nr. parametrilor estimaţi din modelul de regresieunde: k – nr. parametrilor estimaţi din modelul de regresie;; - estimatorul raportului de corelaţie- estimatorul raportului de corelaţie..

La nivelul eşantionului, La nivelul eşantionului,

2

2

calc ˆ1

ˆ

1k

kF

1k

kn

R1

RF

2

2

calc

Page 8: curs 3 2015 (1)

88

Testarea indicatorilor de corelaţie (III)Testarea indicatorilor de corelaţie (III)

•Se citeşte valoarea teoretică a testului:Se citeşte valoarea teoretică a testului:

FFteoreticteoretic= = FFαα,v1, v2 ,v1, v2

unde unde νν11=k-1, =k-1, νν22=n-k reprezintă gradele de libertate =n-k reprezintă gradele de libertate

ale statisticii F.ale statisticii F.

•Criteriu de decizie:Criteriu de decizie: F Fcalccalc > > FFteoreticteoretic se se

respinge ipoterespinge ipotezza nula nulă, ă, cu cu un risc un risc αα

Page 9: curs 3 2015 (1)

99

Testarea modelului de regresie (I)Testarea modelului de regresie (I)Testarea modelului de regresie se realizează cu ajutorul Testarea modelului de regresie se realizează cu ajutorul testului F, după următorul demers:testului F, după următorul demers:

1. Formularea ipotezelor1. Formularea ipotezelorHH00: : ββ00= 0, = 0, ββ11=0 =0 (modelul nu este semnificativ)(modelul nu este semnificativ)

HH11: : (modelul explică semnificativ legătura dintre variabile)(modelul explică semnificativ legătura dintre variabile)

2. Alegerea pragului de semnificaţie 2. Alegerea pragului de semnificaţie αα

3. Alegerea statisticii test3. Alegerea statisticii test

~F(k-1, n-k) ~F(k-1, n-k)

4.4. Valoarea teoretică a statisticii testValoarea teoretică a statisticii test: : FFαα,k-1, n-k,k-1, n-k

5.5. Valoarea calculată a testuluiValoarea calculată a testului: :

1k

kn

V

V

S

SF

R

E2R

2E

1k

kn

RSS

ESSF

0,0 10

Page 10: curs 3 2015 (1)

1010

Testarea modelului de regresie (II)Testarea modelului de regresie (II)

6. Regula de decizie6. Regula de decizie

Dacă se respinge HDacă se respinge H00

Dacă se acceptă HDacă se acceptă H00, pentru risc asumat de 5%., pentru risc asumat de 5%.

În SPSS, decizia se ia pe baza semnificaţiei testului (Sig.):În SPSS, decizia se ia pe baza semnificaţiei testului (Sig.):

- dacă , se respinge H- dacă , se respinge H00

-dacă , se acceptă H-dacă , se acceptă H00, pentru un nivel de încredere , pentru un nivel de încredere de 95%.de 95%.

7. Compararea celor două valori ale statisticii test şi luarea 7. Compararea celor două valori ale statisticii test şi luarea decizieideciziei

8. Interpretarea rezultatului testării8. Interpretarea rezultatului testării

kn,1kcalc FF

kn,1kcalc FF

FSig

FSig

Page 11: curs 3 2015 (1)

1111

Model Summary

.977a .954 .931 550.55630Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Predictors: (Constant), publa.

ANOVAb

12501276 1 12501275.51 41.243 .023a

606224.5 2 303112.245

13107500 3

Regression

Residual

Total

Model1

Sum ofSquares df Mean Square F Sig.

Predictors: (Constant), publa.

Dependent Variable: val_vanzb.

Coefficientsa

2502.041 448.379 5.580 .031 572.821 4431.260

50.510 7.865 .977 6.422 .023 16.669 84.351

(Constant)

publ

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig. Lower Bound Upper Bound

95% Confidence Interval for B

Dependent Variable: val_vanza.

Correlations

1 .977*

.023

4 4

.977* 1

.023

4 4

Pearson Correlation

Sig. (2-tailed)

N

Pearson Correlation

Sig. (2-tailed)

N

val_vanz

publ

val_vanz publ

Correlation is significant at the 0.05 level (2-tailed).*.

Se considera datele cu privire la Se considera datele cu privire la Valoarea vânzărilor şi Cheltuielile cu publicitatea , pentru un esantion de 4 firme.