Modelli Statistici per l’Economia - uniroma1.it · 2017. 5. 11. · 1 Modelli Statistici per...

Post on 28-Feb-2021

7 views 0 download

Transcript of Modelli Statistici per l’Economia - uniroma1.it · 2017. 5. 11. · 1 Modelli Statistici per...

1

Modelli Statistici per lrsquoEconomia

Regressione lineare con un

singolo regressore (terza parte)

2

Verifica di ipotesi su β1

H0 β1 = β10 H1 β1 ne β10

Se egrave vera H0 (cioegrave sotto H0) e n egrave grande la statistica

ha distribuzione N(01)

3

Indichiamo con i il valore della stima OLS di β1

Il valore osservato della statistica test egrave

4

00

Sotto H0 distribuzione di

N(01)

valore osservato

5

Indichiamo con Z la Normale standard e con

Allora

Notazione

6

Un valore-p piccolo fornisce evidenza contro lrsquoipotesi nulla poicheacute egrave piccola la probabilitagrave di osservare un valore almeno pari a quello effettivamente osservato quando H0 egrave vera rarr se valore-p piccolo rifiutiamo H0

Se il valore-p egrave grande non crsquoegrave sufficiente evidenza per rifiutare lrsquoipotesi nulla e non la rifiutiamo almeno provvisoriamente in attesa di ulteriori evidenze

7

Se fissiamo un livello di

significativitagrave α = P(rif H0|H0)

ad es α = 005

0025 0025

0

8

Livello di significativitagrave α

Valore-p

Rifiutiamo H0 se valore-p lt α

0

9

0 196-196

Rifiutiamo H0 seIn alternativa

Valore critico

Se fissiamo un livello di significativitagrave α = P(rif H0|

H0) ad es α = 005

10

H0 β1 = 0 H1 β1 ne 0

Spesso siamo interessati a verificare le ipotesi

indica che la X non ha nessun effetto su Y rarr la retta relativa alla popolazione egrave orizzontale

Si dice che il risultato con riferimento alla stima di un parametro non egrave (statisticamente) significativo quando non ci fornisce evidenza sufficiente per rifiutare H0

11

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

12

Un intervallo di confidenza al 95 per β1 egrave

13

Esempio Dimensione della classe e risultato dellrsquoistruzione

Abbiamo ricavato che

Un intervallo di confidenza al 95 per β1 egrave

[-228 - 196 052 -228 + 196 052]

cioegrave[-330 -126]

14

Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni

Analisi esplorativa

15

hanno media 0

u

x

ˆ

16

ˆ

ˆ

u

y

17y

|u|ˆ

ˆ

18

Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave

19

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

Errori standard classici

20

Errori standard classici

Errori standard robusti

21

Intervalli di confidenza al 95

Con standard error robusti-330 -126

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

22

SE robusti gt SE classici

In pratica spesso accade che

Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0

Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

2

Verifica di ipotesi su β1

H0 β1 = β10 H1 β1 ne β10

Se egrave vera H0 (cioegrave sotto H0) e n egrave grande la statistica

ha distribuzione N(01)

3

Indichiamo con i il valore della stima OLS di β1

Il valore osservato della statistica test egrave

4

00

Sotto H0 distribuzione di

N(01)

valore osservato

5

Indichiamo con Z la Normale standard e con

Allora

Notazione

6

Un valore-p piccolo fornisce evidenza contro lrsquoipotesi nulla poicheacute egrave piccola la probabilitagrave di osservare un valore almeno pari a quello effettivamente osservato quando H0 egrave vera rarr se valore-p piccolo rifiutiamo H0

Se il valore-p egrave grande non crsquoegrave sufficiente evidenza per rifiutare lrsquoipotesi nulla e non la rifiutiamo almeno provvisoriamente in attesa di ulteriori evidenze

7

Se fissiamo un livello di

significativitagrave α = P(rif H0|H0)

ad es α = 005

0025 0025

0

8

Livello di significativitagrave α

Valore-p

Rifiutiamo H0 se valore-p lt α

0

9

0 196-196

Rifiutiamo H0 seIn alternativa

Valore critico

Se fissiamo un livello di significativitagrave α = P(rif H0|

H0) ad es α = 005

10

H0 β1 = 0 H1 β1 ne 0

Spesso siamo interessati a verificare le ipotesi

indica che la X non ha nessun effetto su Y rarr la retta relativa alla popolazione egrave orizzontale

Si dice che il risultato con riferimento alla stima di un parametro non egrave (statisticamente) significativo quando non ci fornisce evidenza sufficiente per rifiutare H0

11

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

12

Un intervallo di confidenza al 95 per β1 egrave

13

Esempio Dimensione della classe e risultato dellrsquoistruzione

Abbiamo ricavato che

Un intervallo di confidenza al 95 per β1 egrave

[-228 - 196 052 -228 + 196 052]

cioegrave[-330 -126]

14

Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni

Analisi esplorativa

15

hanno media 0

u

x

ˆ

16

ˆ

ˆ

u

y

17y

|u|ˆ

ˆ

18

Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave

19

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

Errori standard classici

20

Errori standard classici

Errori standard robusti

21

Intervalli di confidenza al 95

Con standard error robusti-330 -126

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

22

SE robusti gt SE classici

In pratica spesso accade che

Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0

Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

3

Indichiamo con i il valore della stima OLS di β1

Il valore osservato della statistica test egrave

4

00

Sotto H0 distribuzione di

N(01)

valore osservato

5

Indichiamo con Z la Normale standard e con

Allora

Notazione

6

Un valore-p piccolo fornisce evidenza contro lrsquoipotesi nulla poicheacute egrave piccola la probabilitagrave di osservare un valore almeno pari a quello effettivamente osservato quando H0 egrave vera rarr se valore-p piccolo rifiutiamo H0

Se il valore-p egrave grande non crsquoegrave sufficiente evidenza per rifiutare lrsquoipotesi nulla e non la rifiutiamo almeno provvisoriamente in attesa di ulteriori evidenze

7

Se fissiamo un livello di

significativitagrave α = P(rif H0|H0)

ad es α = 005

0025 0025

0

8

Livello di significativitagrave α

Valore-p

Rifiutiamo H0 se valore-p lt α

0

9

0 196-196

Rifiutiamo H0 seIn alternativa

Valore critico

Se fissiamo un livello di significativitagrave α = P(rif H0|

H0) ad es α = 005

10

H0 β1 = 0 H1 β1 ne 0

Spesso siamo interessati a verificare le ipotesi

indica che la X non ha nessun effetto su Y rarr la retta relativa alla popolazione egrave orizzontale

Si dice che il risultato con riferimento alla stima di un parametro non egrave (statisticamente) significativo quando non ci fornisce evidenza sufficiente per rifiutare H0

11

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

12

Un intervallo di confidenza al 95 per β1 egrave

13

Esempio Dimensione della classe e risultato dellrsquoistruzione

Abbiamo ricavato che

Un intervallo di confidenza al 95 per β1 egrave

[-228 - 196 052 -228 + 196 052]

cioegrave[-330 -126]

14

Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni

Analisi esplorativa

15

hanno media 0

u

x

ˆ

16

ˆ

ˆ

u

y

17y

|u|ˆ

ˆ

18

Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave

19

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

Errori standard classici

20

Errori standard classici

Errori standard robusti

21

Intervalli di confidenza al 95

Con standard error robusti-330 -126

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

22

SE robusti gt SE classici

In pratica spesso accade che

Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0

Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

4

00

Sotto H0 distribuzione di

N(01)

valore osservato

5

Indichiamo con Z la Normale standard e con

Allora

Notazione

6

Un valore-p piccolo fornisce evidenza contro lrsquoipotesi nulla poicheacute egrave piccola la probabilitagrave di osservare un valore almeno pari a quello effettivamente osservato quando H0 egrave vera rarr se valore-p piccolo rifiutiamo H0

Se il valore-p egrave grande non crsquoegrave sufficiente evidenza per rifiutare lrsquoipotesi nulla e non la rifiutiamo almeno provvisoriamente in attesa di ulteriori evidenze

7

Se fissiamo un livello di

significativitagrave α = P(rif H0|H0)

ad es α = 005

0025 0025

0

8

Livello di significativitagrave α

Valore-p

Rifiutiamo H0 se valore-p lt α

0

9

0 196-196

Rifiutiamo H0 seIn alternativa

Valore critico

Se fissiamo un livello di significativitagrave α = P(rif H0|

H0) ad es α = 005

10

H0 β1 = 0 H1 β1 ne 0

Spesso siamo interessati a verificare le ipotesi

indica che la X non ha nessun effetto su Y rarr la retta relativa alla popolazione egrave orizzontale

Si dice che il risultato con riferimento alla stima di un parametro non egrave (statisticamente) significativo quando non ci fornisce evidenza sufficiente per rifiutare H0

11

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

12

Un intervallo di confidenza al 95 per β1 egrave

13

Esempio Dimensione della classe e risultato dellrsquoistruzione

Abbiamo ricavato che

Un intervallo di confidenza al 95 per β1 egrave

[-228 - 196 052 -228 + 196 052]

cioegrave[-330 -126]

14

Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni

Analisi esplorativa

15

hanno media 0

u

x

ˆ

16

ˆ

ˆ

u

y

17y

|u|ˆ

ˆ

18

Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave

19

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

Errori standard classici

20

Errori standard classici

Errori standard robusti

21

Intervalli di confidenza al 95

Con standard error robusti-330 -126

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

22

SE robusti gt SE classici

In pratica spesso accade che

Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0

Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

5

Indichiamo con Z la Normale standard e con

Allora

Notazione

6

Un valore-p piccolo fornisce evidenza contro lrsquoipotesi nulla poicheacute egrave piccola la probabilitagrave di osservare un valore almeno pari a quello effettivamente osservato quando H0 egrave vera rarr se valore-p piccolo rifiutiamo H0

Se il valore-p egrave grande non crsquoegrave sufficiente evidenza per rifiutare lrsquoipotesi nulla e non la rifiutiamo almeno provvisoriamente in attesa di ulteriori evidenze

7

Se fissiamo un livello di

significativitagrave α = P(rif H0|H0)

ad es α = 005

0025 0025

0

8

Livello di significativitagrave α

Valore-p

Rifiutiamo H0 se valore-p lt α

0

9

0 196-196

Rifiutiamo H0 seIn alternativa

Valore critico

Se fissiamo un livello di significativitagrave α = P(rif H0|

H0) ad es α = 005

10

H0 β1 = 0 H1 β1 ne 0

Spesso siamo interessati a verificare le ipotesi

indica che la X non ha nessun effetto su Y rarr la retta relativa alla popolazione egrave orizzontale

Si dice che il risultato con riferimento alla stima di un parametro non egrave (statisticamente) significativo quando non ci fornisce evidenza sufficiente per rifiutare H0

11

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

12

Un intervallo di confidenza al 95 per β1 egrave

13

Esempio Dimensione della classe e risultato dellrsquoistruzione

Abbiamo ricavato che

Un intervallo di confidenza al 95 per β1 egrave

[-228 - 196 052 -228 + 196 052]

cioegrave[-330 -126]

14

Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni

Analisi esplorativa

15

hanno media 0

u

x

ˆ

16

ˆ

ˆ

u

y

17y

|u|ˆ

ˆ

18

Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave

19

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

Errori standard classici

20

Errori standard classici

Errori standard robusti

21

Intervalli di confidenza al 95

Con standard error robusti-330 -126

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

22

SE robusti gt SE classici

In pratica spesso accade che

Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0

Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

6

Un valore-p piccolo fornisce evidenza contro lrsquoipotesi nulla poicheacute egrave piccola la probabilitagrave di osservare un valore almeno pari a quello effettivamente osservato quando H0 egrave vera rarr se valore-p piccolo rifiutiamo H0

Se il valore-p egrave grande non crsquoegrave sufficiente evidenza per rifiutare lrsquoipotesi nulla e non la rifiutiamo almeno provvisoriamente in attesa di ulteriori evidenze

7

Se fissiamo un livello di

significativitagrave α = P(rif H0|H0)

ad es α = 005

0025 0025

0

8

Livello di significativitagrave α

Valore-p

Rifiutiamo H0 se valore-p lt α

0

9

0 196-196

Rifiutiamo H0 seIn alternativa

Valore critico

Se fissiamo un livello di significativitagrave α = P(rif H0|

H0) ad es α = 005

10

H0 β1 = 0 H1 β1 ne 0

Spesso siamo interessati a verificare le ipotesi

indica che la X non ha nessun effetto su Y rarr la retta relativa alla popolazione egrave orizzontale

Si dice che il risultato con riferimento alla stima di un parametro non egrave (statisticamente) significativo quando non ci fornisce evidenza sufficiente per rifiutare H0

11

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

12

Un intervallo di confidenza al 95 per β1 egrave

13

Esempio Dimensione della classe e risultato dellrsquoistruzione

Abbiamo ricavato che

Un intervallo di confidenza al 95 per β1 egrave

[-228 - 196 052 -228 + 196 052]

cioegrave[-330 -126]

14

Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni

Analisi esplorativa

15

hanno media 0

u

x

ˆ

16

ˆ

ˆ

u

y

17y

|u|ˆ

ˆ

18

Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave

19

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

Errori standard classici

20

Errori standard classici

Errori standard robusti

21

Intervalli di confidenza al 95

Con standard error robusti-330 -126

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

22

SE robusti gt SE classici

In pratica spesso accade che

Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0

Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

7

Se fissiamo un livello di

significativitagrave α = P(rif H0|H0)

ad es α = 005

0025 0025

0

8

Livello di significativitagrave α

Valore-p

Rifiutiamo H0 se valore-p lt α

0

9

0 196-196

Rifiutiamo H0 seIn alternativa

Valore critico

Se fissiamo un livello di significativitagrave α = P(rif H0|

H0) ad es α = 005

10

H0 β1 = 0 H1 β1 ne 0

Spesso siamo interessati a verificare le ipotesi

indica che la X non ha nessun effetto su Y rarr la retta relativa alla popolazione egrave orizzontale

Si dice che il risultato con riferimento alla stima di un parametro non egrave (statisticamente) significativo quando non ci fornisce evidenza sufficiente per rifiutare H0

11

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

12

Un intervallo di confidenza al 95 per β1 egrave

13

Esempio Dimensione della classe e risultato dellrsquoistruzione

Abbiamo ricavato che

Un intervallo di confidenza al 95 per β1 egrave

[-228 - 196 052 -228 + 196 052]

cioegrave[-330 -126]

14

Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni

Analisi esplorativa

15

hanno media 0

u

x

ˆ

16

ˆ

ˆ

u

y

17y

|u|ˆ

ˆ

18

Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave

19

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

Errori standard classici

20

Errori standard classici

Errori standard robusti

21

Intervalli di confidenza al 95

Con standard error robusti-330 -126

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

22

SE robusti gt SE classici

In pratica spesso accade che

Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0

Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

8

Livello di significativitagrave α

Valore-p

Rifiutiamo H0 se valore-p lt α

0

9

0 196-196

Rifiutiamo H0 seIn alternativa

Valore critico

Se fissiamo un livello di significativitagrave α = P(rif H0|

H0) ad es α = 005

10

H0 β1 = 0 H1 β1 ne 0

Spesso siamo interessati a verificare le ipotesi

indica che la X non ha nessun effetto su Y rarr la retta relativa alla popolazione egrave orizzontale

Si dice che il risultato con riferimento alla stima di un parametro non egrave (statisticamente) significativo quando non ci fornisce evidenza sufficiente per rifiutare H0

11

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

12

Un intervallo di confidenza al 95 per β1 egrave

13

Esempio Dimensione della classe e risultato dellrsquoistruzione

Abbiamo ricavato che

Un intervallo di confidenza al 95 per β1 egrave

[-228 - 196 052 -228 + 196 052]

cioegrave[-330 -126]

14

Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni

Analisi esplorativa

15

hanno media 0

u

x

ˆ

16

ˆ

ˆ

u

y

17y

|u|ˆ

ˆ

18

Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave

19

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

Errori standard classici

20

Errori standard classici

Errori standard robusti

21

Intervalli di confidenza al 95

Con standard error robusti-330 -126

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

22

SE robusti gt SE classici

In pratica spesso accade che

Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0

Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

9

0 196-196

Rifiutiamo H0 seIn alternativa

Valore critico

Se fissiamo un livello di significativitagrave α = P(rif H0|

H0) ad es α = 005

10

H0 β1 = 0 H1 β1 ne 0

Spesso siamo interessati a verificare le ipotesi

indica che la X non ha nessun effetto su Y rarr la retta relativa alla popolazione egrave orizzontale

Si dice che il risultato con riferimento alla stima di un parametro non egrave (statisticamente) significativo quando non ci fornisce evidenza sufficiente per rifiutare H0

11

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

12

Un intervallo di confidenza al 95 per β1 egrave

13

Esempio Dimensione della classe e risultato dellrsquoistruzione

Abbiamo ricavato che

Un intervallo di confidenza al 95 per β1 egrave

[-228 - 196 052 -228 + 196 052]

cioegrave[-330 -126]

14

Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni

Analisi esplorativa

15

hanno media 0

u

x

ˆ

16

ˆ

ˆ

u

y

17y

|u|ˆ

ˆ

18

Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave

19

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

Errori standard classici

20

Errori standard classici

Errori standard robusti

21

Intervalli di confidenza al 95

Con standard error robusti-330 -126

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

22

SE robusti gt SE classici

In pratica spesso accade che

Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0

Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

10

H0 β1 = 0 H1 β1 ne 0

Spesso siamo interessati a verificare le ipotesi

indica che la X non ha nessun effetto su Y rarr la retta relativa alla popolazione egrave orizzontale

Si dice che il risultato con riferimento alla stima di un parametro non egrave (statisticamente) significativo quando non ci fornisce evidenza sufficiente per rifiutare H0

11

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

12

Un intervallo di confidenza al 95 per β1 egrave

13

Esempio Dimensione della classe e risultato dellrsquoistruzione

Abbiamo ricavato che

Un intervallo di confidenza al 95 per β1 egrave

[-228 - 196 052 -228 + 196 052]

cioegrave[-330 -126]

14

Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni

Analisi esplorativa

15

hanno media 0

u

x

ˆ

16

ˆ

ˆ

u

y

17y

|u|ˆ

ˆ

18

Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave

19

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

Errori standard classici

20

Errori standard classici

Errori standard robusti

21

Intervalli di confidenza al 95

Con standard error robusti-330 -126

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

22

SE robusti gt SE classici

In pratica spesso accade che

Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0

Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

11

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

12

Un intervallo di confidenza al 95 per β1 egrave

13

Esempio Dimensione della classe e risultato dellrsquoistruzione

Abbiamo ricavato che

Un intervallo di confidenza al 95 per β1 egrave

[-228 - 196 052 -228 + 196 052]

cioegrave[-330 -126]

14

Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni

Analisi esplorativa

15

hanno media 0

u

x

ˆ

16

ˆ

ˆ

u

y

17y

|u|ˆ

ˆ

18

Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave

19

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

Errori standard classici

20

Errori standard classici

Errori standard robusti

21

Intervalli di confidenza al 95

Con standard error robusti-330 -126

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

22

SE robusti gt SE classici

In pratica spesso accade che

Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0

Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

12

Un intervallo di confidenza al 95 per β1 egrave

13

Esempio Dimensione della classe e risultato dellrsquoistruzione

Abbiamo ricavato che

Un intervallo di confidenza al 95 per β1 egrave

[-228 - 196 052 -228 + 196 052]

cioegrave[-330 -126]

14

Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni

Analisi esplorativa

15

hanno media 0

u

x

ˆ

16

ˆ

ˆ

u

y

17y

|u|ˆ

ˆ

18

Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave

19

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

Errori standard classici

20

Errori standard classici

Errori standard robusti

21

Intervalli di confidenza al 95

Con standard error robusti-330 -126

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

22

SE robusti gt SE classici

In pratica spesso accade che

Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0

Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

13

Esempio Dimensione della classe e risultato dellrsquoistruzione

Abbiamo ricavato che

Un intervallo di confidenza al 95 per β1 egrave

[-228 - 196 052 -228 + 196 052]

cioegrave[-330 -126]

14

Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni

Analisi esplorativa

15

hanno media 0

u

x

ˆ

16

ˆ

ˆ

u

y

17y

|u|ˆ

ˆ

18

Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave

19

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

Errori standard classici

20

Errori standard classici

Errori standard robusti

21

Intervalli di confidenza al 95

Con standard error robusti-330 -126

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

22

SE robusti gt SE classici

In pratica spesso accade che

Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0

Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

14

Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni

Analisi esplorativa

15

hanno media 0

u

x

ˆ

16

ˆ

ˆ

u

y

17y

|u|ˆ

ˆ

18

Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave

19

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

Errori standard classici

20

Errori standard classici

Errori standard robusti

21

Intervalli di confidenza al 95

Con standard error robusti-330 -126

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

22

SE robusti gt SE classici

In pratica spesso accade che

Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0

Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

15

hanno media 0

u

x

ˆ

16

ˆ

ˆ

u

y

17y

|u|ˆ

ˆ

18

Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave

19

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

Errori standard classici

20

Errori standard classici

Errori standard robusti

21

Intervalli di confidenza al 95

Con standard error robusti-330 -126

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

22

SE robusti gt SE classici

In pratica spesso accade che

Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0

Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

16

ˆ

ˆ

u

y

17y

|u|ˆ

ˆ

18

Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave

19

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

Errori standard classici

20

Errori standard classici

Errori standard robusti

21

Intervalli di confidenza al 95

Con standard error robusti-330 -126

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

22

SE robusti gt SE classici

In pratica spesso accade che

Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0

Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

17y

|u|ˆ

ˆ

18

Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave

19

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

Errori standard classici

20

Errori standard classici

Errori standard robusti

21

Intervalli di confidenza al 95

Con standard error robusti-330 -126

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

22

SE robusti gt SE classici

In pratica spesso accade che

Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0

Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

18

Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave

19

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

Errori standard classici

20

Errori standard classici

Errori standard robusti

21

Intervalli di confidenza al 95

Con standard error robusti-330 -126

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

22

SE robusti gt SE classici

In pratica spesso accade che

Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0

Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

19

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

Errori standard classici

20

Errori standard classici

Errori standard robusti

21

Intervalli di confidenza al 95

Con standard error robusti-330 -126

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

22

SE robusti gt SE classici

In pratica spesso accade che

Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0

Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

20

Errori standard classici

Errori standard robusti

21

Intervalli di confidenza al 95

Con standard error robusti-330 -126

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

22

SE robusti gt SE classici

In pratica spesso accade che

Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0

Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

21

Intervalli di confidenza al 95

Con standard error robusti-330 -126

Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)

22

SE robusti gt SE classici

In pratica spesso accade che

Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0

Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

22

SE robusti gt SE classici

In pratica spesso accade che

Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0

Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

23

Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori

Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section

Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

24

Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)

raramente accade

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

25

La regressione quando X egrave una variabile binaria

Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

26

Variabile esplicativa dummy

Esempio Dimensione della classe e risultato dellrsquoistruzione

Qual egrave il significato di β1

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

27

Se Di = 0 (il rapporto studentiinsegnanti egrave alto)

Se Di = 1 (il rapporto studentiinsegnanti egrave basso)

E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0

E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0

rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

28

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

29

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

30

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

31

Intervalli di confidenza al 95

NB non contiene 0

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

32

Data set crescita (disponibile sul sito)

Per n = 65 paesi

crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese

33

r = 035

34

35

36

37

38

39

40

41

42

33

r = 035

34

35

36

37

38

39

40

41

42

34

35

36

37

38

39

40

41

42

35

36

37

38

39

40

41

42

36

37

38

39

40

41

42

37

38

39

40

41

42

38

39

40

41

42

39

40

41

42

40

41

42

41

42

42