Modelli Statistici per l’Economia - uniroma1.it · 2017. 5. 11. · 1 Modelli Statistici per...
Transcript of Modelli Statistici per l’Economia - uniroma1.it · 2017. 5. 11. · 1 Modelli Statistici per...
1
Modelli Statistici per lrsquoEconomia
Regressione lineare con un
singolo regressore (terza parte)
2
Verifica di ipotesi su β1
H0 β1 = β10 H1 β1 ne β10
Se egrave vera H0 (cioegrave sotto H0) e n egrave grande la statistica
ha distribuzione N(01)
3
Indichiamo con i il valore della stima OLS di β1
Il valore osservato della statistica test egrave
4
00
Sotto H0 distribuzione di
N(01)
valore osservato
5
Indichiamo con Z la Normale standard e con
Allora
Notazione
6
Un valore-p piccolo fornisce evidenza contro lrsquoipotesi nulla poicheacute egrave piccola la probabilitagrave di osservare un valore almeno pari a quello effettivamente osservato quando H0 egrave vera rarr se valore-p piccolo rifiutiamo H0
Se il valore-p egrave grande non crsquoegrave sufficiente evidenza per rifiutare lrsquoipotesi nulla e non la rifiutiamo almeno provvisoriamente in attesa di ulteriori evidenze
7
Se fissiamo un livello di
significativitagrave α = P(rif H0|H0)
ad es α = 005
0025 0025
0
8
Livello di significativitagrave α
Valore-p
Rifiutiamo H0 se valore-p lt α
0
9
0 196-196
Rifiutiamo H0 seIn alternativa
Valore critico
Se fissiamo un livello di significativitagrave α = P(rif H0|
H0) ad es α = 005
10
H0 β1 = 0 H1 β1 ne 0
Spesso siamo interessati a verificare le ipotesi
indica che la X non ha nessun effetto su Y rarr la retta relativa alla popolazione egrave orizzontale
Si dice che il risultato con riferimento alla stima di un parametro non egrave (statisticamente) significativo quando non ci fornisce evidenza sufficiente per rifiutare H0
11
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
12
Un intervallo di confidenza al 95 per β1 egrave
13
Esempio Dimensione della classe e risultato dellrsquoistruzione
Abbiamo ricavato che
Un intervallo di confidenza al 95 per β1 egrave
[-228 - 196 052 -228 + 196 052]
cioegrave[-330 -126]
14
Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni
Analisi esplorativa
15
hanno media 0
u
x
ˆ
16
ˆ
ˆ
u
y
17y
|u|ˆ
ˆ
18
Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave
19
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
Errori standard classici
20
Errori standard classici
Errori standard robusti
21
Intervalli di confidenza al 95
Con standard error robusti-330 -126
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
22
SE robusti gt SE classici
In pratica spesso accade che
Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0
Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
2
Verifica di ipotesi su β1
H0 β1 = β10 H1 β1 ne β10
Se egrave vera H0 (cioegrave sotto H0) e n egrave grande la statistica
ha distribuzione N(01)
3
Indichiamo con i il valore della stima OLS di β1
Il valore osservato della statistica test egrave
4
00
Sotto H0 distribuzione di
N(01)
valore osservato
5
Indichiamo con Z la Normale standard e con
Allora
Notazione
6
Un valore-p piccolo fornisce evidenza contro lrsquoipotesi nulla poicheacute egrave piccola la probabilitagrave di osservare un valore almeno pari a quello effettivamente osservato quando H0 egrave vera rarr se valore-p piccolo rifiutiamo H0
Se il valore-p egrave grande non crsquoegrave sufficiente evidenza per rifiutare lrsquoipotesi nulla e non la rifiutiamo almeno provvisoriamente in attesa di ulteriori evidenze
7
Se fissiamo un livello di
significativitagrave α = P(rif H0|H0)
ad es α = 005
0025 0025
0
8
Livello di significativitagrave α
Valore-p
Rifiutiamo H0 se valore-p lt α
0
9
0 196-196
Rifiutiamo H0 seIn alternativa
Valore critico
Se fissiamo un livello di significativitagrave α = P(rif H0|
H0) ad es α = 005
10
H0 β1 = 0 H1 β1 ne 0
Spesso siamo interessati a verificare le ipotesi
indica che la X non ha nessun effetto su Y rarr la retta relativa alla popolazione egrave orizzontale
Si dice che il risultato con riferimento alla stima di un parametro non egrave (statisticamente) significativo quando non ci fornisce evidenza sufficiente per rifiutare H0
11
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
12
Un intervallo di confidenza al 95 per β1 egrave
13
Esempio Dimensione della classe e risultato dellrsquoistruzione
Abbiamo ricavato che
Un intervallo di confidenza al 95 per β1 egrave
[-228 - 196 052 -228 + 196 052]
cioegrave[-330 -126]
14
Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni
Analisi esplorativa
15
hanno media 0
u
x
ˆ
16
ˆ
ˆ
u
y
17y
|u|ˆ
ˆ
18
Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave
19
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
Errori standard classici
20
Errori standard classici
Errori standard robusti
21
Intervalli di confidenza al 95
Con standard error robusti-330 -126
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
22
SE robusti gt SE classici
In pratica spesso accade che
Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0
Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
3
Indichiamo con i il valore della stima OLS di β1
Il valore osservato della statistica test egrave
4
00
Sotto H0 distribuzione di
N(01)
valore osservato
5
Indichiamo con Z la Normale standard e con
Allora
Notazione
6
Un valore-p piccolo fornisce evidenza contro lrsquoipotesi nulla poicheacute egrave piccola la probabilitagrave di osservare un valore almeno pari a quello effettivamente osservato quando H0 egrave vera rarr se valore-p piccolo rifiutiamo H0
Se il valore-p egrave grande non crsquoegrave sufficiente evidenza per rifiutare lrsquoipotesi nulla e non la rifiutiamo almeno provvisoriamente in attesa di ulteriori evidenze
7
Se fissiamo un livello di
significativitagrave α = P(rif H0|H0)
ad es α = 005
0025 0025
0
8
Livello di significativitagrave α
Valore-p
Rifiutiamo H0 se valore-p lt α
0
9
0 196-196
Rifiutiamo H0 seIn alternativa
Valore critico
Se fissiamo un livello di significativitagrave α = P(rif H0|
H0) ad es α = 005
10
H0 β1 = 0 H1 β1 ne 0
Spesso siamo interessati a verificare le ipotesi
indica che la X non ha nessun effetto su Y rarr la retta relativa alla popolazione egrave orizzontale
Si dice che il risultato con riferimento alla stima di un parametro non egrave (statisticamente) significativo quando non ci fornisce evidenza sufficiente per rifiutare H0
11
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
12
Un intervallo di confidenza al 95 per β1 egrave
13
Esempio Dimensione della classe e risultato dellrsquoistruzione
Abbiamo ricavato che
Un intervallo di confidenza al 95 per β1 egrave
[-228 - 196 052 -228 + 196 052]
cioegrave[-330 -126]
14
Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni
Analisi esplorativa
15
hanno media 0
u
x
ˆ
16
ˆ
ˆ
u
y
17y
|u|ˆ
ˆ
18
Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave
19
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
Errori standard classici
20
Errori standard classici
Errori standard robusti
21
Intervalli di confidenza al 95
Con standard error robusti-330 -126
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
22
SE robusti gt SE classici
In pratica spesso accade che
Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0
Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
4
00
Sotto H0 distribuzione di
N(01)
valore osservato
5
Indichiamo con Z la Normale standard e con
Allora
Notazione
6
Un valore-p piccolo fornisce evidenza contro lrsquoipotesi nulla poicheacute egrave piccola la probabilitagrave di osservare un valore almeno pari a quello effettivamente osservato quando H0 egrave vera rarr se valore-p piccolo rifiutiamo H0
Se il valore-p egrave grande non crsquoegrave sufficiente evidenza per rifiutare lrsquoipotesi nulla e non la rifiutiamo almeno provvisoriamente in attesa di ulteriori evidenze
7
Se fissiamo un livello di
significativitagrave α = P(rif H0|H0)
ad es α = 005
0025 0025
0
8
Livello di significativitagrave α
Valore-p
Rifiutiamo H0 se valore-p lt α
0
9
0 196-196
Rifiutiamo H0 seIn alternativa
Valore critico
Se fissiamo un livello di significativitagrave α = P(rif H0|
H0) ad es α = 005
10
H0 β1 = 0 H1 β1 ne 0
Spesso siamo interessati a verificare le ipotesi
indica che la X non ha nessun effetto su Y rarr la retta relativa alla popolazione egrave orizzontale
Si dice che il risultato con riferimento alla stima di un parametro non egrave (statisticamente) significativo quando non ci fornisce evidenza sufficiente per rifiutare H0
11
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
12
Un intervallo di confidenza al 95 per β1 egrave
13
Esempio Dimensione della classe e risultato dellrsquoistruzione
Abbiamo ricavato che
Un intervallo di confidenza al 95 per β1 egrave
[-228 - 196 052 -228 + 196 052]
cioegrave[-330 -126]
14
Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni
Analisi esplorativa
15
hanno media 0
u
x
ˆ
16
ˆ
ˆ
u
y
17y
|u|ˆ
ˆ
18
Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave
19
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
Errori standard classici
20
Errori standard classici
Errori standard robusti
21
Intervalli di confidenza al 95
Con standard error robusti-330 -126
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
22
SE robusti gt SE classici
In pratica spesso accade che
Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0
Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
5
Indichiamo con Z la Normale standard e con
Allora
Notazione
6
Un valore-p piccolo fornisce evidenza contro lrsquoipotesi nulla poicheacute egrave piccola la probabilitagrave di osservare un valore almeno pari a quello effettivamente osservato quando H0 egrave vera rarr se valore-p piccolo rifiutiamo H0
Se il valore-p egrave grande non crsquoegrave sufficiente evidenza per rifiutare lrsquoipotesi nulla e non la rifiutiamo almeno provvisoriamente in attesa di ulteriori evidenze
7
Se fissiamo un livello di
significativitagrave α = P(rif H0|H0)
ad es α = 005
0025 0025
0
8
Livello di significativitagrave α
Valore-p
Rifiutiamo H0 se valore-p lt α
0
9
0 196-196
Rifiutiamo H0 seIn alternativa
Valore critico
Se fissiamo un livello di significativitagrave α = P(rif H0|
H0) ad es α = 005
10
H0 β1 = 0 H1 β1 ne 0
Spesso siamo interessati a verificare le ipotesi
indica che la X non ha nessun effetto su Y rarr la retta relativa alla popolazione egrave orizzontale
Si dice che il risultato con riferimento alla stima di un parametro non egrave (statisticamente) significativo quando non ci fornisce evidenza sufficiente per rifiutare H0
11
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
12
Un intervallo di confidenza al 95 per β1 egrave
13
Esempio Dimensione della classe e risultato dellrsquoistruzione
Abbiamo ricavato che
Un intervallo di confidenza al 95 per β1 egrave
[-228 - 196 052 -228 + 196 052]
cioegrave[-330 -126]
14
Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni
Analisi esplorativa
15
hanno media 0
u
x
ˆ
16
ˆ
ˆ
u
y
17y
|u|ˆ
ˆ
18
Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave
19
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
Errori standard classici
20
Errori standard classici
Errori standard robusti
21
Intervalli di confidenza al 95
Con standard error robusti-330 -126
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
22
SE robusti gt SE classici
In pratica spesso accade che
Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0
Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
6
Un valore-p piccolo fornisce evidenza contro lrsquoipotesi nulla poicheacute egrave piccola la probabilitagrave di osservare un valore almeno pari a quello effettivamente osservato quando H0 egrave vera rarr se valore-p piccolo rifiutiamo H0
Se il valore-p egrave grande non crsquoegrave sufficiente evidenza per rifiutare lrsquoipotesi nulla e non la rifiutiamo almeno provvisoriamente in attesa di ulteriori evidenze
7
Se fissiamo un livello di
significativitagrave α = P(rif H0|H0)
ad es α = 005
0025 0025
0
8
Livello di significativitagrave α
Valore-p
Rifiutiamo H0 se valore-p lt α
0
9
0 196-196
Rifiutiamo H0 seIn alternativa
Valore critico
Se fissiamo un livello di significativitagrave α = P(rif H0|
H0) ad es α = 005
10
H0 β1 = 0 H1 β1 ne 0
Spesso siamo interessati a verificare le ipotesi
indica che la X non ha nessun effetto su Y rarr la retta relativa alla popolazione egrave orizzontale
Si dice che il risultato con riferimento alla stima di un parametro non egrave (statisticamente) significativo quando non ci fornisce evidenza sufficiente per rifiutare H0
11
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
12
Un intervallo di confidenza al 95 per β1 egrave
13
Esempio Dimensione della classe e risultato dellrsquoistruzione
Abbiamo ricavato che
Un intervallo di confidenza al 95 per β1 egrave
[-228 - 196 052 -228 + 196 052]
cioegrave[-330 -126]
14
Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni
Analisi esplorativa
15
hanno media 0
u
x
ˆ
16
ˆ
ˆ
u
y
17y
|u|ˆ
ˆ
18
Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave
19
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
Errori standard classici
20
Errori standard classici
Errori standard robusti
21
Intervalli di confidenza al 95
Con standard error robusti-330 -126
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
22
SE robusti gt SE classici
In pratica spesso accade che
Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0
Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
7
Se fissiamo un livello di
significativitagrave α = P(rif H0|H0)
ad es α = 005
0025 0025
0
8
Livello di significativitagrave α
Valore-p
Rifiutiamo H0 se valore-p lt α
0
9
0 196-196
Rifiutiamo H0 seIn alternativa
Valore critico
Se fissiamo un livello di significativitagrave α = P(rif H0|
H0) ad es α = 005
10
H0 β1 = 0 H1 β1 ne 0
Spesso siamo interessati a verificare le ipotesi
indica che la X non ha nessun effetto su Y rarr la retta relativa alla popolazione egrave orizzontale
Si dice che il risultato con riferimento alla stima di un parametro non egrave (statisticamente) significativo quando non ci fornisce evidenza sufficiente per rifiutare H0
11
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
12
Un intervallo di confidenza al 95 per β1 egrave
13
Esempio Dimensione della classe e risultato dellrsquoistruzione
Abbiamo ricavato che
Un intervallo di confidenza al 95 per β1 egrave
[-228 - 196 052 -228 + 196 052]
cioegrave[-330 -126]
14
Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni
Analisi esplorativa
15
hanno media 0
u
x
ˆ
16
ˆ
ˆ
u
y
17y
|u|ˆ
ˆ
18
Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave
19
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
Errori standard classici
20
Errori standard classici
Errori standard robusti
21
Intervalli di confidenza al 95
Con standard error robusti-330 -126
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
22
SE robusti gt SE classici
In pratica spesso accade che
Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0
Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
8
Livello di significativitagrave α
Valore-p
Rifiutiamo H0 se valore-p lt α
0
9
0 196-196
Rifiutiamo H0 seIn alternativa
Valore critico
Se fissiamo un livello di significativitagrave α = P(rif H0|
H0) ad es α = 005
10
H0 β1 = 0 H1 β1 ne 0
Spesso siamo interessati a verificare le ipotesi
indica che la X non ha nessun effetto su Y rarr la retta relativa alla popolazione egrave orizzontale
Si dice che il risultato con riferimento alla stima di un parametro non egrave (statisticamente) significativo quando non ci fornisce evidenza sufficiente per rifiutare H0
11
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
12
Un intervallo di confidenza al 95 per β1 egrave
13
Esempio Dimensione della classe e risultato dellrsquoistruzione
Abbiamo ricavato che
Un intervallo di confidenza al 95 per β1 egrave
[-228 - 196 052 -228 + 196 052]
cioegrave[-330 -126]
14
Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni
Analisi esplorativa
15
hanno media 0
u
x
ˆ
16
ˆ
ˆ
u
y
17y
|u|ˆ
ˆ
18
Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave
19
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
Errori standard classici
20
Errori standard classici
Errori standard robusti
21
Intervalli di confidenza al 95
Con standard error robusti-330 -126
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
22
SE robusti gt SE classici
In pratica spesso accade che
Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0
Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
9
0 196-196
Rifiutiamo H0 seIn alternativa
Valore critico
Se fissiamo un livello di significativitagrave α = P(rif H0|
H0) ad es α = 005
10
H0 β1 = 0 H1 β1 ne 0
Spesso siamo interessati a verificare le ipotesi
indica che la X non ha nessun effetto su Y rarr la retta relativa alla popolazione egrave orizzontale
Si dice che il risultato con riferimento alla stima di un parametro non egrave (statisticamente) significativo quando non ci fornisce evidenza sufficiente per rifiutare H0
11
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
12
Un intervallo di confidenza al 95 per β1 egrave
13
Esempio Dimensione della classe e risultato dellrsquoistruzione
Abbiamo ricavato che
Un intervallo di confidenza al 95 per β1 egrave
[-228 - 196 052 -228 + 196 052]
cioegrave[-330 -126]
14
Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni
Analisi esplorativa
15
hanno media 0
u
x
ˆ
16
ˆ
ˆ
u
y
17y
|u|ˆ
ˆ
18
Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave
19
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
Errori standard classici
20
Errori standard classici
Errori standard robusti
21
Intervalli di confidenza al 95
Con standard error robusti-330 -126
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
22
SE robusti gt SE classici
In pratica spesso accade che
Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0
Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
10
H0 β1 = 0 H1 β1 ne 0
Spesso siamo interessati a verificare le ipotesi
indica che la X non ha nessun effetto su Y rarr la retta relativa alla popolazione egrave orizzontale
Si dice che il risultato con riferimento alla stima di un parametro non egrave (statisticamente) significativo quando non ci fornisce evidenza sufficiente per rifiutare H0
11
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
12
Un intervallo di confidenza al 95 per β1 egrave
13
Esempio Dimensione della classe e risultato dellrsquoistruzione
Abbiamo ricavato che
Un intervallo di confidenza al 95 per β1 egrave
[-228 - 196 052 -228 + 196 052]
cioegrave[-330 -126]
14
Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni
Analisi esplorativa
15
hanno media 0
u
x
ˆ
16
ˆ
ˆ
u
y
17y
|u|ˆ
ˆ
18
Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave
19
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
Errori standard classici
20
Errori standard classici
Errori standard robusti
21
Intervalli di confidenza al 95
Con standard error robusti-330 -126
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
22
SE robusti gt SE classici
In pratica spesso accade che
Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0
Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
11
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
12
Un intervallo di confidenza al 95 per β1 egrave
13
Esempio Dimensione della classe e risultato dellrsquoistruzione
Abbiamo ricavato che
Un intervallo di confidenza al 95 per β1 egrave
[-228 - 196 052 -228 + 196 052]
cioegrave[-330 -126]
14
Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni
Analisi esplorativa
15
hanno media 0
u
x
ˆ
16
ˆ
ˆ
u
y
17y
|u|ˆ
ˆ
18
Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave
19
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
Errori standard classici
20
Errori standard classici
Errori standard robusti
21
Intervalli di confidenza al 95
Con standard error robusti-330 -126
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
22
SE robusti gt SE classici
In pratica spesso accade che
Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0
Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
12
Un intervallo di confidenza al 95 per β1 egrave
13
Esempio Dimensione della classe e risultato dellrsquoistruzione
Abbiamo ricavato che
Un intervallo di confidenza al 95 per β1 egrave
[-228 - 196 052 -228 + 196 052]
cioegrave[-330 -126]
14
Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni
Analisi esplorativa
15
hanno media 0
u
x
ˆ
16
ˆ
ˆ
u
y
17y
|u|ˆ
ˆ
18
Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave
19
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
Errori standard classici
20
Errori standard classici
Errori standard robusti
21
Intervalli di confidenza al 95
Con standard error robusti-330 -126
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
22
SE robusti gt SE classici
In pratica spesso accade che
Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0
Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
13
Esempio Dimensione della classe e risultato dellrsquoistruzione
Abbiamo ricavato che
Un intervallo di confidenza al 95 per β1 egrave
[-228 - 196 052 -228 + 196 052]
cioegrave[-330 -126]
14
Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni
Analisi esplorativa
15
hanno media 0
u
x
ˆ
16
ˆ
ˆ
u
y
17y
|u|ˆ
ˆ
18
Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave
19
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
Errori standard classici
20
Errori standard classici
Errori standard robusti
21
Intervalli di confidenza al 95
Con standard error robusti-330 -126
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
22
SE robusti gt SE classici
In pratica spesso accade che
Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0
Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
14
Bisogna utilizzare gli errori standard classici o quelli robusti Dipende dalle applicazioni
Analisi esplorativa
15
hanno media 0
u
x
ˆ
16
ˆ
ˆ
u
y
17y
|u|ˆ
ˆ
18
Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave
19
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
Errori standard classici
20
Errori standard classici
Errori standard robusti
21
Intervalli di confidenza al 95
Con standard error robusti-330 -126
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
22
SE robusti gt SE classici
In pratica spesso accade che
Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0
Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
15
hanno media 0
u
x
ˆ
16
ˆ
ˆ
u
y
17y
|u|ˆ
ˆ
18
Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave
19
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
Errori standard classici
20
Errori standard classici
Errori standard robusti
21
Intervalli di confidenza al 95
Con standard error robusti-330 -126
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
22
SE robusti gt SE classici
In pratica spesso accade che
Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0
Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
16
ˆ
ˆ
u
y
17y
|u|ˆ
ˆ
18
Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave
19
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
Errori standard classici
20
Errori standard classici
Errori standard robusti
21
Intervalli di confidenza al 95
Con standard error robusti-330 -126
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
22
SE robusti gt SE classici
In pratica spesso accade che
Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0
Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
17y
|u|ˆ
ˆ
18
Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave
19
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
Errori standard classici
20
Errori standard classici
Errori standard robusti
21
Intervalli di confidenza al 95
Con standard error robusti-330 -126
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
22
SE robusti gt SE classici
In pratica spesso accade che
Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0
Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
18
Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dellrsquoeteroschedasticitagrave
19
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
Errori standard classici
20
Errori standard classici
Errori standard robusti
21
Intervalli di confidenza al 95
Con standard error robusti-330 -126
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
22
SE robusti gt SE classici
In pratica spesso accade che
Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0
Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
19
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
Errori standard classici
20
Errori standard classici
Errori standard robusti
21
Intervalli di confidenza al 95
Con standard error robusti-330 -126
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
22
SE robusti gt SE classici
In pratica spesso accade che
Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0
Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
20
Errori standard classici
Errori standard robusti
21
Intervalli di confidenza al 95
Con standard error robusti-330 -126
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
22
SE robusti gt SE classici
In pratica spesso accade che
Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0
Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
21
Intervalli di confidenza al 95
Con standard error robusti-330 -126
Esempio Dimensione della classe e risultato dellrsquoistruzione (output di R)
22
SE robusti gt SE classici
In pratica spesso accade che
Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0
Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
22
SE robusti gt SE classici
In pratica spesso accade che
Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime intervalli di confidenza meno ampi e test meno conservativi nei confronti di H0
Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime intervalli di confidenza piugrave ampi e test piugrave conservativi nei confronti di H0
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
23
Errori standard classici o robusti analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori
Lrsquoeteroschedasticitagrave egrave una caratteristica frequente dei dati in cross-section
Soluzione prudente assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
24
Se gli errori sono eteroschedastici gli stimatori OLS non sono BLUE Se per ogni i var(ui|Xi) egrave nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(ui|Xi)-1 stimatori dei minimi quadrati ponderati (WLS ndash Weighted Least Squares)
raramente accade
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
25
La regressione quando X egrave una variabile binaria
Finora abbiamo considerato il caso in cui il regressore egrave una variabile continua La regressione puograve essere usata anche quando il regressore si presenta con due modalitagrave che possiamo codificare con 0 e 1 rarr egrave una variabile ldquobinariardquo (si dice anche variabile indicatrice o dummy) Ad esempio
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
26
Variabile esplicativa dummy
Esempio Dimensione della classe e risultato dellrsquoistruzione
Qual egrave il significato di β1
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
27
Se Di = 0 (il rapporto studentiinsegnanti egrave alto)
Se Di = 1 (il rapporto studentiinsegnanti egrave basso)
E(Yi|Di = 0) = β0 poicheacute E(ui|Di = 0) = 0
E(Yi|Di = 1) = β0 + β1 poicheacute E(ui|Di = 1) = 0
rarr E(Yi|Di = 1) - E(Yi|Di = 0) = β1
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
28
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
29
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
30
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
31
Intervalli di confidenza al 95
NB non contiene 0
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
32
Data set crescita (disponibile sul sito)
Per n = 65 paesi
crescita egrave la crescita media annua del paese espressa in percentuale del PIL reale dal 1960 al 1995 commercio egrave la media degli scambi commerciali tra il 1960 al 1995 misurata come la somma di esportazioni ed importazioni divisa per il PIL del paese
33
r = 035
34
35
36
37
38
39
40
41
42
33
r = 035
34
35
36
37
38
39
40
41
42
34
35
36
37
38
39
40
41
42
35
36
37
38
39
40
41
42
36
37
38
39
40
41
42
37
38
39
40
41
42
38
39
40
41
42
39
40
41
42
40
41
42
41
42
42