Download - Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

Transcript
Page 1: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

1

Inferenza Statistica

• Introduzione all’inferenza statistica• Metodo dei minimi quadratiq• Introduzione concetto Stimatori statistici• Stimatori col metodo dei momenti• Stima di parametri in modelli fisici

– Metodo dei Minimi Quadrati • Modelli Lineari• Modelli multilineari

Inferenza statistica - Introduzione

• Nelle precedenti lezioni sono stati introdotti gli strumenti matematici (teoria della probabilità e variabili aleatorie) fondamentali per affrontare il problema dell’inferenza statistica

• Ovvero, dato un campione, quali informazioni possiamo trarre sulla popolazione da cui è tratto? E con quale affidabilità?

Page 2: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

2

Teoria della probabilità. Definizione popolazione e campione.

• Riepilogo Popolazione

P Campione

Processo deduttivo

Processo induttivo

CaratterizzazioneCampione: Statistica

descrittiva

CaratterizzazionePopolazione: Teoria dellaprobabilità e statisticaCorrente

sezione

Inferenza parametrica

• Nell’approccio classico, la caratterizzazione della popolazione incognita passa per l’ipotesi di un modello matematico per la popolazione stessa.

• Ovvero, si suppone che la casualità rispetti una legge dettata da un certo tipo di variabile aleatoria.

• Della pdf caratterizzante il processo casuale non sono noti i parametri.

• Lo scopo è determinare tali parametri dalle informazioni fornite Lo scopo è determ nare tal parametr dalle nformaz on forn te dal campione.

• Per tale motivo, tale tipo di caratterizzazione prende il nome di inferenza parametrica.

Page 3: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

3

Inferenza parametrica

• Esempio: La popolazione genitrice il campione di dati sperimentali è descritta da una gaussiana di media μ e varianza σ2 entrambe gnon noti.

Popolazione μ

σ

• Media e varianza possono essere “ricavati” dalle caratteristiche del campione di dati disponibile.

μ = ?σ2 = ?

Inferenza parametrica

• Incominciamo a considerare il caso in cui la popolazione sia nota, (per esempio: una variabile aleatoria Y di tipo Gaussiano di media μY e varianza σY

2)

σY

• Un’osservazione proveniente da tale

variabile aleatoria può potenzialmente

assumere qualunque valore reale, ma

l ibil i

xμY

plausibilmente non si allontanerà molto dal

trend centrale

Page 4: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

4

Inferenza statistica – Introduzione intuitiva

• Il singolo risultato del processo aleatorio può essere visto come l’estrazione di un risultato da un’ ”urna” in cui i valori più ricorrenti sono nei pressi del trend centrale

xμY

La maggior parte dei risultati che si

possono osservare è nei pressi del centro

Ma non possiamo escludere risultati che siano lontani dal centro

Inferenza statistica – Introduzione intuitiva

• Nel caso in cui si ripetono più prove, la media dei risultati “attenua” l’importanza dei valori individuali estremi

• La media del campione sarà nei pressi della media della popolazione

xμY Y

Page 5: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

5

Inferenza parametricaMetodo dei minimi quadrati

• Nell’ipotesi di VA di tipo normale la migliore “stima” della media può essere ottenuta considerando il valore medio dei punti del campione.

• Tale stima prende il nome di MEDIA del campione di dati.Il l di di i di d ti è i f tti il l θ

N

yy

N

ii∑

== 1

• Il valore medio di un campione di dati è, infatti, il valore θ per cui la somma delle distanze dei valori osservati da esso è minima:

( ) ( )∑=

−=ΦN

iiy

1

2θθ

Inferenza parametricaMetodo dei minimi quadrati

• Infatti con alcuni banali passaggi:

( )

( )( ) 022

0

2 =+−=−∂∂

=∂Φ∂

∑∑ θθθ

θθ

Nyy ii

Ny

y i∑==θ

Page 6: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

6

Inferenza parametricaMetodo dei minimi quadrati

• Nel caso in cui si abbiano Nosservazioni tutte provenienti dallo stessa popolazione (stessa variabile aleatoria) e indipendenti tra esse, si parla di distribuzioni indipendenti identicamente distribuite e si indica con l’acronimo i.i.d.

• Ciascun elemento del campione può essere visto come un esito di una variabile aleatoria.

• L’operazione di somma è quindi da interpretare come una operazione su VA e, in quanto tale, variabile aleatoria anche essa:

Y∑N

yy i∑= N

YY i∑=

Media aritmetica del campione Variabile aleatoria Media

Inferenza parametricaIntroduzione concetto Stimatore

• Se i dati sperimentali sono tutti caratterizzati dalla stessa distribuzione Yi~ N(μ,σ2) quali sono le caratteristiche della VA Media ?Y

[ ] ( )

[ ] [ ] [ ]( ) μμ ==+++

=⎥⎦⎤

⎢⎣⎡ +++=

NN

YEYEYEN

YYYN

EYE

N

N

1...1

...1

21

21

• La media della variabile aleatoria coincide con il parametro media della popolazione sotto esame.

• Questo risultato, nonostante sia intuitivo, non è affatto banale.

Page 7: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

7

Inferenza parametricaIntroduzione concetto Stimatore

• Discorso analogo può essere fatto per la varianza della VA, sfruttando le proprietà incontrate nel caso di trasformazioni lineari:

• In conclusione, se Y ~ N(μ, σ2), la media aritmetica di Nprove sperimentali è una variabile aleatoria

NNY

N

N

ii

2

1

22

11var σσ ==⎟⎠⎞

⎜⎝⎛ ∑∑

=

sperimentali è una variabile aleatoria

⎟⎟⎠

⎞⎜⎜⎝

⎛N

YN

2

,~ σμ

Inferenza parametricaIntroduzione concetto Stimatore

• Riepilogo:• In termini statistici, valutare la media per un campione di dati

i li i l id il i l i di l sperimentali, equivale a considerare il singolo esito di una altra variabile aleatoria, caratterizzata dalla stessa media della singola VA e con una varianza più piccola:

• Con il cappuccio si intende “valore stimato del parametro μ”T l i di i bil l i è i di T M TORE il

nY

ZYZ

22ˆ σσμμμ ===

• Tale tipo di variabile aleatoria è un esempio di STIMATORE per il parametro media μ della VA di tipo gaussiano.

• Nella inferenza puntuale l’obbiettivo è la ricerca degli stimatori caratterizzati dalla minima varianza (e quindi la minore incertezza nel risultato).

Page 8: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

8

Criterio della Massima VerosimiglianzaStimatore Media - Esempio

•1.40.5

0.0

0.2

0.4

0.6

0.8

1.0

1.2

0.0

0.1

0.2

0.3

0.4

σ10σ

Distribuzione densità di probabilità della VA

Y associata alla singola prova sperimentale

Distribuzione densità di probabilità della VA

stimatore media aritmetica

10Y

Inferenza statistica – Media come variabile aleatoria

• Seguendo il grafico delle “urne”, – osservare un valore di X equivale a pescare dall’urna a q p

sinistra, – calcolare la media di un campione equivale a pescare dall’urna

più stretta a destra

μ

XXX

x

Variabile aleatoria X

X X X XXXXXXX

XX

X

XVariabile aleatoria

Page 9: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

9

Inferenza parametricaIntroduzione concetto Stimatore

• Riepilogo:• In termini statistici, valutare la media per un campione di dati

i li i l id il i l i di l sperimentali, equivale a considerare il singolo esito di una altra variabile aleatoria, caratterizzata dalla stessa media della singola VA e con una varianza più piccola:

• Tale tipo di variabile aleatoria è un esempio di STIMATORE per il p m t m di μ d ll VA di tip ssi n

22 x

X X Nσμ σ =

parametro media μ della VA di tipo gaussiano.

Inferenza parametricaIntroduzione concetto Stimatore

• Uno Stimatore è una funzione del campione di dati, non basato sui parametri della popolazione.

• Lo stimatore è una funzione nota delle variabili aleatorie

• Il valore assunto da uno stimatore è quindi l’esito di una VA• Come ogni altra VA, è possibile definire la distribuzione di uno

stimatore.

• Non esiste un unico stimatore per i parametri di una VA• Non esiste un unico stimatore per i parametri di una VA.

Page 10: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

10

Stimatore media -

• La media aritmetica è una valida scelta per stimare il parametro μ di una Gaussiana (in genere per il trend centrale dei risultati)E i h d ll l i i di id il d • Esistono anche delle alternative per individuare il trend centrale:– La mediana – La moda

• Non tutti gli stimatori hanno le stesse “qualità”• Nella inferenza puntuale l’obbiettivo è la ricerca degli stimatori

picaratterizzati dalla minima varianza (e quindi la minore picaratterizzati dalla minima varianza (e quindi la minore incertezza nel risultato).

Inferenza parametricaIntroduzione concetto Stimatore

• Definizione:

• Una funzione di variabili aleatorie che non dipende • Una funzione di variabili aleatorie che non dipende esplicitamente da parametri incogniti è definita statistica.

• Esempio:

• È una statistica. Invece,N

XXXX N+++=

...21

( )μ−XZ• Nonè una statistica, a meno che i parametri μ e σ siano noti.

• Uno stimatore è quindi una statistica

( )σ

μ= XZ

Page 11: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

11

Inferenza parametricaProprietà di uno Stimatore statistico

• Imparzialità: Uno stimatore si dice imparziale (unbiased) se il suo valore atteso coincide con il valore vero del parametro

• NB sebbene il valore vero non sarà mai noto è possibile valutare il verificarsi della imparzialità.

• Efficienza:E’ una misura della varianza dello stimatore Se

( ) Θ=Θ̂E

• Efficienza:E una misura della varianza dello stimatore. Se dispongo di più stimatori devo scegliere quello con varianza minima ovvero quello con la massima efficienza.

Inferenza ParametricaProprietà di uno stimatore statistico

• Esempio – Confronto Stimatori media e mediana per il parametro μ della VA Gaussiana:

[ ][ ] μ

μ==

medianaYEYE

[ ]Y2

var σ=

La media aritmetica e la mediana sono entrambi stimatori imparziali per il

parametro μ della VA Gaussiana

La varianza dello stimatore media è [ ]

[ ]N

Y

NY

mediana

N

2

2var

var

σπ=

= inferiore alla varianza della mediana

La media aritmetica è uno stimatore più efficiente della mediana

Page 12: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

12

Proprietà di uno stimatore

• Da notare che non sempre gli stimatori imparziali sono efficienti e viceversa

• Esempio:

Stimatore U (imparziale)

p(u)

Stimatore V (il più

efficace, ma parziale)

p(v)

μ

Inferenza parametricaProprietà di uno Stimatore statistico

• Consistenza: E’ una proprietà dello stimatore al variare del numero di prove sperimentali. Uno stimatore si dice consistente se:

• Lo stimatore ideale dovrebbe essere uniforme, imparziale e a varianza minima possibile (acronimo: UMVUE, Uniform Minimum Variance Unbiased Estimator)

ˆlimN

θ θ→∞

=

• Si può dimostrare che lo stimatore media aritmetica per una popolazione di tipo gaussiano è uno stimatore UMVUE.

Page 13: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

13

Stimatori – Metodo dei Momenti

• Il metodo dei minimi quadrati (LS: Least Squares) non è il solo modo di ottenere degli stimatori.

• Un altro metodo che può essere usato per ottenere uno stimatore è il metodo dei momenti.

• Definizione:• Momento k-esimo di un campione di dati

∑= kym 1

• Momento centrale k-esimo di un campione di dati:

∑=i

ik yN

m

( )∑ −=i

k

ik yyN

M 1

Stimatori – Metodo dei Momenti

• Il metodo dei momenti è il metodo più semplice per la determinazione dei parametri incogniti in una distribuzione

• Tale metodo ricava i valori dei parametri eguagliando i valori dei momenti del campione di dati con le espressioni matematiche relative.

• A titolo di esempio consideriamo il caso di una VA uniforme di cui non siano noti i valori a e b e che abbia riportato in 5 misure i seguenti esiti:g

– {2.44, 1.21, 2.04, 1.95, 1.82}

Page 14: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

14

Stimatori – Metodo dei Momenti

• È possibile calcolare media e varianza per il campione di dati sperimentali osservati e metterli a sistema con i valori teorici:

• La stima di a e b sarà quindi a = 1.12 e b = 2.66• In linea di principio, è possibile ricavare i valori di a e b da una

l i di i i i i

( ) 198.012

89.12

2

2

1

=−

=

=+

=

baM

bam

qualunque coppia di momenti i-esimi.• Questo approccio è possibile per una qualunque funzione di

distribuzione.• Ovviamente, il tipo di VA deve essere nota

Stimatori – Metodo dei Momenti

• Altro esempio: Variabile aleatoria Y di tipo esponenziale.

( ) ( )

• La funzione ha un solo parametro, λ. • Media (momento primo) e varianza (momento centrale di ordine

2) sono tali che:

( ) ( )( ) ( )yyF

yyf

Y

Y

λλλ−−=

−=exp1exp

λμ 1

= 22 1

λσ =

Page 15: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

15

Stimatori – Metodo dei Momenti

• È utile osservare in questo caso che abbiamo a disposizione, per il metodo dei momenti, due distinte formule per la valutazione del

λ d ll di ib i i lparametro λ della distribuzione esponenziale.

• Esempio: si consideri il caso di una campagna sperimentale per la caratterizzazione del tempo di resistenza di un dato materiale soggetto ad uno sforzo.

• Tale tempo è una variabile aleatoria, dato che varia da campione a campione esaminato

• Supponiamo che 5 prove abbiano riportato i seguenti risultati:Supponiamo che 5 prove abbiano riportato i seguenti risultati

{ 0.178 hr, 0.606 hr, 0.181 hr, 1.13 hr, 0.131 hr}

• Si intende valutare il parametro λ della VA in esame

Stimatori – Metodo dei Momenti VA di tipo esponenziale

• In questo caso è possibile determinare il parametro dalla media:n

• o, analogamente, dalla varianza

24.21446.01 =⇒===∑

= λλn

xy

n

ii

32.210.1861

2

2 =⇒===∑

= λx

s

n

ii

• È da notare che le due procedure portano a due stimatori differenti con due differenti valutazioni del parametro in esame.

32.20.186 2 ⇒ λλn

s

Page 16: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

16

Metodo dei Momenti – Applicazione VA di tipo Gaussiano

• Nel caso di una VA di tipo Gaussiano l’uguaglianza tra momenti campionari e momenti della popolazione porta a risultati di facile interpretazione:

μ==∑

=

N

ym

N

ii

11

( )2∑ yyN

Il metodo dei momenti fornisce anche una

stima ragionevole del parametro varianza ( )

212 σ=

−=

∑=

N

yyM i

i della VA Gaussiana

Criterio della Massima VerosimiglianzaStimatori Varianza.

• Si sono già analizzate le proprietà dello stimatore media.• nel caso dello stimatore varianza:

• Si può innanzitutto osservare che lo stimatore è dipendente dallo stimatore

( )∑=

−=N

iiN Y

N 1

22 ˆ1ˆ μσ

2ˆNσμ̂

• L’espressione per lo stimatore suggerirebbe una relazione con una variabile aleatoria di tipo 2χ

Page 17: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

17

Stima di parametri

• Il caso più interessante è quello in cui la relazione attesa sialineare

• N el caso dell’esperienza della caduta di un oggetto esiste unarelazione di tipo lineare che correla velocità v con il tempo di caduta t

• Più in generale possiamo considerare relazioni del seguente tipo

xy 10 ββ +=

gtvv += 0

• dove β0 (intercetta) e β1 (pendenza) sono costanti

Stima dei parametriCaso dipendenza lineare

• In assenza di incertezza nell’osservazione di yi ci aspettiamo che i punti (x,y), al variare delle condizioni operative xi si trovino tutti su una retta.

Y

15

20

25

30

35

X

0 2 4 6 8 10 120

5

10

Page 18: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

18

Stima dei parametriCaso dipendenza lineare

• In realtà la presenza di errore impedisce che i punti siano allineati.

Y

5

10

15

20

25

30

35

40

• La procedura che si può eseguire è ricercare quale è la retta (tra le tante possibili) che approssima meglio i risultati sperimentali.

X

0 2 4 6 8 10 120

Stima di parametri in modelli fisiciMetodo dei Minimi Quadrati: Modelli lineari

• Il modo migliore per descrivere i dati consiste nel cercare la retta (di regressione) che renda minimo la somma di tutti i quadrati delle distanze

y

y = β0+β1xi

yi

di

x

y β0 β1xi

Page 19: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

19

• Per ciascun dato sperimentale è possibile misurare la

Stima dei parametri - Caso dipendenza lineare- Metodo dei minimi quadrati

Per ciascun dato sperimentale è possibile misurare la distanza del singolo dato dalla ipotetica retta. La misura della distanza è misurata nella direzione verticale.

xi

yidi = yi-β0−β1 xi

β0+ β1 xi

• I parametri β0 e β1 della retta non sono noti a priori• È possibile calcolare quali siano i valori che minimizzano la

distanza complessiva dei punti

xi

Stima di parametri in modelli fisiciMetodo dei Minimi Quadrati: Modelli lineari

• La somma di tutte le distanze tra le prove sperimentali e la retta di equazione canonica generica y = β0+β1 x può essere scritta nella forma:forma:

• Dove θ è il vettore dei parametri ignoti {β0, β1}

Definizione• La funzione Φ(θ) è definita funzione obiettivo

La distanza

di = yi– β0 – β1 xi

( ) ( )θ210

2 Φ=−−= ∑∑i

iii

i xyd ββ

yi =a+b xi

di yi β0 β1 xi

è misurata lungo la verticale perché è l’unica sorgente di deviazioni dal valore vero

Questa distanza è funzione solo delle incognite a e b

di

xi

Page 20: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

20

Stima dei parametriCaso dipendenza lineare

Metodo dei minimi quadrati

Gauss:

• La retta deve essere determinata dai punti sperimentali in modo tale che la somma dei quadrati delle distanze di questi punti dalla linea retta sia minima, dove la distanza è misurata nella direzione verticale.

Stima dei parametri Caso dipendenza lineareMetodo dei minimi quadrati

• La somma di tutte le distanze tra le prove sperimentali e la retta di equazione canonica generica y= β0+β1x può essere scritta nella forma:

• Dove θ è il vettore dei parametri ignoti {β0, β1}

DefinizioneLa funzione Φ(θ) è definita funzione obiettivo

( ) ( )θ210

2 Φ=−−= ∑∑i

iii

i xyd ββ

• La funzione Φ(θ) è definita funzione obiettivo

Page 21: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

21

Stima dei parametri - Caso dipendenza lineare - Metodo dei minimi quadrati

• I valori θ che mi minimizzano la funzione Φ(θ) sono la migliore stima dei parametri per la regressione lineare

• Una determinazione puntuale dei parametri passa sempre per la ricerca dei minimi (o dei massimi) di una funzione obiettivo.

• L’operazioni di determinazione dei valori che mi minimizzano (o massimizzano) una funzione obiettivo è detta ottimizzazione

Stima dei parametri - Caso dipendenza lineare - Metodo dei minimi quadrati

• nel caso della regressione lineare, è possibile ottenere una soluzione analitica dei coefficienti β0 e β1 per cui la funzione obiettivo è minima

• Data la funzione obiettivo:

• Si può facilmente verificare che la funzione di β0 e β1 è un paraboloide e quindi ammette una (ed una sola) coppia di valori

( ) ( ) ( )∑ −−=Φ=Φi

ii xy 21010 ,θ ββββ

paraboloide e quindi ammette una (ed una sola) coppia di valori minima.

Page 22: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

22

Stima dei parametri - Caso dipendenza lineare - Metodo dei minimi quadrati

• Il minimo della funzione obiettivo è ricercato tramite gli zeri delle derivate:delle derivate:

( ) ( )

( ) ( ) 0,

0,

210

110

1

210

010

0

=−−∂∂

=Φ∂∂

=−−∂

∂=Φ

∂∂

iii

iii

xy

xy

βββ

βββ

βββ

βββ

• I valori di β0 e β1 che annullano il sistema di equazioni lineari sono delle stime puntuali dei valori veri della regressione lineare.

Stima dei parametriCaso dipendenza lineare - Metodo dei minimi

quadrati• Derivando la funzione rispetto ai parametri

• Con semplici passaggi si ottiene:

( ) ( )

( ) ( ) 02,

02,

10101

10100

=−−−=Φ∂∂

=−−−=Φ∂

iiii

iii

xxy

xy

βββββ

βββββ

NN

• Il sistema di equazioni precedenti è un sistema di equazioni lineari.

i

N

ii

N

ii

N

ii

ii

ii

xyxx

yxN

∑∑∑

∑∑

===

==

=+

=+

11

21

10

1110

ββ

ββ

Page 23: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

23

Stima dei parametri – Caso dipendenza lineare – Metodo dei Minimi Quadrati

• Le due equazioni lineari sono talvolta chiamate equazioni normalie possono essere facilmente risolte per le costanti β0 e β1

d

xy 10 ββ −=2

11

2

1111 1

1

`⎟⎠⎞⎜

⎝⎛−

−=

∑∑

∑∑∑

==

===

N

ii

N

ii

N

ii

N

ii

N

iii

xN

x

yxN

xyβ

dove:

N

yy

N

ii∑

== 1

N

xx

N

ii∑

== 1

Le formule danno le miglioristime possibili per icoefficienti β0 e β1

Stima dei parametri - Caso dipendenza lineare - Metodo dei minimi quadrati

• Si definisce la somma corretta dei quadrati delle xN

• E la somma corretta dei prodotto x ed y

( )∑=

−=i

ixx xxS1

2

( )( ) ( )∑∑==

−=−−=N

iii

N

iiixy xxyyyxxS

11

• Con qualche passaggio si ottiene la formula equivalente:

( )

( )∑

=

=

−== N

ii

N

iii

xx

xy

xx

xxy

SS

1

2

11 v

v

β

Page 24: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

24

Stima di parametri in modelli fisiciMetodo dei Minimi Quadrati: Modelli lineari

• I valori determinati e sono delle combinazioni lineari delle variabili aleatorie yi

0β̂ 1̂β

• Sono pertanto anche esse delle variabili aleatorie.• Se si ripetono n esperimenti nelle stesse condizioni operative dei

precedenti esperimenti otterremo dei valori differenti per le stime di e

• Le stime dei parametri che tipo di variabili aleatorie sono? Sono delle variabili aleatorie indipendenti?

0β̂ 1̂β

• Le proprietà degli stimatori introdotti con il metodo dei Minimi Quadrati saranno discusse nel seguito

Criterio della Massima VerosimiglianzaModelli lineari – Proprietà stimatori

• È possibile determinare il valore atteso delle variabili aleatorie relative a β0 e β1.0 1

• Consideriamo dapprima la variabile aleatoria relativa a β1

• Possiamo scrivere:

• Dove ci è uguale a:

∑==i

iiXX

XY YcSS

1̂β

l è l ( )

XX

ii S

xxc −=

Tale termine è completamente deterministico in quanto funzione delle sole condizioni sperimentali xi (che si suppone siano note con

precisione assoluta)

Page 25: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

25

Criterio della Massima VerosimiglianzaModelli lineari – Proprietà stimatori

• È possibile quindi calcolare il valore atteso dello stimatore:

• Passaggio 1

( ) ( )

( ) ∑ ∑∑

∑∑+=+

=⎟⎠

⎞⎜⎝

⎛=

i iiii

iii

iii

iii

xccxEc

YEcYcEE

1010

ββββ

β

Questo termine sarà valutato nel passaggio 2

Questo termine sarà valutato nel passaggio 3

Criterio della Massima VerosimiglianzaModelli lineari – Proprietà stimatori

• Passaggio 2( ) ( )∑∑∑ −i xx 01

• Passaggio 3

( )( ) ( )

( )∑∑∑ ∑∑ =−−

=−

=i

i

iii

ii

i

ii xx

xxxxc 022

( ) ( )( )1=

−−=

−=

∑∑∑

XX

iii

i XX

iii

ii S

xxxx

Sxxxxc

• In maniera analoga si dimostra che anche β0 è uno stimatore imparziale

( ) 11̂ ββ =E Lo stimatore β1 è imparziale

Page 26: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

26

Criterio della Massima VerosimiglianzaModelli lineari – Proprietà stimatori

• Parzialità stimatore varianza• Si può dimostrare che:p

• Lo stimatore varianza è parziale. Uno stimatore imparziale è:

( )( )

2

2

102 2

ˆˆˆ σ

ββσ

nn

n

xyEE i

ii −=

⎟⎟⎟⎟

⎜⎜⎜⎜

⎛ −−=

( )2

ˆˆ 2

102

−−=

∑n

xys i

ii ββ

Criterio della Massima VerosimiglianzaModelli lineari – Varianza stimatori

• Dato che e sono delle variabili aleatorie è possibile calcolare per esse la varianza.

0β̂ 1̂βp

• Per β1 è possibile scrivere:

• Dove∑

=

=n

iiiYc

11̂β

( )ii S

xxc −=

• È possibile scrivere per la varianza di :

xxS

( ) ( )∑∑==

=⎟⎠

⎞⎜⎝

⎛=

n

iii

n

iii YVcYcVV

1

2

!

β̂

Page 27: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

27

Criterio della Massima VerosimiglianzaModelli lineari – Varianza stimatori

• Se si suppone per ciascuna yi la stessa varianza:

⎟⎞

⎜⎛

( ) ( )

( )

( )n

i

n

i n

ii

in

ii

Sxx

xx

xxcV

22

2

12

1

2

22

1

221

σ1

σσˆ

=−⎞⎛

=

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎠

⎞⎜⎝

⎛−

−==

∑∑

∑=

=

=

β

• Domanda: come è possibile ridurre la varianza dello stimatore(ovvero, ottenere una stima più precisa)?

( )( )

xxiin

ii

Sxx

12

1

2 ⎟⎠

⎞⎜⎝

⎛−

∑∑ =

=

Criterio della Massima VerosimiglianzaModelli lineari – Varianza stimatori

• Considerazioni analoghe possono essere fatte per la variabile aleatoria β0:

• Come è possibile ridurre l’incertezza nella stima della variabile ?

( )xxS

xn

V222

0σσˆ +=β

0β̂

Page 28: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

28

Criterio della Massima VerosimiglianzaModelli lineari – Proprietà stimatori

• Per quanto riguarda la covarianza si può dimostrare che:

• la covarianza può essere negativa. Le varianze non possono, ovviamente, essere negative. La matrice di covarianza deve essere definita positiva.

XXSx

2

12σσ −=

• Va notato che tutte le varianze contengono il valore vero della varianza sperimentale. Per arrivare a stime bisogna sostituire la stima di tale varianza.

Metodo dei Minimi Quadrati – Leggepolinomiale

• Spesso accade che una variabiley sia esprimibile come una leggepolinomiale di una seconda variabile x

• Per esempio, ci aspettiamo che l’altezza y di un corpo che cadesia una funzione quadratica del tempo

nnxxxy ββββ ++++= ...2

210

200 2

1 gttvyy −+=

• dove y0 e v0 sono l’altezza e la velocità iniziali e g è l’accelerazionedi gravità

2

Page 29: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

29

Metodo dei Minimi Quadrati – Legge polinomiale

• Per semplicità di trattazione ci limitiamo a considerare solo ild l d dcaso di una legge di tipo quadratico:

• Anche in questo caso è possibile determinare i valori di β0, β1e β2 che rendano minima la somma delle distanze tra i valoriosservati yi ed i valori predetti dal modello β0+β1xi

2210 xxy βββ ++=

( ) ( )∑=

−−−=ΦN

iiii xxy

1

22210210 ,, ββββββ

Metodo dei Minimi Quadrati – Legge polinomiale

• Differenziando la funzione obiettivo rispetto ai parametri A, B e C si perviene al seguente sistema di equazioni lineari che puòessere risolto sfruttando i metodi tradizionali (esempio: metododi Cramer)

∑∑∑∑∑∑∑∑∑∑∑

=++

=++

=++

iii

ii

ii

ii

iii

ii

ii

ii

ii

ii

ii

yxxxx

yxxxx

yxxN

242

21

20

32

210

2210

βββ

βββ

βββ

• Il problema può essere generalizzato per una legge polinomialequalunque (anche se i calcoli diventano sempre più complicatiall’aumentare dell’ordine)

Page 30: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

30

Metodo dei Minimi Quadrati – Dipendenza lineare dai parametri

• In presenza di una dipendenza lineare dai parametri è possibile considerare qualunque dipendenza non lineare dalle variabili

• Esempio:

• è una legge lineare in z1=sinx e z2 = cosx• Può essere pertanto risolta con una procedura assolutamente

analoga al caso precedente

xBxAy cossin +=

Metodo dei Minimi Quadrati –Linearizzazione: Funzione esponenziale

• Una delle più importanti funzioni nella fisica è la funzione i lesponenziale

• Dove A e B sono delle costanti.• Parecchi problemi fisici sono descritti da questo semplice

modello, che è chiaramente non lineare nei parametri• L’applicazione diretta della formula per la ricerca del minimo

BxAey =

della funzione obiettivo non ammette soluzione analitica:

( ) ( )∑ −=Φi

Bxi

iAeyBA2

,

Page 31: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

31

Metodo dei Minimi Quadrati –Linearizzazione: Funzione esponenziale

• È comunque possibile trasformare la relazione lineare tra yed xin una relazione lineare, per la quale è quindi possibile applicare la regressione lineare:

• Per ottenere la “linearizzazione” si fa semplicemente il logaritmo della dipendenza

• Si ricade quindi in un problema che può essere trattato con la classica regressione lineare

ii BxAy += lnln

class ca regress one l neare

BxAzy ii +== lnln

Metodo dei Minimi Quadrati –Linearizzazione: Funzione esponenziale

• La linearizzazione attrae per la sua semplicità ed è usato frequentemente.

• Tuttavia, il metodo non è del tutto legittimo da un punto di vista rigoroso.

• La derivazione del metodo era basata sull’ipotesi che i valori misurati y1,…, yNerano tutti ugualmente incerti.

• Ora stiamo ottenendo la regressione usando la variabile z=ln(y). Se i valori misurati yi sono tutti ugualmente incerti, i valori di zicorrispondenti non lo sonop

Page 32: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

32

• La trasformazione altera l’errore e questo fatto ha delle

Metodo dei Minimi Quadrati –Linearizzazione: Funzione esponenziale

conseguenze

Log(r)

• L’errore si amplifica per r piccoli e si riduce per r grandi.

r

Metodo dei Minimi Quadrati –Linearizzazione

• È possibile considerare differenti linearizzazioni per differenti modelli

• etc.I i i i di i hi i h l d è

xx

B

AeByAeB

y

xBAyAxyAxA

ByXB

Axy

−−

+=⇒+

=

+=⇒=

+=⇒+

=

11lnlnln

111

• In tutti i casi non dimentichiamoci che la procedura non è perfettamente rigorosa

Page 33: Inferenza Statistica - Home - people.unica.it - Università di Cagliaripeople.unica.it/massimilianogrosso/files/2009/09/Inferenza... · è descritta da una gaussiana di media μe

33

Metodo dei Minimi quadrati: Regressione Multipla

• Fin qui abbiamo discusso soltanto osservazioni di due variabili x ed y e la loro relazione.

• In molti problemi reali ci sono più di due variabili che devono essere presi in considerazione. Per esempio nello studiare la pressione P di un gas, si trova che essa dipende dal volume V e dalla temperatura T e si deve analizzare P come una funzione di V e T

• L’esempio più semplice di dipendenza da più variabili è il seguente:

( ) yxyxfz 210, θθθ ++==

Metodo dei Minimi quadrati: Regressione Multipla

• In maniera analoga al caso della regressione polinomiale, la ricerca dei parametri A, B e C passa per la risoluzione di un sistema di equazioni lineari

∑∑∑∑∑∑∑∑∑∑∑

=++

=++

=++

iii

ii

iii

ii

iii

iii

ii

ii

ii

ii

ii

zyyyxy

zxyxxx

zyxN

2210

22

10

210

θθθ

θθθ

θθθ