Appunti modellistica e identificazione -...

84
Appunti modellistica e identificazione Note iniziali 1. Prendere questi appunti con le "pinze", in quanto potrei aver scritto castronerie in alcuni passaggi. 2. I programmi che ho usato finora sono: word 2k7, uno scanner, irfanview 4.32, la mitica hp 50g e software correlato. 3. Per correzioni, suggerimenti o altro, mandate una mail a [email protected] , sono graditissime le segnalazioni! 4. Questo documento è distribuito sotto licenza GNU Free documentation license da P. Aiello. 5. Ho notato (tardino, il 19/02/2010) che conviene numerare le equazioni, visto che il documento sarà sottoposto a modifiche farò così (prendendo in prestito le idee di organizzazione dei riassunti cartacei): a. Per la parte di lezione, le equazioni saranno numerate con numero progressivo L ¿ num b. Per la parte di esercitazione avremo E ¿ num c. Per l'appendice A ¿ num d. qualora dovessi inserire altre equazioni tra due numeri progressivi, per esempio L ¿ 3 ed L ¿ 4 , la numerazione sarà la seguente: L ¿ 3. num , con numeri progressivi. Questo vale per ogni sezione e vale anche per ordini di inserimento successivi (alias L ¿ 3. num 1. num 2. num 3. ) e. potrei farle numerare in automatico, ma creerei un pochino di casino, quindi vado a manina. f. Ho trovato un problema. Supponiamo di avere L ¿ 3 ed L ¿ 3.1 inserisco una nuova equazione tra questi due, come la numero? Aggiungo una lettera. Quindi se ho un problema di inserire tra L ¿ num ed L ¿ num . num scriverò: L ¿ num 1. a.num . Continuando tra L. ¿ num ed L ¿ num.a.num scriverò L ¿ num.a.a.num . Non è il massimo, ma mi evita reimpaginazioni. (ed uso la lettera a a caso, si può vedere come "antecedente" ). g. Ho trovato un altro problema. Nel caso devo cancellare qualcosa? Cancello la formula ma non la numerazione, scrivendo L ¿ numcancellata 6. A causa della notazione cangiante, della mia scarsa capacità di capire "al volo" le cose, e delle poche spiegazioni (causa orario ridotto), gli appunti che prendo sono di 3 tipi: Il primo tipo riguarda quelle parti di cui ne capisco il perchè, ed ovviamente lo trascrivo negli appunti digitali. Il secondo tipo riguarda quelle parti di cui non ne capisco il perchè, ma sono certo di aver scritto commenti e simboli corretti, e quindi la trascrivo (semplicemente ne faccio una copia senza, in pratica, elaborazioni) Il terzo tipo sono quegli spezzoni di lezione di cui non ho capito e non

Transcript of Appunti modellistica e identificazione -...

Page 1: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Appunti modellistica e identificazioneNote iniziali

1. Prendere questi appunti con le "pinze", in quanto potrei aver scritto castronerie in alcuni passaggi.

2. I programmi che ho usato finora sono: word 2k7, uno scanner, irfanview 4.32, la mitica hp 50g e software correlato.

3. Per correzioni, suggerimenti o altro, mandate una mail a [email protected] , sono graditissime le segnalazioni!

4. Questo documento è distribuito sotto licenza GNU Free documentation license da P. Aiello.

5. Ho notato (tardino, il 19/02/2010) che conviene numerare le equazioni, visto che il documento sarà sottoposto a modifiche farò così (prendendo in prestito le idee di organizzazione dei riassunti cartacei):

a. Per la parte di lezione, le equazioni saranno numerate con numero progressivo L ¿num

b. Per la parte di esercitazione avremo E ¿numc. Per l'appendice A ¿numd. qualora dovessi inserire altre equazioni tra due numeri progressivi, per esempio

L¿3 ed L ¿4 , la numerazione sarà la seguente: L ¿3.num , con numeri progressivi. Questo vale per ogni sezione e vale anche per ordini di inserimento successivi (alias L ¿3.num 1.num 2.num 3.… )

e. potrei farle numerare in automatico, ma creerei un pochino di casino, quindi vado a manina.

f. Ho trovato un problema. Supponiamo di avere L ¿3 ed L ¿3.1 inserisco una nuova equazione tra questi due, come la numero?Aggiungo una lettera.Quindi se ho un problema di inserire tra L ¿num ed L ¿num.num scriverò: L ¿num1.a .num .Continuando tra L .¿num ed L ¿num.a .num scriveròL ¿num.a .a .num . Non è il massimo, ma mi evita reimpaginazioni. (ed uso la lettera a a caso, si può vedere come "antecedente" ).

g. Ho trovato un altro problema. Nel caso devo cancellare qualcosa? Cancello la formula ma non la numerazione, scrivendo L ¿numcancellata

6. A causa della notazione cangiante, della mia scarsa capacità di capire "al volo" le cose, e delle poche spiegazioni (causa orario ridotto), gli appunti che prendo sono di 3 tipi:Il primo tipo riguarda quelle parti di cui ne capisco il perchè, ed ovviamente lo trascrivo negli appunti digitali.Il secondo tipo riguarda quelle parti di cui non ne capisco il perchè, ma sono certo di aver scritto commenti e simboli corretti, e quindi la trascrivo (semplicemente ne faccio una copia senza, in pratica, elaborazioni)Il terzo tipo sono quegli spezzoni di lezione di cui non ho capito e non mi sembra corretto ciò che ho scritto, in quel caso trascrivo solo l'argomento di cui si è parlato, citandolo e nient'altro per evitare confusione (sia per me sia per altri).Per il secondo e terzo tipo spero che andando a icevimento dal professore riesco a dissipare i dubbi (e quindi a migliorare gli appunti digitali), altrimenti li lascio come sono, meglio aver meno cose buone che più cose fatte male e fuorvianti.

7. Questo documento deve cercare di essere coerente con se stesso (ovvero le informazioni in esso contenute non devono entrare in contraddizione), come secondo

Page 2: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

obiettivo si cerca di inserire tutto il resto che risulta poco chiario(al limite si rivede) che è contenuto negli appunti della lezione.Coerente non significa corretto! Una cosa può essere coerente nella sua esposizione, anche se totalmente irreale o sbagliata. Ma almeno è coerente, quarzo.

8. E' ovvio che anche se effettuerò almeno una revisione, non individuerò tutti gli errori, quindi più occhi che visionano lo stesso documento fanno solo bene a quest'ultimo.

Indice1. Note iniziali

2. Indice

3. Lezione 22/01/2010

3.1. Sistema generale di riferimento

3.2. Obiettivo da raggiungere

3.3. Obiettivo più "realistico"

3.4. Il processo di identificazione è necessario anche se si conosce gran parte della struttura di f

3.5. Tipi di modellazione

3.6. Caratteristiche dei modelli derivati dai processi di identificazione

3.7. Processo/algoritmo di identificazione

4. Lezione 29/01/2010

4.1. Definizione generale dei segnali di disturbo

4.2. Problema di analisi dei segnali di disturbo

4.3. Analisi probabilistica: variabile aleatoria

4.4. Analisi probabilistica: distribuzione di probabilità

4.5. Analisi probabilistica: processo stocastico

4.6. Analisi probabilistica: distribuzione di probabilità congiunta

4.7. Analisi probabilistica: distribuzione di probabilità congiunta applicata ad un processo stocastico

4.8. Generazione di processi stocastici tramite equazioni differenziali lineari

4.9. Analisi probabilistica: Parametri caratterizzanti una distribuzione di probabilità congiunta di un processo stocastico

4.10. Analisi probabilistica: Processo stocastico stazionario

4.11. Analisi probabilistica: Processo stocastico debolmente stazionario

4.12. Analisi probabilistica: Osservazioni nel caso di processi stocastici debolmente stazionari

4.13. Analisi probabilistica: dall'esercitazione del 5 feb 2010

4.14. Funzione di densità spettrale

4.15. Informazioni ottenibili tramite la funzione di densità spettrale

4.16. Indice di autocorrelazione e causalità

4.17. Un processo stocastico particolare, il rumore bianco

Page 3: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

5. Lezione 12/02/2010

5.1. Introduzione al processo di identificazione

5.2. Modello di regressione lineare per l'identificazione di un sistema senza disturbi

5.3. Esempio di identificazione del sistema, la risposta al gradino

5.4. Ottenere la soluzione del modello di regressione lineare

5.5. Ottenere la soluzione del modello di regressione lineare con sistema con disturbi/errori

5.6. Proprietà statistiche della soluzione del modello di regressione lineare con sistema con disturbi/errori stocastici.

6. Lezione 26/02/2010

6.1. Segnali noti di "stimolazione" per l'identificazione

6.2. Premesse per l'analisi dei segnali noti di stimolazione

6.3. Gradino

6.4. PBRS

6.5. Processo stocastco ARMA

6.6. Segnali sinusoidali

6.7. Richiami su nozioni di probabilità e statistica per analizzare i segnali di stimolazione noti

6.8. Analisi statistica del segnale PBRS

6.9. Analisi statistica del processo stacastico ARMA

6.10. Analisi statistica del segnale sinusoidale

7. Lezione 05/03/2010

7.1. Classificazione dei modelli per l'identificazione : struttura generale di un modello

7.2. Il rumore bianco

7.3. Matrice di covarianza

7.4. Caratterizzare i termini G ed H del modello generale

7.5. Definizione generale dell'insieme ammissibile dei parametri che definiscono θ7.6. Il modello ARMAX

7.7. Definizione di θ nel modello ARMAX e determinazione dei parametri ammissibili

7.8. Modelli derivati dall'ARMAX (tutti LTI-TD, SISO)

7.9. Vedere i modelli derivati dall'ARMAX e l'ARMAX stesso in termini di schemi a blocchi

8. Lezione 17/03/2010

9. Ricapitolazione

9.1. Soluzione del modello parametrico di regressione lineare normalizzata

9.2. Le misure vere

9.3. Differenza tra soluzione per modelli deterministici e modelli stocastici

9.4. E' possibile riutilizzare la soluzione ai minimi quadrati su un modello stocastico?

9.5. L'identificazione come problema di controllo

Page 4: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

9.6. Il controllo con modelli stocastici

9.7. Definizione di predizione ad un passo

9.8. Errore di stima o predizione

9.9. Modello di predizione basato sull'ARMAX

9.10. Strumenti per la predizione

9.11. Matrice di covarianza dell'errore di stima

9.12. Funzione da minimizzare (o funzionale di costo)

9.13. Algoritmo PEM (prediction error method) in breve

9.14. Esempio generico: Scelta ottimale di L1 ed L29.15. Esempio particolare di scelta ottimale di L1 ed L29.16. La ricorsività del PEM richiede la condizione iniziale

10. Esercitazione 05/02/2010

11. Esercitazione 19/02/2010

11.1. Identificazione tramite equazioni normali

11.2. Identificazione tramite triangolarizzazione ortogonale o metodo QR

11.3. Confronto tra il metodo QR ed il metodo delle equazioni normali

11.4. Identificazione tramite algoritmo ricorsivo per il calcolo dei minimi quadrati

11.5. Esempi e codice matlab: pressione arteriosa

11.6. Esempio 2

11.7. Esempio 3

12. Appendice

12.1. Norma 2

12.2. Matrice positiva o semidefinita positiva

12.3.ΦTΦ definita positiva o semipositiva

12.4. Operazione di trasposizione di una matrice semplice o su operazioni tra matrici.

12.5. Operazione di trasposizione sulla stessa matrice

12.6. Equivalenza tra punti su varietà lineari affini

12.7. Stime polarizzate

12.8. Matrice ortogonale

12.9. Matrice triangolare superiore

12.10. La matrice RN12.11. Matrice Simmetrica

12.12. Operatore di ritardo a tempo discreto

12.13. Prodotto tra un numero complesso ed il suo coniugato

12.14. Disuguaglianza triangolare

12.15. δx , y la delta di kronecker

12.16. Dinamica di un modello

Page 5: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

12.17. Prodotto tra matrici quadrate

12.18. Prodotto tra una matrice quadrata e le matrici generatrici di una simmetrica. (include generare una matrice simmetrica dato un vettore)

12.19. Operazione di inversa su prodotto tra matrici

12.20. Moltiplicazione tra polinomi di matrici

12.21. Aggiunta di una matrice 2x2

12.22. Invarianza dell'ordine tra trasposizione ed inversione?

12.23. Associabilità del prodotto tra determinanti?

12.24. Autovalori, determinante e polinomio caratteristico di una matrice

Lezione 22/01/2010Sistema generale di riferimento

dove S: sistema.

La rappresentazione locale ingresso uscita del sistema, in forma matematica, è:L¿1 ⟧ y (t )=f (t , u ( t ) , d (t ) )

dove: t indica una eventuale dipendenza dal tempo della funzione f u ( t ) indica una eventuale dipendenza dagli ingressi controllabili. d ( t ) indica una eventuale dipendenza dagli ingressi non controllabili, detti disturbi.

In generale   y ( t ) , u ( t ) , d ( t )sono vettori di funzioni mentre t ϵ R

Obiettivo da raggiungereL'idea è dare una rappresentazione matematica alla funzione f , che rappresenta la dinamica del sistema S, a partire dalla conoscenza delle sequenze di dati in ingresso e dalle relative sequenze di dati in uscita generate.Ovvero, posto di non conoscere la f che modella il sistema, oppure posto di conoscerne una parte (magari ne conosciamo la struttura matematica ma qualche termine non è definito precisamente), noi dobbiamo determinarla in modo tale che la f così ricavata sia compatibile con le sequenze di dati in ingresso e relative uscite di cui noi siamo a conoscenza.

In pratica, conoscendo:{u i ( t ) }i=1

n e le relative uscite { y i (t ) }i=1n

Poichè noi possiamo sapere entrambe (gli ingressi li decidiamo noi, le uscite le misuriamo) dobbiamo trovare quella f che li metta in relazione, ovvero:

Page 6: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

L¿2 ⟧ {ui ( t ) }i=1n f

→{ y i ( t ) }i=1

n

Con un'esposizione più formale si può scrivere:Dato il vettore dei disturbi d ( t )=0 ,∀ t ≥0 e data la relazione locale ingresso uscita y ( t )=f (t ,u ( t ) , d (t ) ) (si osservi che   y sarebbe la derivata di primo ordine di y , ma è solo un formalismo, noi utilizzeremo sempre y ( t ) in seguito) riducibile, per l'assunzione prima fatta, a: y ( t )=f (t ,u ( t ) ), conoscendo una sequenza di ingressi {u i ( t ) }i=1

n e relative uscite generate { y i ( t ) }i=1n

, vogliamo determinare la funzione f tale che L¿3 ⟧ {f (t , ui ( t )) }i=1

n ⇒ f (t ,u i ( t ) )= y i (t ) ∀ i=1 ,…,n

Obiettivo più "realistico"La definizione formale data in precedenza è ideale, questo poichè nella realtà non è possibile ottenere la compatibilità totale tra f e le sequenze conosciute. Perchè? Perchè esistono degli ingressi nel sistema non controllabili (i disturbi) ed inoltre poichè esistono errori di misurazione.Allora si cerca la f che fornisca la migliore approssimazione delle sequenze in uscita (dati gli ingressi), in termini formali:cerchiamo una f tale che:

L¿4 ⟧mini

{‖y i (t )−f (t , ui (t ) )‖}Ovvero per ogni sequenza in uscita, la f trovata generi la discrepanza minima in termini di distanza (o norma) da quella misurata.

Il processo di identificazione è necessario anche se si conosce gran parte della struttura di f

Come abbiamo accennato all'inizio, il nostro obiettivo è identificare con precisione f , questo vale anche se sappiamo la stuttura matematica di quest'ultima ma alcuni dei suoi termini non sono precisati in modo unico.

Supponiamo di avere la seguente modellazione del sistema S a tempo discreto:L¿5 ⟧ y (k+n )+an−1⋅ y (k+n−1 )+…+a0⋅ y ( k )=u(k )

Questa è la rappresentazione f del sistema in forma di equazione alle differenze con coefficenti costanti nel tempo.Per sapere in modo univoco f io dovrei conoscere tutti i coefficenti a i , i=0 ,…,n−1 .Se qualche coefficente non fosse noto in maniera univoca (è sconosciuto oppure sappiamo che può assumere un valore entro un certo intervallo limitato) allora io non posso dire di sapere f con precisione. Dunque devo ricorrere ad un processo di identificazione per stabilire il valore preciso dei coefficenti non conosciuti (o che ammettono un valore entro un certo intervallo limitato).

Tipi di modellazioneEsistono diversi tipi di modellazione:1. intuitiva2. per mezzo di tabelle / grafici3. matematica

Page 7: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

La (1) è una descrizione del sistema tramite una serie di affermazioni verbali derivanti da una grammatica.La (2) è una descrizione del sistema tramite tabelle o grafici (esempio i diagrammi di bode), visto che un grafico è convertibile in una tabella e viceversa.La (3) è una rappresentazione in termini di equazioni differenziali o equazioni alle differenze.

Si studieranno, in questo corso, rappresentazioni matematiche dei modelli ed in particolare i modelli di sistemi LTI (sistemi lineari tempo invarianti), dove:

- stazionarità = tempo invarianza- linearità = validità del principio di sovrapposizione degli effetti.

Esempio: miscelatore di liquidi.

Dove:F1 , F2 sono i flussi in ingressoC1 ,C2 sono le concentrazioni dei due liquidi in ingressoV volume del contenitoreh altezza del liquido nel contenitoreC concentrazione del liquido nel contenitore

Page 8: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

F flusso in uscita dal contenitoreA area del contenitorea area del flusso in uscita

Come ingressi manipolabili abbiamo: u={F1 ,F2 }Le concentrazioni non sono manipolabili, quindi le vediamo come disturbi: d= {C1 ,C2 }L'uscita è la misurazione dei valori: y= {F ,C }

Obiettivo: avere C costante ∀ t ≥ t

Il modello e non lineare e per impostare C costante dobbiamo trovare il modello matematico che caratterizza il sistema.Come ricaviamo il modello? Proviamo a ricavarlo sulla base delle leggi della fisica e della chimica.L'uso di queste leggi ci costringe a fare delle assunzioni, anche molto forti (che tendono all'idealità):

- il liquido è incomprimibile, quindi la densità è costante.- la concentrazione di sostanza è omogenea in ogni punto del contenitore.- h è costante.

Fatte queste assunzioni usiamo le equazioni di bilanciamento che affermano: la differenza di qualcosa è data dalla differenza di quel qualcosa in entrata con quella in uscita. Quindi la usiamo per bilanciare il volume e relativi flussi:

I. d (V ( t ) )dt

=F1 (t )+F2 (t )−F ( t )

Per l'assunzione fatta sulle concentrazioni possiamo bilanciare, di conseguenza, i prodotti tra concentrazioni e volumi:

II. d (C ⋅V (t ) )dt

=C1⋅F1 ( t )+C2 ⋅F2 ( t )−C ⋅F (t )

Con la legge di torricelli ricaviamo il flusso in uscita in funzione dell'altezza del liquido nel serbatoio

III. F=a ⋅√2gh Infine

IV. V=A ⋅ h

Sembra che il modello descriva bene il sistema, ma in realtà presenta un difetto. Noi stiamo supponendo costante l'area del flusso in uscita, quando potrebbe benissimo non esserlo. Ed inoltre non è possibile misurarla. Quindi, pur usando leggi note, ho bisogno di identificare a ( t ) che è l'area del flusso in uscita in funzione del tempo.

Caratteristiche dei modelli derivati dai processi di identificazione1. Il modello derivato dal processo è "facilmente" determinabile rispetto ai modelli

costruiti con le assunzioni sfruttate dai principi fisici e chimici.2. I modelli derivati valgono per domini limitati di punti di lavoro (es: modello per bassi

regimi del motore). I modelli derivati dalle leggi fisiche sono più generali.3. I modelli derivati sono LTI, quindi sono di "facile" usabilità ed identificazione.4. I modelli derivati non sono "full-proof", ovvero funzionano praticamente ma non sono

dimostrati formalmente.

Page 9: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

5. I modelli derivati hanno coefficenti numerici che non sempre hanno significato fisico, mentre nei modelli basati su leggi fisiche ogni coefficente ha un significato fisico.

Processo/algoritmo di identificazioneI passi per identificare un modello sono i seguenti:

1. Si scelgono delle funzioni in ingresso capaci di stimolare una risposta d'interesse da parte del sistema {u i ( t ) }i=1

n a cui corrispondono le misurazioni { y i (t ) }i=1n

2. Si decide la struttura del modello (in generale LTI-TD TD: tempo discreto) che normalmente è nella forma:

L¿6 ⟧ y (k+n )+an−1⋅ y (k+n−1 )+…+a0 ⋅ y (k )=u (k+m )+bm−1⋅u ( k+m−1 )+…+b0⋅u (k )con n≥m , e decido un n=n (in pratica decido l'ordine del sistema, primo, secondo,

etc..)3. Cerchiamo, una volta fissato il modello matematico, di trovare i parametri di questo in

grado di minimizzare la discrepanza tra le stime y i fornite dal modello e l'uscita misurata y i, ovvero:L¿7 ⟧min

i{‖ y i− y i‖}

in generale, per questa operazione, devo identificare i coefficenti a i , b j che mi permettono questo, ovvero trovo i coefficenti per cui vale la minima discrepanza per

ogni misurazione e li segno come a i , b j

4. Valido il modello (operazione che non si vedrà nel corso)5. Se il modello non risulta valido, si ripete il processo cambiando struttura al modello o

aumentandone il grado n

Lezione 29/01/2010Definizione generale dei segnali di disturbo

I segnali di disturbo sono così definiti:L¿8 ⟧d (t )∈D=¿ {d (⋅ )∈Rnd tale che‖d (⋅ )‖∞<±∞}

Dove ‖d (⋅ )‖∞ è la notazione per la norma di un segnale.A parole sarebbe:I segnali di disturbo appartengono ad una classe di segnali, che comprende segnali che sono generalmente estesi ad nd dimensioni ma che hanno norma limitata.

Problema di analisi dei segnali di disturboI segnali di disturbo non controllabili, normalmente non sono neanche prevedibili (non se ne conosce la struttura matematica in grado di farci prevedere che valore avranno negli istanti futuri) e dunque si studiano a livello statistico/probabilistico. In generale sono segnali non deterministici. Per studiare segnali non deterministici bisogna dare dei richiami all'analisi probabilistica.Tuttavia, come si vedrà, verranno usati pochissimi concetti, e solo i risultati.

Analisi probabilistica: variabile aleatoriaDefinizione.

Page 10: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Una funzione X (⋅ ) definita su un insieme Ω è detta variabile aleatoria se ∀ x∈R vale la seguente disuguaglianza: L¿8.1 ⟧ X (ω )≤ x con ω⊂Ω.

Dove: Ω è l'insieme degli eventi possibili (o spazio degli eventi). ω è un sottoinsieme di Ω x è detta realizzazione della variabile aleatoria.

In termini funzionali possiamo vedere la definizione in questo modo:L¿9 ⟧ X (⋅ ):Ω→x∈R

Si associa un insieme (o un sottoinsieme) di eventi ad un numero reale.

Analisi probabilistica: distribuzione di probabilitàUna variabile aleatoria può essere studiata a livello statistico grazie alla funzione di distribuzione di probabilità, definta come segue:

L¿10 ⟧ FX (x )=¿ Prob (X (ω )≤ x ), ∀ x∈RSe FX è nota allora io conosco le proprietà statistiche di X (⋅ ).Nota: la specifica ∀ x∈R è generale, in realtà basta che x appartenga ad un insieme che comprenda tutte le possibili realizzazioni (es, dado: {1,2,3,4,5,6 } ), anche se questo è limitato.

Proprietà no1: la funzione di distribuzione è monotona crescente.L¿11⟧ FX (x1 )≤ FX (x2 ) ,∀ x1≤x2

Proprietà no2: la distribuzione di probabilità di realizzazioni non contemplate è nulla,L¿12 ⟧ lim

x→−∞FX ( x )=0

(con x→−∞ si vuole intendere una realizzazione che non è contemplata. A livello formale, vista la definizione di X (⋅ ) è ovvio che se x→−∞ nessun sottoinsieme ω soddisferà la disuguaglianza L ¿8.1)Ad esempio, se l'insieme delle realizzazioni è {1,2,3,4,5,6 } (un dado), se voglio la realizzazione dell'evento ω=¿ "ottenere il valore −1 con un lancio" ottengo probabilità nulla, in quanto non esiste.Proprietà no3: la distribuzione di probabilità che si verifichino tutte le realizzazioni è certa.

L¿13 ⟧ limx→+∞

F X ( x )=1

Sempre con l'esempio del dado, se voglio la probabilità dell'insieme evento ω=¿"ottenere un valore minore o uguale di 6" ottengo probabilità 1 poichè è certo che l'evento si verifichi.Proprietà no4: semplicemente: L¿14 ⟧ 0≤ FX (x )≤1 , ∀ x∈R

Analisi probabilistica: processo stocasticoUn processo stocastico è un insieme ordinato di variabili aleatorie indicizzate da un parametro t che appartiene ad un insieme di indici T . In modo formale:

L¿15 ⟧ {X t (ω) , t∈T ,ω⊂Ω }Normalmente T è un insieme di indici temporali, dunque se T=Z si ha un processo stocastico a tempo discreto, se T=R si ha un processo stocastico a tempo continuo.Ovviamente T potrebbe essere anche un sottoinsieme dei numeri relativi o dei numeri reali o qualsiasi altro insieme indice.

Page 11: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Ogni elemento dell'insieme è una variabile aleatoria, ognuna di queste è definita sullo stesso insieme degli eventi Ω.

Se fissiamo un indiece t=t noi stiamo individuando una precisa variabile aleatoria nell'insieme, ovvero X t (ω).Se fisso ω=ω allora io individuo una precisa realizzazione per ogni variabile aleatoria nell'insieme del processo stocastico, quindi sto tracciando una traiettoria del processo stocastico.

Un processo stocastico, analogamente ad una variabile aleatoria, è statisticamente caratterizzato da una funzione di distribuzione di probabilità, detta "funzione di distribuzione di probabilità congiunta"

Analisi probabilistica: distribuzione di probabilità congiuntaPer introdurre la distribuzione di probabilità congiunta, partiamo dalle cose semplici. Fissato un t=t io ottengo la distribuzione di probabilità di una delle variabili aleatorie in un processo stocastico.

L¿16 ⟧ X t (ω) ⇒FX t( x )

(vedi anche L ¿10 )Ma visto che la variabile aleatoria associata all'indice t è unica, posso scrivere:

L¿17 ⟧ F t ( x )

Se prendo due variabili aleatorie ho: X t 1(ω) , X t2

(ω).

Page 12: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Vorrei sapere la probabilità che si verifichi una certa realizzazione relativa ad X t 1(⋅) insieme

ad una certa realizzazione relativa ad X t 2(⋅) questo si ottiene con la distribuzione di

probabilità congiunta.Questa si scrive con la notazione seguente (contando sul fatto che gl'indici t 1 , t 2 identificano variabili aleatorie precise): L¿18 ⟧ Ft 1 ,t 2

(x1 , x2 )

Ovviamente questa operazione deve esser fattibile L¿19 ⟧∀ X t1 (ω ) , X t 2(ω ) ∈ {X t (ω) , t∈T ,ω⊂Ω }

Analisi probabilistica: distribuzione di probabilità congiunta applicata ad un processo stocastico

In generale, per descrivere pienamente un processo stocastico, mi serve la probabilità congiunta tra ogni variabile aleatoria appartenente all'insieme. Dunque:

L¿20 ⟧ ∀n∈N ,∀ {t 1 ,…,t n }⊂T ,F t 1 ,… ,tn (x t1 ,…, xt n )=¿ Prob (X t 1

(ω)≤x t1 ,…, X tn (ω )≤ x tn )Nota: nella probabilità le virgole equivalgono ad un'intersezione (o and logico). Quindi: Prob (X t1 (ω )≤ xt 1

,…, X t n (ω)≤x t n)=Prob (X t 1(ω )≤ x t1∩…∩X t n (ω )≤ x tn )

Se è nota la L¿21 ⟧ Ft 1 ,… ,tn (x t1 ,…, xt n ) allora il processo sticastico è statisticamente noto.

Proprietà.1. E' simmetrica (non varia la struttura) se io vario l'ordine degli argomenti. Ad esempio

invece che L¿22 ⟧ Ft 1 ,t2 , t3 (x t1 , x t 2, x t3 ) scrivo L¿23 ⟧ Ft 3 ,t 2 ,t1 (x t3 , xt 2

, x t1 ) , ottengo lo stesso risultato.

2. Se la realizzazione di una variabile aleatoria la dò per certa, allora mi riduco a studiare la probabilità congiunta delle altre n−1 variabili aleatorie.

L¿24 ⟧ ∀ n∈N , ∀ {t1 ,…, tn }⊂T , ∀ [ x t1 ,…,x tn−1, x ]T∈ Rn

(l'ultimo è un vettore trasposto di realizzazioni) ho che:L¿25 ⟧ lim

x→+∞F t 1 ,… ,tn (x t1 ,…, xt n−1

, x )=F t1 ,…, tn−1 ( xt 1,…, x tn−1 )

(da notare il limite, che mi assicura la certezza di verificarsi per x relativa a X t n (ω) . Vedi L ¿13 )

3. Un processo stocastico si dice gaussiano o normale, se tutte le sue distribuzioni di probabilità congiunta (sia relative a coppie di variabili aleatorie, sia relative a tutte le variabili aleatorie, sia a terne, etc..) assumono una distribuzione gaussiana o normale

Generazione di processi stocastici tramite equazioni differenziali lineariUn modo per generare un processo stocastico è quello di "giocare" con alcuni parametri di un'equazione differenziale. Sia l'equzione differenziale:

L¿26 ⟧ y ( n) (t )+an−1⋅ y (n−1 ) ( t )+…+a1⋅ y ( t )+a0 ⋅ y (t )=x ( t )per risolverla in modo univoco dobbiamo conoscere le prime n condizioni iniziali:

y ¿Se invece di conoscerle, noi le scegliamo in modo arbitrario e vediamo l'evoluzione dell'equazione differenziale con diversi insiemi di condizioni iniziali arbitrarie, allora generiamo tanti tracciati che possono esser riuniti in un processo stocastico.

Page 13: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Analisi probabilistica: Parametri caratterizzanti una distribuzione di probabilità congiunta di un processo stocastico

- valor medio

L¿27 ⟧mX (t )=E [X t (ω)]=¿ ∫−∞

+∞

x ⋅ f t (x) ⋅dx

Dove:

L¿28 ⟧ f t ( x)=d [F ¿¿ t( x)]dx

¿

Ovvero è la densità di probabilità, che si ottiene derivando la distribuzione di probabilità.Si osserva che il valor medio mantiene la dimensione matriciale degli enti matematici a cui è applicato: se si applica su scalari si ottiene uno scalare, se si applica su vettori si ottiene un vettore, etc...- varianza

L¿29 ⟧VAR [X t (ω)]=¿ E [ (X t(ω)−E [X t (ω)] )2 ]=E [ X t(ω)2 ]−E [X t(ω)]2

- deviazione standardL¿30 ⟧σ [X t (ω)]=¿ √VAR [X t(ω)]

- covarianzaDà un valore al legame che esiste tra un evento che si verifica all'istante s ed un evento che si verifica all'istante t dello stesso processo stocastico. Nel caso il processo stocastico è identificato da X (senza alcun indice di identificazione).

L¿31 ⟧R X, X (s ,t )=cov (X s (ω ) , X t (ω) )=¿ E [ (X s (ω )−mX (s ) )(X t (ω )−mX (t ) )T ]Il trasposto all'ultima parentesi si ha perchè, in generale, posso trattare con matrici. Ancora non è finita e si continua con:

L¿32 ⟧ E [(X s (ω)−mX (s ) )(X t (ω )−mX (t ) )T ]=∫−∞

+∞

∫−∞

+∞

( xs−m (s ) ) (x t−m (t ) ) f s ,t (xs , x t )d xsd xtCon t ≠ s- cross varianza Dà un valore al legame tra 2 processi stocastici X ed Y. Con t ≠ s e la definizione appena data, si ha:

L¿33 ⟧ RX ,Y ( s , t )=cov (X s (ω ) ,Y t (ω) )

Esempio in matlabSia un segnale che genera un processo stocastico:

L¿34 ⟧ x (t )=sin( π50t)+n(t)

Con n( t) un segnale casuale (sarà il rumore bianco), con le seguenti caratteristiche:E [n (t ) ]=0 ; VAR [n ( t ) ]=0.2per generare x (t) in matlab devo scrivere:for i=1:100 for j=1:1000 processo(j,i)=sin(pi/50 * i) + 0.2* random(1) endendQuindi per ogni istante di tempo (i) genero 1000 possibili valori casuali (grazie al termine random).Questi 1000 possibili valori generano la variabile aleatoria X i

Page 14: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Per calcolarmi la media di ogni variabile aleatoria faccio:for i=1:100 media(i)=mean(processo(:,i));end(il risultato sarà una sinusoide, quindi il processo stocastico non sarà stazionario. Questi han valor medi costanti)

Per calcolarmi la covarianzafor i=1:100 for j=1:100 covar(i,j)=mean((processo(:,i)-mean(processo(:,i))).*mean((processo(:,j)-mean(processo(:,j))); endend

Analisi probabilistica: Processo stocastico stazionarioUn processo stocastico si dice stazionario se la F t1 ,… ,t n ( xt 1

,…, xtn ) è identica alla F t1+ τ ,… ,t n+ τ ( xt 1+τ ,…, x tn+τ ).Ovvero, la distribuzione congiunta è costante nel tempo (o con traslando omogeneamente gli indici).In modo formale, è stazionario se:

L¿35 ⟧ Ft 1 ,… ,t n (x t 1,…, x tn )=Ft 1+τ ,… ,tn+τ (xt1+τ ,…, xt n+ τ ) ,∀ n∈N ,∀ {t1 ,…, t n }⊂T ,∀ τ∈T

In pratica una qualsiasi traslazione di indice non fa variare la distribuzione; a livello di indice temporale qualsiasi traslazione temporale non fà variare la distribuzione.

Una spiegazione grafica la si può dare come analogia con le funzioni 'standard'.

Page 15: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Inoltre un processo stocastico stazionario ha valor medio costante.L¿36 ⟧mX (t )=mX , ∀ t∈T

Nota: a volte, invece di scrivere X t (ω) scriverò solo X t

Analisi probabilistica: Processo stocastico debolmente stazionarioUn processo stocastico è debolmente stazionario quando si hanno le seguenti coincidenze:

L¿37 ⟧( tutto il guppo sotto)E [X t ]=E [X t+ τ ] ,∀ t , τ∈TVAR [ X t ]=VAR [X t+τ ] ,∀ t , τ∈TCOVAR [ X t , X t+k ]=COVAR [X t+τ , X t+ τ+k ] ,∀ t , τ , k∈T

Quindi la media, la varianza e la covarianza sono costanti nel tempo (o con indici diversi).

Analisi probabilistica: Osservazioni nel caso di processi stocastici debolmente stazionari

La cross varianza non dipende più da istanti di tempo differenti (o indici temporali differenti), ma soltanto dalla loro differenza:

L¿38 ⟧ RX ,Y ( t , s )=RX ,Y ( t−s)

La funzione di covarianza dipende soltanto da un istante di tempo (sempre la differenza) e diventa autocovarianza.

L¿39 ⟧ RX , X (t , s )=R X (t−s )Poichè dipende solo da un istante di tempo (che è dato dalla differenza), io posso fare in modo

di traslare questa differenza, ogni volta, in modo tale che mi dia zero. Quindi valuto l'autocovarianza sempre in zero.

L¿40 ⟧ RX (0 )

Analisi probabilistica: dall'esercitazione del 5 feb 2010Vedere i concetti di media temporale e autocorrelazione temporale, anche nel caso particolare di processi stocastici stazionari nei quali queste due grandezze diventano anch'esse variabili aleatorie (quindi hanno un valor medio).Inoltre vedere l'ergodicità e l'ergodicità congiunta.

Funzione di densità spettraleOra poniamo che Ω sia un insieme di eventi coincidente con le frequenze, e siano X ,Y due processi stocastici debolmente stazionari definiti su Ω. Con k pari ad un indice temporale abbiamo la funzione di densità spettrale definita come segue:

L¿41 ⟧ΦX ,Y (ω )=¿ 12 π

⋅ ∑k=−∞

+∞

RX ,Y (k )⋅ e− jkω

Nel continuo sarebbe:

L¿41.2 ⟧ΦX ,Y (ω )= 12 π ∫−∞

+∞

RX , Y( t )e− jtωdω

Nota: ω sono frequenze!Questa funzione non è altro che la trasformata discreta di fourier. La cui "antitrasformata" è:

L¿42 ⟧ RX ,Y (k )=¿ ∫−π

π

ΦX ,Y (ω) ⋅e jkω⋅ dω

Page 16: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

La funzione di densità spettrale applicata allo stesso processo debolmente stazionario si semplifica in questo modo:

L¿43 ⟧Φ X , X (ω )=ΦX (ω)poichè

L¿44 ⟧ RX, X (t , s )=RX (t−s )

L¿45 ⟧CancellataL¿46 ⟧Cancellata

Informazioni ottenibili tramite la funzione di densità spettraleLa funzione di densità spettrale definisce l'insieme delle armoniche (o frequenze) fondamentali del segnale (il quale è visto come un processo stocastico).Ovvero ci informa su quali frequenze la potenza è significativa tale da renderle interessanti. Il grafico della densità spettrale si traccia sempre in modulo ( ovvero |Φ X (ω )| ) , diventando lo spettro del segnale.

Se definiamo un intervallo di frequenze Ω=[ω1 ,ω2 ] e ne valutiamo l'integrale

L¿47 ⟧∫ω1

ω2

|ΦX ,Y (ω)|⋅dω l'area che calcoleremo definirà la potenza del segnale in

quell'intervallo di frequenza.

Page 17: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Indice di autocorrelazione e causalità

L¿48 ⟧ ρ ( τ )=¿RX ( τ )R X (0 )

, τ ≠0

Poichè si verifica che (non lo vedremo): |RX (τ )|≤RX (0 ) per processi debolmente stazionari, allora: −1≤ρ (τ )≤1 .Con ρ autocorrelazione.Questo indice ci informa di quanto sia forte il legame tra due esperimenti-eventi dello stesso processo stocastico effettuati in istanti diversi.Se la funzione di autocorrelazione tende ad uno, vuol dire che i due eventi sono fortemente legati (c'è una causalità quasi certa, il primo causa il secondo).Se la funzione di autocorrelazione tende a 0, i due eventi sono praticamente indipendenti.Se tende a -1, vuol dire che l'evento nel futuro causa quello nel passato, che, per la conoscenza umana attuale, è assurdo.

Un processo stocastico particolare, il rumore biancoHa uno spettro costante, come la luce bianca.

Page 18: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Questo è un processo stocastico stazionario.E' statisticamente indipendente, ossia ogni variabile aleatoria nell'insieme L¿49 ⟧ {X t (ω ) , t∈T ,ω⊂Ω (frequenze ) } ha la stessa distribuzione di probabilità.

Inoltre si ha, per il rumore bianco, che L¿50⟧ RX (τ )={σ2 ,t=00 , t ≠0

Dunque la sua funzione di densità spettrale è:

L¿51 ⟧ΦX (ω )=¿ 12π

⋅ ∑k=−∞

+∞

RX (k ) ⋅e− jkω

ma RX (⋅ ) è costane ed ha valore solo in k=0, quindi

L¿52 ⟧ΦX (ω )=¿ σ2

2π⋅e− j ( k=0)ω=1

Per queste proprietà il rumore bianco assume le caratteristiche di un segnale standard per la generazione di processi stocastici (come lo è la delta per la generazione di segnali deterministici).

(dall'esercitazione del 5 feb 2010)Un processo stocastico continuo (t∈ R) è definibile "bianco" se:

L¿53 ⟧ E [X t ]=0 ,∀ t ∈TQuindi ha valor medio nullo ed inoltre la covarianza

L¿54 ⟧ RX , X ( t1 ,t 2 )=E [ X t1 ⋅X t 2 ]=σ2 ⋅δ (t 1−t 2 )

Da cuiL¿55 ⟧ΦX , X (ω)=σ2

poichè la trasformata di fourier della delta di dirac è 1.Un vettore casuale w è un vettore di rumore bianco se:

L¿56 ⟧(gruppo sotto)E [w ]=0RW ,W=σ2⋅ I

(con I matrice identità)Questi sono tutti risultati dati, non dimostrati o ricavati.

Page 19: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Lezione 12/02/2010Introduzione al processo di identificazione

Si parte dal solito sistema S:

Questo sistema ha una rappresentazione matematica di tipo ARMA:

L¿57 ⟧ S :∑i=0

n

ai ⋅ y(i ) (t )=∑

i=0

m

b i⋅u(i) (t )

Con y (i ) (t ) , u( i) (t ) eventuali derivate di ordine i dell'uscita o dell'ingresso.Supponiamo che una parte (o tutti) dei parametri del modello non siano univocamente conosciuti, quindi li dobbiamo identificare.

Per identificarli stimoliamo il sistema con un certo numero di segnali d'ingresso e raccogliamo le rispettive uscite. Ovvero abbiamo i set:{u i ( t ) }i=1

n ; { y i ( t ) }i=1n

Detto questo vediamo i punti necassari al processo di identificazione:1. Bisogna conoscere la struttura matematica del modello (e supponiamo di conoscerla, è

S )2. Bisogna ipotizzare un modello che metta in relazione ogni segnale di ingresso con la

sua rispettiva uscita. Questo modello lo chiamiamo m .Ipotizziamo che m dipenda da un insieme di parametri θ. Dunque dobbiamo identificare il sistema tramite il modello m (θ ). Questo modello coinciderà o sarà un'approssimazione del modello matematico "preciso" S .m (θ ) lo chiamo modello parametrico.

3. Algoritmo di identificazione4. Un insieme di caratteristiche del sistema che mi fanno scegliere un set di segnali

d'ingresso piuttosto che un altro per "l'eccitazione" di questo.

Modello di regressione lineare per l'identificazione di un sistema senza disturbi

L'assenza di disturbi ci permette di dire che il modello sarà deterministico (in quanto i disturbi sono generalmente probabilistici).

Dato un sistema LTI ed un set di sequenze d'ingresso e relative uscite: {u i (t ) }i=1n ; { y i (t ) }i=1

n

Il modello più semplice a cui facciamo riferimento per l'identificazione è la regressione lineare.Ovvero:

Page 20: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

L¿58 ⟧m (θ ): y i ( t )=φ (t )T ⋅θ(dove T come esponente vuol dire trasposto)In generale:L¿59 ⟧θ∈Rn è un vettore di parametri ad n componentiL¿60 ⟧φ ( t )∈ Rn vettore di variabili di regressione, si vede come costruirlo (relativamente al contesto di quella sezione) nella L ¿162 .L¿61 ⟧ y i ( t ) è il valore misurato (un intero segnale, di i-esimo indice, in questo caso).Supponendo il tutto a tempo discreto, quindi t∈ZQuesto nel caso di un ingresso ed una uscita , quindi SISO (single input, single output).

Nel caso a più ingressi (≥1) e più uscite (≥1) avrei:m (θ ) : yi (t )=Φ (t )T ⋅θ

Con:L¿62 ⟧ y i ( t )∈ Rp vettore delle funzioni d'uscita misurateθ∈Rn è un vettore di parametri ad n componentiL¿63 ⟧Φ (t )∈ Rn×p vettore di variabili di regressione

In ogni caso φ (t )∈ Rn o Φ ( t )∈ Rn×p sono quantità note. Quello che vogliamo determinare è il vettore θ∈Rn .

Nota: quando non parlerò dell'i-esimo segnale misurato (o mandato in ingresso) y i ( t ) (o ui (t ) ) , ma parlerò solo di un segnale (anche se poi potrei generalizzare), ometto il pedice i.

Esempio di identificazione del sistema, la risposta al gradinoLa risposta di un sistema LTI al gradino è nella forma:

L¿64 ⟧ y ( t )=k1 ⋅e−P 1t+…+k n⋅ e−Pn t

L'equivalenza di questa struttura matematica col modello è data da:m (θ ) : yi ( t )=φ (t )T ⋅θ

con φ (t )T=[e−P1 t…e−Pn t ]

θT=[k 1…k n ](si osserva che ho θT altrimenti avrei dovuto scrivere θ come un vettore riga, come è effettivamente usato nella L ¿58)

Ottenere la soluzione del modello di regressione lineareDate le sequenze note

L¿65 ⟧ {y (1 ) ,…, y (N )φ (1 ) ,…,φ (N )

, N>0

(notare che sto parlando delle misurazioni di un solo segnale d'uscita, e non di N segnali d'uscita)determinare quel vettore θ che è una stima del vettore dei parametri θ che rende la differenza minima tra la misura rilevata y ( i ) e quella stimata dal modello   y (i ) , per ogni istante di misura i.

Formalmente: L¿66 ⟧ mini=1 ,… , N

|y (i)− y (i )| (essendo misure singole e non segnali, basta il modulo

in quanto sono scalari).

Page 21: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Esaminiamo ora la sequenza di stime generate dal modello in relazione con le misure rilevate.Da notare che φ ( i )T ⋅θ genera la misura stimata dal modello, mentre a primo membro c'è la misura rilevata.

L¿67 ⟧ { y (1 )=φ (1 )T ⋅θ⋮

y (N )=φ (N )T ⋅θSe N<n (il numero di misure è minore del numero di parametri di θ) allora il modello è sottodimensionato, e non si riuscirà a trovare una soluzione univoca ad ogni parametro o componente di θ.

Quindi il numero di misure deve essere almeno N=n per poter ottenere una soluzione.Posso riscrivere il sistema di equazioni in forma matriciale, ponendo:

L¿68 ⟧Y=[ y (1 )⋮

y (N )]∈ RN

L¿69 ⟧Φ=[ φ (1 )T

⋮φ (N )T ]∈RN×n

(La L ¿69 ha questa dimensione perchè ogni singolo φ (i ) ha n componenti come visto prima nella L¿60 ed è trasposto poichè altrimenti sarebbero vettori riga, mentre devon esser vettori colonna. Per farmi capire la L ¿68 è un vettore riga)

Dunque avrei il sistema matriciale: L¿70 ⟧Y=Φ ⋅θSe Φ fosse invertibile (ovvero det Φ≠0 , quindi non esiste una colonna o una riga che è combinazione lineare delle altre) potrei trovare l'unica soluzione:  L¿71 ⟧ θ=Φ−1⋅Y

Ottenere la soluzione del modello di regressione lineare con sistema con disturbi/errori

Il problema è che il sistema, realmente, è affetto da disturbi (come detto nella L ¿4 ), dunque in questo caso la mia stima potrebbe non essere sufficientemente precisa.Per ridurre l'effetto del rumore sulla stima, devo "spalmare" questo effetto su molte misurazioni, così da ottenere una stima più affidabile (questo poichè potrei beccare delle misurazioni che abbiano molto rumore, mentre altre con poco rumore, se ne prendo tante, faccio una media).Dunque devo avere N≫n.

Il problema è che questa scelta dà luogo ad un sistema sovradimensionato, quale delle possibili infinite soluzioni scegliamo? Quella che minimizza la differenza tra stima e misura, come visto precedentemente ( L ¿66 ). Questo è problema di ottimizzazione (e come vedremo, di minimo).

Per risolverlo definisco una variabile che mi aiuta a formalizzare il problema di ottimo, l'errore tra misura rilevata e misura stimata.

L¿72 ⟧ ε (t )= y ( t )−φ (t )T ⋅θdunque per ogni istante io ho la misura della discrepanza tra valore misurato e valore stimato (in pratica l'errore). Si osserva che l'errore non è probabilistico, ma deterministico, in quanto

Page 22: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

è dato da una differenza per ogni misura nota. La misura rilevata è nota in quanto rilevata, la misura stimata è nota in quanto theta e phi trasposto sono noti. Ma se è tutto noto perchè esiste l'errore? Perchè appunto noi non conosciamo il sistema e dobbiamo trovare una funzione (il modello parametrico) che lo approssima al meglio. Tra l'approssimazione e le misure stimate può esserci discrepanza, che definiamo errore. Posso costruirne l'equivalente matriciale:

L¿73 ⟧ E=[ ε (1 )⋮

ε (N )]∈RN

Ottentendo: L¿74 ⟧ E=Y−Φ ⋅ θ . Fatto questo, la formula matematica che utilizziamo per trovare la soluzione di questo problema sovradimensionato è la stima ai minimi quadrati.In pratica avremo che la soluzione ottima sarà:  L¿75 ⟧ θ=¿ argminV (θ )

θ

Ovvero la soluzione corrisponde alla soluzione di un problema di minimo sulla funzione V basata sui parametri θ . Dove V (θ ) non è altro che la differenza tra uscita l'uscita misurata e l'uscita stimata opportunamente elaborata per "funzionare" bene come funzione di costo (una funzione di costo è "facilmente" minimizzabile).Minimizzando questa si ottiene la stima ai minimi quadrati:

L¿76 ⟧V (θ )=¿ 12∑i=1

N

ε (i )2 (stima ai minimi quadrati)

Posso notare che L¿77 ⟧ ET ⋅E=[ε (1 )…ε (N ) ] ⋅ [ ε (1 )⋮

ε (N )]=∑i=1

N

ε ( i )2 dunque:

L¿78 ⟧V (θ )=¿ 12ET ⋅E=1

2‖E‖2

2

Per maggiori informazioni sulla norma 2, ‖⋅‖2 vedere l'appendice.

Sotto l'ipotesi che la matrice ΦTΦ sia positiva (Vedere appendice), V (θ ) ha un unico minimo globale.Il valore del minimo sarà pari a L¿79 ⟧ θ=¿ (ΦTΦ )−1ΦTY

Il valore di V (θ ) nel punto di minimo sarà: L¿80 ⟧ V (θ )|θ=θ=12

[Y TY−Y TΦ (ΦTΦ)−1ΦT Y ]Dimostriamo queste due affermazioni (non le approfondirò granchè, preferisco recuperare i concetti di probabilità esposti ad esercitazione in una notazione talmente "nuova" (accidenti a loro) che non c'ho capito nulla. Inoltre devo ammettere che anche la dimostrazione l'ho trascritta poco chiaramente a lezione).

Scriviamo ed espandiamo V (θ )

L¿80.a .a.1 ⟧V (θ )=12ET ⋅E=1

2[Y−Φ ⋅θ ]T ⋅ [Y−Φ ⋅θ ]

per l'applicazione di un trasposto ad operazioni tra matrici vedere l'appendice.Questo è uguale ad (vedere moltiplicazione tra polinomi di matrici nell'appendice):

V (θ )=12

[θTΦTΦθ−θTΦTY−Y TΦθ+Y TY ]Ora supponiamo che questa funziona abbia soluzione V 1 (θ ) che abbia la seguente struttura:

L¿80.a .1 ⟧V 1 (θ )=12

[θ−(ΦTΦ )−1ΦT Y ]T (ΦTΦ ) [θ−(ΦTΦ )−1ΦT Y ]

Page 23: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Da notare che questa è la scrittura quadratica evidenziata nell'appendice per le matrici positive. Ovvero:

[A ]T (ΦTΦ) [A ]Con A=θ−(ΦTΦ )−1ΦTY .Ora sviluppo V 1 (θ ) per vedere se coincide con V (θ ) (e dunque ne è soluzione), osservando che prima devo fare il trasposto di un fattore (vedi operazione di trasposizione su operazioni tra matrici) e poi la moltiplicazione tra polinomi di matrici.

L¿80.1 ⟧V 1 (θ )=12

[θTΦTΦθ−θT (ΦTΦ ) (ΦTΦ )−1ΦTY−Y TΦ (ΦTΦ )−T (ΦTΦ )θ+Y TΦ (ΦTΦ )−T (ΦTΦ) (ΦTΦ)−1ΦT Y ]Osservo che L¿80.2 ⟧ (ΦTΦ )−T=( (ΦTΦ )T )−1

Ma (ΦTΦ )T per l'operazione di trasposizione (vedi appendice) è pari ad (ΦTΦ). Quindi, la L ¿80.2 diventa:

L¿80.3 ⟧ (ΦTΦ )−T=(ΦTΦ )−1

Dunque, la L ¿80.1 posso riscriverla come:

V 1 (θ )=12

[θTΦTΦθ−θT (ΦTΦ) (ΦTΦ)−1ΦTY−Y TΦ (ΦTΦ )−1 (ΦTΦ )θ+Y TΦ (ΦTΦ)−1 (ΦTΦ) (ΦTΦ)−1ΦTY ]Togliendo i prodotti che danno l'identità (in verde) diventa:

V 1 (θ )=12

[θTΦTΦθ−θTΦTY−Y TΦθ+Y TΦ (ΦTΦ)−1ΦTY ]Per avere l'eguaglianza V 1 (θ )=V (θ ) dovrei avere:

L¿81 ⟧V (θ )=V 1 (θ )+ 12

[Y T Y−Y TΦ (ΦTΦ )−1ΦT Y ]Quindi avrei che V (θ ) è riscrivibile nella somma di due termini. Uno è pari a V 1 (θ ) l'altro al termine che manca a quest'ultimo per avere l'eguaglianza.Il primo termine dipende da θ il secondo no e dunque al variare di θ rimane costante.Il primo termine abbiam visto che è una forma quadratica, e sotto l'ipotesi che ΦTΦ sia definita positiva, vuol dire che sarà sempre un numero positivo.Ma se il secondo termine è costante ed il primo è sempre positivo, come trovo il minimo?C'è un modo per azzerare il primo termine (meno di questo non posso fare in quanto la forma è quadratica e ΦTΦ è positiva), dunque averei il valore minimo per V (θ ).Per azzerare il primo termine posso solo porre: θ=θ=(ΦTΦ )−1ΦT Y , che rende la L ¿80.a.1 nulla in quanto azzera almeno un fattore, ottenendo, per l'appunto, il valore minimo e quindi il vettore dei parametri che risolve il problema e che andavo cercando (la soluzione).In conseguenza di ciò, quando θ=θ , V (θ ) tocca il suo minimo, che è proprio pari al secondo termine (il primo si azzera), ovvero:

V (θ )|θ=θ=12

[Y TY−Y TΦ (ΦTΦ)−1ΦT Y ]Come volevamo dimostrare.

Ma cosa succede se ΦTΦ non è positiva? Si dimostra che ΦTΦ può esser definita al più semi definita positiva (Notazione ΦTΦ≥0 , vedere appendice). In questo caso cosa accade?Invece di poter trovare una soluzione univoca, dobbiamo metterci a ricercare i minimi della funzione V (θ ), tramite il gradiente. Abbiamo dunque dalla L ¿80.a.a .1 che:

V (θ )=12

[Y−Φ ⋅θ ]T ⋅ [Y−Φ ⋅θ ]

Quindi:

Page 24: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

V (θ )=12

[Y T−θT ⋅ΦT ]⋅ [Y−Φ ⋅θ ]

V (θ )=12

[Y TY−Y TΦθ−θT ⋅ΦT Y+θTΦTΦθ ]Se derivo (occhio che Y T Y sparisce in quanto costante rispetto θ) posso scrivere

∂V (θ )∂θ

=12

[θTΦTΦ+ΦTΦθ−ΦT Y−Y TΦ ](non saprei ricavarlo ma è come se avesse derivato prima per θ e poi per θT )Si dimostra che i termini in verde e quelli in blu sono uguali e quindi posso scivere:

∂V (θ )∂θ

=12 [+2θT (ΦTΦ )−2Y TΦ ]=θT (ΦTΦ )−Y TΦ

Visto che voglio trovare i punti di minimo, poniamo ∂V (θ )∂θ

=0 quindi otteniamo, facendo il

trasposto di tutto (vedere appendice):

[θT (ΦTΦ )−Y TΦ ]T=(ΦTΦ )θ−ΦTY=0L¿82 ⟧ (ΦTΦ )θ=ΦTY

Si dimostra che se ΦTΦ non è positiva, ma è semi positiva, non ha rango massimo, quindi non è invertibile, dunque ci saranno infiniti minimi.Tuttavia si dimostra anche che questi minimi appartengono a diverse infinità di varietà lineari, quindi sono tutti uguali (per classe, ovvero ogni minimo ha infinite repliche), ne basta cercare uno appartenente alla classe che ci interessa. Vedere appendice per le varietà lineari.E come lo cerchiamo?Lo stiamo dicendo dall'inizio, con la stima ai minimi quadrati.

Richiamiamo un attimo il problema di partenza: Io voglio che le misure stimate coincidano il più possibile con le misure rilevate (che lo ricordiamo, in questo caso sono affette da disturbi).In forma matriciale: Y=Φ ⋅θ (vedi L ¿70 )per spiegare la soluzione scompatto Φ lungo le sue colonne, ovvero:

L¿83 ⟧Φ=[Φ1…Φn ]∈RN×n ,Φ i∈RN ×1

Nota: ho sezionato Φ per colonne, non per righe! L'avessi fatto per righe avrei ottenuto

nuovamente Φ=[ φ (1 )T

⋮φ (N )T ]∈RN×n

.

Ora, il prodotto Φ ⋅θ non è altro che una combinazione lineare, essendo Φ nota, io voglio trovare i coefficenti che appartengono a θ tali per cui questa combinazione lineare approssima al meglio Y .Si dimostra che la migliore approssimazione è data dalla proiezione ortogonale di Y nello spazio formato dalle basi [Φ1…Φn ].Facciamo un esempio grafico con 2 basi, Φ1,Φ2 . Io proietto ortogonalmente Y nello spazio formato da queste basi (un piano), se scompongo il vettore proiettato (Y ¿) nelle componenti lungo la prima e la seconda base, ottengo i pesi da applicare (lungo la prima p1e lungo la seconda p2 base) per ottenere il vettore stesso. Questi pesi non sono altro che le componenti di θ. Tutto ciò mi fornisce la migliore approssimazione.

Page 25: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Otteniamo che L¿84 ⟧Y ¿=∑j=1

n

θ j ⋅Φ j dove θ j è la j-esima componente di θ mentre invece l'altro

termine è la j-esima colonna di Phi, ovvero la j-esima base dello spazio.Nell'esempio del disegno abbiamo: Y ¿=θ1 ⋅Φ1+θ2 ⋅Φ2=p1⋅Φ1+ p2 ⋅Φ2 .(la somma vale solo se si vede il tutto come una somma di vettori, altrimenti si richiede il teorema di pitagora per il calcolo del modulo di Y ¿ )

Inoltre si ha che L¿85 ⟧Φ iT (Y❑⊥−Y ¿ )=0 , i=1 ,…,n , ovvero la proiezione di Y (Y⊥) sullo

spazio ΦT (tanto è per ogni i quindi è pari a tutto lo spazio Φ) è pari proprio ad Y ¿ che è la migliore approssimazione possibile. Per questo fa zero.

Per la L ¿84 si può scrivere: L¿86 ⟧ΦiT Y⊥=Φi

T Y ¿=ΦiT∑j=1

n

θ j⋅Φ j , i=1 ,…n

In forma matriciale estesa avrei (occhio che si switcha il primo con il secondo membro ovvero

ΦiT∑j=1

n

θ j ⋅Φ j=ΦiT Y⊥ ,i=1,…n) :

L¿87 ⟧ [Φ1TΦ1…Φ1

TΦn

⋮ ⋮Φn

TΦ1…ΦnTΦn

][θ1

⋮θn]=[Φ1

T Y⊥

⋮Φn

T Y⊥]

Questa è la soluzione ai minimi quadrati spalmando il rumore (con errore deterministico o noto) su ogni misura.

Proprietà statistiche della soluzione del modello di regressione lineare con sistema con disturbi/errori stocastici.

Leggi la nota alla fine di questa sezione.La soluzione che abbiamo è data da (supponendo ΦTΦ positiva): θ=θ=(ΦTΦ )−1ΦT Y , vedi L ¿79I dati sono ottenuti da un modello in realtà un pochino più dettagliato di quello iniziale (ovvero si mette in evidenza l'errore):

Page 26: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

L¿88 ⟧m (θ ): y ( t )=φ (t )T ⋅θ0+e (t )θ0è la supposizione di conoscere i coefficenti effettivi per avere le misure reali senza errori, che saranno sporcati dal disturbo e (t ) (che prima chiamavamo con ε (t ) ).

e ( t ) è il rumore bianco, quindi ha caratteristiche (con e=[ e (1 )⋮

e (N )]): VAR [e ]=λ2 ;

COVAR [ e (t )⋅e ( t )T ]=λ2 (I vari esse, lambda, etc.. sono costanti numeriche. Comunque la struttura è quella. Per esempio la covarianza dovrebbe esser data da 2 termini più dettagliati, tuttavia qui il valor medio del rumore bianco è costante [anche nullo vuol dire costante], quindi non entra nell'operazione di media vedi L ¿135)

In forma vettoriale, il modello parametrico diventa:L¿89 ⟧Y=Φ ⋅θ0+E

In questo caso la soluzione θ mi serve per minimizzare l'incertezza data dal disturbo. Ed ha le seguenti proprietà statistiche (che sinceramente ho capito poco e presumo abbiano anche errori di trascrizione dato l'orario che si era fatto, le prendo per buone, speriamo in spiegazioni future):1. θ è una stima non polarizzata di θ0 (vedere appendice per stima polarizzata), quindi

L¿90 ⟧ E [ θ ]−θ0=02. La L¿91 ⟧Cov [ θ ]=λ2 (ΦTΦ )−1 , con ΦTΦ positiva3. Una stima non polarizzata attraverso θ della varianza del rumore bianco è data da:

L¿92 ⟧ s2=2−V (θ )N−n

, dove s2 è una misura (come λ) che in alcuni processi coincide con

λ2 .4. Essendo il rumore, bianco non c'è alcuna correlazione statistica tra istanti diversi di questo (es: e (a ) ed e (b ) con a≠b )

Nota: in questo caso abbiamo analizzato le proprietà della soluzione per l'identificazione di sistemi deterministici (ovvero la L ¿79 ) applicata a sistemi non deterministici con errori probabilistici (il rumore bianco). Vedremo questa cosa meglio verso le ultime lezioni, per ora è solo un'introduzione che non pesa tantissimo ai fini della comprensione, serve soprattutto come dati sulle proprietà del rumore bianco. E' molto meglio dopo.

Lezione 26/02/2010Segnali noti di "stimolazione" per l'identificazione

Abbiamo detto che per stimolare (e dunque identificare tramite le misurazioni e le stime) un sistema devo scegliere opportuni segnali d'ingresso. Questi segnali sono stati studiati e sono state individuate classi di segnali utili per stimolare una risposta interessante.

Gradino (e segnali derivati, come rampa, parabola, etc..) PBRS (sequenza casuale binaria) Processo stocastico ARMA (autoregressivo a media mobile) Segnali sinusoidali

La scelta di uno di questi segnali è determinata dal processo di identificazione che si vuole affrontare.

Page 27: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Ad esempio la risposta di un sistema LTI-TD è:y ( t )=k1 ⋅e−P1 t+…+kn ⋅e

−Pn t

Supponiamo di voler determinare i coefficenti {k1,…, kn }, va benissimo la classe dei segnali a cui appartiene il gradino.

Nel caso di un processo stocastico, il gradino non sarebbe granchè stimolante.

Premesse per l'analisi dei segnali noti di stimolazioneFacciamo riferimento ad un sistema LTI-TD quindi t∈Z , a livello grafico:

a livello temporale ci interessa: valor medio m covarianza R (τ )

a livello frequenziale ci interessa: densità spettrale di potenza Φ (ω ) (si noti che non ci riferimano ad un processo

stocastico in particolare, quindi non scriviamo ΦX (ω) )

GradinoL¿93 ⟧ sca ( t )={A ,t ≥0

0 , t<0, A∈R

PBRSE' una sequenza binaria pseudo casuale. Segnale periodico che varia tra due valori fissati.Il periodo è individuato come sottomultiplo dei campioni da trattare (situati sull'asse delle ordinate) in quanto è più semplice a livello computazionale.

Page 28: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Processo stocastco ARMAIl problema è: "bisogna generare un processo stocastico".Consideriamo una sequenza iniziale da cui partire coincidente o simile al rumore bianco, {e (t ) }.

La sua media normalizzata sarà: L¿94 ⟧ 1N∑

t=1

N

e (t )e (t+τ ) con N numero di campioni.

Con τ che ha le dimensioni della costante di tempo del polo più lento del sistema che si vuole studiare (il polo più lento è quello dominante, che individua quindi la dinamica dominante del sistema da individuare).

Nota: la media normalizzata tende a 0 se N tende a +∞ (proprio per il coefficente 1N

).

Prima di inviarlo al sistema, facciamo passare il segnale attraverso un filtro che denominiamo H . Il sistema complessivo assumerà il seguente schema a blocchi:

H sarà modellato da un'equazione alle differenze a coefficenti costanti, dunque rispetta il modello ARMA.La sue equazione sarà:

L¿95 ⟧H :u (t )+C1⋅u ( t−1 )+…+Cm ⋅u ( t−m )=e (t )+d1 ⋅e (t−1 )+…+dm⋅ e ( t−m )ARMA : AR (auto regressivo, poichè il valore dell'uscita si calcola grazie agli istanti precedenti di questa) MA (media mobile: perchè ad ogni nuovo campione cambia la media normalizata dell'ingresso, vedi la formula della media normalizzata prima descritta).

Si dimostra che l'uscita di H, ovvero u ( t ) è un processo stocastico, in quanto l'ingresso e ( t ) è un processo stocastico.

Page 29: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Notiamo che il filtro è un sistema proprio nel quale l'ingresso e l'uscita hanno lo stesso ordine (m).

Il filtro H è costruito dal progettista, che deve specificare:m;C i ,i=1,…,m; d i , i=1 ,…,m

Facciamo alcune osservazioni:Poniamo d i=0 ,i=1 ,…,m , non avremo media mobile ma solo auto regressione (AR), e la struttura diventerà:

L¿96 ⟧ H :u ( t )+C1⋅u ( t−1 )+…+Cm ⋅u ( t−m )=e ( t )Se invece poniamo C i=0 , i=1 ,…,m otteniamo un sistema solo a media mobile (MA):

L¿97 ⟧H :u ( t )=e (t )+d1⋅ e ( t−1 )+…+dm⋅e ( t−m )

Fatte queste osservazioni, ripassiamo a considerazioni di carattere generale. Utilizzando la definizione di operatore di ritardo a tempo discreto (vedi appendice) posso riscrivere H così:

L¿98 ⟧C (q−1 ) ⋅u ( t )=D (q−1) ⋅ e (t )Da cui:

L¿99 ⟧C (q−1 )=1+C1 ⋅q−1+…+Cm ⋅q−m

L¿100 ⟧D (q−1)=1+d1⋅q−1+…+dm⋅ q−m

Il progettista di H deve scegliere i coefficenti C i , d i in modo tale che H sia stabile. Infatti posso riscrivere l'espressione precedente come:

L¿101 ⟧u (t )=D (q−1 )C (q−1 )

⋅e (t )=H (q−1 ) ⋅e (t )

Per la stabilità, visto che siamo a TD, si richiede che gli zeri di C (q−1 ) siano all'interno del cerchio di raggio unitario sul piano complesso. (vedere controllo digitale)Ovvero: C (q−1 ) con zeri |q i|<1 da cui, utilizzando la trasformata zeta, si ottiene che, per la stabilità, bisogna avere C ( z ) con gli zeri |z i|>1 (notare che l'argomento di C è z e non z−1) (vedi dimanica di un modello nell'appendice ed anche lezioni successive).

Infine, come vedremo, la scelta dei coefficenti C i , d i rappresenta la capacità di modellazione dei contenuti frequenziali sull'uscita u ( t ).

Segnali sinusoidaliNon essendoci filtri riparliamo direttamente di u ( t ).

Hanno una struttura: L¿102 ⟧u (t )=∑j=1

m

a j⋅sin (ω j t+φ j) , con ω j pulsazione di riferimento e φ j

sfasamento.Questi segnali devono rispettare la relazione d'ordine:

0≤ω1<ω2<…<ωm≤ π

Notiamo che, se ω1=0 la sinusoide corrispondente sarà: a1sinφ1=costante

Page 30: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Se ho ω1=π ottengo la sinusoide corrispondente campionata (poichè siamo a TD) a seconda

del tempo di campionamento (ad esempio se ho che t=k ⋅ 12

ottengo

sin(π 12 ) , sin (π ) , sin(π 3

2 ) ,… ).

Richiami su nozioni di probabilità e statistica per analizzare i segnali di stimolazione noti

Dato un segnale x (t ) . media: L¿103 ⟧m=¿ E [ x ( t ) ] (vedi L ¿27 )

covarianza: L¿104 ⟧R (τ )=¿ E [ [ x ( t+τ )−m ] [ x ( t )−m ]T ] (vedi L ¿31 )

queste due definizioni riguardano un segnale che segue un processo stocastico.Per quanto riguarda un segnale deterministico si hanno le relative misure normalizzate rispetto al numero di campioni.

media: L¿105 ⟧mnorm=¿ limN→+∞

1N∑

t=1

N

x ( t )

covarianza: L¿106 ⟧Rnorm ( τ )=¿ limN→+∞

1N∑

t=1

N

[ [ x (t+τ )−m ] [ x (t )−m ]T ]

C'è un caso in cui i valori calcolati per un processo stocastico coincidono con i valori calcolati come se fosse deterministico, vale per i processi stocastici stazionari ergodici.Questi si hanno quando:

I. mnorm=¿ limN →+∞

1N ∑

t=1

N

x (t ) coincide con E [ x ( t ) ]

II. Rnorm ( τ )=¿ limN→+∞

1N∑

t=1

N

[ [ x (t+τ )−m ] [ x (t )−m]T ] coincide con

R (τ )=¿ E [ [ x (t+τ ) ] [ x ( t ) ]T ] (si noti l'assenza di m in quanto è un processo stazionario e per la L¿37 ha valor medio costante dunque non influenza l'operazione di media).

Ricordiamo anche la funzione di densità spettrale che coinvolge la covarianza (che è la trasformata discreta di fourier):

L¿107 ⟧Φ (ω )=¿ ∑t=−∞

+∞

R (τ )e− jtω ,ω∈ (−π ,π )

Page 31: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Che è una funzione definita semi positiva (notazione Φ (ω )≥0 )e per simmetria hermitiana abbiamo che: L¿108 ⟧Φ¿ (ω)=Φ (−ω) (il primo termine è complesso coniugato).Questo poichè la funzione Φ (ω ) è complessa, ovvero L¿109 ⟧Φ (ω ) : (−π ,π )→CLa funzione duale (l'antitrasformata) è la seguente:

L¿110⟧ R (τ )=∫−π

π

Φ (ω) e jωτdω

Analisi statistica del segnale PBRSSupponiamo di avere un segnale PBRS di periodo M che varia tra −a ed a.

La sua covarianza avrà i seguenti valori:

L¿111⟧R ( τ )={ a2 , τ=0 , ± M ,±2M ,…−a2

M ,τ ≠quelli precedentemente esposti

La funzione di densità spettrale è la seguente:

L¿112⟧Φ (ω )=∑k=0

M−1

Ck ⋅δ (ω−2πkM )

Si limita ai primi M campioni (e non è infinita come la L ¿107 ) perchè la funzione è periodica e basta esaminare solo un periodo. Inoltre la trasformata di forurier del gradino è la delta di dirac. Quindi, essendo la PBRS visibile come una somma di gradini (il disegno lascia a desiderare), con Fourier saranno tante delta.

Vediamo i coefficenti che valore hanno.

L¿113⟧C0=1M ∑

τ=0

M−1

R(τ )

Ma noi sappiamo quanto vale la covarianza di questa funzione nei vari valori di tau, quindi posso scrivere:

Page 32: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

C0=1M ( a2⏟

valore della cov.quando τ=0

+∑τ=1

M−1 −a2

M )C0=1M (a2+ −a2

M⏟è costante rispetto a τ

∑τ=1

M−1

1)C0=1M (a2+−a2

M(M−1 ))

L¿114 ⟧C0=a2

M 2

Vediamo i rimanenti coefficenti:

L¿115⟧ Ck >0

k=1M ∑

τ=0

M−1

α−kτ ⋅R (τ ) , α=ej2πM

Per i valori di R(τ) prima visti, abbiamo, osservando che α−(k=0)τ=1 :

Ck >0

k=1M (a2+ ∑

τ=1

M−1

α−kτ ⋅R ( τ ))L¿116⟧ Ck>0

k=1M (a2− a2

M ∑τ=1

M−1

α−kτ)Osservo che il termine: L¿117⟧ ∑

τ=1

M−1

α−kτ è una sommatoria geometrica troncata, per esserlo

propriamente deve iniziare da 0, quindi faccio un cambio di variabili (e di indici) pari a τ=τ−1 , quindi

τ=τ−1|τ=1=0 , τ=τ−1|τ=M−1=M−2e scrivo:

∑τ=0

M−2

α−k τ ⋅α−k=α−k ⋅ ∑τ=0

M−2

α−k τ=α−k ⋅ 1−α−(M−1 )k

1−α−k

Dalla L ¿116 faccio il mcm e metto in evidenza a2

M ottenendo:

Ck >0

k=a2

M 2 (M−1 ∑τ=1

M−1

α−kτ)Con il risultato precedentemente raggiunto scrivo:

Ck >0

k=a2

M 2 (M−α−k ⋅ 1−α−(M−1) k

1−α−k )Osservo che L¿118⟧ αM=(e j2π

M )M=e j2π=cos2 π+ j sin 2π=1 , quindi:

Ck >0

k=a2

M 2 (M−α−k ⋅ 1−α−Mk ⋅ α+k

1−α−k )Ck >0k=

a2

M 2 (M−α−k ⋅ 1−(α−M )k ⋅α+ k

1−α−k )Ck >0

k=a2

M 2 (M−α−k ⋅ 1−(1 )k ⋅α+ k

1−α−k )Ck >0k=

a2

M 2 (M−α−k−α−k ⋅ α+k

1−α−k )Ck >0

k=a2

M 2 (M−α−k−11−α−k )= a2

M 2 (M+ α−k−1α−k−1 )L¿119 ⟧ C

k >0k=

a2

M 2 (M+1 )

Quindi la L ¿112 diventa:

L¿120 ⟧Φ (ω )= a2

M2 [δ (ω )+(M+1)∑k=1

M−1

δ(ω−2 πkM )]

Analisi statistica del processo stacastico ARMASupponiamo che il segnale per generare il processo stocastico sia un rumore bianco (stessa supposizione di prima quando l'abbiamo introdotto) allora sono noti alcuni suoi valori:

Page 33: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

La covarianza avrà valore: L¿121 ⟧R e (τ )=λ2 ⋅δ τ , 0 (vedi appendice per δ τ , 0 , mentre labda quadro è numero noto)Nota: Scrivo Re (τ ) in quanto si riferisce al valore statistico del segnale d'ingresso al filtro H, a noi interessa anche la statistica del segnale che generiamo (che è proprio il processo stocastico ARMA) che indicherò con "pedice u".

Inoltre: L¿122 ⟧Φe (ω)= λ2

Si dimostra che: L¿123 ⟧Φu (ω )=H (e jω )Φe (ω )H (e jω)T

Per la L ¿101 e se i coefficenti C i , d i sono reali, posso scrivere il trasposto come complesso coniugato (la prendo per buona, non la vedo sinceramente). Dunque scrivo:

Φu (ω )= λ2

2πD (e jω )⋅D (e− jω)C (e jω )⋅C (e− jω )

=H (e jω)Φe (ω )H (e jω )T

Osserviamo (vedere appendice) che il prodotto di un numero per il suo complesso coniugato dà il modulo al quadrato del numero stesso. Quindi:

L¿124 ⟧Φu (ω)= λ2

2π|D (e jω)|2

|C (e jω)|2

Ovvero, giocando con i valori dei coefficenti C i , d i io posso eccitare il sistema (il cui ingresso è il processo stocastico {u ( t ) } ) come voglio. In quanto posso decidere su quali frequenze inserire contenuto informativo e vedere che reazione ha il sistema per queste frequenze (mentre le altre sono praticamente inifluenti).Infatti se assegno determinati coefficenti in modo di avere due poli complessi e coniugati presso ω0 relativamente al polinomio D (e jω ) , e riesco a spostare questi poli verso l'asse immaginario, avrò che il contenuto frequenziale presso ω0 sarà nullo (si dovrebbe azzerare, se ho ben capito, il numeratore di Φu (ω0 )), quindi sto dicendo "non mi interessa analizzare il comportamento del sistema presso ω0, ed infatti gli annullo il numeratore, lo voglio stimolare in altre frequenze".Diversamente, la stessa situazione relativamente a C (e jω) rende il contenuto frequenziale infinito (si dovrebbe avere il denominatore di Φu (ω0 ) nullo e quindi valori infiniti) utile a stimolare il sistema da identificare.

Analisi statistica del segnale sinusoidaleNota: ora parlo direttamente del segnale d'ingresso u non serve specificarlo come pedice.Ricordando la L ¿102 e relativa relazione d'ordine tra pulsazioni, considero la seguente somma parziale:

L¿125 ⟧SN=1N∑

t=1

N

sin (ωt+φ )

La posso vedere tramite sommatoria di parti immaginarie di un numero complesso:

L¿126 ⟧ SN=1N

ℑ[∑t=1

N

e j (ωt+φ )]Notiamo che l'esponenziale è una sommatoria geometrica troncata, che va leggermente aggiustata negli indici (vedi L ¿117) e diventa:

Page 34: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

SN=1N

ℑ[e jφe jω 1−e jωN

1−e jω ]Ricordo che il modulo di e jx è pari ad uno. Quindi, vedendo i moduli:

|SN|≤ 1N

|1−e jωN||1−e jω|

e per disuguaglianza triangolare (vedi appendice):

|SN|≤ 1N

|1−e jωN||1−e jω|

≤ 1N

2

|e jω2 −e

− jω2 |

Questo perchè |1−e jωN|≤|1|+|e jωN| (vedi appendice - disuguaglianza triangolare) ma il modulo di un esponenziale complesso abbiam detto che è unitario, dunque |1−e jωN|≤|1|+|e jωN|=2.Sotto invece (non ne sono sicurissimo) posso vedere |1−e jω|≤|1|+|−e jω| ma |1|=|−e jω| allora

posso anche scrivere: |1|+|−e jω|=|e jω2 |+|−e

− jω2 | da cui |e jω

2 |+|−e− jω

2 |≥|e− jω2 −e

− jω2 |=|1−e jωN|

che può essere sostituito a denominatore. Quindi rimane che, tolto il termine 1N

,abbiamo la

relazione ab≤ cb

. Quindi, poichè e− jω

2 −e− jω

2 =sin(ω2 ) per Eulero, abbiamo:

L¿127 ⟧|SN|≤1N

2

|sin (ω2 )|Da cui si dimostra che:

L¿128 ⟧SN N→+∞→

{sin φ , seω=2 πk , k∈Z0 , altrimenti

L¿129 ⟧m={a1 sinφ1 , se ω1=00 , altrimenti

Ed inoltre:

L¿130 ⟧ R (τ )=∑j=1

m

c j cos (ω j τ )Ricordando dalla L ¿102 che è una somma di m sinusoidi. I singoli coefficenti han valore:

L¿131 ⟧c j=a j

2

2Si dimostra pure che:

L¿132 ⟧Φ (ω )=∑j=1

m c j2 [ δ (ω−ω j )+δ (ω+ωj ) ]

Questo perchè ricordiamo la trasformata di fourier del seno, che è: L¿133 ⟧ F [sin(ω0 t)]=δ (ω0 )+δ (−ω0 )

Lezione 05/03/2010Classificazione dei modelli per l'identificazione : struttura generale di un

modelloPosto che siamo a TD.La struttura generale di un modello per l'identificazione è la seguente:

L¿134 ⟧ y ( t )=G (q−1 , θ ) ⋅u (t )+H (q−1 ,θ ) ⋅e ( t )

Page 35: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Esprime la relazione generale, lineare, della relazione tra ingresso (o segnale d'eccitazione) u (t ), disturbo e ( t ) e l'uscita y ( t ) . Il modello che prenderemo in considerazione avrà una struttura generale LTI (lineare tempo invariante). Nota: il filtro H (si vedrà che è un filtro) è diverso (anche se dovrebbe esser ovvio) dal filtro precedentemente visto per generare un segnale stocastico con un processo ARMA.

Il rumore biancoIl rumore, identificato da e (t ) è una successione di valori {e (0 ) , e (1 ) ,…}.In generale ogni valore e (i ) è un vettore di variabili aleatorie. Puoi vedere questo così.

Supponi che e (i )=[ x1

x2] , x1 ed x2 non assumono valori fissi ma possono variare entro un

intervallo di valori. Questo intervallo di valori (che può esser diverso tra x1 ed x2 ) è definito proprio dalle realizzazioni di una variabile aleatoria.

Ogni vettore ha le relative variabili aleatorie con la stessa distribuzione di probabilità (poichè è la definizione del rumore bianco), cioò sia nello stesso vettore che tra vettori diversi.In generale possiamo dire che e (t ) è una sequenza di vettori di variabili aleatorie identicamente distribuite.Proprietà:

Il valor medio di questa sequenza è nullo, ovvero: L¿135 ⟧ E [e ( t ) ]=0 (è un vettore di zeri)

I vettori sono non correlati o statisticamente indipendenti. (La distribuzione delle variabili aleatorie di un vettore non dipende dalle altre distrubizioni negli altri vettori).Formalmente ciò viene espresso con: L¿136 ⟧ E [e ( t ) ⋅e ( s)T ]=Λ (θ )δ t , s(vedi appendice per δ t , s). Per la definizione della delta di kronecker, l'indipendenza statistica (la L ¿136 ) afferma che la covarianza ha valore solo se t=s altrimenti è nullo.

Con queste caratteristiche il rumore diventa pari al rumore bianco.

Page 36: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Matrice di covarianzaRicordiamo che, dal modello L ¿134 si ha:

y (t ) ∈Rny

u ( t )∈Rnu

e ( t ) ∈Rn y

(notiamo che y ( t ) ed e ( t ) han la stessa dimensione)Vediamo che dimensione ha il prodotto e ( t ) e ( s)T che è l'argomento del valor medio usato per calcolare la covarianza.

L¿137 ⟧n yrighe {[ ¿e (t )¿ ]⏟

n y×1

⋅ [ ∧ ∧e (s )T∧¿ ]⏟ny colonne⏟

1×n y

⇒ Λ (θ ) ∈Rn y×n y

Λ (θ ) è detta matrice di covarianza.

Questa ha due proprietà: è simmetrica (vedi appendice) ed è semidefinita positiva. Verifichiamolo.Sappiamo come si calcola, per la L ¿136 che ha valori solo per t=s quindi abbiamo che:

L¿138 ⟧E [e ( t )⋅ e (t )T ]= Λ (θ )⋅1Grazie proprio al prodotto e ( t ) ⋅e ( t )T io ottengo la simmetria.Tralasciando il fatto che siano vettori aleatori a cui è applicato un valor medio, vediamo in un caso semplice se un prodotto di questo tipo crea una matrice simmetrica.Lo verifichiamo grazie all'hp50g, con una matrice A∈R4×3

L¿139 ⟧A ⋅AT è pari a:

Si nota che, a parte l'inversione (ovvero, invece di a13⋅a43 vedo a43⋅a13), la matrice è simmetrica. Quello che volevamo ottenere.

Ora vediamo perchè è semidefinta positiva (vedi appendice).Prendo un qualsiasi vettore ξ∈Rn y e costruisco la forma quadratica:

L¿140 ⟧ξT ⋅E [e ( t )⋅ e (t )T ] ⋅ξPer ipotesi ξ∈Rn y è deterministico, quindi per le proprietà del valor medio può essere incluso. Scrivo quindi:

E [ξT ⋅e (t ) ⋅e ( t )T ⋅ξ ]Posso individuare due fattori:

E [ (ξT ⋅ e ( t )) ⋅ (e ( t )T ⋅ξ )]ne osservo la dimensione:

E [(ξT ⋅ e ( t ) )⏟( 1×n y) (ny×1 )⏟

1×1

⋅ (e (t )T ⋅ξ )⏟(1×ny )(n y× 1)⏟

1×1]

Page 37: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

In pratica ho due scalari, dati da ξT ⋅e (t ) (ed anche l'altro prodotto, ovviamente) che è una combinazione lineare delle componenti di e ( t ) secondo i pesi di ξT, ovvero:

L¿141 ⟧α (t )=ξT ⋅e (t )=ξ1 e1 (t )+…+ξn yen y

(t )α (t ) è si uno scalare, ma è ancora una variabile aleatoria in quanto dipende dal rumore bianco.Per l'altro prodotto otteniamo il trasposto: α (t )T . Dunque:

E [α (t ) ⋅α (t )T ]Ma α (t ) ∈R quindi α (t )=α ( t )T quindi α (t ) ⋅α (t )T=α (t )2.

E [α (t )2 ]Ma il valor medio di una quantità positiva o nulla (visto che è uno scalare al quadrato) è sempre una quantità positiva o nulla (ovviamente è uno scalare anch'esso) quindi:

E [α (t )2 ]≥0Come si voleva dimostrare.

Caratterizzare i termini G ed H del modello generaleQuesti due termini sono in realtà due filtri.Dal punto di vista della cardinalità (della dimensione) sono matrici. (più precisamente sono filtri lineari a struttura matriciale)L¿142 ⟧G (q−1 , θ )∈Rn y×nu è una matrice rettangolare (poichè in generale non è detto che la dimensione dell'uscita sia uguale a quella dell'ingresso).L¿143 ⟧H (q−1, θ )∈Rny×n y è una matrice quadrata.

Gli argomenti dei filtri cosa sono?θ è il vettore dei parametri a dimensione finita (vedremo da cosa è costituito) tale che θ∈Rnθ.q−1 è l'operatore di ritardo (vedi appendice).

G ed H devono rispettare le seguenti proprietà.L¿143.1 ⟧G (0 , θ )=0n y×nu

L¿143.2 ⟧ H (0 , θ )=In y×nu

(Osservo che se q−1=0 sto esprimendo l'ipotesi di assenza di ritardi)Questo perchè, nell'ipotesi di annullare l'operatore di ritardo, dovrei avere un collegamento istantaneo tra ingresso ed uscita. Ma ciò è assurdo fisicamente, dove si richiede almeno un ritardo. Ricordando dalla L ¿134 che G è legato all'ingresso, allora se i ritardi sono nulli, anche il legame deve esser nullo, dunque G deve essere una matrice di solo zeri, tale per cui:

L¿143.3 ⟧ y (t )=0n y×nu⋅u ( t )=0ny

La proprietà su H si spiegherà più avanti (vedere predizione).

Definizione generale dell'insieme ammissibile dei parametri che definiscono θ

Abbiamo la seguente definizione:L¿144 ⟧D par= {θ∈Rnθ :H−1 (q−1 , θ )∧H−1 (q−1 ,θ )⋅G (q−1 ,θ ) rispettano la BIBO stabilità }

Quindi sia il singolo filtro (inverso) sia il prodotto di H inverso e G devono rispettare la BIBO stabilità per i parametri di θ , ed è ovvio che questo è un vincolo rispetto a tutti i valori possibili.

Page 38: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Il modello ARMAXSupposto che u (t ) ed y (t ) siano vettori ad una componente (un solo ingresso ed una sola uscita, sistema SISO), possiamo definire come segue il modello ARMAX.

L¿145 ⟧ A (q−1 )⋅ y ( t )=B (q−1 )⋅u (t )+C (q−1 ) ⋅e (t )A ,B ,C sono polinomi in q−1

Vedremo che questi sono riconducibili facilmente alla struttura generale vista prima.La forma dei polinomi è la seguente:

L¿146 ⟧ A (q−1 )=1+a1⋅q−1+…+ana⋅ q−na

L¿147 ⟧ B (q−1)=b1 ⋅q−1+…+bnb ⋅q−nb

L¿148 ⟧C (q−1 )=1+c1 ⋅q−1+…+c ⋅q−nc

Si osserva che A (0 )=1 e B (0 )=0, ed è facile osservare come si ottiene la formula generale, ovvero basta dividere per A (q−1 ) il modello ARMAX ottenendo:

L¿149 ⟧G (q−1 , θ )= B (q−1 )A (q−1 )

Che si annulla (ripettando la proprietà L ¿143.1 ) proprio quando q−1=0. Ed inoltre:

L¿150 ⟧H (q−1 , θ )=C (q−1 )A (q−1 )

Che quando q−1=0 vale 1, compre una matrice identità 1x1 (siamo nel caso SISO), come da proprietà L ¿143.2 .

Definizione di θ nel modello ARMAX e determinazione dei parametri ammissibili

L¿151 ⟧θ=[a1 ,…,ana, b1,…,bnb , c1 ,…, cnc ]Ovvero è un vettore composto da tutti i coefficenti dei polinomi del modello ARMAX.Quali sono i parametri (o valori) ammissibili? Quelli che rispettano il vincolo generale, visto nella L¿144 .Costuiamoci quindi H−1 (q−1 , θ ) ed H−1 (q−1 , θ ) ⋅G (q−1 ,θ ) .Dalla L ¿149 e dalla L ¿150 abbiamo:

L¿152 ⟧H−1 (q−1 , θ )= A (q−1 )C (q−1 )

L¿153 ⟧H−1 (q−1 , θ ) ⋅G (q−1 , θ )= A (q−1 )C (q−1 )

⋅ B (q−1 )A (q−1 )

=B (q−1 )C (q−1 )

Ora dobbiamo analizzare la bibo stabilità di queste espressioni.Per analizzare la bibo stabilità bisogna lavorare con la trasformata Z. Sapendo che in pratica: q−1=z−1 sostituiamo, ottenendo (si noti che l'argomento θ non verrà più citato in zeta, in fondo sono i coefficenti dei polinomi):

L¿154 ⟧H−1 ( z−1 )= A ( z−1 )C ( z−1 )

L¿155 ⟧H−1 ( z−1 )⋅G ( z−1 )=B ( z−1 )C ( z−1)

Per avere bibo stabilità, dai corsi precedenti (controlli automatici, controllo digitale, teoria dei sistemi), sappiamo che i poli del denominatore di entrambe le espressioni devono avere un modulo minore di 1, ovvero |poli|<1.Tuttavia dobbiamo stare attenti poichè il sistema vero e proprio deve essere riscritto in z , mentre ora come ora l'abbiamo scritto nel suo reciproco (z−1).

Page 39: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Si dimostra che per avere i poli con modulo minore di uno (|poli|<1 ) nel in un sistema F ( z ) bisogna ottenere i poli con modulo maggiore di uno (ovvero il complemento, escluso l'uguale per problemi di convergenza, quindi |poli|>1 ) nel sistema con argomento reciproco F ( z−1 ), che è quello da noi ricavato nelle L ¿154 ed L ¿155.Quindi:

L¿156 ⟧Dpa r ARMAX= {θ∈ Rnθ : radici di C ( z-1 ) hanno tutte il modulo maggiore di 1}

Modelli derivati dall'ARMAX (tutti LTI-TD, SISO)E' un analisi nel caso SISO.

1. AR (auto regressivo)L¿157 ⟧ A (q−1 )⋅ y ( t )=e ( t )

dunque è ottenibile dall'ARMAX ponendo B (q−1)=0 , C (q−1 )=1 .2. ARMA (auto regressive mobile average)

L¿158 ⟧ A (q−1 )⋅ y ( t )⏟parte AR

=C (q−1) ⋅ e ( t )⏟parte MA

dunque è ottenibile dall'ARMAX ponendo B (q−1)=0 .3. FIR (finite input response)

L¿159 ⟧ y (t )=B (q−1 ) ⋅u ( t )+e ( t )dunque è ottenibile dall'ARMAX ponendo A (q−1 )=1 , C (q−1 )=1 .Nota sulla dinamica di un modello: vedi appendice.4. ARIMA (la I esiste in quanto c'è un fattore integrale)è uguale al modello ARMA (L ¿158 ) soltanto che è presente un fattore integrale del tipo (1−q−1 )Ovvero A (q−1 ) è riscrivibile come L¿160 ⟧ A (q−1 )=(1−q−1) A (q−1 )5. ARX (non si ha l'effetto di media mobile)

L¿161 ⟧A (q−1) ⋅ y ( t )⏟AR

=B (q−1 )⋅u (t )⏟X

+e ( t )

(X come esogeno, ingresso esogeno) ovviamente: C (q−1 )=1 .Questo modello è legato all'operazione dei minimi quadrati, ricordiamo infatti la L ¿72 (riscritta un pochino)

m (θ ): y ( t )=φ ( t )T ⋅θ+e ( t )Finalmente ci viene sveltato come costruire (o io non me n'ero mai accorto) φ ( t ) ovvero:

L¿162 ⟧φ ( t )T=[ y ( t−1 ) ,…, y (t−na ) ,u ( t−1 ) ,…,u ( t−nb ) ]mentre theta è pari ad (ovviamente per l'ARX):

θ=[−a1

⋮−anab1

⋮bnb

]Dall'operazione φ (t )T ⋅θ si ottiene nel modello generale:

L¿163 ⟧ y (t )=−a1 ⋅ y (t−1 )−…−ana ⋅ y ( t−na )+b1⋅u ( t−1 )+…+bnb⋅u (t−nb )+e ( t )Se si spostano i termini in y a primo mebro otteniamo:

y ( t )+a1⋅ y ( t−1 )+…+ana⋅ y (t−na )=b1⋅u ( t−1 )+…+bnb ⋅u (t−nb )+e ( t )Posso riscriverla in termini di q−1 .

Page 40: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

y ( t )+a1⋅ q−1 ⋅ y ( t )+…+ana⋅q

−na⋅ y ( t )=b1 ⋅q−1⋅u ( t )+…+bnb⋅q−nb ⋅u ( t )+e ( t )

Da qui ricaviamo quello che avevamo precedentemente definito: A (q−1 )=1+a1⋅ q−1+…+ana ⋅q

−na

B (q−1)=b1 ⋅q−1+…+bnb⋅q−nb

Ovvero abbiamo verificato che dal modello ai minimi quadrati siamo passati al modello ARX.6. MA (mobile average)

L¿164 ⟧ y ( t )=C (q−1 ) ⋅e ( t )⏟MA

con A (q−1 )=1 , B (q−1)=0

Vedere i modelli derivati dall'ARMAX e l'ARMAX stesso in termini di schemi a blocchi

L'ARMAX, ovvero A (q−1 ) ⋅ y (t )=B (q−1 )⋅u (t )+C (q−1 ) ⋅e (t ) si può vedere in due modi di schemi a blocchi, ma prima bisogna riscriverlo come:

L¿165 ⟧ y (t )= B (q−1 )A (q−1 )⏟

G

⋅u (t )+C(q−1 )

A (q−1)⏟H

⋅e (t )

Oppure posso vederlo in questo altro modo:

Page 41: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Gli altri modelli diventano: AR

o MA

o FIR

o ARX

Page 42: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

o

Lezione 17/03/2010

RicapitolazioneFinora abbiam visto come identificare i parametri di modelli deterministici. Abbiamo anche visto che il modello ARMAX non è altro che la generalizzazione dell'algoritmo dei minimi quadrati (ovvero il modello parametrico relativo).Con l'AR ( vedi L ¿161 ) abbiamo visto come ricavare dal modello parametrico di regressione linerare l'AR stesso. Si può ricavare l'ARMAX semplicemente come segue:Ricordiamo infatti la L¿72 (riscritta un pochino)

m (θ ) : y (t )=φ (t )T ⋅θ+e (t )dove φ (t ):

L¿166 ⟧φ (t )T= [ y (t−1 ) ,…, y ( t−na ) , u ( t−1 ) ,…,u (t−nb ) , e (t−1 ) ,…, e (t−nc ) ]mentre theta è pari ad (ovviamente per l'ARMAX):

θ=[−a1

⋮−anab1

⋮bnbc1

⋮cnc

]Dall'operazione φ ( t )T ⋅θ si ottiene:L¿167 ⟧ y (t )=−a1 ⋅ y (t−1 )−…−ana ⋅ y ( t−na )+b1⋅u (t−1 )+…+bnb ⋅u ( t−nb )+c1 ⋅e ( t−1 )+…+cnc⋅e (t−nc )+e ( t )

Se si spostano i termini in y a primo mebro otteniamo:y ( t )+a1⋅ y (t−1 )+…+ana⋅ y (t−na )=b1⋅u (t−1 )+…+bnb ⋅u (t−nb )+c1 ⋅e (t−1 )+…+cnc⋅e (t−nc )+e (t )

Posso riscriverla in termini di q−1 .y ( t )+a1⋅ q

−1 ⋅ y ( t )+…+ana⋅q−na⋅ y ( t )=b1 ⋅q−1⋅u ( t )+…+bnb⋅q

−nb ⋅u ( t )+c1 ⋅q−1⋅e ( t )+…+cnc⋅q−nc⋅ e ( t )+e ( t )

Da qui ricaviamo quello che avevamo precedentemente definito: A (q−1 )=1+a1⋅ q−1+…+ana ⋅q

−na

B (q−1)=b1 ⋅q−1+…+bnb⋅q−nb

Page 43: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

C (q−1 )=1+c1⋅q−1+…+cnc ⋅q−nc

Ovvero abbiamo verificato che dal modello ai minimi quadrati siamo passati al modello ARMAX.

e ( t ) è detto anche equazione d'errore e rappresenta il disturbo.

Soluzione del modello parametrico di regressione lineare normalizzataAbbiamo visto come ottenere la soluzione del modello parametrico tramite il funzionale di costo nella L ¿76 e nella L ¿78 , con la soluzione del problema di minimo: L ¿79 .Possiamo riscrivere queste equazioni "esplodendole" e normalizzandole (quindi non è la stessissima cosa) rispetto al numero di misurazioni (che ricordiamo essere N ). Ricordando l'ipotesi di positività di ΦTΦ ( ΦTΦ>0 )

L¿168 ⟧V N (θ )= 1N∑

t=1

N

e ( t )2

con soluzione:

L¿169 ⟧ θ=[ 1N∑

t=1

N

φ ( t )⋅φ (t )T ]−1

⋅ [ 1N∑

t=1

N

φ ( t )⋅ y (t )]Che non è altro che la L ¿79 normalizzata ed esplosa. Vediamolo per chiarezza.Sia Φ la seguente:

Da notare che 'FI(1)' equivale ad

φ (1 )

. Per la

L ¿69

.allora (si so che si scrive PHI, ma sono 3 lettere ed è una palla) ΦT sarà:

Allora ΦTΦ sarà:

Si osserva che è una combinazione lineare semplice del tipo: ∑t=1

N

φ ( t ) ⋅φ ( t ) (ovviamente è

analogo per il secondo termine della L ¿169 ), il trasposto sul secondo fattore della sommatoria nel primo termine della L ¿169 è necessario per il caso multivariabile. Questo metodo è detto, come abbiam visto: metodo ai minimi quadrati o regressione lineare o equazione d'errore.

Le misure vereAbbiamo visto che il modello precedente è affetto da errore (o disturbo). Supponiamo di conoscere quei coefficenti che ci consentirebbero di avere i veri valori in uscita (senza errori) ovvero θ0:

L¿170 ⟧ y (t )=φ ( t )T ⋅θ0

Page 44: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

dunque torniamo alla L¿72 e ( t )= y (t )−φ (t )T ⋅θ0

che appunto ci descrive il metodo ai minimi quadrati o, come ultima definizione, equazione d'errore, ovviamente per la L ¿170 l'equazione d'errore sarà sempre nulla, proprio perchè sappiamo le misure vere.

Differenza tra soluzione per modelli deterministici e modelli stocasticiI modelli precedentemente visti servono per trovare la soluzione per modelli parametrici deterministici. In quel caso il vettore dei regressori φ (t ) è noto, quindi la stima è deterministica (e viene confrontata con l'uscita rilevata generando un errore deterministico).Nel caso di modelli stocastici, il vettore dei regressori non è noto, ma è appunto stocastico (e neanche statisticamente noto, come può esserlo il rumore bianco), ne segue che e (t )= y ( t )−φ (t )T ⋅θ è un errore stocastico in quanto se le misurazioni sono quelle e basta, φ (t )T ⋅θ è una misura stocastica data dal vettore dei regressori φ (t ).

E' possibile riutilizzare la soluzione ai minimi quadrati su un modello stocastico?

Pur sapendo che l'ARMAX ha la matrice dei regressori stocastica, noi applichiamo lo stesso procedimento visto nel caso deterministico per ottenere la soluzione, per vedere cosa ne esce.In pratica ho l'ARMAX in una delle seguenti rappresentazioni:

L¿17 1 ⟧ {A (q−1 ) ⋅ y (t )=B (q−1 ) ⋅u ( t )+e ( t )y (t )=φ ( t )T ⋅θ+e (t )

Nota: per semplicità C (q−1 )=1 .Supponiamo di conoscere il vettore dei parametri θ0 che mi permette di ricavarmi le misure senza disturbo, a cui associamo un errore stocastico (più precisamente processo stocastico stazionario) non correlato con l'ingresso (ovvero u(t ) ) che chiamiamo v ( t ) dove, nota bene, e (t )≠v (t ). Il vettore θ0 ovviamente influenza i polinomi A ,B ,C quindi avremmo una rappresentazione del modello ARMAX "vero" (con i parametri corrispondenti a quelli necessari per le misure reali)

L¿172 ⟧ {A0 (q−1 ) ⋅ y (t )=B0 (q−1 ) ⋅u ( t )+v (t )y (t )=φ ( t )T ⋅θ0+v ( t )

Osservazione: L¿172.1 ⟧φ ( t )T ⋅θ0= y (t )vero , ovvero questo termine restituirebbe i valori reali del sistema senza disturbi.Per validare l'operazione che vogliamo fare, ovvero applicare la soluzione ai minimi quadrati deterministica su un modello non deterministico, dobbiamo provare la proprietà di consistenza. Ovvero che con N molto grande la media della soluzione ottenuta  θ dovrebbe tendere a θ0 . Ovvero:

L¿173 ⟧E [ θ ]N→+∞→

θ0

Nota per la revisione: Questa sezione sembra una copia più chiara della sezione con la formula L ¿88 . Inizio a pensare che quelle non siano osservazioni relative alla sezione discussa precedentemente, ma bensì sia questa spiegazione "compressa". Quando rivedi il documento vedi se un merge migliora la chiarezza del tutto, perchè mantenendo due cose che non si "trovano" aumenti solo la confusione, meglio aver meno ma più chiaro. (occhio che devi vedere anche i rimandi alle equazioni coinvolte nel resto del documento). Confermo, quella

Page 45: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

sezione era l'analisi e questa discussione è l'"implementazione" del concetto, le sezioni le hai già parzialmente sistemate, comunque c'è sempre del margine e dunque lascio questa nota.

Verifichiamo se accade davvero questo. Valutiamo θ−θ0 , se c'è consistenza, il valor medio di questa differenza sarà nullo.Sfrutto la L ¿79 per le rappresentazioni L ¿171 ed L ¿172 ed ottengo: θ=(ΦTΦ )−1ΦTY .Per la rappresentazione L ¿171 la soluzione rimane uguale a come è scritta prima, per la L ¿172 osserviamo che , visto che sappiamo i valori "veri" abbiamo che Y vero=Φθ0 (escludendo v (t ) ). Quindi

L¿174 ⟧ θ−θ0=(ΦTΦ )−1ΦT Y−(ΦTΦ )−1ΦTΦθ0

θ−θ0=[ (ΦTΦ )−1 ] [ΦT Y−ΦTΦθ0 ]Se applico la normalizzazione per ogni singola misura, come vista nella L ¿169 ottengo:

L¿175 ⟧ θ−θ0=[ 1N∑

t=1

N

φ (t ) ⋅φ (t )T ]−1

[ 1N∑

t=1

N

φ ( t ) ⋅ y (t )−( 1N∑

t=1

N

φ ( t )⋅ φ ( t )T⏟nota1

)θ0]Nota1: si mette il trasposto nel caso multivariabile (non lo vedo, ma ho chiesto al professore e mi fido).Elaborando ancora si può scrivere:

θ−θ0=[ (ΦTΦ )−1 ] [ΦT (Y−Φθ0 ) ]Ma (Y−Φθ0 ) dalla L ¿172 (vista in modo matriciale) è pari a V (la matrice dei v ( t ) ). Quindi:

θ−θ0=[ (ΦTΦ )−1 ] [ΦTV ]ovvero:

L¿176 ⟧ θ−θ0=[ 1N∑

t=1

N

φ ( t )⋅φ ( t )T ]−1

[ 1N∑

t=1

N

φ ( t ) ⋅v ( t )]Si dimostra che c'è la proprietà di consistenza sotto queste ipotesi:

1) E [φ (t )⋅φ ( t )T ] non è singolare (è una media applicata su una matrice, la quale può restituire una matrice con determinante non nullo, ovvero senza la possibilità che una riga sia multipla di un'altra)

2) E [φ (t )⋅ v ( t ) ]=0 . Ovvero non esiste correlazione tra matrice di regressione e disturbo applicato ai valori veri.

Se verifico queste due condizioni, posso utilizzare la soluzione deterministica anche sul modello stocastico.Si verifica che la prima condizione è quasi sempre verificata, poichè φ (t ) è casuale, quindi è difficile avere una matrice non singolare.La seconda condizione è vera solo se v ( t ) è un rumore bianco. Ma il rumore bianco non è un processo reale, dunque la seconda condizione non si verifica quasi mai.Dunque non si può usare la stima ai minimi quadrati per un modello stocastico.

L'identificazione come problema di controlloNoi desideriamo identificare precisamente m (θ ) (alias vogliamo trovare il vettore  θ per la migliore approssimazione del sistema reale) per poter attuare operazioni di controllo su questo sistema (che è approssimato da m (θ ) ).Il controllo di un sistema si basa sulle informazioni disponibili da un tempo di origine (formalmente t=−∞ ) ad un instante precedente il tempo attuale (t−1).

Page 46: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Il controllo con modelli stocasticiNormalmente, in un sistema deterministico, io saprei calcolarmi y ( t ) in quanto ottenibile dalla relazione: L¿177 ⟧ y ( t )=f ( y (t−1 ) ,u (t−1 ) ) sapendo bene che y ( t−1 ) ed u (t−1 ) sono noti (come anche f , sennò lallero).Sapendo quale sarà il prossimo valore dell'uscita, posso controllare il sistema calibrando opportunamente il mio prossimo ingresso al sistema (che è modellato tramite controllori).In un sistema stocastico non riesco a predeterminare il valore dell'uscita, devo, al più, stimarla. In questo caso devo basarmi sulla stima per calibrare l'ingresso e controllare il sistema (tanto più la stima è diversa dall'uscita reale, tanto più il mio controllo sarà errato). Ovvero io ho un sistema di controllo pensato non sull'uscita reale, ma sulla stima, quindi L¿178 ⟧ y (t )=−a1 ⋅ y (t−1 )−…−ana ⋅ y ( t−na )+b1⋅u (t−1 )+…+bnb⋅u (t−nb )=φ (t )T ⋅θ .La stima (o predizione) della prossima uscita è basata su un algoritmo che tiene conto della storia passata del sistema (dal tempo di origine ad un istante di ritardo dall'istante attuale, ovvero (−∞, t−1 ] ), tuttavia sappiamo che queste informazioni, generalmente, sono contenute nei valori y (t−1 ) ed u (t−1 ) .

Definizione di predizione ad un passoNotazione:  L¿179 ⟧ y (t∨t−1 , θ )In pratica con questa notazione indico la predizione (o stima) di y (t ) conoscendo tutto ciò che è successo fino a t−1 ed i parametri θ.

Errore di stima o predizioneDefinito come segue:

L¿180 ⟧e (t ,θ )=¿ y (t )− y (t∨t−1 , θ )Da notare che questo non è l'errore stocastico del modello ARMAX. (cercherò di evitare fraintendimenti grazie alla notazione e (t , θ ) che non combacia con e (t ) )

Modello di predizione basato sull'ARMAXFacendo riferimento alla L ¿145 ed alla L ¿134 , ricordando anche la L ¿149, L ¿150 ,L ¿138 e le proprietà L ¿143.1 , L ¿143.2 .Dobbiamo definire un modello che generi la predizione.Suppongo l'esistenza di un dispositivo che predice l'uscita basandoci su cià che possiamo misurare, che ha la seguente struttura:

L¿181 ⟧ y (t∨t−1 , θ )=L1 (q−1, θ ) y (t )+L2 (q−1 ,θ )u ( t )nota: c'è t nelle forme di y ed i u , ma è la scrittura generale ed è ovvio che si riferisce solo agli istanti misurabili e non all'istante stesso che dobbiamo predire, come si vedrà in seguito.

Page 47: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

(A supporto della nota) L1 ed L2 non legano istantaneamente gli ingressi con la stima, quindi devono rispettare la proprietà che: L¿182 ⟧ L1 (q−1=0 , θ )=0 , L¿183 ⟧ L2 (q−1=0 ,θ )=0 .Altrimenti saprei l'uscita in modo istantaneo e la predizione non mi servirebbe.

Supponiamo che L1 ed L2 siano noti. Io desidero la minima discrepanza tra la stima e l'errore, ovvero dovrò fare un confronto riferendomi all'errore di stima L ¿180 .

Strumenti per la predizionePer farla ci serve conoscere ed eseguire i seguenti passi:

1. Il modello che approssima il sistema reale, ovvero m (θ )2. il predittore che stima il valore della prossima uscita3. minimizzare di volta in volta l'errore di predizione, ovvero devo far tendere e (t , θ )→0

quando t→+∞Si osserva che la predizione è basata su un algoritmo ricorsivo che calibra meglio il tutto ad ogni istante che passa, basandosi sull'errore di stima.

Matrice di covarianza dell'errore di stimaDefinita come segue (normalizzata sul numero delle misure):

L¿184 ⟧ RN (θ )= 1N∑

t=1

N

e ( t , θ )e ( t , θ )T

A livello "raccolto" non normalizzato (non si mostra l'operazione matematica di valor medio, ma lo si cita e basta) è pari ad:

L¿184.1 ⟧RN (θ )=E [e ( t ,θ )⋅ e ( t , θ )T ]E' definita positiva, quindi: RN (θ )>0 (come notazione, per l'operazione vedi appendice).Nel caso siso (un ingresso ed un'uscita) RN (θ ) è uno scalare (è può essere anche usata come funzione da minimizzare per far convergere a zero l'errore).Questo perchè l'errore di stima sarebbe la differenza tra due scalari (ricordando la L ¿180 visto che l'uscita è uno scalare. Se l'uscita è un vettore ∈Rny allora la differenza tra due vettori di questo tipo rende e (t , θ ) un vettore della stessa dimensione, ma il prodotto e (t , θ ) e ( t , θ )T avrà dimensioni (n y×1 ) (1×ny )=n y×ny quindi RN (θ ) sarà quadrata.Ma essendo il prodotto tra due vettori uguali, solo che uno il trasposto dell'altro, è anche simmetrica (vedi L ¿139 ).

Page 48: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Funzione da minimizzare (o funzionale di costo)Come per l'errore deterministico la discrepanza minima si basa sulla minimizzazione di una funzione appositamente scelta, detta "funzionale di costo". Questa funzione è basata sulla matrice di covarianza dell'errore di stima come segue:

L¿185 ⟧V N (θ )=h (RN (θ ) )h è una qualche funzione basata su RN (θ ) che definisce la struttura di V N (θ ) .Per h possiamo scegliere tra due possibilità:

- la traccia della matrice RN (θ ) . Quindi L¿185.1 ⟧h (RN (θ ) )=h1 (RN (θ ) )=Trac (S ⋅RN (θ ))S è una matrice simmetrica di "pesi", quindi è possibile riscriverla come L¿185.1.1 ⟧ S=S1⋅ S1

T (vedi appendice per la matrice simmetrica). Con S1 matrice non singolare e quadrata.- il determinante della matrice RN (θ ) . Quindi L¿185.2 ⟧h (RN (θ ) )=h2 (RN (θ ) )=Det (RN (θ ) )

Perchè solo queste due scelte? Poichè entrambe soddisfano una proprietà per la quale si ha un solo minimo globale, ovvero la proprietà di crescenza monotona. Dunque, data una qualsiasi matrice ΔRN (θ )≥0 avrei che:

L¿186 ⟧h (RN (θ )+ΔRN (θ ))≥h (RN (θ ) ) Nel caso della traccia si dimostra che possiamo scrivere:

L¿186.1 ⟧h1 (RN (θ )+ΔRN (θ ) )−h1 (RN (θ ))=traccia (S ⋅ΔRN (θ ))Con RN (θ )>0 ed ΔRN (θ )≥0 .Continuando posso scrivere: traccia (S ⋅ΔRN (θ ))=traccia (S1⋅ S1

T ⋅ ΔRN (θ ) )ma questa è uguale a: L¿186.2 ⟧ traccia (S1 ⋅S1

T ⋅ΔRN (θ ) )=traccia (S1T ⋅ ΔRN (θ )⋅S1 )

E si dimostra che: traccia (S1T ⋅ΔRN (θ ) ⋅S1)≥0

(ovvero h1 (RN (θ )+ΔRN (θ ) )−h1 (RN (θ ) )≥0 quindi la funzione è monotona crescente)Osserviamo che RN (θ ) è quadrata, per il discorso sulla L ¿184 , dunque, per omogeneità delle operazioni, anche ΔRN (θ ) lo sarà, come pure S in quanto simmetrica.Tuttavia l'operazione di traccia deve fare qualche cosa di strano, poichè la L ¿186.2 cambia argomento, al primo membro è una matrice quadrata che viene data in pasto all'operazione di traccia, nel secondo caso abbiamo uno scalare (la forma quadratica S1T ⋅ΔRN (θ )⋅ S1, da cui si osserva che, per definizione di ΔRN (θ )≥0 , darà uno scalare

maggiore o uguale di zero . Se si pone ΔRN (θ )>0 si avrà un argomento strettamente positivo ), come si può vedere dall'appendice "Prodotto tra una matrice quadrata e le matrici generatrici di una simmetrica". Nel caso del determinante possiamo scrivere così:

L¿186.3 ⟧h2 (RN (θ )+ΔRN (θ ) )−h2 (RN (θ ) )=Det (RN (θ )+ΔRN (θ ) )−Det (RN (θ ) )Ma posso riscrivere il secondo membro come: Det (RN (θ ) ⋅ (I+RN (θ )−1 ⋅ΔRN (θ ) ))−Det (RN (θ ))Poichè RN (θ ) ⋅I=RN (θ ) ed RN (θ ) ⋅RN (θ )−1⋅ ΔRN (θ )=I ⋅ΔRN (θ )=ΔRN (θ )Ma posso mettere in evidenza Det (RN (θ ) ) , e sfruttare la simmetria di RN (θ ), ovvero RN (θ )=Q1 ⋅Q1

T=Q , così (vedi anche vari punti dell'appendice):

Det (RN (θ ) (I+RN (θ )−1 ⋅ΔRN (θ ) ))−Det (RN (θ ))=Det (Q )⋅ [Det ( I+Q−TQ−1⋅ΔQ )−1 ]L'operazione appena fatta sfrutta anche l'associatività del determinante (vedi appendice)Ricordando che L¿186.4 ⟧Det ( I+AB )=Det ( I+BA ), scrivo:

L¿186.5 ⟧ Det (Q )⋅ [Det ( I +Q−TQ−1 ⋅ΔQ )−1 ]=Det (Q ) ⋅ [Det ( I+Q−1⋅ ΔQ⋅Q−T )−1 ]Ma si dimostra che Q−1 ⋅ΔQ ⋅Q−T è definita positiva ed è simmetrica. Allora i suoi autovalori sono tutti maggiori o uguali di zero. In pratica λ i≥0 ,i=1 ,.. , ny . Ma il

Page 49: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

determinante può esser visto anche come prodotto dei sui autovalori (vedi appendice) quindi si dimostra che:

L¿186.6 ⟧h2 (RN (θ )+ΔRN (θ ) )−h2 (RN (θ ) )=Det (Q ) ⋅ [∏i=1

n y

(1−λ i )−1]≥0

(l' eguaglianza con zero si avrebbe con λ i=0 , i=1 ,.. , ny che implica ΔQ=ΔRN (θ )=0)Che mostra che anche h2 è monotona crescente.

Allora minimizzando h che ha la proprietà L ¿186 troverò un'unica soluzione ottima.Computazionalmente pesano allo stesso modo, però se si implementano a livello ricorsivo, conviene usare la traccia (quindi h1)

Algoritmo PEM (prediction error method) in breve- dato il modello stocastico ARMAX (L ¿134)

y (t )=G (q−1 , θ ) ⋅u ( t )+H (q−1 ,θ )⋅ e (t )- Dato il predittore (L ¿181)

y ( t∨t−1 ,θ )=L1 (q−1 , θ ) y ( t )+L2 (q−1 , θ )u (t )- Dato il funzionale di costo (L ¿185)

V N (θ )=h (RN (θ ))- Si deve trovare la soluzione ottima dell'ultimo

L¿187 ⟧ θ=argminV N (θ )θ

=argminh (RN (θ ) )θ

Graficamente ho:

Page 50: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Si dimostra che possiamo scegliere L1 ed L2 arbitrariamente, tanto con la minimizzazione tenderei sempre a convergere verso valori di stima sempre migliori. Tuttavia potrei non avere l'ottimalità, ovvero potrei non rientrare nell'intervallo di precisione richiesto.

Esempio generico: Scelta ottimale di L1 ed L2

Riferendoci al modello ARMAX (L ¿134 , L ¿136 , L ¿143.1 , L ¿143.2 , L ¿149 , L ¿150 , L ¿156)Posso scrivere:

L¿188 ⟧ y (t )=G (q−1 ,θ ) ⋅u (t )+{H (q−1 ,θ )−I }⋅e (t )+e (t )(con I matrice identità ). Osservo che ho aggiunto zero poichè: −I ⋅ e (t )+e ( t )=0Osservo dalla L ¿134 che poso ottenere e (t ) in questo modo:

L¿189 ⟧ [ y ( t )−G (q−1 , θ ) ⋅u (t ) ] ⋅H−1 (q−1 , θ )=e (t )Quindi tornando alla L ¿188 :

y ( t )=[G (q−1 , θ ) ⋅u ( t )+ {H (q−1 , θ )−I }⋅H−1 (q−1 , θ ) ⋅ { y ( t )−G (q−1 , θ ) ⋅u ( t ) } ]+e ( t )

y (t )=[G (q−1 , θ ) ⋅u ( t )+ {H (q−1 , θ )H−1 (q−1 ,θ )−H−1 (q−1 , θ ) }⋅ {y (t )−G (q−1 , θ ) ⋅u (t ) } ]+e (t )

y ( t )=[G (q−1 , θ ) ⋅u ( t )+ {I−H−1 (q−1 , θ ) }⋅ { y ( t )−G (q−1 , θ ) ⋅u (t ) } ]+e (t )

y (t )=[G (q−1 , θ ) ⋅u (t )+ I ⋅ { y (t )−G (q−1, θ ) ⋅u (t ) }−H−1 (q−1 ,θ )⋅ { y (t )−G (q−1 ,θ ) ⋅u (t ) } ]+e (t )

Page 51: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

y ( t )=[G (q−1 , θ ) ⋅u ( t )+ y ( t )−G (q−1 ,θ )⋅u (t )−H−1 (q−1 ,θ )⋅ { y ( t )−G (q−1 ,θ ) ⋅u ( t ) } ]+e ( t )

L¿190 ⟧ y (t )= [(I−H−1 (q−1 ,θ ))⋅ y (t )+H−1 (q−1 , θ ) ⋅G (q−1 ,θ )⋅u ( t ) ]⏟lo chiamo Z (t )

+e ( t )

L¿191 ⟧ y (t )=Z ( t )+e (t )Data   y ( t|t−1 , θ ) la stima del predittore. Sappiamo che questo (il predittore) deve minimizzare RN (θ ) per aver la migliore stima.Quindi richiamiamo la L ¿184.1 :

E [e ( t , θ )⋅ e ( t , θ )T ]ma sappiamo dalla L ¿180 come è definito l'errore di stima, quindi:

E [ [ y (t )− y (t∨t−1, θ ) ]⋅ [ y (t )− y ( t∨t−1 , θ ) ]T ]Se il predittore è ottimo posso scrivere, dalla L ¿191

E [ [Z ( t )+e ( t )− y ( t∨t−1 ,θ ) ]⋅ [Z ( t )+e (t )− y ( t∨t−1 , θ ) ]T ]Elaborando (non vedo come e non mi ci sono messo) si ottiene, solo nel caso in cui e (t ) non è correlato ne all'ingresso ne all'uscita:

E [ [Z ( t )− y (t∨t−1 ,θ ) ]⋅ [Z ( t )− y ( t∨t−1 ,θ ) ]T ]+Λ (θ )Nota: Λ (θ ) è proprio quella della L ¿136 in quanto si ottiene con l'errore ricavato dall'ARMAX (vedi L ¿191), mentre RN (θ ) è tutta la formula precedente, non solo un termine!

Si dimostra che ottengo il miglior risultato di predizione quando la matrice di covarianza dell'errore di stima assume un valore simile alla matrice di covarianza L ¿136, ovvero:

L¿192 ⟧RN (θ )=E [ [Z ( t )− y ( t∨t−1 ,θ ) ]⋅ [Z ( t )− y (t∨t−1 ,θ ) ]T ]+Λ (θ )≃ Λ (θ )Ma per aver questo (l'ottimalità) bisogna avere che L¿193 ⟧ y (t∨t−1 , θ )=Z (t ) ottenendo, nella L ¿192:

RN (θ )=0+Λ (θ )=Λ (θ )

Così abbiam scelto L1 ed L2 ottimi. Ovvero, dalla L ¿193 e dalla L ¿190 :

L¿194 ⟧ y ( t∨t−1 ,θ )=Z ( t )=H−1 (q−1 ,θ ) ⋅G (q−1 ,θ )⋅u ( t )+(I−H−1 (q−1 ,θ )) ⋅ y (t )Osservando che se H−1 (q−1=0 , θ )≠ I si avrebbe che la stima dell'uscita di un certo istante dipenderebbe dall'uscita stessa allo stesso istante. A parte che è assurdo, non si avrebbe alcuna utilità visto che dovrei misurare l'uscita allo stesso istante senza poterla predire.Per questo si deve avere la proprietà L ¿143.2 .(da notare che se H (q−1=0 , θ )=I allora anche H−1 (q−1=0 , θ )=I

infatti sia A=[1∧00∧1]=I allora A−1=

aggiunta ( A )det ( A )

=[1∧00∧1]

1 =[1∧00∧1]=I )

Esempio particolare di scelta ottimale di L1 ed L2

Consideriamo il modello ARMAX nel caso particolare:L¿194.a.1 ⟧ y (t )+a ⋅ y (t−1 )=b ⋅u ( t−1 )+e ( t ,θ )+c ⋅ e (t−1 ,θ )

Con e (t , θ ) rumore bianco a E [e ( t ,θ ) ]=0 (L ¿135, L ¿53) ed L¿194.1 ⟧VAR [e (t ,θ ) ]=λ2 (con lambda pari ad una costante nota, ma non da me).

Page 52: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

In questo caso θ=[a∧b∧c ]T.

Assumiamo che il rumore sia incorrelato con l'ingresso, ovvero: {u ( t )e ( s)

, t<s non sono correlati

(statisticamente indipendenti).L'uscita al tempo t sarà pari ad, dalla L ¿194.a .1 :

y ( t )=[−a ⋅ y (t−1 )+b ⋅u (t−1 )+c ⋅e (t−1 ,θ ) ]+e (t , θ )Indicando con y (t )¿ una predizione arbitraria di y (t ) si può avere quanto segue:

L¿194.2 ⟧ E [ ( y (t )− y (t )¿)2 ]⏟varianza vedi L#29

=E [( [−a ⋅ y ( t−1 )+b ⋅u (t−1 )+c ⋅e (t−1, θ ) ]− y (t )¿)2 ]+λ2≥ λ2

Con λ2 varianza del rumore bianco, vedi L ¿194.1 .L'eguaglianza è ottenuta solo quando il predittore ( y (t )¿) ha la forma:

L¿194.3 ⟧ y (t∨t−1 , θ )=−a ⋅ y (t−1 )+b ⋅u (t−1 )+c ⋅e (t−1, θ )Questo è un predittore ideale non realizzabile, poichè non conosciamo il rumore agli istanti precisi, come ad esempio e ( t−1 ). Tuttavia questo è ricostruibile basandoci sui parametri a noi noti (y ( t−1 ) , y (t−2 ) ,…,u ( t−1 ) , u (t−2 ) ,…). Sapendo dalla L ¿180 (lo sapevo che sballava l'omogeneità della notazione, che è importantissima, ogni volta che revisioni devi fare due cose, o passi e (t ,θ) nella notazione e (t ) distinguendo dal contesto l'errore deterministico da quello stocastico, oppure in ogni caso che parli di errore stocastico metti e (t ,θ) [la seconda opzione è migliore imo] ) che

L¿194.4 ⟧e (t−1, θ )= y (t−1 )− y (t−1∨t−2 ,θ )= y (t−1 )+a ⋅ y (t−2 )−b ⋅u ( t−2 )−c ⋅e ( t−2, θ )allora:

y ( t∨t−1 ,θ )=−a ⋅ y ( t−1 )+b ⋅u (t−1 )+c ⋅ [ y (t−1 )+a ⋅ y (t−2 )−b ⋅u ( t−2 )−c ⋅ e (t−2 ,θ ) ]Continuando posso scrivere:y ( t∨t−1 ,θ )=−a ⋅ y (t−1 )+b ⋅u ( t−1 )+c ⋅ [ y (t−1 )+a ⋅ y ( t−2 )−b⋅ u ( t−2 )−c ⋅ [ y ( t−2 )+a ⋅ y ( t−3 )−b ⋅u (t−3 )−c ⋅e (t−3 ,θ ) ] ]e così via.Si arriva ad

L¿194.5 ⟧ y (t∨t−1 , θ )=(c−a )⋅ [∑i=1

t−1

(−c )i−1 y ( t−i )]−a (−c )t−1 y (0 )+b ⋅ [∑i=1

t

(−c )i−1u (t−i )]−(−c )t e (0 )

(da verificare quando revisioni, comunque osserva che nella sommatoria relativa all'ingresso l'indice superiore non è t−1 poichè non è messo in evidenza u (0 ) )Questa ha la condizione che |c|<1 (altrimenti il valore stimato sarà sempre più grande e quindi divergente), tramite il quale, si può osservare, che il valore scelto per e (0 ,θ ) non influenza molto la stima in quanto il termine (−c )t ne riduce molto l'influenza.Con t molto grande posso trascurare qualche termine (l'ultimo in particolare) e posso scrivere:

L¿194.6 ⟧ y ( t∨t−1, θ )=(c−a )⋅ [∑i=1

t−1

(−c )i−1 y (t−i )]−a (−c )t−1 y (0 )+b ⋅[∑i=1

t

(−c )i−1u ( t−i )]Tuttavia a livello computazionale non è gestibile (ci sono troppi termini) e si usa questa ricorsione:

L¿194.7 ⟧ y ( t∨t−1, θ )+c ⋅ ( y (t−1∨t−2 , θ ) )= (c−a )⋅ y (t−1 )+b ⋅u (t−1 )(da verificare, possibilmente, anche questa).

Page 53: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

La ricorsività del PEM richiede la condizione inizialePoichè il PEM funziona ricorsivamente, adattandosi ad ogni nuova misura, serve la discrepanza iniziale. ma questa non è ottenibile realmente, poichè il sistema deve "partire".Dunque si sceglie una condizione iniziale che non influisca sulle predizioni successive (considerando che lo storico delle rilevazioni aiuta il pem a migliorare la calibrazione della predizione).Si dimostra che la migliore condizione iniziale da assumere è: L¿195 ⟧e (0 , θ )=0 , il che implica un'assunzione di errore nullo. Ovvero: L¿196 ⟧ y (0∨−1 , θ )= y (0 ).Con questa assunzione il grafico di e (t , θ ) sarà all'incirca come segue:

Esercitazione 05/02/2010In questa esercitazione in realtà si sono espressi concetti teorici, in parte già esposti nella seconda lezione (quella del 29/01/2010). Inoltre i concetti esposti non mi sono risultati chiarissimi a causa dell'uso di una notazione che definirei "dinamicamente mutevole". Può sembrar strano, ma io ritengo che una notazione ben definita aiuti molto la comprensione, altrimenti potremmo inventarcene una nostra che cambia ad ogni ora e lasciare ai poveri studenti il compito di decifrarla (e poi capirne il contenuto).Perciò riporterò solo i concetti (o meglio le aggiunte ai concetti già espressi) che sono riuscito a decifrare con una certa sicurezza nel "capitolo" relativo alla lezione del 29 gennaio, per il resto darò solo la descrizione informale, per evitar danni. Tuttavia molte cose devono essere verificate chiedendo al prof o sui libri, per esser sicuri.

Esercitazione 19/02/2010Prima di tutto mi lamento nuovamente (e poi basta altrimenti divento ripetitivo).Forse sono scemo io, ma se dei contenuti, seppur chiarissimi, vengono esposti in una notazione mutevole nel corso della stessa lezione (figurarsi tra lezioni) diventano incomprensibili mentre si segue la lezione. Infatti, durante questa, oltre che a fare una mera copia di ciò che espone il professore, cerco di capire. Se mi si modifica ogni poco la notazione, non riesco più a farlo e vado in semplice "modalità copia".

Page 54: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Poi a casa devo prima capire a quali concetti si riferisce una data notazione (visto che gli stessi concetti vengono citati con notazioni diverse per farci felici) e poi capire il concetto stesso. Un archeologo me lo mangio a colazione! Questa esposizione è un peccato, perchè è un corso davvero interessante.Per cui, a differenza della precedente esercitazione, ricopierò tutto quello che ho scritto, se ho capito alcune cose lo scrivo, altrimenti amen, le accetto per "volontà divina".

Identificazione tramite equazioni normaliQueste prevedono prima la risoluzione delle matrici: E¿1 ⟧ΦTΦ ; E¿2 ⟧ΦT YPoi si passa a risolvere le equazioni normali: E¿3 ⟧ (ΦTΦ )θ=ΦT YDa queste calcolo θ .Queste soluzioni sono molto sensibili alle approssimazioni di calcolo fatte (eventualmente da un calcolatore).

Identificazione tramite triangolarizzazione ortogonale o metodo QRSi parte da questa equazione: E¿4 ⟧Φθ=YPoi si moltiplica a sinistra per una matrice Q ortogonale (vedi appendice). Quindi:

E¿5 ⟧QΦθ=QYRicordando la funzione "indice di costo", ovvero quella funzione di θ che si vuole minimizzare per ottenere la soluzione del modello di regressione lineare (vedi L ¿78 ) :

V (θ )=¿ 12ET⋅E=1

2‖E‖2

2

Vediamo che la moltiplicazione per Q non ne modifica la forma. Infatti otteniamo che la forma matriciale di E era: E=Y−ΦθOra diventa: E¿6 ⟧E=QY−QΦθDa cui: E¿7 ⟧‖E‖2

2=‖QY−QΦθ‖2

2=‖Q (Y−Φθ )‖2

2

Ma sappiamo pure che E¿8 ⟧ ET ⋅E=‖E‖22

Dunque: E¿9 ⟧‖E‖22=[Q (Y−Φθ ) ]T [Q (Y−Φθ ) ]

Per le proprietà della trasposizione (vedi appendice) diventa: ‖E‖22=(Y−Φθ )TQTQ (Y−Φθ )

Per ortogonalità E¿10 ⟧QTQ=IQuindi: E¿11⟧‖E‖2

2=(Y−Φθ )T (Y−Φθ )Esattamente uguale alla formula di V (θ ) senza la moltiplicazione per Q , vedi L ¿80.a.a .1 .

Supponiamo di scegliere una Q tale che il prodotto: QΦ dia come risultato una matrice

triangolare superiore (vedi appendice), quindi E¿12 ⟧QΦ=[Ra Rb

0 Rc ] dove i blocchi Ra , Rb ,R c

fanno parte della stessa matrice R che ha una forma triangolare superiore ed è quadrata.

Mentre QY diventa la composizione di due blocchi: E¿13 ⟧QY=[Z1

Z2]Con questa scelta, l'indice di costo diventa (non ho indagato sul perchè da una norma di una sottrazione siamo passati a due norme distinte):

E¿14 ⟧V (θ )=12‖E‖2

2=12‖QY−QΦθ‖2

2=12 (‖Rθ−Z1‖2

2+‖Z2‖22 )

Page 55: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Se R non è singolare (rango massimo o determinante diverso da 0) allora Φ sarà a rango massimo, quindi ΦTΦ non è singolare. Se questo è vero, si ottiene che: Rθ=Z1 e dunque:

E¿15 ⟧V (θ )=12‖E‖2

2=12‖Z2‖2

2=Z2T ⋅Z2

Il metodo QR è meno sensibile alle approssimazioni di calcolo.

Confronto tra il metodo QR ed il metodo delle equazioni normaliSia il sistema da risolvere:

(3 3−δ4 4+δ )X=(−1

1 )Con δ molto piccolo.

La soluzione "perfetta" del sistema è: X=(−1δ1δ

)Si può notare che i la prima e la seconda colonna della matrice a primo membro del sistema

siano quasi coincidenti, a meno di delta (ovvero i vettori 34 ed 3−δ4+δ sono praticamente gli

stessi), quindi la soluzione è molto sensibile al coefficente delta.

Con il metodo QR scegliamo una matrice Q così fatta: Q=15 (3 4

4 −3)Quindi il sistema diventa, se moltiplichiamo a sinistra ad entrambi i membri:

(5 5+ δ5

0 −7δ5

)X=(15

−75

)Si noti la matrice triangolare superiore.

Con le equazioni normali abbiamo il seguente sistema:

( 25 25+δ25+δ 25+2δ+2δ 2)X=( 1

1+2δ)Supponendo di risolvere i sistemi al calcolatore, avendo a disposizione un'aritmetica finita (che avrà voluto dire!?), e supponendo di approssimare a zero qualsiasi termine di grado maggiore del primo, relativamente a delta (ovvero δ 2=0 e così via), otteniamo:la soluzione per le equazioni normali è

X=(49δ

+2

−49δ

)la soluzione per il metodo QR è

X=(−1δ1δ

)

Page 56: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Si vede che le equazioni normali "soffrono" molto l'approssimazione, che non intacca, invece, la soluzione del metodo QR.

Identificazione tramite algoritmo ricorsivo per il calcolo dei minimi quadrati

(anche negli altri modelli si tratta la soluzione ai minimi quadrati, ma questa volta la si tratta direttamente, e non tramite la funzione V (θ ) )

Si riscrive la stima ottima dei parametri da identificare, ovvero: θ=(ΦTΦ )−1ΦTY ; in modo ricorsivo:

E¿16 ⟧ θ ( t )=θ ( t−1 )+K ( t ) [ y (t )−φT ( t ) θ ( t−1 ) ]La spiegazione non ci è data (per ora).

Esempi e codice matlab: pressione arteriosaStimare la relazione tra pressione arteriosa ed età.I dati rilevati dalle misurazioni sono: x(età)

y(pressione)

25 12030 12542 13555 14055 14569 14070 160

Con il modello di regressione lineare cerchiamo una curva che approssimi meglio questa tabella. Supponiamo che il modello sia nella forma E¿17 ⟧ y=ax+b (potevamo supporre curve più precise) e quindi calcoliamo la miglior stima dei parametri tramite θ=(ΦTΦ )−1ΦTYSolo che essendo in matlab scriviamo: S= (M TM )−1M T Y (ovvero S= θ ,M=Φ )

Essendo una curva lineare, con un valore rilevato x=x0 il valore stimato dal processo di identificazione sarà pari ad: E¿17.1 ⟧ ys=Φ (x0 )θ (visto che, come si vedrà, Φ o M dipende dai dati x rilevati, ovvero x0).Il codice è quello che segue:x = [25, 30, 42, 55, 55, 69, 70]';y=[120,125,135,140,145,140,160]';M=[x, ones(7,1)];S=inv(M' * M) * M' * Y;a = S(1);b = S(2);//si plottaplot(x,y,'b');//si blocca la figurahold onys= a * M(:,1) + b;plot (M(:,1), ys, 'r');

Page 57: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

hold off

Con l'hp50g il calcolo viene "automatico" (è una delle funzioni preesistenti nella calcolatrice, le altre possono essere sviluppate/aggiunte grazie ai vari utenti o appassionati che condividono il loro sapere su www.hpcalc.org )L'immagine è la seguente, dove i punti rappresentano i dati e la linea la retta di regressione (il modello lineare):

Per verificare che l'approssimazione non è cattiva analizziamo l'analisi dei residui o delle discrepanze, ovvero:e=y-ys;La stima è buona se i residui assomigliano ad un vettore di rumore bianco, e lo si vede analizzando il valor medio e la varianza del parametro e.

Esempio 2Supponiamo di voler approssimare un'altra serie di approssimazioni, con una curva con più dimensioni:

E¿18 ⟧ y=a ⋅ x1+b ⋅ x2+cChe è un piano, perchè se si fissa x1 e si varia x2 , o viceversa, cosa impossibile per rette in R3

, si continuano ad ottenere valori per la y.Per ottenere una retta, non particolare (ovvero che non si sviluppa utilizzando solo 2 dimensioni), in R3, bisogna intersecare 2 piani.

x1=[4,4.2,4.4,4.6,4.8,5]';x2=[17.1,16.5,18.2,17.9,19,18.9]';y=[7.1,8.2,8.1,9.8,11.6,13]';M=[x1,x2,ones(6,1)];S=inv(M' * M) * M * ya= S(1);b= S(2);c = S(3);plot3(x1,x2,y,'b');hold onys=a * M(:,1) + b*M(:,2) + c;plot3(M(:,1), M(:2), ys);hold off

per questa soluzione mi è venuto comodissimo l'esempio (senza neanche leggerlo molto attentamente) riportato sull'user guide manual (non advanced) dell'hp 50g. Anche senza

Page 58: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

calcolatrice è spiegato "teoricamente" abbastanza bene (e l'ho letto superficialmente, altrimenti nelle note aggiunge molti dettagli). Si trova a pagina 624 fino a 626 del manuale.Otteniamo i seguenti coefficenti , solo che non sono nello stesso ordine detto dal prof, il primo

è il termine noto, il secondo è per x1, come se il modello di regressione di base fosse: y=a+b ⋅ x1+c ⋅ x2

Esempio 3Abbiamo il seguente circuito RC

Stimare la costante RC. Sapendo che:R=10 k Ω;C=10 μF ; RC=10−1 sec ; e per ipotesi su R agisca un rumore casuale di tipo termico.

Il modello a TempoContinuo del sistema si ricava dalle leggi di Kirchoff

C ⋅d (V c )dt

=V i−V c

RCon questa formula si calcola la corrente icDa cui:

C ⋅d (V c )dt

+V c

R=V i

RCon il V c pari all'uscita e V i pari all'ingresso.Divido per C:

d (V c)dt

+V c

RC=V i

RCSe pongo T=RC ho:

d (V c)dt

+V c

T=V i

Tdiscretizzando il sistema diventa, a tempo discreto:

Page 59: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

V c (t+T c )+(T c

T−1)V c ( t )=

T c

TV i (t )

Il sistema ha la struttura: E¿19 ⟧ y ( t )+a ⋅ y (t−1 )=b ⋅u(t−1) , anche se non saprei ricavarla dalla formula precedente. Noi vogliamo stimare a e b.

Possiamo vedere ΦTΦ come E¿20 ⟧∑t=1

N

φ (t )φ (t )T=R (N ) grazie alla definizione di Φ data a

lezione (vedi appendice).Quindi abbiamo che la stima θ=(ΦTΦ )−1ΦTY "esplosa" ad N campioni diventa:

E¿21 ⟧ θ=(R (N ) )−1∑t=1

N

φ ( t )T y ( t )

dove la sommatoria non è altro che il prodotto esploso ΦTY .

Il codice matlab è:res = 10*1000;cap = 10^-6;stima = [];for j=1:1000 vi = ones(1,20); tc = 0,01; vc(1) = 0; for i=2:20 vc(i)= - (tc (res*(1+0.3*rand(1)-0.5)-cap)-1*vc(i-1)+(tc/(res*(1+0.3*rand(1))-0.5)-cap)*vi(i-1); end r = zeros(2,1); for i=2:20 r(1,1)=r(1,1) + vc(i-1)*vc(i-1); r(1,2)=r(1,2) - vc(i-1)*vi(i-1); r(2,1)=r(1,2); r(2,2)=r(2,2) + vi(i-1)*vi(i-1); end phiY=zeros(2,1); for i=2:20 phiY(1)= PhiY(1) -vc(i-1)*vc(i); phiY(2) = phiY(2) + vi(i-1)*vc(i); end stima = [stima, inv(r)*phiY]; //sarebbe la stima ei valori theta clear vi, vc, r, phiYend

AppendiceNorma 2

Notazione: ‖⋅‖2

Dato un vettore v ad n componenti, la sua norma 2 (o generalmente norma) è data dalla somma delle sue componenti al quadrato, sotto radice (per due componenti sarebbe il classico teorema di pitagora, a livello geometrico).

Page 60: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

A ¿1 ⟧‖v‖2=¿ [∑

i=1

n

v i2]

12

nel continuo (un vettore di segnali) si ha:

A ¿2 ⟧‖v (t )‖2=¿ [∫0

+∞

v i (t )2 ⋅dt ]12

Matrice positiva o semidefinita positivaUna matrice A∈Rn× n è detta positiva (con notazione A>0 ) quando:∀ z∈Rn, dominio nel quale A è definita (in quanto A :R→R , forse qui sbaglio qualcosa, non dovrebbe esser un'applicazione multidimensionale!?) la forma quadratica:A ¿3 ⟧ zT ⋅ A ⋅ z avrà sempre un risultato scalare strettamente positivo zT ⋅A ⋅ z>0. Da notare che l'operazione di prima restituisce uno scalare. In quanto:

A ¿4 ⟧ z (1×n )T ⋅ A (n×n )⋅ z (n× 1)=ri s1×1

(da notare che il vettore originale z è un vettore riga e non un vettore colonna).Quando è semidefinita positiva ho che: A ¿4.1 ⟧ zT ⋅ A ⋅ z ≥0

ΦTΦ definita positiva o semipositivaPerchè ΦTΦ è definita positiva o semipositiva? Vediamolo.Per la definizione data sempre nell'appendice, posso scrivere che ∀ z∈Rn allora:

zT ⋅ΦTΦ ⋅ z ≥0Ma posso scrivere X=Φ ⋅ z quindi XT=zT ⋅ΦT (per l'operazione di trasposizione vedi ancora l'appendice). Dunque:

zT ⋅ΦTΦ ⋅ z=XT X ≥0Ma XT X è la definizione di norma2 al quadrato di X (vedi L ¿78 ). Ma la norma due è per definizione positiva o nulla, quindi:

XT X=‖X‖22≥0

Operazione di trasposizione di una matrice semplice o su operazioni tra matrici.

Quando bisogna far vedere un'operazione a livello generale, di solito la scrittura abbreviata (con i punti) su carta o su carta digitale va benissimo. Ma a volte più che osservazioni generali bastano (almeno per me) degli esempi generici (simbolici) abbastanza ampi, fatti passo per passo.Ora, far questo a mano (o via tastiera) è un suicidio, ci vuole tantissimo tempo. Ecco che ci vengono in aiuto ambienti matematici potenti come l'Hp50g.Stabiliamo 3 matrici. A ,B ,C∈R4× 4 (dovrei farlo con diverse dimensioni, al limite lo farò successivamente, per iniziare scelgo dimensioni abbastanza generali, che magari non possono essere interpretate da una 2x2 o 3x3).

; ; Abbiamo l'operazione matriciale A−B ⋅C.

Page 61: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Vista in modo esteso:

(a mano sarei morto).

Ora vediamo l'operazione di trasposizione su una singola matrice: AT

Come ci aspettavamo dalla teoria, le righe si scambiano con le colonne.

L'operazione di trasposizione sull'operazione matriciale, si ricava come sempre (ovviamente) dalla teoria, ma è un pochino più difficile vederla: [A−B ⋅C ]T

Possiamo riscrivere questa operazione trasponendo le singole matrici? Forse si, vediamo.Notiamo che per la matrice A (che fornisce il primo termine di ogni elemento) c'è una trasposizione semplice, e dopo l'operazione di sottrazione.Quindi dobbiamo indagare sul prodotto B⋅C trasposto.Ci accorgiamo che gli elementi del prodotto B⋅C a cui è applicata la trasposizione sono dati da una riga di C che prima era una colonna, e da una colonna di B che prima era una riga.Dunque sembra che [A−B ⋅C ]T=[ AT−BT ⋅CT ] ma non è così.Infatti ci accorgiamo, senza visualizzarlo sulla calcolatrice, che se C fosse: C∈R4× 3 la sua trasposta sarebbe CT∈R3× 4 che non permetterebbe l'operazione di moltiplicazione in quanto se B∈ R4× 4 allora BT ∈R4×4, ma ciò renderebbe valido il prodotto B⋅C ma non altrettanto valido BT ⋅CT . Dunque abbiamo che:A ¿5 ⟧ [ A−B ⋅C ]T=[ AT−CT ⋅BT ] .

Page 62: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Verifichiamolo costruendo A1 ,C1 ∈R4× 3 , lasciando invariata B e calcolando A1T−C1

T ⋅BT.Otteniamo:

Osserviamo che si ha lo stesso risultato di prima (soltanto che ora è 4x3) e dunque la nostra ipotesi funziona (non è certo dimostrata, per far quello rivolgetevi alla teoria). Dunque:

A ¿6 ⟧ [A1−B⋅C 1 ]T= [A1T−C1

T ⋅BT ]

Operazione di trasposizione sulla stessa matriceHa come risultato una matrice simmetrica, vedi L ¿139 .

Equivalenza tra punti su varietà lineari affiniFacciamo un esempio in R2, se cerco un punto x p su una retta, potrò trovare infiniti punti equivalenti sulle varietà lineari affini a questa retta, che si trovano su tutte le rette appartenenti allo stesso fascio di rette della retta data.

Page 63: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Stime polarizzateData θ stima polarizzata di θ0 allora si ha:

A ¿7 ⟧ E [ θ ]≠θ0

Osservo che per la L ¿24 il valor medio di un vettore è un vettore a sua volta, etc..Una stima non polarizzata implica che E [ θ ]=θ0 (L ¿90)

Matrice ortogonaleFonti: [1]Si definisce matrice A una matrice ortogonale se:

- è quadrata- vale la relazione: A ¿8 ⟧ A ⋅ AT=AT ⋅A=I , con I matrice identità.

Matrice triangolare superiore

A ¿9 ⟧ A=[a11

00

a12

a22

0

a13

a23

a33

………

a1n

a2n

a3n

⋮0⋮0⋱0⋱0

⋮amn

]

Page 64: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

La matrice R (N )

Abbiamo visto che possiamo vedere ΦTΦ come A ¿10 ⟧∑t=1

N

φ (t )φ (t )T=R (N ) grazie alla

definizione di Φ data a lezione.Ora, la definizione di Φ è:

Φ=[ φ (1 )T

⋮φ (N )T ]∈RN×n

Dunque, vediamo di verificare questa cosa tramite un esempio via calcolatrice, no meglio a mano.

Sia la matrice A=[a11∧a12∧a13

a21∧a22∧a23] dove [a11a12a13 ]=a (1 )T ed [a21a22 a23 ]=a (2 )T , quindi: A=[a (1 )T

a (2 )T ]Ora A

T=[a11∧a21

a12∧a22

a13∧a23] che equivale a scrivere AT=[a (1 )∧a (2 ) ] quindi il prodotto sarà:

AT A=[a11∧a21

a12∧a22

a13∧a23]⋅[a11∧a12∧a13

a21∧a22∧a23]=[a (1 )∧a (2 ) ]⋅ [a (1 )T

a (2 )T ]=[a (1 )a (1 )T+a (2 )a (2 )T ]

Combacia con la forma teorica generale.

Matrice SimmetricaUna matrice A∈Rn×n è simmetrica quando: A=AT

In pratica, sia a ik l'elemento nella i-esima riga e k-esima colonna di A, possiamo dire che questa è simmetrica quando: a ik=aki ,∀ i , k

Operatore di ritardo a tempo discretoSi definisce q−1 operatore di ritardo a tempo discreto, tale che x (t ) ⋅q−1=x (t−1 )

Prodotto tra un numero complesso ed il suo coniugatoSia a=ar+ j ai ed il suo complesso coniugato a¿=ar− j ai otteniamo che:

a ⋅a¿= (ar+ j ai ) (ar− j ai )=ar2− j ai ar+ j ai ar−(−a i2 )a ⋅a¿=ar

2+ar2

Ora calcoliamo il modulo di a|a|=√ar2+ai2

da cui facilmente:A ¿11⟧|a|2=ar

2+ai2=a ⋅a¿

Disuguaglianza triangolareSemplicemente: A ¿12 ⟧|a+b|≤|a|+|b|

Page 65: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

δ x , y la delta di kroneckerFinalmente ho capito la notazione δ x , y grazie al professor famularo. Semplicemente è la delta di kronecker

A ¿13 ⟧δ x, y=δ (x )={1 , x= y0 , x ≠ y

Dinamica di un modelloUn modello ha dinamica se esiste una f.d.t. (funzione di trasferimento) con poli (i quali determinano i modi di evoluzione, quindi la dinamica, del sistema). Vediamo il modello FIR (L ¿159). La relazione tra uscita e ingresso è data solo da B(q−1) (ovvero questo polinomio sarà la fdt). Quindi dalla L ¿147

B (q−1)=b1 ⋅q−1+…+bnb⋅q−nb

Posta l'eguaglianza q−1=z−1 scriviamo:B ( z−1 )=b1⋅ z−1+…+bnb⋅ z

−nb

Che può esser riscritto come:

A ¿14 ⟧B ( z )=b1

z+…+

bnbznb

=b1 ⋅ znb−1+…+bnb

znbQuindi è una fdt con nb poli in zero, che determinano un certo modo di evoluzione.

Prodotto tra matrici quadrateSiano due matrici quadrate S ,T∈Rn× n , nel caso banale abbiamo uno scalare, quindi S=s ed T=t dunque:

A ¿15 ⟧ S1×1 ⋅T 1× 1=s ⋅ t=t ⋅ s=T 1×1 ⋅S1×1

Nel caso di matrici quadrate, vediamo l'operazione su una 3x3 con l'hp50g.

S ⋅T

:

T ⋅ S

: Si può osservare che non sono uguali, quindi il prodotto, anche se tra matrici quadrate, non è sempre commutabile (abbiam visto che in casi di matrici 1x1 è possibile).

Prodotto tra una matrice quadrata e le matrici generatrici di una simmetrica. (include generare una matrice simmetrica dato un vettore)

Con riferimento alla L¿186.2 verifichiamo che funzioni.

Page 66: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Sia una matrice quadrata ma simmetrica. Quindi S=S1⋅ S1T , con S1 ∈Rn×1 , facciamo

l'esempio 3x3 con l'hp50g.

Dunque

S=S1⋅ S1T

: osserviamo che questa è simmetrica infatti

A ¿16 ⟧ S=S1⋅S1T=ST=(S1⋅ S1

T )T

Che per "operazione di trasposizione sulla stessa matrice" e "operazione di trasposizione semplice e su operazioni tra matrici" è pari ad:

ST=(S1 ⋅S1T )T=S1

T ⋅S1

: che è facilmente riconoscibile pari ad

S=S1⋅ S1T

.

Sia ora una

T∈R3×3

abbiamo: Il prodotto S ⋅T=S1⋅ S1

T ⋅ T darà:

Vediamo se questo è uguale a S ⋅T=S1T ⋅T ⋅ S1 , notiamo che dimensionalmente ci aspettiamo

una cosa diversa, poichè abbiamo (1×3 ) (3×3 ) (3×1 ). Dunque uno scalare. Vediamo:

Come si vede è un solo scalare.

Operazione di inversa su prodotto tra matriciBrevemente, dato un prodotto tra matrici: A ⋅BT , l'inverso di questo prodotto è pari ad:

A ¿17 ⟧ ( A ⋅BT )−1=B−T ⋅ A−1

Page 67: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Vediamo subito (grazie a Marco C. , poichè io non ci avevo pensato) che questo funziona in quanto per definizione di inversa:

(B−T ⋅ A−1 ) (A ⋅BT )=IB−T ⋅ A−1⋅ A ⋅BT=IB−T ⋅ I ⋅BT=I(BT )−1⋅BT=I

I=IOsservazione: c'è un errore logico in questa dimostrazione formale, sempre grazie a me (che sono scarso), meno male che provo con gli esempi!

Vediamo un esempio con A2 ∈R4×3 e B2∈ R3×4.

Quindi

B2T

Dunque (A2⋅B2T )−1

Sembra che l'inversa a livello simbolico sia un pochino troppo (bisogna calcolare prima l'aggiunta e poi il determinante) per l'hp50g, soprattutto il determinante (che l'aggiunta è praticamente uno spostamento di elementi in casi semplici come 2x2).Quindi restringiamo le operazioni e proviamo con una A3 ∈R2× 1 , B3∈ R2×1 che male che vada faccio tutto a mano. Niente devo farlo a mano, non riesce a calcolarlo simbolicamente.

Sia A3=[a1

a2] e B3=[b1

b2] . La trasposta B3T=[b1∧b2 ] quindi:

A3 ⋅B3T=[a1

a2] [b1∧b2 ]=[a1 ⋅b1∧a1⋅b2

a2 ⋅b1∧a2⋅b2]Da cui:

(A3⋅B3T )−1=[a1 ⋅b1∧a1⋅b2

a2 ⋅b1∧a2⋅b2]−1

=Aggiunta ((A3 ⋅B3

T ))Det ( (A3 ⋅B3

T ) )Ora, l'aggiunta è un bordello (sarebbe la matrice dei cofattori trasposta. Ma per una 2x2 è semplice, vedi altro punto nell'appendice):

Quindi: Aggiunta ( (A3 ⋅B3T ))=[a2 ⋅b2∧−a1⋅ b2

−a2 ⋅b1∧a1⋅ b1]Mentre il determinante (che è un altro casino a livello generale) viene:

Det ((A3 ⋅B3T ))=a1⋅b1⋅a2⋅b2−a1 ⋅b2 ⋅a2 ⋅b1

Oh wait! Il determinante è nullo, quindi [a1 ⋅b1∧a1⋅b2

a2 ⋅b1∧a2⋅b2 ] non ha rango massimo (ha almeno una

riga o colonna che è combinazione lineare delle altre) e dunque non ammette inversa. Quarzo, devo ricominciare da capo con altre matrici, stavolta non prendo vettori ma matrici 2x2.Ho fatto un pretest con l'hp50g e dovrei scrivere molto (anche se, a differenza dell'hp, magari con qualche messa in evidenza mi risparmio qualcosina, tuttavia è tanto da scrivere quindi vai di hp50g).

Page 68: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Allora, sia

A4

,

B4

(A4 ⋅B4T )

è pari a: (occhio che è una 2x2 ed è corta!)L'inversa è un bordello:

L'hp50g è piena di risorse (non per niente è straprogrammabile in 3 linguaggi diversi) ed addirittura un eseguibile del 1992 permette di trasformare un oggetto grafico (che può essere qualsiasi oggetto dell'hp visto come GROB) in un'immagine tiff (che è un formato abbastanza datato ma ottimo per queste cose). Quindi il bordello di prima diventa, grazie al tiff, questo (da notare che l'oggetto grob pesa 14Kbyte, la matrice da cui il grob è generato pesa 1kb):Sicome è larghetta (1400 pixel) la spezzo a metà:la prima colonna

la seconda colonna

lascio la stessa scrittura in pezzettini così uno si può rendere conto quando inizia una e finisce l'altra colonna.

Ora facciamo la stessa cosa facendo calcolare all'hp50g il prodotto: B4−T ⋅ A4

−1

Viene, supponendo di applicare prima la trasposta e poi l'inversa:

Page 69: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

col1

col2

Non vedo possibilità di eguaglianza con il risultato precedente. E' vero che potrebbe esserci qualche semplificazione che io trascuro in quanto ho analizzato il risultato non troppo attentamente (tuttavia utilizzando più volte il comando simplify dovrei ottenere il risultato minimo ottenibile con passaggi semplici, in fondo non sono tirate in ballo operazioni diverse dalle 4 operazioni, ma a parte qualche parentesi esterna e qualche segno, nient'altro appare semplificabile dunque la conclusione precedente è corretta), ma è anche vero che basta esaminare il primo termine della prima colonna per verificare che tutte le possibili semplificazioni (salvo non spaccare in una somma di due termini lo stesso elemento e fare passaggi astrusi) velocemente visibili sono state prese dal modulo CAS dell'hp50g. Non è certo un uomo, ma credo che non sia malaccio, anzi!

Quindi sembra non esser vera, e la dimostrazione formale precedentemente fatta sembra essere affetta da un errore logico (che ovviamente dipende da me che non conosco quale sia il giusto ordine di applicazione, ovvero: prima l'inversa e poi la trasposta o il contrario?) visibile in un'altra sezione dell'appendice.

Ora vorrei fare un piccolo appunto personale. Giustamente Marco C. mi ha fatto osservare "ma non ti basta la definizione formale? Alla fine quello racchiude tutto, che te ne fai di un solo esempio simbolico particolare?". Senza rifletterci molto ha ragione. Cioè o faccio le cose formalmente, quindi per ogni caso, oppure è un esercizio inutile. Se poi si riflette meglio (per lo meno ho pensato questo) si giunge a questa conclusione:E' facile (dipende dall'ente matematico che si sta affrontando) accettare un formalismo generale matematico compatto o meno, come ad esempio la definizione di matrice inversa, tale per cui : A ⋅ A−1=I . Il problema, per me, è che non faccio pienamente "mia" (non la inglobo) questa definizione finchè non la vedo. Perchè formalismi così compatti (a differenza, per l'appunto, delle forme estese) non spiegano come si ottengono queste cose. Diciamo che io distinguo la definizione teorica, che spesso equivale ad un formalismo compatto (perchè di solito nelle dimostrazioni, e non nelle definizioni, comunque bisogna esplicitar i passaggi di calcolo), dal calcolo. Per comprendere una cosa non mi basta solo la definizione, devo vedere anche il calcolo con almeno un esempio simbolico. Devo vedere che funziona e come funziona. Altrimenti, come ho già scritto, non faccio mia la definizione. Dunque dove posso allego sempre un esempietto alle varie definizioni.

Moltiplicazione tra polinomi di matriciSiccome non mi ricordo (si son scarso) ed il libro di testo da me posseduto è davvero poco chiaro (no a questo giro mi chiamo fuori, non c'entro! E' davvero scritto male), mi ricostruisco la moltiplicazione tra polinomi di matrici per capire come funziona (sempre grazie al supporto dell'Hp50g che è ben programmata, altrimenti dovevo andare a manina).Partiamo da cose semplici.

Page 70: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Siano 4 matrici A ,B ,C ,D io voglio calcolare: [A+B ] [C+D ]. (che è un prodotto tra binomi, sottoinsieme di polinomi)Osservo che l'addizione (o la sottrazione) non cambiano la dimensione dai singoli termini al risultato, quindi le matrici [A+B ] ,[C+D ] devono avere la stessa dimensione, rispettivamente, di A ,B e C , D.Per il prodotto ho la regola che il numero di colonne della matrice a sinistra deve esser pari al numero di righe della matrice a destra, altrimenti non posso farlo, proprio per definizione.Dunque, se A ,B∈Rn×m allora C , D∈Rm×n.Prendiamo un caso semplice ma abbastanza ampio, dimensione 4x3 per A ,B e 3x4 C , D.Io avrei che [A+B ] [C+D ]=S1⋅ S2=P1 con A ,B , S1 ∈R4 ×3 ed C , D ,S2∈R3×4 ed infine P1∈ R4× 4.Mi verrebbe la tentazione di scrivere, relativamente al caso scalare 1x1:

[A+B ] [C+D ]=AC+AD+BC+BDPosso farlo davvero? Vediamolo con l'hp50g.Siano le matrici A2 ,B2 ,C2 , D2 (mi serve chiamarle così nella memoria della calcolatrice per ricordarmi che mi son servite per una data operazione tutte assieme).

Facciamo ora:

[ A2+B2 ]=S2.1

Idem con

[C2+D 2 ]=S2.2

Il prodotto S2.1 ⋅S2.2 è pari ad

Lunghetto, per questo l'esempio è ampio!Ora vediamo se funziona:

[ A2+B2 ] [C2+D2 ]=A2C2+A2 D2+B2C2+B2 D2

Si può notare che dimensionalmente torna, però non sappiamo se i termini saranno gli stessi. Farlo teoricamente (a livello generale) richiederebbe molti simboli scritti (e tempo per

Page 71: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

l'elaborazione), quindi ci accontentiamo della risposta particolare (anche se sempre simbolica) dell'hp 50g (perchè mi evita di scrivere simboli su simboli).

E' più lungo perchè non c'è il raggruppamento. Osserviamo i vari elementi delle due matrici. Nel caso di S2.1 ⋅S2.2 sono messi in evidenza, quindi vediamo mentalmente se raccogliendo i termini di [ A2+B2 ] [C2+D2 ]=A2C2+A2 D2+B2C2+B2 D2 otteniamo lo stesso risultato.Se analizzate bene (in caso io stia scrivendo quarzate ditemelo!) sono uguali. Quindi è possibile fare l'operazione di distribuzione (ovviamente per lo stesso lato, altrimenti non torna dimensionalmente) tra polinomi di matrici.

Aggiunta di una matrice 2x2In generale è un casino, ma per una 2x2 è facile (grazie anche all'internet, che il libro consigliato non è affatto granchè, didatticamente parlando):

Sia: [a1∧a2

a3∧a4] , la sua aggiunta (o trasposta dei cofattori) è [a4∧−a2

−a3∧a1]PS. il termine corretto per l'"aggiunta" è: matrice dei cofattori trasposta.

Invarianza dell'ordine tra trasposizione ed inversione?Verifichiamo se A−T è ottenibile indipendentemente sia come ( AT )−1 sia come ( A−1 )T .

Utilizziamo: Facciamo prima (A4

T )−1 ed otteniamo:

Page 72: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Tuttavia l'hp50g semplifica ma non troppo (ed ovviamente a volte neanche correttamente, ma quando si tratta di operazioni semplici con le 4 operazioni se la cava benissimo), bisogna utilizzare più volte il comando simplify. Quindi si ottiene alla fine:

Poi (A4−1 )T :

Richiamando il comando simplify finchè non si modifica più niente si ottiene:

(da notare che il semplificabile era poco)

Come si vede dalle verifiche non è la stessa cosa, quindi non c'è invarianza tra le due operazioni (se avessi avuto abbastanza tempo, visto che non sono skilled in queste cose, avrei potuto dimostrarlo formalmente), bensì l'ordine di applicazione è importante.Dunque, ogni volta che ne faccio uso a livello compatto (esempio nella L ¿80.2) sto azzardando un pochino (dipende anche dalla forma della matrice, esempio "diagonale" o "simmetrica", che non tengo in conto).

Associabilità del prodotto tra determinanti?In funzione della L ¿186.3 e di ciò che segue, mi son chiesto se (visto che non lo ricordo e non l'ho cercato sulle fonti affidabili), date due matrici A∈Rn×m ,B∈Rm× p esiste l'equivalenza tra:

Det (A ⋅B )=Det (A ) ⋅Det (B )Provo a verificarlo con un esempio simbolico in cui A∈R2× 2 , B∈ R2×2 , farlo a livello generale teorico mi risulterebbe pesante, mi fido di un esempio fatto velocemente.

Page 73: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

Uso e .

Det ( A4 )

:

Det (B4 )

: Quindi: Det ( A4 )⋅Det (B4 )

Ora vediamo Det ( A4 ⋅B4 )

Identico. Quindi, anche se non l'ho dimostrato (ma basteràvedere da una fonte affidabile), credo che sia verificata l'associatività del determinante.

Autovalori, determinante e polinomio caratteristico di una matriceCome al solito sono scarso quindi non farò citazioni generali, ma esempietti grazie all'hp50g.Inizio (un piccolo dettaglio del manuale esteso dell'hp50g e che riporta anche la teoria matematica di alcune operazioni, quindi è un mini-manuale di matematica ben fatto, vedere pag 11-45 dell'userguide) con il dire cosa sono gli autovalori di una matrice A∈Rn× n :Sono quelli che soddisfano la seguente definizione A ⋅ x=λ ⋅ x , dove λ è il vettore degli autovalori ed x un vettore generico. Questa equazione ha soluzioni solo se la matrice ( A−λI ) è singolare, ovvero se A ¿18 ⟧Det ( A−λI )=0 (quindi ( A−λI ) ha qualche riga o colonna che è combinazione lineare delle altre).La A ¿18 è detto anche polinomio caratteristico di A.

Allora devo verificare che Det (A )=∏i=1

n

λ i .

Prendiamo il cui determinante è:

Det ( A4 )

. Ora vediamo gli autovalori:

(da notare che sono due colonne, la prima termina dopo la prima radice, ed inoltre c'è la notazione .5=0.5 )Ora facciamo il prodotto degli autovalori ed otteniamo:

Page 74: Appunti modellistica e identificazione - pier4r.wikispaces.compier4r.wikispaces.com/.../appuntiModellisticaEIdentificazi…  · Web viewQuindi la usiamo per bilanciare il volume

che semplificando (uso del comando simplify) diventa: .Quindi abbiamo verificato (o meglio ci fidiamo dell'esempio) che il determinante di una matrice è pari al prodotto dei suoi autovalori.