Download - Independent Component Analysis (ICA)

Transcript
Page 1: Independent Component Analysis (ICA)

Independent Component Analysis (ICA)

Ιανουάριος 2012

Page 2: Independent Component Analysis (ICA)

PCA vs ICA

-1.5 -1 -0.5 0 0.5 1 1.5 2

-1

-0.5

0

0.5

1

1.5

Page 3: Independent Component Analysis (ICA)

PCA vs ICA

-1.5 -1 -0.5 0 0.5 1 1.5 2

-1

-0.5

0

0.5

1

1.5

Page 4: Independent Component Analysis (ICA)

PCA vs ICA

-1.5 -1 -0.5 0 0.5 1 1.5 2

-1

-0.5

0

0.5

1

1.5

Page 5: Independent Component Analysis (ICA)

PCA vs ICA

Page 6: Independent Component Analysis (ICA)

PCA vs ICA

Page 7: Independent Component Analysis (ICA)

PCA vs ICA

Page 8: Independent Component Analysis (ICA)

PCA vs ICA

PCA

ICA

Page 9: Independent Component Analysis (ICA)

Cocktail Party

Independent SourcesObservations

s1

s2

x1

x2

Page 10: Independent Component Analysis (ICA)

Cocktail Party

Independent SourcesObservations

s1

s2

x1

x2

Using Vector-Matrix notation

Page 11: Independent Component Analysis (ICA)

Ανεξαρτησία Τυχαίων Μεταβλητών• Δύο τυχαίες μεταβλητές είναι ανεξάρτητες όταν η

πληροφορία γα την τιμή της μίας δεν προσφέρει καμία επιπλέον πληροφορία για την τιμή της άλλης.

• Όταν η από κοινού pdf είναι παραγοντοποιήσιμη:

,

Page 12: Independent Component Analysis (ICA)

Ανεξαρτησία Τυχαίων Μεταβλητών

s1

s2

x1

x2

Page 13: Independent Component Analysis (ICA)

Ανεξαρτησία Τυχαίων Μεταβλητών

s1

s2

x1

x2

PC2

PC1

IC1

IC2

Page 14: Independent Component Analysis (ICA)

Κεντρικό Οριακό Θεώρημα (CLT)

• Η κατανομή του αθροίσματος ανεξάρτητων τυχαίων μεταβλητών τείνει προς την Gaussian κατανομή.

Page 15: Independent Component Analysis (ICA)

Κεντρικό Οριακό Θεώρημα (CLT)

• Η κατανομή του αθροίσματος ανεξάρτητων τυχαίων μεταβλητών τείνει προς την Gaussian κατανομή.

Observed signal = IC1 IC2 ICnm1 + m2 ….+ mn

toward Gaussian Non-GaussianNon-Gaussian Non-Gaussian

Page 16: Independent Component Analysis (ICA)

“Nongaussian is Independent”Έστω γραμμικός συνδυασμός των παρατηρήσεων

Αν το διάνυσμα w ισούται με μία από τις γραμμές του Α-1 τότε το y ισούται με μία από τις ανεξάρτητες συνιστώσες.

Page 17: Independent Component Analysis (ICA)

“Nongaussian is Independent”Έστω γραμμικός συνδυασμός των παρατηρήσεων

Αν το διάνυσμα w ισούται με μία από τις γραμμές του Α-1 τότε το y ισούται με μία από τις ανεξάρτητες συνιστώσες.

Με αλλαγή μεταβλητών τότε

Page 18: Independent Component Analysis (ICA)

“Nongaussian is Independent”Έστω γραμμικός συνδυασμός των παρατηρήσεων

Αν το διάνυσμα w ισούται με μία από τις γραμμές του Α-1 τότε το y ισούται με μία από τις ανεξάρτητες συνιστώσες.

Με αλλαγή μεταβλητών τότε

Το άθροισμα έστω και δύο τυχαίων μεταβλητών είναι περισσότερο «Γκαουσιανό» από καθεμία ξεχωριστά. Η ιδιότητα αυτή ελαχιστοποιείται όταν ο γραμμικός συνδυασμός γίνεται ίσος κάποιο από τα si.

Page 19: Independent Component Analysis (ICA)

“Nongaussian is Independent”Αρκεί λοιπόν ένα αξιόπιστο μέτρο για τη «μή Γκαουσιανότητα» από τη βελτιστοποίηση του οποίου θα προκύψουν οι ανεξάρτητες συνιστώσες.

Σε χώρο n διαστάσεων μία τέτοια συνάρτηση έχει 2n τοπικά μέγιστα.

Η εύρεση των ανεξάρτητων συνιστωσών γίνεται με αβεβαιότητα ως προς το πρόσημο (κατεύθυνση) και την σειρά.

Page 20: Independent Component Analysis (ICA)

Μέτρα μη Γκαουσιανότητας

• Kurtosis

Page 21: Independent Component Analysis (ICA)

Μέτρα μη Γκαουσιανότητας

• Kurtosis

Super-Gaussian kurtosis > 0

Gaussian kurtosis = 0

Sub-Gaussian kurtosis < 0

Page 22: Independent Component Analysis (ICA)

Μέτρα μη Γκαουσιανότητας

• Kurtosis

Super-Gaussian kurtosis > 0

Gaussian kurtosis = 0

Sub-Gaussian kurtosis < 0

Μειονέκτημα: Παρουσιάζει μεγάλη ευαισθησία σε outliers. Η τιμή της καθορίζεται περισσότερο από δείγματα στην ουρά της κατανομής.

Page 23: Independent Component Analysis (ICA)

Μέτρα μη Γκαουσιανότητας

• Negentropy

Η εντροπία μίας τυχαίας μεταβλητής y με πυκνότητα f(y) ορίζεται ως:

Page 24: Independent Component Analysis (ICA)

Μέτρα μη Γκαουσιανότητας

• Negentropy

Η Gaussian κατανομή παρουσιάζει τη μέγιστη εντροπία για δεδομένη διακύμανση.

Η εντροπία μίας τυχαίας μεταβλητής y με πυκνότητα f(y) ορίζεται ως:

Page 25: Independent Component Analysis (ICA)

Μέτρα μη Γκαουσιανότητας

• Negentropy

Η Gaussian κατανομή παρουσιάζει τη μέγιστη εντροπία για δεδομένη διακύμανση.

Συνεπώς ένα κατάλληλο μέτρο για τη μη Γκαουσιανότητα θα ήταν το εξής:

Η εντροπία μίας τυχαίας μεταβλητής y με πυκνότητα f(y) ορίζεται ως:

Page 26: Independent Component Analysis (ICA)

Μέτρα μη Γκαουσιανότητας

• NegentropyΜειονέκτημα: απαιτεί εκτίμηση (πιθανώς μη παραμετρική) της f(y).

Page 27: Independent Component Analysis (ICA)

Μέτρα μη Γκαουσιανότητας

• NegentropyΜειονέκτημα: απαιτεί εκτίμηση (πιθανώς μη παραμετρική) της f(y).

• Approximations of Negentropy1. Με χρήση στατιστικών ροπών ανώτερης τάξης:

2. Χρησιμοποιώντας την προσέγγιση

Page 28: Independent Component Analysis (ICA)

Ισοδύναμες προσεγγίσεις

• Ελαχιστοποίηση της αμοιβαίας πληροφορίας(Minimization of Mutual Information)

• Εκτίμηση μέγιστης πιθανοφάνειας(Maximum Likelihood Estimation)

Page 29: Independent Component Analysis (ICA)

Ελαχιστοποίηση της αμοιβαίας πληροφορίας (MMI)

• Η αμοιβαία πληροφορία ανάμεσα σε m τυχαίες μεταβλητές ορίζεται ως:

Page 30: Independent Component Analysis (ICA)

Ελαχιστοποίηση της αμοιβαίας πληροφορίας (MMI)

• Η αμοιβαία πληροφορία ανάμεσα σε m τυχαίες μεταβλητές ορίζεται ως:

• Για έναν αντιστρεπτό γραμμικό μετασχηματισμό η έκφραση γίνεται:

• Αποδεικνύεται πως η αναζήτηση για μετασχηματισμό W που να ελαχιστοποιεί την αμοιβαία πληροφορία ισοδυναμεί με μεγιστοποίηση του negentropy.

Page 31: Independent Component Analysis (ICA)

Εκτίμηση μέγιστης πιθανοφάνειαςΈστω ο πίνακας Α-1 . Τότε η log-likelihood έχει τη μορφή:

Page 32: Independent Component Analysis (ICA)

Εκτίμηση μέγιστης πιθανοφάνειαςΈστω ο πίνακας Α-1 . Τότε η log-likelihood έχει τη μορφή:

Η αναζήτηση των ανεξάρτητων συνιστωσών ισοδυναμεί με αναζήτηση κατάλληλου W ώστε να μεγιστοποιείται το L.

Page 33: Independent Component Analysis (ICA)

Εκτίμηση μέγιστης πιθανοφάνειαςΈστω ο πίνακας Α-1 . Τότε η log-likelihood έχει τη μορφή:

Η αναζήτηση των ανεξάρτητων συνιστωσών ισοδυναμεί με αναζήτηση κατάλληλου W ώστε να μεγιστοποιείται το L.

Απαιτείται εκτίμηση της . Στην πράξη αρκεί η εκτίμηση για το αν οι κατανομές είναι sub ή supergaussian.

Μειονέκτημα: Αν η εκτίμηση είναι λάθος, το αποτέλεσμα μπορεί να είναι εντελώς λανθασμένο.

Page 34: Independent Component Analysis (ICA)

Επεκτάσεις της ICA

• Noisy ICAΣυμπεριλαμβάνονται μοντέλα θορύβου κατά την ανάλυση.

• Non-Linear ICAΤα παρατηρούμενα σήματα είναι μη γραμμικός συνδυασμός των πηγών.

• Binary ICAΟι πηγές και τα παρατηρούμενα σήματα είναι δυαδικά.

• Overcomplete ICAΟι πηγές είναι περισσότερες από τα παρατηρούμενα σήματα.

Page 35: Independent Component Analysis (ICA)

Εφαρμογές της ICAΗλεκτροεγκεφαλογραφία (EEG) – Μαγνητοεγκεφαλογραφία (MEG)

Page 36: Independent Component Analysis (ICA)

Εφαρμογές της ICAΗλεκτροεγκεφαλογραφία (EEG) – Μαγνητοεγκεφαλογραφία (MEG)

Page 37: Independent Component Analysis (ICA)

Εφαρμογές της ICAΤομογραφία - fMRI

Page 38: Independent Component Analysis (ICA)

Εφαρμογές της ICAΤηλεπικοινωνίες: Εξάλειψη θορύβου & αντιμετώπιση πολυόδευσης

Page 39: Independent Component Analysis (ICA)

Εφαρμογές της ICAΟικονομία: Ανάλυση ροών χρήματος

Page 40: Independent Component Analysis (ICA)

Εφαρμογές της ICAΑστρονομία: Ανάλυση φασματικών υπογραφών Αστέρων

0 50 100 150 200 250 300 350-0.2

0

0.2

0.4

0.6

0.8

1

1.2

1.4

Page 41: Independent Component Analysis (ICA)

Εφαρμογές της ICAΕπεξεργασία εικόνας - Denoising

Page 42: Independent Component Analysis (ICA)

Εφαρμογές της ICAΕξαγωγή χαρακτηριστικών

Page 43: Independent Component Analysis (ICA)

Χρήσιμες Πηγές• Fast ICA

http://research.ics.tkk.fi/ica/fastica/

• Cocktail Party audio exampleshttp://cnl.salk.edu/~tewon/Blind/blind_audio.html

• “Independent Component Analysis: Algorithms and Applications”, Aapo Hyvärinen and Erkki Oja.

• “Survey on Independent Component Analysis”, Aapo Hyvärinen.