Independent Component Analysis (ICA)

43
Independent Component Analysis (ICA) Ιανουάριος 2012

description

Independent Component Analysis (ICA). Ιανουάριος 2012. PCA vs ICA. PCA vs ICA. PCA vs ICA. PCA vs ICA. PCA vs ICA. PCA vs ICA. PCA vs ICA. ICA. PCA. Cocktail Party. x 1. s 1. Observations. Independent Sources. x 2. s 2. Cocktail Party. x 1. s 1. Observations. - PowerPoint PPT Presentation

Transcript of Independent Component Analysis (ICA)

Page 1: Independent Component Analysis (ICA)

Independent Component Analysis (ICA)

Ιανουάριος 2012

Page 2: Independent Component Analysis (ICA)

PCA vs ICA

-1.5 -1 -0.5 0 0.5 1 1.5 2

-1

-0.5

0

0.5

1

1.5

Page 3: Independent Component Analysis (ICA)

PCA vs ICA

-1.5 -1 -0.5 0 0.5 1 1.5 2

-1

-0.5

0

0.5

1

1.5

Page 4: Independent Component Analysis (ICA)

PCA vs ICA

-1.5 -1 -0.5 0 0.5 1 1.5 2

-1

-0.5

0

0.5

1

1.5

Page 5: Independent Component Analysis (ICA)

PCA vs ICA

Page 6: Independent Component Analysis (ICA)

PCA vs ICA

Page 7: Independent Component Analysis (ICA)

PCA vs ICA

Page 8: Independent Component Analysis (ICA)

PCA vs ICA

PCA

ICA

Page 9: Independent Component Analysis (ICA)

Cocktail Party

Independent SourcesObservations

s1

s2

x1

x2

Page 10: Independent Component Analysis (ICA)

Cocktail Party

Independent SourcesObservations

s1

s2

x1

x2

Using Vector-Matrix notation

Page 11: Independent Component Analysis (ICA)

Ανεξαρτησία Τυχαίων Μεταβλητών• Δύο τυχαίες μεταβλητές είναι ανεξάρτητες όταν η

πληροφορία γα την τιμή της μίας δεν προσφέρει καμία επιπλέον πληροφορία για την τιμή της άλλης.

• Όταν η από κοινού pdf είναι παραγοντοποιήσιμη:

,

Page 12: Independent Component Analysis (ICA)

Ανεξαρτησία Τυχαίων Μεταβλητών

s1

s2

x1

x2

Page 13: Independent Component Analysis (ICA)

Ανεξαρτησία Τυχαίων Μεταβλητών

s1

s2

x1

x2

PC2

PC1

IC1

IC2

Page 14: Independent Component Analysis (ICA)

Κεντρικό Οριακό Θεώρημα (CLT)

• Η κατανομή του αθροίσματος ανεξάρτητων τυχαίων μεταβλητών τείνει προς την Gaussian κατανομή.

Page 15: Independent Component Analysis (ICA)

Κεντρικό Οριακό Θεώρημα (CLT)

• Η κατανομή του αθροίσματος ανεξάρτητων τυχαίων μεταβλητών τείνει προς την Gaussian κατανομή.

Observed signal = IC1 IC2 ICnm1 + m2 ….+ mn

toward Gaussian Non-GaussianNon-Gaussian Non-Gaussian

Page 16: Independent Component Analysis (ICA)

“Nongaussian is Independent”Έστω γραμμικός συνδυασμός των παρατηρήσεων

Αν το διάνυσμα w ισούται με μία από τις γραμμές του Α-1 τότε το y ισούται με μία από τις ανεξάρτητες συνιστώσες.

Page 17: Independent Component Analysis (ICA)

“Nongaussian is Independent”Έστω γραμμικός συνδυασμός των παρατηρήσεων

Αν το διάνυσμα w ισούται με μία από τις γραμμές του Α-1 τότε το y ισούται με μία από τις ανεξάρτητες συνιστώσες.

Με αλλαγή μεταβλητών τότε

Page 18: Independent Component Analysis (ICA)

“Nongaussian is Independent”Έστω γραμμικός συνδυασμός των παρατηρήσεων

Αν το διάνυσμα w ισούται με μία από τις γραμμές του Α-1 τότε το y ισούται με μία από τις ανεξάρτητες συνιστώσες.

Με αλλαγή μεταβλητών τότε

Το άθροισμα έστω και δύο τυχαίων μεταβλητών είναι περισσότερο «Γκαουσιανό» από καθεμία ξεχωριστά. Η ιδιότητα αυτή ελαχιστοποιείται όταν ο γραμμικός συνδυασμός γίνεται ίσος κάποιο από τα si.

Page 19: Independent Component Analysis (ICA)

“Nongaussian is Independent”Αρκεί λοιπόν ένα αξιόπιστο μέτρο για τη «μή Γκαουσιανότητα» από τη βελτιστοποίηση του οποίου θα προκύψουν οι ανεξάρτητες συνιστώσες.

Σε χώρο n διαστάσεων μία τέτοια συνάρτηση έχει 2n τοπικά μέγιστα.

Η εύρεση των ανεξάρτητων συνιστωσών γίνεται με αβεβαιότητα ως προς το πρόσημο (κατεύθυνση) και την σειρά.

Page 20: Independent Component Analysis (ICA)

Μέτρα μη Γκαουσιανότητας

• Kurtosis

Page 21: Independent Component Analysis (ICA)

Μέτρα μη Γκαουσιανότητας

• Kurtosis

Super-Gaussian kurtosis > 0

Gaussian kurtosis = 0

Sub-Gaussian kurtosis < 0

Page 22: Independent Component Analysis (ICA)

Μέτρα μη Γκαουσιανότητας

• Kurtosis

Super-Gaussian kurtosis > 0

Gaussian kurtosis = 0

Sub-Gaussian kurtosis < 0

Μειονέκτημα: Παρουσιάζει μεγάλη ευαισθησία σε outliers. Η τιμή της καθορίζεται περισσότερο από δείγματα στην ουρά της κατανομής.

Page 23: Independent Component Analysis (ICA)

Μέτρα μη Γκαουσιανότητας

• Negentropy

Η εντροπία μίας τυχαίας μεταβλητής y με πυκνότητα f(y) ορίζεται ως:

Page 24: Independent Component Analysis (ICA)

Μέτρα μη Γκαουσιανότητας

• Negentropy

Η Gaussian κατανομή παρουσιάζει τη μέγιστη εντροπία για δεδομένη διακύμανση.

Η εντροπία μίας τυχαίας μεταβλητής y με πυκνότητα f(y) ορίζεται ως:

Page 25: Independent Component Analysis (ICA)

Μέτρα μη Γκαουσιανότητας

• Negentropy

Η Gaussian κατανομή παρουσιάζει τη μέγιστη εντροπία για δεδομένη διακύμανση.

Συνεπώς ένα κατάλληλο μέτρο για τη μη Γκαουσιανότητα θα ήταν το εξής:

Η εντροπία μίας τυχαίας μεταβλητής y με πυκνότητα f(y) ορίζεται ως:

Page 26: Independent Component Analysis (ICA)

Μέτρα μη Γκαουσιανότητας

• NegentropyΜειονέκτημα: απαιτεί εκτίμηση (πιθανώς μη παραμετρική) της f(y).

Page 27: Independent Component Analysis (ICA)

Μέτρα μη Γκαουσιανότητας

• NegentropyΜειονέκτημα: απαιτεί εκτίμηση (πιθανώς μη παραμετρική) της f(y).

• Approximations of Negentropy1. Με χρήση στατιστικών ροπών ανώτερης τάξης:

2. Χρησιμοποιώντας την προσέγγιση

Page 28: Independent Component Analysis (ICA)

Ισοδύναμες προσεγγίσεις

• Ελαχιστοποίηση της αμοιβαίας πληροφορίας(Minimization of Mutual Information)

• Εκτίμηση μέγιστης πιθανοφάνειας(Maximum Likelihood Estimation)

Page 29: Independent Component Analysis (ICA)

Ελαχιστοποίηση της αμοιβαίας πληροφορίας (MMI)

• Η αμοιβαία πληροφορία ανάμεσα σε m τυχαίες μεταβλητές ορίζεται ως:

Page 30: Independent Component Analysis (ICA)

Ελαχιστοποίηση της αμοιβαίας πληροφορίας (MMI)

• Η αμοιβαία πληροφορία ανάμεσα σε m τυχαίες μεταβλητές ορίζεται ως:

• Για έναν αντιστρεπτό γραμμικό μετασχηματισμό η έκφραση γίνεται:

• Αποδεικνύεται πως η αναζήτηση για μετασχηματισμό W που να ελαχιστοποιεί την αμοιβαία πληροφορία ισοδυναμεί με μεγιστοποίηση του negentropy.

Page 31: Independent Component Analysis (ICA)

Εκτίμηση μέγιστης πιθανοφάνειαςΈστω ο πίνακας Α-1 . Τότε η log-likelihood έχει τη μορφή:

Page 32: Independent Component Analysis (ICA)

Εκτίμηση μέγιστης πιθανοφάνειαςΈστω ο πίνακας Α-1 . Τότε η log-likelihood έχει τη μορφή:

Η αναζήτηση των ανεξάρτητων συνιστωσών ισοδυναμεί με αναζήτηση κατάλληλου W ώστε να μεγιστοποιείται το L.

Page 33: Independent Component Analysis (ICA)

Εκτίμηση μέγιστης πιθανοφάνειαςΈστω ο πίνακας Α-1 . Τότε η log-likelihood έχει τη μορφή:

Η αναζήτηση των ανεξάρτητων συνιστωσών ισοδυναμεί με αναζήτηση κατάλληλου W ώστε να μεγιστοποιείται το L.

Απαιτείται εκτίμηση της . Στην πράξη αρκεί η εκτίμηση για το αν οι κατανομές είναι sub ή supergaussian.

Μειονέκτημα: Αν η εκτίμηση είναι λάθος, το αποτέλεσμα μπορεί να είναι εντελώς λανθασμένο.

Page 34: Independent Component Analysis (ICA)

Επεκτάσεις της ICA

• Noisy ICAΣυμπεριλαμβάνονται μοντέλα θορύβου κατά την ανάλυση.

• Non-Linear ICAΤα παρατηρούμενα σήματα είναι μη γραμμικός συνδυασμός των πηγών.

• Binary ICAΟι πηγές και τα παρατηρούμενα σήματα είναι δυαδικά.

• Overcomplete ICAΟι πηγές είναι περισσότερες από τα παρατηρούμενα σήματα.

Page 35: Independent Component Analysis (ICA)

Εφαρμογές της ICAΗλεκτροεγκεφαλογραφία (EEG) – Μαγνητοεγκεφαλογραφία (MEG)

Page 36: Independent Component Analysis (ICA)

Εφαρμογές της ICAΗλεκτροεγκεφαλογραφία (EEG) – Μαγνητοεγκεφαλογραφία (MEG)

Page 37: Independent Component Analysis (ICA)

Εφαρμογές της ICAΤομογραφία - fMRI

Page 38: Independent Component Analysis (ICA)

Εφαρμογές της ICAΤηλεπικοινωνίες: Εξάλειψη θορύβου & αντιμετώπιση πολυόδευσης

Page 39: Independent Component Analysis (ICA)

Εφαρμογές της ICAΟικονομία: Ανάλυση ροών χρήματος

Page 40: Independent Component Analysis (ICA)

Εφαρμογές της ICAΑστρονομία: Ανάλυση φασματικών υπογραφών Αστέρων

0 50 100 150 200 250 300 350-0.2

0

0.2

0.4

0.6

0.8

1

1.2

1.4

Page 41: Independent Component Analysis (ICA)

Εφαρμογές της ICAΕπεξεργασία εικόνας - Denoising

Page 42: Independent Component Analysis (ICA)

Εφαρμογές της ICAΕξαγωγή χαρακτηριστικών

Page 43: Independent Component Analysis (ICA)

Χρήσιμες Πηγές• Fast ICA

http://research.ics.tkk.fi/ica/fastica/

• Cocktail Party audio exampleshttp://cnl.salk.edu/~tewon/Blind/blind_audio.html

• “Independent Component Analysis: Algorithms and Applications”, Aapo Hyvärinen and Erkki Oja.

• “Survey on Independent Component Analysis”, Aapo Hyvärinen.