Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε...

127
Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή Θετικών Επιστημών Τμήμα Φυσικής Νευρωνικά Δίκτυα Δρ Δεμερτζής Κωνσταντίνος

Transcript of Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε...

Page 1: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος

Σχολή Θετικών Επιστημών

Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Δρ Δεμερτζής Κωνσταντίνος

Page 2: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος

Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Page 3: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Σκοπός

− Στο κεφάλαιο αυτό εξηγείται τι είναι τα νευρωνικά δίκτυα και οι νευρώνες

από τους οποίους αποτελούνται.

− Παρουσιάζεται η δομή ενός δικτύου, ο τρόπος λειτουργίας του και ο

τρόπος εκπαίδευσής του.

− Αναλύεται η σχέση με τα βιολογικά νευρωνικά δίκτυα των ζώντων

οργανισμών.

− Αναπτύσσονται παραστατικά οι αναλογίες με τους υπολογιστές, οι

ομοιότητες και οι διαφορές.

− Παρουσιάζονται μερικές επιλεγμένες εφαρμογές που δείχνουν τι ακριβώς

μπορούν να κάνουν τα νευρωνικά δίκτυα.

− Τέλος, γίνεται μία σύντομη ιστορική ανασκόπηση της ερευνητικής

περιοχής, παρουσιάζονται επιγραμματικά οι φάσεις από τις οποίες

πέρασε η εξέλιξη τους, τα μοντέλα που προτάθηκαν και

χρησιμοποιήθηκαν (απλά και περίπλοκα), καθώς και οι δραστηριότητες

που υπάρχουν σήμερα σε όλο τον κόσμο και καθιστούν τα νευρωνικά

δίκτυα μια αυτοτελή περιοχή και επιστήμη.

Page 4: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

− Βιολογικοί Νευρώνες

Δομή των νευρικών κυττάρων

Ο νευρώνας ή το νευρικό κύτταρο αποτελεί τη βασική δομική και λειτουργική

μονάδα του νευρικού συστήματος. Οι νευρώνες έχουν τη δυνατότητα να

μεταδίδουν ηλεκτρικά σήματα από το ένα μέρος του κυττάρου στο άλλο ενώ

παράλληλα επικοινωνούν με άλλους νευρώνες εκλύοντας νευροδιαβιβαστές.

Το μέγεθος ενός νευρώνα κυμαίνεται από ~0 έως και 1m και ανατομικά,

αποτελείται από τέσσερα μέρη:

Το κυτταρικό σώμα

Τους δενδρίτες

Τον νευροάξονα

Τις απολήξεις άξονα ή συναπτικά άκρα ή τις συνάψεις

Ο νευρώνας που άγει σήματα προς μία σύναψη ονομάζεται προσυναπτικός,

ενώ ο νευρώνας που δέχεται ονομάζεται μετασυναπτικός. Ένας νευρώνας

είναι ταυτόχρονα προσυναπτικός σε κάποιες συνάψεις και μετασυναπτικός

σε κάποιες άλλες ανάλογα με τον τρόπο συμμετοχής του σε αυτές.

Page 5: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

− Βιολογικοί Νευρώνες

Page 6: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

− Βιολογικοί Νευρώνες

Δυναμικά χαρακτηριστικά της κυτταρικής

μεμβράνης

Η διαφορά δυναμικού που παρατηρείται

εκατέρωθεν της κυτταρικής μεμβράνης ενός

νευρώνα λόγω της αντιδιαστολής μεταξύ των

ποσοτήτων των φορτισμένων σωματιδίων

που διαχωρίζονται από την μεμβράνη,

ονομάζεται δυναμικό μεμβράνης (membrane

potential).

Σε συνθήκες ηρεμίας (resting potential), το

εσωτερικό του νευρώνα είναι αρνητικά

φορτισμένο σε σχέση με το εξωτερικό και η

τιμή του κυμαίνεται από -40 έως -75 mV.

Page 7: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

– Βιολογικοί Νευρώνες

Δυναμικά χαρακτηριστικά της κυτταρικής μεμβράνης

Το βασικό χαρακτηριστικό στη λειτουργία του νευρώνα είναι η

ικανότητα του να αυξομειώνει ταχύτατα το δυναμικό της

μεμβράνης του από την αρνητική κατάσταση ηρεμίας σε

πολύ θετικές τιμές και το αντίθετο.

Η εκφορτιστική αυτή συμπεριφορά ονομάζεται δυναμικό

δράσης (action potential) ή spike, λόγω της μικρής του

διάρκειας (1-3ms) και αποτελεί τη βασική μορφή

επικοινωνίας και μετάδοσης πληροφορίας ανάμεσα στους

νευρώνες.

Η πρόκληση των δυναμικών δράσης οφείλεται στις

μεταβολές του δυναμικού της μεμβράνης σε σχέση με το

δυναμικό ηρεμίας και εφόσον υπερβεί μία συγκεκριμένη τιμή

κατωφλίου.

Spike Train.

Page 8: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

current response'EPSC'

Νευρωνικά Δίκτυα

Spiking Neural Networks

– Βιολογικοί Νευρώνες

Δυναμικά χαρακτηριστικά της κυτταρικής μεμβράνης

Spikes

Page 9: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

− Βιολογικοί Νευρώνες

Δυναμικά χαρακτηριστικά της κυτταρικής μεμβράνης

Οι βασικές μεταβολές του δυναμικού της μεμβράνης σε σχέση με το δυναμικό ηρεμίας,

είναι:

Αποπόλωση, όταν το δυναμικό της μεμβράνης γίνεται λιγότερο αρνητικό.

Υπερπόλωση, όταν το δυναμικό της μεμβράνης γίνεται περισσότερο αρνητικό.

Επαναπόλωση, όταν το δυναμικό της μεμβράνης επιστρέφει στην τιμή ηρεμίας.

Page 10: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

− Βιολογικοί Νευρώνες

Δυναμικά χαρακτηριστικά της κυτταρικής μεμβράνης

Αν κατά την αποπόλωση της μεμβράνης, η τιμή του δυναμικού της υπερβεί μία συγκεκριμένη

τιμή κατωφλίου, μεγαλύτερη από το δυναμικό ηρεμίας, τότε ο νευρώνας πυροδοτεί ένα δυναμικό

δράσης.

Μετά από την πυροδότηση ακολουθεί μία βραχεία περίοδος ηρεμίας -ανερέθιστη περίοδος-

(spike after-potential (SAP)) κατά την οποία είναι σχεδόν αδύνατον να προκληθεί ένα δεύτερο

δυναμικό δράσης.

Page 11: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

− Βιολογικοί Νευρώνες

Μετασυναπτικά Δυναμικά

Όταν ένα δυναμικό δράσης φτάνει στα τελικά

συναπτικά κομβία των νευροαξονικών απολήξεων

προκαλεί την απελευθέρωση της νευροδια-

βιβαστικής ουσίας που περιέχεται στα

αποθηκευτικά κυστίδια του προσυναπτικού

νευρώνα.

Ο νευροδιαβιβαστής προσδένεται στους ειδικούς

υποδοχείς της μετασυναπτικής μεμβράνης και

μεταβάλει το δυναμικό της μέσω εισροής ιόντων.

Page 12: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

− Βιολογικοί Νευρώνες

Μετασυναπτικά Δυναμικά

Η μεταβολή αυτή ονομάζεται μετασυναπτικό δυναμικό

(postsynaptic potential – PSP) και το ποσοστό της ηλεκτρικής

δραστηριότητας που μεταδίδεται, συναπτικό βάρος (synaptic

weight).

Ανάλογα με τον τύπο του νευροδιαβιβαστή που εκκρίνεται, μία

σύναψη μπορεί να είναι :

Διεγερτική καθώς προκαλεί αποπόλωση της μεμβράνης του

μετασυναπτικού νευρώνα και ονομάζεται ευοδωτικό μετασυναπτικό

δυναμικό (excitatory postsynaptic potential – EPSP).

Ανασταλτική κσθώς προκαλεί υπερπόλωση της μεμβράνης του

μετασυναπτικού νευρώνα και ονομάζεται ανασταλτικό

μετασυναπτικό δυναμικό (inhibitory postsynaptic potential – IPSP).

Page 13: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

− Βιολογικοί Νευρώνες

Χωρική και Χρονική Άθροιση Μετασυναπτικών Δυναμικών

Η επίδραση των μετασυναπτικών δυναμικών αθροίζεται χωρικά και χρονικά.

Page 14: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

− Βιολογικοί Νευρώνες

Συναπτική Πλαστικότητα

Η ικανότητα του εγκεφάλου να αλλάζει και να

αναπροσαρμόζεται, ονομάζεται πλαστικότητα.

Η ικανότητα αναπροσαρμογής του τρόπου επικοινωνίας των

νευρώνων, ονομάζεται συναπτική πλαστικότητα.

Οι αλλαγές στην πλαστικότητα των συνάψεων συνδέεται με

διάφορες μορφές μνήμης, καθώς επίσης με την ικανότητα

μάθησης και την αντιστοίχηση συμπεριφορών ανάλογη

εμπειριών.

Ανάλογα με την διάρκεια διακρίνουμε:

Μακροπρόθεσμη Πλαστικότητα

Μακροπρόθεσμη Ενδυνάμωση (Long-Term

Potentiation – LTP).

Μακροπρόθεσμη Kαταστολή (Long-Term Depression

– LTD).

Βραχυπρόθεσμη Πλαστικότητα

Page 15: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

− Βιολογικοί Νευρώνες

Προβλήματα

Κάθε χιλιοστό του δευτερολέπτου κατακλύζεται από χιλιάδες ερεθίσματα.

Η μεθοδολογία λήψης βέλτιστης απόφασης σε σχέση με τον χρόνο και την ενέργεια

δράσης ή αντίδρασης, αποτελεί βασικό αντικείμενο διαρκούς μελέτης.

Σύγκριση Βιολογικών και ΤΝ Δικτύων

Ταχύτητα

Πολυπλοκότητα

Page 16: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

– Εφαρμογές SNN

Page 17: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Artificial Neural Networks

– Γενικά

Τα Τεχνητά Νευρωνικά Δίκτυα επινοήθηκαν το 1943 από τον Αμερικανό νευροφυσιολόγο

McCullock και το μαθηματικό Pitts και αποτελούν την προσπάθεια μαθηματικής

μοντελοποίησης του ανθρώπινου εγκεφάλου.

Βασικό δομικό στοιχείο του εγκεφάλου είναι οι νευρώνες, δηλαδή τα νευρικά κύτταρα τα οποία

δημιουργούν ένα πυκνό δίκτυο επικοινωνίας.

– Ιστορική αναδρομή ΤΝΔ

1η Γενιά: Binary networks (activation of 0 or 1).

2η Γενιά: Real-valued networks.

3η Γενιά: Spiking Neural Networks (SNNs).

– Εφαρμογές ΤΝΔ

Σχεδιασμός ενεργειών (planning),

Χρονοπρογραμματισμός (scheduling),

Αναγνώριση προτύπων (π.χ. υπογραφών, ομιλίας, γραφής, εικόνων),

Πρόβλεψη (π.χ. καιρού, τιμών μετοχών).

Νευρωνικά Δίκτυα

Page 18: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Περιγραφή

Τα ΤΝΔ

Έχουν την ικανότητα να εκτελούν υπολογισμούς με μαζικό παράλληλο τρόπο, να

αποθηκεύουν εμπειρική γνώση και να την έχουν διαθέσιμη για μελλοντική χρήση.

Αποκτούν γνώση μέσω μιας διαδικασίας εκπαίδευσης η οποία τους επιτρέπει να

"μαθαίνουν" από μόνα τους αυτό που πρέπει να υπολογίσουν, χάρη σε αλγορίθμους που

σταδιακά διορθώνουν τα λάθη τους καθώς μεταβάλλεται η κατάσταση τους.

Αποτελούνται από ένα μεγάλο αριθμό ανεξάρτητων υπολογιστικών στοιχείων που

ονομάζονται νευρώνες (neurons), οι οποίοι διασυνδέονται μεταξύ τους και είναι

οργανωμένοι σε στρώματα (layers).

Τα ΤΝΔ πρέπει να διαθέτουν δύο βασικά χαρακτηριστικά:

Οι νευρώνες να έχουν ρυθμιζόμενες παραμέτρους ώστε να διευκολύνεται η διαδικασία

της μάθησης και

Το δίκτυο να αποτελείται από μεγάλο πλήθος νευρώνων ώστε να επιτυγχάνεται

παραλληλισμός της επεξεργασίας και κατανομή της πληροφορίας.

Η χρήση ΤΝΔ προσφέρει:

Ευκολία υλοποίησης και αξιόπιστη λειτουργία.

Προσαρμοστικότητα (ευπλαστότητα).

Άμεση απόκριση κατά τη φάση πραγματικής λειτουργίας.

Νευρωνικά Δίκτυα

Page 19: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Περιγραφή

Με μαθηματικούς όρους ένα ΤΝΔ ορίζεται ως ένας προσανατολισμένος γράφος με τις

παρακάτω ιδιότητες:

Μία μεταβλητή κατάστασης ni ανατίθεται σε κάθε κόμβο (node) i.

Σε κάθε σύνδεσμο (link) μεταξύ δύο κόμβων i και k ανατίθεται ένα βάρος (weight) wik με

τιμή πραγματικό αριθμό.

Μια τιμή πόλωσης (bias) bi, ανατίθεται σε κάθε κόμβο (node) i.

Για κάθε κόμβο i ορίζεται μια συνάρτηση ενεργοποίησης (activation function) φi [nk, wik,

bi] η οποία καθορίζει την κατάσταση του κόμβου συναρτήσει της πόλωσής του, των

βαρών των εισερχομένων συνδέσμων και της κατάστασης των κόμβων οι οποίοι

συνδέονται μέσω αυτών των συνδέσμων.

Oι κόμβοι ονομάζονται νευρώνες (neurons), οι σύνδεσμοι ονομάζονται συνάψεις

(synapses) και η πόλωση είναι γνωστή ως κατώφλι ενεργοποίησης (activation threshold).

Κόμβοι χωρίς εισερχόμενους συνδέσμους ονομάζονται νευρώνες εισόδου (input neurons)

και κόμβοι χωρίς εξερχόμενους συνδέσμους νευρώνες εξόδου (output neurons).

Ένα δίκτυο το οποίο τοπολογικά δεν έχει αναδρομικές συνδέσεις ονομάζεται feed-

forward.

Νευρωνικά Δίκτυα

Page 20: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

a) shallow

b) deep

Νευρωνικά Δίκτυα

Page 21: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Περιγραφή

Νευρωνικά Δίκτυα

Page 22: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Ένα απλό νευρωνικό δίκτυο

– Ένα νευρωνικό δίκτυο αποτελείται από ένα αριθμό στοιχείων, τους νευρώνες. Σε κάθε νευρώνα καταφθάνει

ένας αριθμός σημάτων, τα οποία έρχονται ως είσοδος σ’ αυτόν. Ο νευρώνας έχει μερικές πιθανές

καταστάσεις στις οποίες μπορεί να βρεθεί η εσωτερική δομή του που δέχεται τα σήματα εισόδου και, τέλος,

έχει μία μόνον έξοδο, η οποία είναι συνάρτηση των σημάτων εισόδου.

– Κάθε σήμα που μεταδίδεται από ένα νευρώνα σε ένα άλλο μέσα στον νευρωνικό δίκτυο συνδέεται με την

τιμή βάρους, w, και η οποία υποδηλώνει πόσο στενά είναι συνδεδεμένοι οι δύο νευρώνες που συνδέονται

με το βάρος αυτό. Η τιμή αυτή συνήθως κυμαίνεται σε ένα συγκεκριμένο διάστημα, λ.χ. στο διάστημα από –

1 ως 1, αλλά αυτό είναι αυθαίρετο και εξαρτάται από το πρόβλημα που προσπαθούμε να λύσουμε. Η

σημασία του βάρους είναι όπως ακριβώς είναι και ο χημικός δεσμός ανάμεσα σε δύο άτομα που

απαρτίζουν ένα μόριο. Ο δεσμός μας δείχνει πόσο δυνατά είναι συνδεδεμένα τα δύο άτομα του μορίου.

Έτσι και ένα βάρος μας λέγει ακριβώς πόσο σημαντική είναι η συνεισφορά του συγκεκριμένου σήματος

στην διαμόρφωση της δομής του δικτύου για τους δύο νευρώνες τους οποίους συνδέει. Οταν το w είναι

μεγάλο/μικρό, τότε η συνεισφορά του σήματος είναι μεγάλη/μικρή.

Νευρωνικά Δίκτυα

Page 23: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Ένα απλό νευρωνικό δίκτυο

Νευρωνικά Δίκτυα

Page 24: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Ένα απλό νευρωνικό δίκτυο

– όλα τα σήματα που φθάνουν σε ένα νευρώνα μαζεύονται (αθροίζονται), υπόκεινται σε μία διαδικασία,

παράγεται ως αποτέλεσμα της διαδικασίας μία έξοδος και αυτό είναι το σήμα το οποίο μεταδίδεται

περαιτέρω στους επόμενους νευρώνες. Η θεώρηση αυτή είναι γενική και ισχύει πάντοτε, αυτό όμως που

αλλάζει είναι η διαδικασία η οποία δεν είναι πάντα η ίδια.

– Ας δούμε αρχικά δύο τρόπους με τους οποίους γίνεται η μετάδοση αυτή:

– Ο πρώτος τρόπος είναι δυαδικός. Στην περίπτωση αυτή ένας νευρώνας μπορεί να βρεθεί σε μία από

δύο δυνατές καταστάσεις να είναι ενεργός ή να είναι αδρανής. Όταν ένας νευρώνας δέχεται διάφορα

σήματα, τότε υπολογίζει μία ποσότητα x από όλα τα δεδομένα που έχει και συγκρίνει την τιμή της

ποσότητας αυτής με μια τιμή κατωφλίου, θ, η οποία είναι χαρακτηριστική (σταθερή) και ορισμένη από

την αρχή για τον νευρώνα αυτόν. Αν η τιμή της ποσότητας είναι μεγαλύτερη από την τιμή κατωφλίου,

τότε λέμε ότι ο νευρώνας ενεργοποιείται. Αν όμως είναι μικρότερη, τότε ο νευρώνας παραμένει

αδρανής, δηλ. στην δεδομένη στιγμή δεν μεταδίδει κανένα σήμα παραιτέρω στο δίκτυο. Επειδή ο

νευρώνας εδώ δρα ως δυαδικό στοιχείο, γι’ αυτό η έξοδός του, f(x), θα ειναι 1 οταν είναι

ενεργοποιημένος και 0 όταν είναι αδρανής.

Νευρωνικά Δίκτυα

Page 25: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Ένα απλό νευρωνικό δίκτυο

– Με τον δεύτερο τρόπο δεν υπάρχει χαρακτηριστική τιμή κατωφλίου με την οποία γίνεται η σύγκριση της

συνάρτησης. Η μετάδοση του σήματος γίνεται πάλι με την συνάρτηση f(x), η οποία τώρα έχει μία ειδική

μορφή. Χρησιμοποιούμε όλες τις τιμές των εισόδων και τις τιμές των βαρών, w, και υπολογίζουμε

αριθμητικά την f(x). Ενα παράδειγμα μορφής της συνάρτησης αυτής είναι το εξής:

– Εκτός από αυτές τις μορφές (θα δούμε αργότερα και άλλες μορφές) η f(x) είναι συνάρτηση μεταφοράς

(transfer function), ή συνάρτηση ενεργοποίησης (activation function). Οι συναρτήσεις αυτές είναι πάντοτε

μη–γραμμικές. Δεν αρκούν γραμμικές συναρτήσεις, γιατί τότε η έξοδος θα ήταν ευθέως ανάλογη με την

είσοδο, κάτι που δεν μπορεί να συμβεί στα νευρωνικά δίκτυα.

Νευρωνικά Δίκτυα

Page 26: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Αρχιτεκτονική

Κάθε νευρώνας του δικτύου:

Δέχεται τις εισόδους των γειτονικών νευρώνων ή τις εξωτερικές εισόδους και τις

χρησιμοποιεί για να υπολογίσει το σήμα εξόδου το οποίο διαδίδεται σε άλλους νευρώνες.

Εκτελεί προσαρμογή των βαρών.

Το σύστημα είναι από φύση παράλληλο, με την έννοια ότι πολλοί νευρώνες μπορούν να

εκτελούν τους υπολογισμούς τους ταυτόχρονα.

Τα τρία είδη των νευρώνων που αποτελούν ένα ΤΝΔ, είναι:

Οι νευρώνες εισόδου (input units) οι οποίες δέχονται εξωτερικά δεδομένα.

Οι νευρώνες εξόδου (output units) οι οποίες αποδίδουν το αποτέλεσμα.

Οι κρυμμένοι νευρώνες (hidden units) των οποίων η είσοδος και η έξοδος παραμένουν

μέσα στο ΤΝΔ.

Κατά την λειτουργία του ΤΝΔ οι νευρώνες μπορούν να ενημερώνονται:

Σύγχρονα.

Όλοι οι νευρώνες ενημερώνουν ταυτόχρονα την κατάσταση ενεργοποίησης.

Ασύγχρονα.

Κάθε νευρώνας έχει μία συνήθως σταθερή πιθανότητα ενημέρωσης της κατάστασης

ενεργοποίησής του σε κάποια χρονική τιμή.

Νευρωνικά Δίκτυα

Page 27: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Αρχιτεκτονική

Στις περισσότερες περιπτώσεις ο κάθε νευρώνας παρέχει έναν παράγοντα άθροισης στην

είσοδο του νευρώνα με τον οποίο είναι συνδεδεμένος.

Η συνολική είσοδος του νευρώνα k είναι το σταθμισμένο άθροισμα (weighted sum) των εξόδων

των νευρώνων οι οποίοι είναι συνδεδεμένοι με αυτόν, συν μίας τιμής πόλωσης (bias) bk:

sk(t) = wjk(t)·yj(t)+bk(t)

Η συνεισφορά για θετικό βάρος wjk θεωρείται διέγερση (excitation) ενώ για αρνητικό βάρος

θεωρείται αποτροπή ή αναστολή (inhibitation).

Σε κάποιες περιπτώσεις χρησιμοποιούνται πιο πολύπλοκοι κανόνες συνδυασμού των εισόδων

στους οποίους διαχωρίζονται οι είσοδοι διέγερσης και αποτροπής.

Οι νευρώνες που χρησιμοποιούν τον κανόνα διάδοσης (propagation rule) sk(t) ονομάζονται

νευρώνες σίγμα (sigma units)

Νευρωνικά Δίκτυα

Page 28: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Ένα απλό νευρωνικό δίκτυο

Νευρωνικά Δίκτυα

Στην Άσκηση αυτή δοκιμάζουμε τους

συνδυασμούς (Ν1= 1 και Ν2= 0), (Ν1= 1 και Ν2

= 1), (Ν1= 0 και Ν2= 0), (Ν1= 0 και Ν2= 1), ως

τιμές εισόδου,

βρίσκουμε τα γινόμενα (σήμα)(βάρος)

χρησιμοποιώντας τα βάρη που είναι γραμμένα

πάνω στο Σχήμα.

Συγκρίνουμε το αποτέλεσμα κάθε φορά με την

τιμή 2 γιατί όλα τα κατώφλια έχουν τιμή θ = 2.Παρατηρούμε ότι μόνο οι δύο πρώτοι

συνδυασμοί από τους τέσσερεις δίνουν 1 στην

έξοδο, ενώ οι δύο τελευταίοι δίνουν 0 στην

έξοδο. Αν βρήκατε αυτές τις τιμές τότε

προχωράτε πολύ καλά, έχετε καταλάβει τον

σωστό τρόπο διάδοσης του σήματος μέσα σε

ένα δίκτυο.

Page 29: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Πλεονεκτήματα

Μπορούν να παραγάγουν αποτελέσματα από πολύπλοκα δεδομένα και να χρησιμοποιηθούν

για να εξαγάγουν πρότυπα και να ανιχνεύσουν τάσεις, που είναι αρκετά περίπλοκες για να

προβλεφθούν, είτε με άλλες υπολογιστικές τεχνικές είτε από την ανθρώπινη παρατήρηση και

εμπειρία.

Έχουν δυνατότητα προσαρμοσμένης μάθησης.

Χρησιμοποιούν τεχνικές αυτοοργάνωσης.

Λειτουργούν σε πραγματικό χρόνο.

Διαθέτουν μηχανισμούς ανοχής σφαλμάτων.

Νευρωνικά Δίκτυα

Page 30: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Αρχιτεκτονική

Δομικές μονάδες αποτελούν οι νευρώνες, οι οποίοι δημιουργούν στρώματα (layers) τα οποία

συνδέονται με τρόπο ώστε το δίκτυο να μπορεί να εκπαιδευτεί σωστά και να δώσει βέλτιστα

αποτελέσματα.

Ανάλογα με των αριθμό των στρωμάτων τα δίκτυα διαχωρίζονται σε:

Μονοστρωματικά ΤΝΔ (Singled-layer Artificial Neural Networks).

Αποτελούνται από ένα στρώμα.

Η συνάρτηση ενεργοποίησης τους είναι η ίδια σε κάθε νευρώνα.

Μέσω των στοιχείων εισόδου, υπολογίζονται τα στοιχεία εξόδου.

Πολυστρωματικά ΤΝΔ (Multi-layer Artificial Neural Networks).

Αποτελούνται από πολλαπλά στρώματα νευρώνων.

Τα στοιχεία εξόδου κάθε προηγούμενου στρώματος νευρώνων, αποτελούν τα στοιχεία εισόδου

του επόμενου στρώματος.

Κάθε στρώμα μπορεί να έχει διαφορετικό αριθμό νευρώνων και διαφορετική συνάρτηση

ενεργοποίησης.

Ανάλογα με τον τρόπο λειτουργίας τους, διαχωρίζονται σε:

Δίκτυα Προώθησης (feedforward networks).

Τα δεδομένα ρέουν αυστηρά και μόνο από τις μονάδες εισόδου προς τις μονάδες εξόδου.

Δίκτυα Ανατροφοδότησης (recurrent networks).

Υπάρχουν συνδέσεις ανατροφοδότησης (feedback connections).

Νευρωνικά Δίκτυα

Page 31: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Αρχιτεκτονική

Νευρωνικά Δίκτυα

Page 32: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Εκπαίδευση

Κάθε νευρώνας έχει:

ένα αριθμό σημάτων που έρχονται ως είσοδος σ’ αυτόν,

μερικές πιθανές καταστάσεις στις οποίες μπορεί να βρεθεί,

μία έξοδο, η οποία είναι συνάρτηση των σημάτων εισόδου.

Κάθε είσοδος έχει:

μία δική της τιμή βάρους, η οποία υποδηλώνει πόσο στενά είναι συνδεδεμένοι οι

νευρώνες που συνδέονται με το βάρος αυτό.

Όταν ένας νευρώνας ενεργοποιείται:

Υπολογίζει μία συνάρτηση από όλα τα δεδομένα που έχει.

Συγκρίνει την τιμή της συνάρτησης αυτής με μια τιμή κατωφλίου, η οποία είναι

χαρακτηριστική για το νευρώνα αυτόν.

Αν η τιμή της συνάρτησης είναι μεγαλύτερη από την τιμή κατωφλίου, τότε ο νευρώνας

υπολογίζει την έξοδο, την οποία προωθεί ως είσοδο στον επόμενο ή τους επόμενους

νευρώνες.

Κατά τη διάρκεια της εκπαίδευσης το μόνο πράγμα που αλλάζει είναι η τιμές των βαρών και

των συντελεστών πόλωσης των συνδέσεων των νευρώνων.

Νευρωνικά Δίκτυα

Page 33: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Εκπαίδευση

Για να χρησιμοποιηθεί ένα ΤΝΔ πρέπει πρώτα να εκπαιδευτεί για να μάθει.

Η μάθηση συνίσταται στον προσδιορισμό και στην αλλαγή των βαρών των συνδέσεων

(συναπτικών βαρών) και των συντελεστών πόλωσης μεταξύ των νευρώνων, ώστε το ΤΝΔ να

εκτελεί τους επιθυμητούς υπολογισμούς.

Η διαδικασία αυτή πραγματοποιείται με τη βοήθεια αλγόριθμων που είναι γνωστοί ως κανόνες

ή αλγόριθμοι μάθησης.

Ο ρόλος των συντελεστών βάρους μπορεί να ερμηνευτεί ως αποθήκευση γνώσης, η οποία

παρέχεται μέσω παραδειγμάτων.

Νευρωνικά Δίκτυα

Page 34: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Εκπαίδευση

Οι μέθοδοι εκπαίδευσης μπορούν να διαχωριστούν σε:

Επιβλεπόμενη (supervised learning)

Το ΤΝΔ εκπαιδεύεται με συγκεκριμένες εισόδους οι οποίες ταιριάζουν με τις εξόδους.

Μη επιβλεπόμενη (unsupervised learning)

Μια μονάδα εξόδου εκπαιδεύεται να ανταποκρίνεται σε ομάδες προτύπων που υπάρχουν στην

είσοδο.

Η εκπαίδευση δύο σταδίων (semi-supervised training)

Πρόκειται για τον συνδυασμό των παραπάνω μεθόδων εκπαίδευσης και εκτελείται σε δύο στάδια.

Κατά το πρώτο στάδιο, γίνεται εκπαίδευση χωρίς επίβλεψη, η οποία ομαδοποιεί τα δεδομένα

εισόδου.

Κατά το δεύτερο στάδιο γίνεται εκπαίδευση με επίβλεψη και δημιουργείται η συνάρτηση

απεικόνισης εισόδου – εξόδου.

Οι ομάδες του πρώτου σταδίου χρησιμεύουν για να αρχικοποιηθεί το τεχνητό νευρωνικό δίκτυο

κατά το δεύτερο στάδιο.

Ενισχυμένη μάθηση (reinforcement learning)

Bασίζεται σε διαδικασίες ανταμοιβής σε σχέση με το αποτέλεσμα.

Προσαρμογή βαρών

Η εκπαίδευση αποσκοπεί στην αναπροσαρμογή των βαρών των συνδέσεων μεταξύ των

νευρώνων του ΤΝΔ, σύμφωνα με κάποιο κανόνα μετατροπής (Hebbian Learning Rule).

Νευρωνικά Δίκτυα

Page 35: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Εκπαίδευση

Η εποπτευόμενη μάθηση συμβαίνει όταν ξεκινούμε με τυχαίες τιμές των βαρών και δίνουμε τις

τιμές των εισόδων και των στόχων που πρέπει να μάθει το δίκτυο. Κατά τη διαδικασία της

εκπαίδευσης (on-line training), το δίκτυο αλλάζει τις τιμές των βαρών διορθώνοντας αυτές

ανάλογα με το σφάλμα που παίρνουμε κάθε φορά.

Στη μη-εποπτευόμενη μάθηση απλώς δίνουμε την πληροφορία στο δίκτυο, χωρίς να γίνεται

κανένας έλεγχος. Στη μάθηση με αυτο-οργανούμενο τρόπο, το δίκτυο αυτο-ελέγχει τον εαυτό

του και διορθώνει τα σφάλματα στα δεδομένα, συνολικά, με ένα μηχανισμό ανάδρασης.

Στην εποπτευόμενη μάθηση η εκπαίδευση γίνεται με το να παρουσιάσουμε μια ομάδα από

πρότυπα στο δίκτυο, αντιπροσωπευτικά ή παρόμοια με αυτά που θέλουμε να μάθει. Αυτό

σημαίνει ότι δίνουμε στο δίκτυο ως εισόδους κάποια πρότυπα για τα οποία ξέρουμε ποια

πρέπει να είναι η έξοδος του δικτύου. Το δίκτυο με τα δεδομένα αυτά τροποποιεί τις τιμές των

συναπτικών βαρών (weights) και των συντελεστών πόλωσης (biases). Ακολούθως, αφού βρει

τη σωστή εσωτερική δομή, τότε θα μπορεί να λύνει και άλλα ανάλογα προβλήματα για τα οποία

δεν έχει εκπαιδευθεί αρκεί τα προβλήματα αυτά να είναι της ίδιας φύσης και των ίδιων

χαρακτηριστικών όπως αυτά για τα οποία εκπαιδεύτηκε.

Σε όλες τις περιπτώσεις όταν το δίκτυο σταματάει να αλλάζει τις τιμές των βαρών, τότε

θεωρούμε ότι η εκπαίδευση έχει επιτευχθεί επειδή το σφάλμα στην έξοδο γίνεται μηδέν ή

είναι πολύ κοντά (τείνει) στο μηδέν.

Νευρωνικά Δίκτυα

Page 36: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Εκπαίδευση

Κανόνας Δ

Κατά την εκπαίδευση ενός δικτύου, σε όποια κατάσταση και αν βρίσκεται αυτό σε μιά δεδομένη στιγμή, σημασία έχει

η απόκλιση που δίνει στην την έξοδο του το δίκτυο από την αναμενόμενη τιμή ή τον στόχο που έχουμε θέσει.

Η διαφορά αυτή δίνει το σφάλμα που παράγει το δίκτυο την δεδομένη στιγμή n και δίνεται από:

όπου «t» είναι ο στόχος, «ο» είναι η έξοδος και «δ» είναι το σφάλμα. Το δ τώρα ενεργοποιεί ένα μηχανισμό ελέγχου

με σκοπό να επιφέρει μιά σειρά από διορθωτικές αλλαγές στα βάρη w, πράγμα που θα φέρει το δίκτυο πλησιέστερα

στην εκπαίδευση του. Αυτό γίνεται με τον υπολογισμό της ποσότητας Δ:

οπου η είναι μιά σταθερά, και xi είναι η τιμή του σήματος εισόδου. Τέλος το Δw(n), δηλ. η διόρθωση του βάρους w

στην δεδομένη στιγμή n, δίνεται κατ’ ευθείαν από το Δ:

Νευρωνικά Δίκτυα

Page 37: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Τύποι

Page 38: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Back Propagation ή Generalized Delta Rule

Ο αλγόριθμος Back-Propagation προτάθηκε από τον Paul Werbos στη δεκαετία του 1970 στα

πλαίσια της ανάλυσης μοντέλων οικονομικής και πολιτικής πρόβλεψης.

Πρόκειται για μια τεχνική μάθησης με επίβλεψη (superνised).

Ο αλγόριθμος βασίζεται στην εξής απλή ιδέα:

Δίνοντας ένα σύνολο προτύπων στην είσοδο, παρατηρούμε τις τιμές των νευρώνων της

εξόδου.

Ανάλογα με την απόκλιση των τελευταίων από τις επιθυμητές τιμές, διορθώνουμε τα

αντίστοιχα βάρη και τους συντελεστές πόλωσης κατά μια υπολογισμένη από μαθηματικό

τύπο τιμή.

Αφού τελειώσουμε με την έξοδο, εφαρμόζουμε τα ίδια βήματα για την αμέσως

προηγούμενη ζώνη, κ.ο.κ., δηλαδή διορθώνουμε τα βάρη και τους συντελεστές πόλωσης

αρχίζοντας από την έξοδο και καταλήγοντας στην είσοδο.

Η υλοποίηση του περιγράφεται από δύο στάδια υπολογισμών:

Μια πρόσω διάδοση (Forward Pass) όπου η επίδραση του προτύπου που εφαρμόζεται

στην είσοδο διαδίδεται στο δίκτυο και παράγεται το αποτέλεσμα στην έξοδο.

Μια ανάστροφη διάδοση (Backward Pass) όπου γίνεται αναπροσαρμογή των βαρών και

των συντελεστών πόλωσης.

Νευρωνικά Δίκτυα

Page 39: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Back Propagation ή Generalized Delta Rule

Η βασική ιδέα είναι να καθοριστεί το “ποσοστό” του συνολικού σφάλματος που αντιστοιχεί στα

βάρη και στους συντελεστές πόλωσης του κάθε νευρώνα.

Υπολογίζεται αρχικά το σφάλμα για τους νευρώνες του επιπέδου εξόδου, στη συνέχεια

υπολογίζονται τα σφάλματα στο τελευταίο κρυμμένο επίπεδο και η διαδικασία συνεχίζεται

αναδρομικά μέχρι το πρώτο επίπεδο.

Γίνεται υπολογισμός της συνεισφοράς κάθε βάρους και του συντελεστή πόλωσης των

νευρώνων στο ολικό σφάλμα καθώς τα σφάλματα κάθε επιπέδου χρησιμοποιούνται για να

μεταβάλλουν τα βάρη και τους συντελεστές πόλωσης του κάθε νευρώνα και η διαδικασία

επαναλαμβάνεται μέχρι το σφάλμα να πάρει τιμή στα όρια ανοχής που έχει θέσει ο χρήστης.

Νευρωνικά Δίκτυα

Page 40: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Back Propagation ή Generalized Delta Rule

Νευρωνικά Δίκτυα

Page 41: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Back Propagation ή Generalized Delta Rule

Η μέθοδος της οπισθοδιάδοσης έχει μειονεκτήματα γιατί:

ο χρόνος εκπαίδευσης μπορεί να είναι υπερβολικά μεγάλος

το δίκτυο μπορεί να πέσει σε τοπικά ελάχιστα και να μην

μπορεί να απεγκλωβισθεί

το μέγεθος του βήματος πρέπει να επιλεγεί προσεκτικά

αν τα πρότυπα που παρουσιάζονται αλλάζουν, το δίκτυο

δεν εκπαιδεύεται.

Νευρωνικά Δίκτυα

Page 42: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Γραμμική Διαχωρισιμότητα

Νευρωνικά Δίκτυα

Page 43: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Γραμμική Διαχωρισιμότητα

Νευρωνικά Δίκτυα

Page 44: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Γραμμική Διαχωρισιμότητα

Νευρωνικά Δίκτυα

Page 45: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Neural Networks

– Ερευνητικά Προβλήματα

Οι διαδικασίες εκπαίδευσης, ενώ καταρχήν φαίνονται σωστές, εντούτοις μπορεί να έχουν αρκετά προβλήματα, τα οποία

ακόμη και σήμερα δεν έχουν απαντηθεί ικανοποιητικά.

Είναι φανερό ότι το δίκτυο πρέπει να μαθαίνει όλο το σύνολο των προτύπων που του παρουσιάζονται. Το ερώτημα

είναι πώς πρέπει να παρουσιάζονται τα πρότυπα, δηλ. σε μια δεδομένη σειρά, που επαναλαμβάνεται συνεχώς ή

πρέπει να επιλέγονται με τυχαίο τρόπο;

Πόσους κύκλους χρειάζεται ένα νευρωνικό δίκτυο για να εκπαιδευθεί;

Ποιες πρέπει να είναι οι τιμές του η;

Σε όλα αυτά τα ερωτήματα οι απαντήσεις είναι εμπειρικές και συνήθως δίνονται με την μέθοδο trial–and–error, δηλ. την

μέθοδο κατά την οποία δοκιμάζουμε κάποιες λογικές τιμές, τις οποίες μεταβάλλουμε ανάλογα με τα αποτελέσματα που

παίρνουμε, μέχρις ότου αυτά είναι ικανοποιητικά.

Νευρωνικά Δίκτυα

Page 46: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Εφαρμογή Νευρωνικού Δικτύου για πρόβλεψη τιμών (Regression Real-Valued)

GUI Matlab

Nnstart (Neural Network getting STarted GUI).

Εργαλειοθήκη ανάπτυξης νευρωνικών δικτύων με γραφικό περιβάλλον στο Matlab.

Neural Network Fitting Tool.

Εφαρμογή που επιτρέπει την εισαγωγή ενός συνόλου δεδομένων, την δημιουργία, την εκπαίδευση και την αξιολόγηση της απόδοσης ενός

νευρωνικού δικτύου, χρησιμοποιώντας τις τεχνικές:

Του μέσου τετραγώνων των σφαλμάτων (mean square error)

Και της ανάλυσης παλινδρόμησης (regression analysis).

Αρχιτεκτονική

Τwo-layer feed-forward network.

Sigmoid hidden neurons.

Linear output neurons.

Εκπαίδευση

Levenberg-Marquardt Βackpropagation Αlgorithm.

Page 47: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Δεδομένα

Δημιουργούμε ένα νευρωνικό δίκτυο που θα δέχεται:

Inputs: 1127 δείγματα και 7 στοιχεία,

Outputs: 1127 δείγματα και 1 στοιχείο.

Page 48: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Επιλογή ποσοστών εκπαίδευσης, δοκιμών και επαλήθευσης

Page 49: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Επιλογή νευρώνων κρυφού επιπέδου

Page 50: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Εκπαίδευση νευρωνικού δικτύου

Page 51: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Αξιολόγηση νευρωνικού δικτύου

Η ανάλυση συσχέτισης μεταβλητών θεωρείται πλήρως επιτυχής όταν το σύνολο των δεδομένων συσπειρώνετε σε μια

ευθεία με κλίση 45ο.

Page 52: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Αξιολόγηση νευρωνικού δικτύου

Page 53: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Αξιολόγηση νευρωνικού δικτύου

Page 54: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Δεδομένα

Δημιουργούμε ένα νευρωνικό δίκτυο που θα δέχεται:

Inputs: 1127 δείγματα και 8 στοιχεία,

Outputs: 1127 δείγματα και 1 στοιχείο.

Page 55: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Αξιολόγηση νευρωνικού δικτύου

Page 56: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Αξιολόγηση νευρωνικού δικτύου

Page 57: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Αξιολόγηση νευρωνικού δικτύου

Page 58: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Γραφική παράσταση σύγκρισης πραγματικών μεταβλητών εξόδου με τις μεταβλητές εξόδου που απέδωσε το νευρωνικό

δίκτυο.

– Συμπερασματικά αναφέρεται ότι το με την αύξηση των ανεξάρτητων μεταβλητών, το νευρωνικό δίκτυο κατάφερε να

αποδώσει σχεδόν το άριστο (0,99935) για το σύνολο των δεδομένων που κλήθηκε να εκπαιδευτεί.

Page 59: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Εφαρμογή Νευρωνικού Δικτύου για κατηγοριοποίηση (Classification)

Matlab Code

Αρχιτεκτονική

Πολυεπίπεδο εμπρόσθιας τροφοδοσίας ΝΔ με 2 κρυφά επίπεδα (multilayer perceptron).

Εκπαίδευση

Levenberg-Marquardt Βackpropagation Αlgorithm.

Δημιουργία νευρωνικού δικτύου.

net = feedforwardnet.

Σκοπός

Επίλυση του XOR προβλήματος.

Page 60: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Εφαρμογή Νευρωνικού Δικτύου για κατηγοριοποίηση (Classification)

Solving XOR problem with a multilayer perceptron

Δεν υπάρχει ένα υπερεπίπεδο (γραμμή) που να διαχωρίζει την κλάση Α από την Β.

Οι λειτουργίες AND και OR είναι γραμμικώς διαχωρίσιμα προβλήματα.

.

Page 61: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής61

Νευρωνικά Δίκτυα

Neural Networks

– Εφαρμογή Νευρωνικού Δικτύου για κατηγοριοποίηση (Classification)

Solving XOR problem with a multilayer perceptron

Αλγόριθμος

Ζωγράφισε 2 επίπεδα κατάταξης των κλάσεων.

Η κλάση Α βρίσκεται εντός της σκιασμένης περιοχής ενώ η κλάση Β εκτός.

Two-phase design

1st Phase

o Χάραξη 2 υπερεπιπέδων g1(x)=g2(x)=0 κάθε ένα εκ των οποίων υλοποιείται από ένα percepton με έξοδο την θέση του x.

2nd Phase

o Εντοπισμός της θέσης του x ως προς τα υπερεπίπεδα, με βάση τις τιμές των y1, y2.

Page 62: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Εφαρμογή Νευρωνικού Δικτύου για κατηγοριοποίηση (Classification)

Solving XOR problem with a multilayer perceptron

Αλγόριθμος

Αρχιτεκτονική

Page 63: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής63

Νευρωνικά Δίκτυα

Neural Networks

– Εφαρμογή Νευρωνικού Δικτύου για κατηγοριοποίηση (Classification)

Solving XOR problem with a multilayer perceptron

Υλοποίηση

Κώδικας

% number of samples of each class

o K = 100;

% define 4 clusters of input data

o q = .6; % offset of classes

o A = [rand(1,K)-q; rand(1,K)+q];

o B = [rand(1,K)+q; rand(1,K)+q];

o C = [rand(1,K)+q; rand(1,K)-q];

o D = [rand(1,K)-q; rand(1,K)-q];

% text labels for clusters

o text(.5-q,.5+2*q,'Class A')

o text(.5+q,.5+2*q,'Class B')

o text(.5+q,.5-2*q,'Class A')

o text(.5-q,.5-2*q,'Class B')

% encode clusters a and c as one class, and b and d as another class

o a = -1; % a | b

o c = -1; % -------

o b = 1; % d | c

o d = 1; %

Page 64: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής64

Νευρωνικά Δίκτυα

Neural Networks

– Εφαρμογή Νευρωνικού Δικτύου για κατηγοριοποίηση (Classification)

Solving XOR problem with a multilayer perceptron

Υλοποίηση

Κώδικας

% define inputs (combine samples from all four classes)

o P = [A B C D];

% define targets

o T = [repmat(a,1,length(A)) repmat(b,1,length(B)) ...

o repmat(c,1,length(C)) repmat(d,1,length(D)) ];

% create a neural network

o net = feedforwardnet([5 3]);

% train net

o net.divideParam.trainRatio = 1; % training set [%]

o net.divideParam.valRatio = 0; % validation set [%]

o net.divideParam.testRatio = 0; % test set [%]

% train a neural network

o [net,tr,Y,E] = train(net,P,T);

% plot classification regions

o figure(1)

o mesh(P1,P2,reshape(aa,length(span),length(span))-5);

o colormap cool

o view(2)

Page 65: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Εφαρμογή Νευρωνικού Δικτύου για κατηγοριοποίηση (Classification)

Solving XOR problem with a multilayer perceptron

Υλοποίηση

Δημιουργία κλάσεων

Page 66: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Εφαρμογή Νευρωνικού Δικτύου για κατηγοριοποίηση (Classification)

Solving XOR problem with a multilayer perceptron

Υλοποίηση

Δημιουργία δικτύου

Page 67: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Εφαρμογή Νευρωνικού Δικτύου για κατηγοριοποίηση (Classification)

Solving XOR problem with a multilayer perceptron

Υλοποίηση

Page 68: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Εφαρμογή Νευρωνικού Δικτύου για κατηγοριοποίηση (Classification)

Solving XOR problem with a multilayer perceptron

Υλοποίηση

Performance

Page 69: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Εφαρμογή Νευρωνικού Δικτύου για κατηγοριοποίηση (Classification)

Solving XOR problem with a multilayer perceptron

Υλοποίηση

Κατάσταση Εκπαίδευσης

Page 70: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Εφαρμογή Νευρωνικού Δικτύου για κατηγοριοποίηση (Classification)

Solving XOR problem with a multilayer perceptron

Υλοποίηση

Error Histogram

Page 71: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Εφαρμογή Νευρωνικού Δικτύου για κατηγοριοποίηση (Classification)

Solving XOR problem with a multilayer perceptron

Υλοποίηση

Error Histogram

Page 72: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Εφαρμογή Νευρωνικού Δικτύου για κατηγοριοποίηση (Classification)

Solving XOR problem with a multilayer perceptron

Υλοποίηση

Network Response

Page 73: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Neural Networks

– Εφαρμογή Νευρωνικού Δικτύου για κατηγοριοποίηση (Classification)

Solving XOR problem with a multilayer perceptron

Υλοποίηση

XOR Classification

Page 74: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

– Εφαρμογές SNN

Oι εφαρμογές των SNN ακολουθούν τον γενικό εννοιολογικό πλαίσιο λειτουργίας των

αντίστοιχων βιολογικών δικτύων. Συγκεκριμένα:

Υπάρχουν πολλαπλές είσοδοι δεδομένων που παράγουν μια έξοδο σήματος τύπου

spiking.

Η πιθανότητα δημιουργίας spikes προσαυξάνεται με ευοδωτικό μετασυναπτικό δυναμικό

(excitatory postsynaptic potential) και αντίστοιχα ελαττώνεται με ανασταλτικό

μετασυναπτικό δυναμικό (inhibitory postsynaptic potential).

Η δυναμική τους χαρακτηρίζεται από τουλάχιστον μία μεταβλητή κατάστασης η οποία

όταν φτάσει ένα συγκεκριμένο όριο – κατώφλι (threshold) δημιουργεί spikes.

Page 75: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

– Εφαρμογές SNN

Αρχιτεκτονική

FeedForward Networks

Είναι τα δίκτυα ενιαίας τροφοδότησης μιας κατεύθυνσης.

Recurrent Networks

Δίκτυα με ανατροφοδότηση (feedback) κόμβων.

Hybrid Networks

Synfire Chain

Reservoir Computing

Page 76: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

– Εφαρμογές SNN

Κωδικοποίηση Πληροφοριών

Η κωδικοποίηση των

πληροφοριών ως σήματα

εισόδου spikes, καθώς και η

χρονική ανάλυση των spikes,

για επεξεργασία και λήψη

βέλτιστων αποφάσεων,

αποτελεί το βασικότερο και

δυσκολότερο αντικείμενο

έρευνας και μελέτης στα SNN.

Inputs????? – Outputs?????

Δεν υπάρχει προτυποποίηση

διαδικασιών και η μεθοδολογία

έγκειται στο τρόπο

προσέγγισης του προβλήματος.

Page 77: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

– Εφαρμογές SNN

Κωδικοποίηση Πληροφοριών

Time to first spike

Οι πληροφορίες κωδικοποιούνται στον χρόνο που μεσολαβεί μεταξύ του χρόνου έναρξης του

ερεθισμού και τον χρόνο απόκρισης του πρώτου spike.

Αποτελεί ενδεικτική λύση σε περιπτώσεις άμεσης επεξεργασίας πληροφοριών.

Η κωδικοποίηση μπορεί να εφαρμοστεί με χρήση ενός μόνο νευρώνα με ανασταλτικό δυναμικό

(inhibitory) και ανάδραση (feedback), που εμποδίζει την εκπομπή άλλων spikes.

Χαρακτηριστικό παράδειγμα προσομοίωσης

νευρώνων με κωδικοποίηση Time to first spike

αποτελεί η κωδικοποίηση πληροφοριών για

προσομοίωση συστημάτων αφής όπου πρώτα

μεταφέρονται οι πληροφορίες από τα δάχτυλα.

Page 78: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

– Εφαρμογές SNN

Κωδικοποίηση Πληροφοριών

Rank-Order Coding (ROC)

Στο ROC η πληροφορία κωδικοποιείται στον τρόπο διάταξης των spikes κατά την ενεργή περίοδο

ενός νευρωνικού πληθυσμού.

Προτάθηκε για να εξηγήσει τον τρόπο άμεσης κατηγοριοποίησης που χρησιμοποιείται στο

πρωτεύον οπτικό σύστημα, στο οποίο μια συγκεκριμένη σειρά spikes μπορούν να οπτικοποιήσουν

ένα οπτικό ερέθισμα.

Πρόκειται για υλοποίηση μοντέλου, στο οποίο σχεδιάζεται δίκτυο εμπρόσθιας τροφοδοσίας

(feedforward) με ανασταλτικό δυναμικό (inhibitory) και συνδέσεις ανάδρασης (feedback).

Χαρακτηριστικό παράδειγμα προσομοίωσης

νευρώνων με κωδικοποίηση ROC αποτελεί η

κωδικοποίηση πληροφοριών για προσομοίωση

οπτικοποίηση εικόνων. Το μοντέλο υποθέτει ότι

κάθε νευρώνας εκπέμπει 1 spike κατά την

παρουσίαση της εικόνας.

Page 79: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

– Εφαρμογές SNN

Κωδικοποίηση Πληροφοριών

Latency Code

H πληροφορία κωδικοποιείται στον ακριβή προσδιορισμό της χρονοσειράς μεταξύ των spikes.

Είναι εξαιρετικά αποτελεσματικό στην αξιόπιστη και γρήγορη μεταφορά μεγάλου όγκου

πληροφοριών.

Μπορεί να εφαρμοστεί σε δίκτυα εμπρόσθιας τροφοδοσίας (feedforward), αν και ο θόρυβος και η

εγγενή δυναμική (inherent dynamics) στα δίκτυα αυτά μπορεί να διαταράξει εύκολα την ακρίβεια

χρονισμού που απαιτείται.

Τα ακριβώς χρονισμένα μοτίβα αιχμών

παίζουν σημαντικό ρόλο σε πολλές λειτουργίες,

καθώς είναι μία από τις κρίσιμες παραμέτρους

που ελέγχουν πολλές μορφές της συναπτικής

πλαστικότητας.

Πχ η αλλαγή του σχετικού χρονισμού των

προσυναπτικών και μετασυναπτικών αιχμών

της τάξης μόλις 10 ms, μπορεί να καθορίσει εάν

μια σύναψη είναι διεγερτική ή ανασταλτική.

Page 80: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

– Εφαρμογές SNN

Κωδικοποίηση Πληροφοριών

Coding by Synchrony

Το μοντέλο αυτό βασίζεται στην παραδοχή ότι οι νευρώνες κωδικοποιούν διαφορετικά κομμάτια

πληροφορίας τα οποία μπορούν να αποδοθούν με συγχρονισμένα spikes.

O συγχρονισμός μπορεί να χρησιμεύσει ως μηχανισμός βελτιστοποίησης τόσο στην μετάδοση

πληροφοριών μέσω του δικτύου, όσο και στην ακρίβεια του χρονοδιαγράμματος των γεγονότων

βασισμένων σε spikes (spikes events).

Χαρακτηριστικό παράδειγμα συντονισμού,

παρατηρείται στους οπτικούς νευρώνες κατά

την διάρκεια εστίασης σε κάποιο συγκεκριμένο

σημείο.

Page 81: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

– Εφαρμογές SNN

Κωδικοποίηση Πληροφοριών

Phase Coding

Οι χρόνοι εκπομπής spikes στο μοντέλο αυτό αναφέρονται σε ένα περιοδικό σήμα.

Η κωδικοποίηση της πληροφορίας πραγματοποιείται με την κωδικοποίηση της ταλάντωσης του

σήματος.

Το μοντέλο αυτό έχει προταθεί για τον

ιππόκαμπο, το οσφρητικό σύστημα, καθώς

επίσης και για άλλες περιοχές του εγκεφάλου,

όπου είναι συχνά τα φαινόμενα ταλαντώσεων.

Page 82: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

– Εφαρμογές SNN

Κωδικοποίηση Πληροφοριών

Resonant Burst Model

Ο Izhikevich το 2002 πρότεινε ότι ο προσδιορισμός της συχνότητας μιας έκρηξη spikes μπορεί να

προσδιορίσει τους ενεργούς νευρώνες που συμμετέχουν σε αυτήν.

Το φαινόμενο αυτό μπορεί να παρέχει έναν αποτελεσματικό μηχανισμό για την επιλεκτική

επικοινωνία μεταξύ των νευρώνων.

Xρησιμοποιώντας το φαινόμενο του

συντονισμού, ο Izhikevich έδειξε ότι μια

σύντομη ριπή από spikes μπορεί να

προκαλέσει ισχυρή μετασυναπτική απόκριση

εάν η συχνότητα ριπής συντονίζεται με τις

συχνότητες των ταλαντώσεων του δυναμικού

της μεμβράνης των νευρώνων-στόχων.

Αντίθετα, η ίδια έκρηξη θα είχε αμελητέα

επίδραση στο μετασυναπτικό δυναμικό της

μεμβράνης, αν η έκρηξη δεν ήταν

συντονισμένη.

Page 83: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

– Εφαρμογές SNN

Εκπαίδευση

O βασικός μηχανισμός μάθησης και μνήμης στα SNN είναι η συναπτική πλαστικότητα. Η ικανότητα

δηλαδή αναπροσαρμογής των συναπτικών συνδέσεων μεταξύ των νευρώνων.

Το 1949 ο Hebb εξέφρασε σε μαθηματικούς όρους το πώς η αναπροσαρμογή των συνάψεων μπορεί να

χρησιμοποιηθεί στην αποθήκευση πληροφοριών: Δwji∞νiνj (Hebbian Learning Rule).

Τύποι εκπαίδευσης

Unsupervised learning

Supervised learning

Reinforcement learning

Όπου Δwji η αλλαγή της αντοχής της συναπτικής σύζευξης wji μεταξύ του προσυναπτικού i και του

μετασυναπτικού νευρώνα j και νi, νj αντιπροσωπεύουν τις δραστηριότητες αυτών των νευρώνων.

Page 84: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

– Εφαρμογές SNN

Unsupervised learning

Γενικοί κανόνες

Η προκύπτουσα μεταβολή με την μορφή συνάρτησης στην συναπτική αποτελεσματικότητα, μετά

από αρκετές επαναλήψεις ενός πειράματος σε σχέση με τον χρόνο, ονομάζεται παράθυρο

μάθησης (learning window).

Σημαντικό ρόλο στη συναπτική προσαρμογή παίζει ο τρόπος αλληλεπίδρασης μεταξύ των

προσυναπτικών και μετασυναπτικών spikes καθώς και ο κατάλληλος χρονισμός τους.

STDP (Spike-Timing-Dependent-Plasticity)

Στις περιπτώσεις που ένα προσυναπτικό spike προηγείται ενός μετασυναπτικού, (long-term

potentiation (LTP)) παρατηρείται ενδυνάμωση των συνάψεων, ενώ η αντίστροφη σειρά προκαλεί

αποδυνάμωση (long-term depression (LTD)).

Page 85: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

– Εφαρμογές SNN

Unsupervised learning

STDP (Spike-Timing-Dependent-Plasticity)

W. Gerstner. What’s Different with Spiking Neurons? HAK Mastebroek, Kluwer Academic, 2001

Page 86: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

– Εφαρμογές SNN

Unsupervised learning

Anti-STDP (anti-Hebbian plasticity)

Έχει παρατηρηθεί αποδυνάμωση των συνάψεων στις περιπτώσεις άφιξης ερεθισμού στο

προσυναπτικό νευρώνα σε ελάχιστο χρόνο πριν εκδηλωθεί το μετασυναπτικό spike και το

σντιστροφο.

Page 87: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

– Εφαρμογές SNN

Supervised learning

Supervised Hebbian Learning (SHL)

Σύμφωνα με την μέθοδο αυτή, η spike-based Hebbian διαδικασία, «επιβλέπεται» από ένα

πρόσθετο σήμα – δάσκαλο το οποίο υποδεικνύει σε ποια ακριβώς χρονικά διαστήματα θα

πρέπει ο μετασυναπτικός νευρώνας να εκτελέσει spikes και σε ποια να παραμείνει αδρανής.

Το σήμα – δάσκαλος μεταδίδεται συνήθως στο νευρώνα με τη μορφή των συναπτικών ρευμάτων

ή ως εμβόλιμο ενδοκυτταρικό ρεύμα.

ReSuMe

Και στην περίπτωση αυτή ένα σήμα – δάσκαλος διαμορφώνει επιβλέποντας την συναπτική

πλαστικότητα, έχοντας επίδραση στο μετασυναπτικό δυναμικό της μεμβράνης του σώματος του

νευρώνα αλλάζοντας τα συναπτικά βάρη με βάση την παρακάτω εξίσωση:

Sd(t) is the target spike train

Sj(t) is the output spike train

Si(t) is the low-pass filtered input spike train

Page 88: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

– Εφαρμογές SNN

Supervised learning

SpikeProp

Ο αλγόριθμος αυτός προσπαθεί να μιμηθεί τον ενδεδειγμένο από τα 2ης γενιάς νευρωνικά δίκτυα

αλγόριθμο error backpropagation, ενώ έχει εφαρμογή σε multi-layer SNN.

Ο κύριος περιορισμός της μεθόδου, αφορά την υπόθεση ότι ο κάθε νευρώνας εκτελεί spike μόνο

μία φορά κατά τη διάρκεια ενός κύκλου προσομοίωσης, ενώ δεν λαμβάνεται υπόψη η χρονική

πορεία του δυναμικού της μεμβράνης μετά την εκπυρσοκρότηση.

Το SpikeProp δίκτυο μοιάζει με ένα σύνηθες feed-forward δίκτυο, στο οποίο όμως κάθε σύνδεση

έχει έναν σταθερό αριθμό συνάψεων καθυστέρησης, με διαφορετικά βάρη και καθυστερήσεις η

κάθε μία.

Στο δίκτυο αυτό μόνο τα βάρη μπορούν να εκπαιδευθούν, ενώ οι καθυστερήσεις είναι από πριν

προσδιορισμένες.

Page 89: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

– Εφαρμογές SNN

Reinforcement learning

Η ενισχυμένη μάθηση βασίζεται σε διαδικασίες ανταμοιβής σε σχέση με το αποτέλεσμα.

Page 90: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

Μοντέλα Προσομοίωσης Βιολογικών Νευρώνων

– Για τη μαθηματική περιγραφή των βασικών ιδιοτήτων των νευρικών κυττάρων και κυρίως του

μεμβρανικού δυναμικού, έχουν αναπτυχθεί υπολογιστικά μοντέλα προσομοίωσης των

λειτουργικών ιδιοτήτων και αποκρίσεων των βιολογικών νευρώνων, με σκοπό την γενική

περιγραφή και πρόβλεψη βιολογικών διεργασιών.

– Τα γνωστότερα μοντέλα είναι:

Hodgkin-Huxley

Integrate & Fire

FitzHugh-Nagumo

Morris-Lecar

Hindmarch-Rose

Izhikevich

− Ανάλογα την εφαρμογή χρησιμοποίησης, εμφανίζουν πλεονεκτήματα και μειονεκτήματα.

− Η κύριες παράμετροι που πρέπει να ληφθούν υπόψιν κατά τη σχεδίαση βιολογικού δικτύου

είναι:

Η υπολογιστική απλότητα του μοντέλου.

Η βιολογική αληθοφάνεια (να παράγουν ένα ευρύ σύνολο από πρότυπα ΔΕ).

Page 91: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

Μοντέλα Προσομοίωσης Βιολογικών Νευρώνων

– Hodgkin-Huxley

Η μαθηματική περιγραφή του μοντέλου συνοψίζεται σε ένα σύστημα διαφορικών

εξισώσεων με παραμέτρους τα ηλεκτρικά χαρακτηριστικά του νευρώνα.

Μελετώντας τα χαρακτηριστικά και τον τρόπο παραγωγής ΔΕ ανακάλυψαν ότι συμβάλουν

συγκεκριμένες ιοντικές ροές της κυτταρικής μεμβράνης, με τη βοήθεια καναλιών ιόντων.

Στο πρότυπο μοντέλο τους, οι ερευνητές ταυτοποίησαν τρία είδη διαύλων: από ένα

δίαυλο για τα ιόντα Na+ και K+ ενώ έναν ακόμη δίαυλο τον οποίο ονόμασαν “κανάλι

διαρροής”.

Το μοντέλο συνοψίζεται σε ένα σύστημα των τεσσάρων συνήθων διαφορικών εξισώσεων:

Οι 4 διαφορικές εξισώσεις μοντελοποιούν τη λειτουργία ενός νευρώνα, που οι ιοντικοί

δίαυλοι και οι συνάψεις βρίσκονται στο κυτταρικό σώμα, χωρίς να λαμβάνονται υπόψη οι

δενδρίτες.

Ανεξάρτητη μεταβλητή είναι ο χρόνος t

Εξαρτημένες είναι το δυναμικό μεμβράνης V

και οι μεταβλητές κατάστασης των πυλών:

m πύλη ενεργοποίησης Na+

h πύλη απενεργοποίησης Na+

N πύλη ενεργοποίησης Κ+

Page 92: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

Μοντέλα Προσομοίωσης Βιολογικών Νευρώνων

– Integrate & Fire Models

Integrate & Fire

Το απλό μοντέλο ολοκλήρωσης και πυροδότησης χρησιμοποιείται κυρίως για την

προσομοίωση της παραγωγής ΔΕ.

Λαμβάνονται υπόψη οι μεταβλητές του δυναμικού μεμβράνης (V) και του ρεύματος

που διαρρέει τη μεμβράνη (I).

Περιγράφεται από την εξίσωση:

Στο μοντέλο αυτό, ο νευρώνας πυροδοτεί όταν το δυναμικό της μεμβράνης

αυξάνεται τόσο ώστε να φτάσει μια προκαθορισμένη τιμή κατωφλίου, θ.

Τα ΔΕ θεωρούνται ότι χαρακτηρίζονται μόνο από το χρόνο πυροδότησης (firing

time) ο οποίος ορίζεται ως:

Αμέσως μετά την πυροδότηση, το δυναμικό μεμβράνης τίθεται σε μια νέα τιμή Vr<θ,

η οποία έχει καθοριστεί από πριν.

Η παράμετρος Cm εκφράζει τη χωρητικότητα

της κυτταρικής μεμβράνης.

Page 93: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

Μοντέλα Προσομοίωσης Βιολογικών Νευρώνων

– Integrate & Fire Models

Leaky Integrate & Fire

Το απλό IF δεν λαμβάνει υπόψη τη βιολογική ιδιότητα της περιορισμένης μνήμης.

Για να αντιμετωπιστεί η έλλειψη αυτή, εισήχθη μια παραλλαγή αυτού η οποία

ονομάζεται μοντέλο ολοκλήρωσης και πυροδότησης με απώλειες.

Στην ουσία, προστίθεται μια ωμική αντίσταση μεμβράνης, Rm, η οποία εκφράζει

έναν παράγοντα απωλειών.

Το LIF περιγράφεται από την εξίσωση:

Όπως και στο IF, αμέσως μετά την πυροδότηση, το δυναμικό μεμβράνης τίθεται σε

μια νέα τιμή Vr < θ, η οποία έχει καθοριστεί από πριν.

Τα IF & LIF σε καμία περίπτωση δεν μπορούν να

αναπαράγουν την ποικιλία εκφορτιστικών

μοτίβων που εμφανίζονται σε πραγματικούς

νευρώνες, όπως εκφορτίσεις ριπής, μεταβολές

του κατωφλίου πυροδότησης κ.α

Page 94: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

Μοντέλα Προσομοίωσης Βιολογικών Νευρώνων

– Integrate & Fire Models

Άλλα μοντέλα βασιζόμενα στο Integrate & Fire

Σκοπός αυτών των προσθηκών είναι να καταστεί δυνατή η αναπαραγωγή όσο το

δυνατόν περισσότερων εκφορτιστικών προτύπων.

Μία τέτοια προσπάθεια εισάγει έναν όρο που ονομάζεται απόλυτη περίοδος

αδράνειας, Δabs, αμέσως μετά την πυροδότηση. Η παράμετρος αυτή εκφράζει την

αδυναμία πυροδότησης του νευρώνα αμέσως μετά από πυροδότηση.

Σε μια άλλη εκδοχή του αρχικού μοντέλου, η περίοδος αδράνειας είναι μια

συνάρτηση η οποία εκφράζει το γεγονός ότι το κατώφλι είναι δυναμικό (συνήθως

υψηλό αμέσως μετά από πυροδότηση και μειώνεται σταδιακά έως την

προκαθορισμένη τιμή). Κάτι τέτοιο επιτρέπει την πρόκληση ΔΕ σχεδόν αμέσως

μετά από πυροδότηση, ωστόσο η διέγερση που απαιτείται για να συμβεί αυτό

πρέπει να είναι ιδιαιτέρως σημαντική.

Τέλος, υπάρχουν εκδοχές όπου έχουν εισαχθεί επιπλέον εξισώσεις ή μεταβλητές

στο μοντέλο ολοκλήρωσης & πυροδότησης, ώστε να παρουσιάζει δυναμικές

συμπεριφορές, όπως εκφορτίσεις ριπής.

Μία πιο γενική μορφή είναι το μη-γραμμικό μοντέλο IF:

Oι F(V) και G(V) εκφράζουν μη γραμμικές μεταβολές του δυναμικού μεμβράνης

Page 95: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

Μοντέλα Προσομοίωσης Βιολογικών Νευρώνων

– Spike Response Model

Το μοντέλο απόκρισης δυναμικού ενεργείας αποτελεί γενίκευση του IF

H κατάσταση ενός νευρώνα i περιγράφεται από τη μεταβλητή ui που εκφράζει το

δυναμικό της μεμβράνης του.

Απουσία εκφορτιστικής δραστηριότητας, η μεταβλητή αυτή έχει την τιμή ηρεμίας urest =

0.

Κάθε εισερχόμενο στο νευρώνα ΔΕ προκαλεί μεταβολή στην τιμή της ui και ύστερα από

κάποιο χρόνο η μεταβλητή επιστρέφει στην τιμή ηρεμίας της.

Αν θεωρήσουμε ότι ο υπό μελέτη νευρώνας i έχει πυροδοτήσει για τελευταία φορά τη

στιγμή lastit, μετά από τη στιγμή αυτή, το δυναμικό μεμβράνης του συναρτήσει του

χρόνου θα δίνεται από τη σχέση:

Το συγκεκριμένο μοντέλο δεν είναι κατάλληλο για τη μελέτη περιπτώσεων όπου είτε το

κατώφλι εξαρτάται από το ρεύμα εισόδου που διεγείρει το νευρώνα, είτε θα έπρεπε να

εμφανίζεται καθυστερημένη εκκίνηση ΔΕ.

Όλοι οι όροι εξαρτώνται από το χρόνο που έχει μεσολαβήσει από την τελευταία πυροδότηση

Η συνάρτηση ε μπορεί να εκφράσει ευοδωτικό ή ανασταλτικό μετασυναπτικό δυναμικό

Το κατώφλι μπορεί να εξαρτάται από το χρόνο της τελευταίας πυροδότησης (δυναμικό κατώφλι)

Page 96: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

Μοντέλα Προσομοίωσης Βιολογικών Νευρώνων

– Fitzhugh-Nagumo

Στο μοντέλο αυτό γίνεται μια ομαδοποίηση όλων των μεταβλητών του μοντέλου Hodgkin-

Huxley, οι οποίες εξελίσσονται σε παρόμοια κλίμακα χρόνου.

Το δυναμικό μεμβράνης, V(t), περιγράφεται από το παρακάτω σύστημα διαφορικών

εξισώσεων:

Το μοντέλο παράγει πληθώρα εκφορτιστικών μοτίβων και έχει ικανοποιητική βιολογική

εγκυρότητα.

Η μεταβλητή w ονομάζεται μεταβλητή

επαναφοράς.

Οι υπόλοιπες παράμετροι έχουν

υπολογιστεί πειραματικά.

Page 97: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

Μοντέλα Προσομοίωσης Βιολογικών Νευρώνων

– Hindmarsh-Rose

Το μοντέλο έχει ως σκοπό την περιγραφή της συμπεριφοράς των νευρώνων με

εκφορτίσεις ριπής που παρατηρούνται σε πειράματα με έναν νευρώνα.

Περιγράφεται από το σύστημα διαφορικών εξισώσεων:

Όπου F, G, H συγκεκριμένες συναρτήσεις, ανάλογα

με την επιλογή των οποίων, το μοντέλο μπορεί να

παράγει μεγάλη ποικιλία μοτίβων εκφόρτισης.

H συνάρτηση V(t) αναπαριστά το δυναμικό της

μεμβράνης

Η συνάρτηση u(t) ονομάζεται μεταβλητή

εκφορτίσεων (spiking variable) και αναπαριστά το

ρυθμό διαπέρασης της μεμβράνης από τα ιόντα Να+

και Κ+

Η συνάρτηση w(t) ονομάζεται μεταβλητή εκφόρτισης

ριπής (bursting variable) και αναπαριστά τον τρόπο

διαπέρασης της μεμβράνης από αργά κανάλια.

Page 98: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

Μοντέλα Προσομοίωσης Βιολογικών Νευρώνων

– Morris-Lecar

Είναι ένα σχετικά απλό δισδιάστατο μοντέλο, που περιγράφει τη νευρική δραστηριότητα

της γιγαντιαίας μυϊκής ίνας της πεταλίδας, έχει παραμέτρους βιολογικά μετρήσιμες και

παράγει μεγάλη ποικιλία μοτίβων εκφόρτισης.

Αποτελείται από μια εξίσωση με στιγμιαία ενεργοποίηση του ρεύματος των ιόντων Ca++

και μια επιπλέον εξίσωση που περιγράφει τη βραδύτερη ενεργοποίηση του ρεύματος των

ιόντων Κ+:

Οι τιμές όλων των παραμέτρων

είναι σαφώς προσδιορισμένες

Page 99: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

Μοντέλα Προσομοίωσης Βιολογικών Νευρώνων

– Izhikevich

Το γενικό μοντέλο συνδυάζει υπολογιστική απλότητα και δυνατότητα μοντελοποίησης μιας

ευρύτατης συλλογής από νευρώνες με διαφορετική μεταξύ τους προτυποποίηση

πυροδότησης ΔΕ (πχ. νευρώνες ριπής, ολοκληρωτές νευρώνες κα.).

Αποτελείται από ένα σύστημα δύο διαφορικών εξισώσεων και μία βοηθητική συνθήκη. Οι

εξισώσεις περιέχουν τέσσερις ελεύθερες παραμέτρους, ενώ ανάλογα με τις τιμές που

λαμβάνουν αυτές οι παράμετροι, το μοντέλο είναι σε θέση να προσομοιώσει την

πυροδότηση ΔΕ διαφόρων τύπων από νευρώνες οι οποίοι συναντώνται στον εγκεφαλικό

φλοιό.

Το δισδιάστατο σύστημα των διαφορικών εξισώσεων είναι:

Η μεταβλητή V εκφράζει την τιμή του

δυναμικού μεμβράνης του νευρώνα σε mV.

Μετά την πυροδότησης ενός ΔΕ, το

δυναμικό μεμβράνης V αυξάνει μέχρι την

τιμή των 30 mV

Page 100: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

Μοντέλα Προσομοίωσης Βιολογικών Νευρώνων

– Πρότυπα ΔΕ που παράγονται από το μοντέλο Izhikevich

Page 101: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

Σύγκριση Μοντέλων Προσομοίωσης Βιολογικών Νευρώνων

− Η κύριες παράμετροι σύγκρισης που πρέπει να ληφθούν υπόψιν είναι:

Η υπολογιστική απλότητα του μοντέλου.

Η βιολογική αληθοφάνεια (να παράγουν ένα ευρύ σύνολο από πρότυπα ΔΕ).

Page 102: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

Σύγκριση Μοντέλων Προσομοίωσης Βιολογικών Νευρώνων

Page 103: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Spiking Neural Networks

– Εφαρμογές SNN

Χρησιμοποίηση

Real-world data classification

2-layer feedforward network for data clustering and classification.

Image recognition

Using a feedforward network with the STDP-learning and the rank-order coding model.

Odor recognition

Hybrid models.

Spatial navigation

Supervised learning

Mental exploration of the environment

All-to-all excitatory connections

Motor control and trajectory tracking

Liquid state machine network

Decision making with application to financial market

SNN, supervised learning and fuzzy reasoning

Page 104: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος

Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Στατιστικές Μέθοδοι Εκπαίδευσης

Page 105: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Στατιστικές Μέθοδοι Εκπαίδευσης

Σκοπός

Στο κεφάλαιο αυτό εισάγεται μιά νέα κατηγορία νευρωνικών δικτύων τα οποία βασίζονται στην Στατιστική Φυσική. Ο στόχος

είναι να περιγραφούν οι βασικές ιδέες οι προερχόμενες από την Φυσική και να δούμε πως χρησιμοποιούνται για την

εκπαίδευση δικτύων με στατιστικό τρόπο.

Εισάγεται απαραίτητα η έννοια της προσομοίωσης με την τεχνική Monte Carlo που είναι η βάση της τεχνικής αυτής.

Αποδεικνύεται επίσης πως τα δίκτυα αυτά μπορούν να χρησιμοποιηθούν για προβλήματα βελτιστοποίησης.

Απώτερος σκοπός μας πάντα είναι να βρούμε έναν ακόμα τρόπο εκπαίδευσης, που πιθανόν για συγκεκριμένα προβλήματα

να είναι ο πλέον κατάλληλος.

Τα στατιστικά δίκτυα είναι ένα καλό παράδειγμα που δείχνει πως οι γνώσεις από μία άλλη επιστήμη μπορούν να

χρησιμοποιηθούν άμεσα στα νευρωνικά δίκτυα και να προτείνουν έτσι ένα νέο τρόπο εκπαίδευσης. Θα παρουσιάσουμε τις

βασικές ιδέες της τεχνικής της προσομοίωσης, όπως αναπτύχθηκαν πριν πενήντα χρόνια και που σήμερα

χρησιμοποιούνται σε μεγάλο βαθμό σχεδόν σε όλες τις επιστήμες.

Εισάγεται η πιθανότητα Boltzmann και διάφορες φυσικές ιδιότητες, όπως η θερμοκρασία, η ενέργεια κτλ. για τις οποίες

δημιουργούμε «νευρωνικά ανάλογα» και τα χρησιμοποιούμε με παράλληλο τρόπο, όπως και στην Φυσική. Το νέο

χαρακτηριστικό που συναντάται για πρώτη φορά από όλες τις κατηγορίες δικτύων που είδαμε είναι η σημασία του

στατιστικού αποτελέσματος και η έννοια ότι με την διαδικασία αυτή είναι πιθανόν μερικές φορές κατά την εκπαίδευση το

σφάλμα να μεγαλώνει αντί να ελαττώνεται, πράγμα που είναι όμως απαραίτητο χαρακτηριστικό της μεθόδου αυτής. Αυτό

μας οδηγεί στο μεγάλο πλεονέκτημα ότι τα στατιστικά δίκτυα αποφεύγουν ένα από τα πιο συχνά συναντώμενα

προβλήματα, αυτό των τοπικών ελαχίστων. Αυτό δεν σημαίνει όμως ότι είναι η τέλεια μεθόδος χωρίς προβλήματα. Ο

αλγόριθμος που χρησιμοποιείται παρουσιάζεται σε διάγραμμα ροής και περιγράφει μία μορφή προσομοίωσης που είναι

κλασικό παράδειγμα της τεχνικής Monte Carlo.

Page 106: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Στατιστικές Μέθοδοι Εκπαίδευσης

Στατιστικά Δίκτυα

Χρησιμοποιούν ιδέες από την Στατιστική Φυσική για να εκπαιδεύσουν ένα νευρωνικό δίκτυο στα πρότυπα που τουσ

παρουσιάζονται. Κατά την διάρκεια της εκπαίδευσης πρέπει να αλλάζουν οι τιμές των βαρών έτσι ώστε το δίκτυο να δίδει το

σωστό αποτέλεσμα κάθε φορά που παρουσιάζεται ένα πρότυπο.

Η Στατιστική Φυσική είναι η κατεξοχήν περιοχή της Φυσικής που χρησιμοποιεί την τυχαιότητα στα φαινόμενα που εξετάζει.

Υπεισέρχεται στον μικρόκοσμο και στις ατομικές κινήσεις των μονάδων της ύλης (άτομα, μόρια). Θεωρεί ένα πολύ μεγάλο

αριθμό δειγμάτων για τα οποία επιχειρεί πάρα πολλές πραγματοποιήσεις ή μετρήσεις του φαινομένου που μελετάται. Από

τις μετρήσεις αυτές υπολογίζει τις κατανομές και τις μέσες τιμές των ιδιοτήτων (δηλ. τον μέσο όρο) που μελετά. Μπορεί να

αποδειχθεί όμως ότι ο τρόπος αυτός στο τέλος έχει ως αποτέλεσμα η ιδιότητα που υπολογίζεται να είναι πολύ κοντά στην

πραγματικότητα, δηλ σε αυτήν που αναμένεται και θεωρητικά και σε αυτήν που μετράται πειραματικά με άλλους μη

στατιστικούς τρόπους. Επειδή ο αριθμός των υπολογισμών είναι πολύ μεγάλος, είναι απαραίτητη η χρήση ΗΥ.

Η διαφορά των στατιστικών μεθόδων από τις άλλες μεθόδους, όπως λ.χ. την μέθοδο της οπισθοδιάδοσης, έγκειται στο ότι

στις άλλες μεθόδους ακολουθούμε μία αυστηρή διαδικασία, χρησιμοποιώντας μαθηματικές εξισώσεις όπου αλλάζουμε τα

βάρη ανάλογα με τα σφάλματα που παίρνουμε στην έξοδο. Η καινοτομία είναι ότι αλλάζουμε τα βάρη με τυχαίο τρόπο και

παίρνουμε τις αποφάσεις με βάση κάποια κριτήρια, ακολουθώντας όμως κάποιο συγκεκριμένο αλγόριθμο.

Οταν λέμε τυχαίο τρόπο, εννοούμε ότι επιλέγουμε τυχαίους αριθμούς από μία ομοιόμορφη κατανομή τυχαίων αριθμών και

τους χρησιμοποιούμε κατευθείαν στον αλγόριθμο για να πάρουμε σημαντικές αποφάσεις που επηρρεάζουν την εκπαίδευση

του δικτύου. Η στατιστική αυτή διαδικασία λέμε ότι αποτελεί μία μέθοδο προσομοίωσης (simulation) του προβλήματος. Οι

μέθοδοι προσομοίωσης χρησιμοποιούνται όλο και περισσότερο σε προβλήματα των φυσικών επιστημών τα τελευταία

χρόνια. Μπορούμε λοιπόν με σιγουριά να πούμε ότι αν το πρόβλημά μας χρησιμοποιεί τυχαίους αριθμούς, τότε έχουμε

μέθοδο προσομοίωσης.

Page 107: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Στατιστικές Μέθοδοι Εκπαίδευσης

Στατιστικά Δίκτυα

Υπάρχουν απλοί αλλά και πιο περίπλοκοι αλγόριθμοι εκπαίδευσης και ανάλογα με την περιπλοκότητα τους έχουν και την

σχετική επιτυχία, αλλά και προβλήματα ή δυσκολίες στην εκπαίδευση. Στην πιο απλή μορφή, πρώτα αλλάζουμε τα βάρη με

τυχαίο τρόπο και κατόπιν υπολογίζουμε το σφάλμα. Αν η τυχαία αλλαγή κάνει το σφάλμα μικρότερο, τότε αυτό φέρνει το

δίκτυο πιο κοντά στην εκπαίδευση του και επομένως κρατάμε την αλλαγή αυτή. Αν όμως μεγαλώνει το σφάλμα, τότε την

απορρίπτουμε και προχωράμε σε μία άλλη τυχαία αλλαγή. Ένας τέτοιος αλγόριθμος περιλαμβάνει τα εξής στάδια:

Θεωρούμε μία ομάδα προτύπων, τα οποία εισέρχονται στο επίπεδο εισόδου. Τα πρότυπα παρουσιάζονται ένα–ένα,

ως συνήθως. Με μία μη–γραμμική συνάρτηση βρίσκουμε την έξοδο.

Συγκρίνουμε την έξοδο με τον στόχο, για κάθε πρότυπο. Βρίσκουμε το άθροισμα των τετραγώνων της διαφοράς και

πρέπει το άθροισμα αυτό να ελαχιστοποιηθεί.

Διαλέγουμε ένα w τυχαία και το αλλάζουμε επίσης τυχαία, κατά ένα μικρό όμως ποσοστό. Αν η αλλαγή αυτή ελαττώνει

το άθροισμα των τετραγώνων, τότε την κρατάμε, εάν όχι τότε το w αυτό δεν αλλάζει καθόλου, αλλά συνεχίζει να έχει

την προηγούμενη τιμή του.

Διαλέγουμε τυχαία ένα άλλο w και επαναλαμβάνουμε την συνολική διαδικασία των παραπάνω τριών βημάτων τόσες

φορές όσες χρειάζεται το δίκτυο για να εκπαιδευθεί.

Page 108: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Στατιστικές Μέθοδοι Εκπαίδευσης

Στατιστικά Δίκτυα

Η διαδικασία αυτή εκ πρώτης όψεως φαίνεται σωστή και ότι εξασφαλίζει την

λύση που εκπαιδεύει το δίκτυο. Υπάρχει όμως πάντα το πρόβλημα των

τοπικών ελαχίστων, που είδαμε στα προηγούμενα κεφάλαια. Συγκεκριμένα,

έστω ότι μειώνοντας το σφάλμα το σύστημα βρίσκεται στο σημείο Α. Εάν οι

τυχαίες αλλαγές στο w είναι μικρές, τότε κάθε αλλαγή θα απορρίπτεται διότι

με μικρές αλλαγές δεν μπορεί να απεγκλωβισθεί (να ξεπεράσει το ύψος του

εμποδίου) και το σφάλμα έτσι δεν μπορεί να ελαττωθεί. Το σύστημα θα

συνεχίσει να έχει τα w με τα οποία θα παραμένει για πάντα στο Α και δεν θα

βρει το Β, που είναι το πραγματικό σημείο που θέλουμε το δίκτυο να φθάσει.

Λέμε ότι το σύστημα παγιδεύεται σε ένα τοπικό ελάχιστο.

Εάν, για να αποφύγουμε την δυσκολία αυτή, κάνουμε τις μεταβολές στα w

να είναι μεγάλες, τότε το σύστημα θα επισκέπτεται συχνά και το Α και το Β,

αλλά επειδή οι αλλαγές είναι μεγάλες, τα μεγάλα βήματα θα το καθιστούν

σχετικά εύκολο για το σύστημα να ξεφεύγει συχνά και από το Α και από το Β

και έτσι δεν θα κατασταλάξει στο ελάχιστο, αλλά θα επισκέπτεται όλα τα

σημεία στην καμπύλη του σφάλματος. Ποτέ όμως δεν θα μπορεί να

παγιδευθεί σε ένα ελάχιστο, με αποτέλεσμα το δίκτυο να μην μπορεί να

εκπαιδευθεί. Έτσι, παρόλο που η γενική διαδικασία φαίνεται εκ πρώτης

όψεως σωστή, για τους λόγους αυτούς δεν είναι ικανοποιητική και χρειάζεται

απαραίτητα κάποια τροποποίηση.

Page 109: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Στατιστικές Μέθοδοι Εκπαίδευσης

Στατιστικά Δίκτυα

Μία καλύτερη τακτική είναι να μην κρατήσουμε το μέγεθος των βημάτων σταθερό, αλλά να αρχίσουμε με μεγάλα βήματα, τα

οποία όμως σιγά–σιγά να μικραίνουν, και έτσι το σύστημα στην αρχή μεν να μπορεί να απο–παγιδεύεται από τα τοπικά

ελάχιστα, αλλά τελικά, μετά από μεγάλο χρόνο εκπαίδευσης, να παραμένει στο ολικό ελάχιστο.

Στην αρχή έχουμε μεγάλες μεταβολές, από τις οποίες κρατάμε μόνο αυτές που ελαττώνουν το σφάλμα.

Ακολούθως το μέγεθος του βήματος μικραίνει και τελικά φθάνουμε στο ολικό ελάχιστο.

Η διαδικασία αυτή είναι ανάλογη μιας γνωστής διεργασίας στην Φυσική η οποία περιγράφει το πως (δηλ. με ποιο ρυθμό)

ψύχεται ένα μέταλλο ή ένας κρύσταλλος, αλλά και σε πολλές άλλες διαφορετικές περιπτώσεις.

Η διαδικασία αυτή λέγεται ανόπτηση (annealing).

Σε ένα σύστημα όπως το νευρωνικό δίκτυο ελαττώνεται η παράμετρος Τ, που είναι μία αφηρημένη παράμετρος που

αντιστοιχεί στην θερμοκρασία σε ένα πρόβλημα Φυσικής.

Η αντίστοιχη διαδικασία λέγεται προσομοιωμένη ανόπτηση (simulated annealing) και το μοντέλο που την περιγράφει είναι

και αυτό ένα μοντέλο προσομοίωσης.

Page 110: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Στατιστικές Μέθοδοι Εκπαίδευσης

Στατιστικά Δίκτυα

Ας δούμε λοιπόν τι γίνεται σε ένα από τα συνήθη αυτά φαινόμενα, στην κρυστάλλωση, δηλ. το φαινόμενο που περιγράφει

την δημιουργία του στερεού κρυστάλλου από τον υγρό κρύσταλλο με την πτώση της θερμοκρασίας από μια υψηλή σε μια

χαμηλή τιμή.

Όταν ένα υλικό είναι στην υγρή κατάσταση, τα μόριά του έχουν υψηλή σχετικά ενέργεια και κάνουν πολλές βίαιες κινήσεις.

Καθόσον σιγά–σιγά πέφτει η θερμοκρασία του συστήματος, πέφτει και η ενέργεια των μορίων, των οποίων οι κινήσεις τώρα

είναι πιο μικρές, και με κάποιο ρυθμό το υγρό σύστημα μετατρέπεται σε στερεό, στην κατάσταση κατά την οποία οι κινήσεις

των μορίων είναι μικρές και περιορίζονται από το πλέγμα στο οποίο τώρα βρίσκονται.

Όταν το σύστημα είναι κοντά στην θερμοκρασία μεταβολής της φάσης, τότε και οι πιο μικρές αλλαγές είναι πολύ κρίσιμες.

Από την εμπειρία ξέρουμε ότι τα αποτελέσματα θα είναι διαφορετικά αν ο ρυθμός της μεταβολής είναι γρήγορος ή αργός.

Όταν ο ρυθμός είναι αργός τότε δημιουργείται ένα απόλυτα κρυσταλλικό υλικό, καθαρό, διαφανές, με μεγάλο βαθμό

συμμετρίας. Όταν ο ρυθμός είναι γρήγορος, τότε δημιουργείται ένας πρόχειρος κρύσταλλος, με μεγάλες ατέλειες,

αδιαφανής, χωρίς συμμετρία.

Το ίδιο συμβαίνει και στο νευρωνικό δίκτυο. Όταν το δίκτυο είναι στην αρχή της εκπαίδευσης, τότε τα βήματα μπορεί να είναι

μεγάλα, όταν όμως είναι κοντά στο τελικό σημείο εκπαίδευσης, τότε πρέπει τα βήματα να είναι μικρά, ώστε να μην υπάρχει

ο φόβος να ξεφύγει το σύστημα από την κατάσταση στην οποία έχει ήδη φτάσει.

Το σημαντικότερο πρόβλημα λοιπόν είναι να βρούμε τον σωστό ρυθμό εκπαίδευσης, ο οποίος δεν πρέπει να είναι ούτε

πολύ γρήγορος ούτε πολύ αργός. Αυτό βέβαια δεν είναι καθόλου εύκολο γιατί δεν υπάρχουν κανόνες για το πως πρέπει να

γίνει και παρόλο που η ιδέα αυτή φαίνεται καλύτερη από την προηγούμενη, στην πράξη δεν εγγυάται ότι το δίκτυο θα

εκπαιδευθεί κατάλληλα.

Page 111: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Στατιστικές Μέθοδοι Εκπαίδευσης

Εκπαίδευση Boltzman

Ο Λούντβιχ Μπόλτσμαν (Ludwig Eduard Boltzmann, 20 Φεβρουαρίου 1844 – 5 Σεπτεμβρίου 1906) ήταν Αυστριακός

θεωρητικός φυσικός και φιλόσοφος.

Ο Μπόλτσμαν υπήρξε από τους θεμελιωτές της Στατιστικής Φυσικής και Θερμοδυναμικής.

Συνδύασε τη Θεωρία πιθανοτήτων στον 2ο Θερμοδυναμικό Νόμο, αποδεικνύοντας ότι η πιθανότερη κατάσταση ενός

θερμοδυναμικού συστήματος είναι η κατάσταση ισορροπίας.

Απέδειξε το θεώρημα ισοκατανομής της ενέργειας, (Νόμος Μάξουελ-Μπόλτσμαν) και ήταν ένας από τους σημαντικότερους

υποστηρικτές της Ατομικής Θεωρίας όταν πολλοί μεγάλοι επιστήμονες αμφισβητούσαν ακόμα την ύπαρξη των ατόμων.

Ο δεύτερος θερμοδυναμικός νόμος είναι ο ένας σημαντικός νόμος

της Θερμοδυναμικής. Υπάρχουν δύο ισοδύναμες βασικές διατυπώσεις του νόμου:

•Κάθε θερμική μηχανή έχει απώλειες ενέργειας.

•Για τη λειτουργία μιας ψυκτικής μηχανής απαιτείται καταβολή ενέργειας.

Μια θερμική μηχανή αριστερά και μια ψυκτική δεξιά. Σε κάθε

μηχανή το πάνω ορθογώνιο αναπαριστά μια δεξαμενή

ψηλής θερμοκρασίας και το κάτω ορθογώνιο μια δεξαμενή

χαμηλής θερμοκρασίας. Τα βέλη αναπαριστούν τη μεταφορά

ενέργειας. Από αυτό το σχήμα φαίνεται ότι η θερμική μηχανή

είναι το θεωρητικό αντίστροφο της ψυκτικής μηχανής.

Page 112: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Στατιστικές Μέθοδοι Εκπαίδευσης

Εκπαίδευση Boltzman

Μιά πιο εξελιγμένη ιδέα της Στατιστικής Φυσικής μπορεί να χρησιμοποιηθεί για την εκπαίδευση ενός νευρωνικού δικτύου

που έχει γίνει γνωστή τα τελευταία χρόνια κυρίως από την διάδοση της προσομοίωσης στα φυσικά προβλήματα και την

τεχνική Monte–Carlo.

Όπως ξέρουμε από τον γνωστό νόμο του Boltzmann, σε οποιαδήποτε κατάσταση και αν βρίσκεται ένα υλικό, όλα τα μόρια

του δεν έχουν ακριβώς την ίδια ενέργεια, αλλά άλλα έχουν μεγαλύτερη και άλλα μικρότερη ενέργεια. Η κατανομή των

ενεργειών των μορίων υπακούει τον νόμο:

όπου Ε είναι η ενέργεια, P(E) η πιθανότητα το σύστημα να βρίσκεται σε κατάσταση με ενέργεια Ε, k η

σταθερά Boltzmann, και Τ η θερμοκρασία.

Σε υψηλές θερμοκρασίες, κάθε μόριο λέμε ότι έχει μεγάλη θερμική ενέργεια, λόγω του ότι το Τ είναι

στον παρανομαστή του κλάσματος και έτσι P(E) = 1, δηλ. κάθε ενεργειακή κατάσταση είναι πιθανή.

Καθόσον η θερμοκρασία ελαττώνεται, η πιθανότητα να έχουμε μεγάλη Ε μειώνεται και το σύστημα

πέφτει σε μικρές ενεργειακές καταστάσεις.

Page 113: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Στατιστικές Μέθοδοι Εκπαίδευσης

Εκπαίδευση Boltzman

Η εκπαίδευση λοιπόν µε την στατιστική µέθοδο Boltzmann ακολουθεί την παρακάτω διαδικασία:

∆ίνουµε µία τιµή στην παράµετρο Τ του συστήµατος. Στην αρχή έχουµε µεγάλες τιµές του Τ.

Βάζουµε στο επίπεδο εισόδου τα πρότυπα και υπολογίζουµε την έξοδο και το σφάλµα.

Κάνουµε µία τυχαία αλλαγή στα βάρη w και υπολογίζουµε πάλι την έξοδο.

Εάν το σφάλµα µικραίνει κρατάµε την αλλαγή.

Εάν το σφάλµα µεγαλώνει τότε υπολογίζουµε την πιθανότητα P(c) να δεχθούµε την αλλαγή αυτή,

όπου k είναι σταθερά, αντίστοιχη προς την σταθερά Boltzmann και εξαρτάται από το συγκεκριµένο πρόβληµα, Τ είναι η

τεχνητή θερµοκρασία και P(c) είναι η πιθανότητα για µία αλλαγή c στη συνάρτηση σφάλµατος. Στην πράξη το k

απορροφάται από το Τ, ή απλά θεωρείται ότι k = 1.

∆ιαλέγουµε έναν τυχαίο αριθµό r, από µία οµοιόµορφη κατανοµή όπου 0 < r < 1.

Εάν P(c) > r, τότε κρατάµε την αλλαγή. Εάν P(c) < r, τότε η αλλαγή απορρίπτεται και πάµε στο επόµενο βήµα, που

είναι µία νέα αλλαγή στα βάρη w. Η διαδικασία επαναλαµβάνεται.

Page 114: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Στατιστικές Μέθοδοι Εκπαίδευσης

Εκπαίδευση Boltzman

Η καινοτοµία εδώ είναι τα δύο τελευταία βήµατα από τα συνολικά

έξη, δηλ. η σύγκριση του Ρ µε το r. Με την διαδικασία αυτή σε

µερικές περιπτώσεις το σύστηµα πηγαίνει σε κατάσταση

υψηλότερης ενέργειας. Το δίκτυο αποµακρύνεται περισσότερο από

το σηµείο εκπαίδευσης και θα πάρει µεγαλύτερο χρόνο για να

βρούµε τελικά τα σωστά w. Αλλά το πλεονέκτηµα που έχουµε είναι

ότι το δίκτυο µπορεί να ξεφύγει από ένα τοπικό ελάχιστο.

Η διαδικασία αυτή γίνεται για όλα τα βάρη w, ένα προς ένα, µέχρις

ότου το δίκτυο εκπαιδευθεί στο συγκεκριµένο πρότυπο. Κατά την

διάρκεια της διαδικασίας ελαττώνουµε σιγά–σιγά την θερµοκρασία

Τ, µέχρις ότου το σφάλµα ελαχιστοποιηθεί. Ακολούθως

παρουσιάζουµε τα επόµενα πρότυπα, και ακολουθούµε τα ίδια

βήµατα.

Η διαδικασία που ακολουθείται στο διάγραµµα ροής είναι µία

διαδικασία προσοµοίωσης και αρχικά ήταν αυτή που είχε

ονοµασθεί διαδικασία προσοµοίωσης Monte Carlo. Aργότερα

όµως ο όρος Monte Carlo γενικεύθηκε και ουσιαστικά όλες οι

µέθοδοι που χρησιµοποιούν τυχαίους αριθµούς για να πάρουν

σηµαντικές αποφάσεις, όπως είναι η σύγκριση των παραµέτρων Ρ

και r, ονοµάζονται µέθοδοι προσοµοίωσης Monte Carlo.

Page 115: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Στατιστικές Μέθοδοι Εκπαίδευσης

Εκπαίδευση Boltzman

Το µέγεθος την αλλαγής στο w µπορεί να υπολογισθεί µε διάφορους τρόπους, όπως λ.χ. από µία κατανοµή Gauss:

όπου P(w) είναι η πιθανότητα η αλλαγή να έχει µέγεθος w. Βρίσκουµε την συνάρτηση πιθανότητας που

αντιστοιχεί στο P(w). Αυτό δίνεται από το ολοκλήρωµα:

Το ολοκλήρωµα αυτό υπολογίζεται αριθµητικά,και µας δίνει το ∆w. Μετά παίρνουµε έναν τυχαίο αριθµό

r, από µία οµοιόµορφη κατανοµή τυχαίων αριθµών µε όρια το διάστηµα αυτό. Αυτή είναι η τιµή του P(w),

δηλ. P(w) = r, και ακολούθως βρίσκουµε σε ποια τιµή του ∆w αντιστοιχεί η τιµή αυτή.

Αυτή η µέθοδος εκπαίδευσης λέγεται µέθοδος Boltzmann, και το δίκτυο λέγεται και µηχανή Boltzamann.

Page 116: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Στατιστικές Μέθοδοι Εκπαίδευσης

Εκπαίδευση Boltzman

Έχουν γίνει πολλές εργασίες πάνω στο µοντέλο αυτό. Έχει αποδειχθεί ότι ο ρυθµός µε τον οποίο πρέπει να ελαττώνεται η

θερµοκρασία είναι ανάλογος µε το αντίστροφο του λογαρίθµου του χρόνου:

όπου T(t) είναι η θερµοκρασία ως συνάρτηση του χρόνου t, T0 είναι η αρχική θερµοκρασία. Το αποτέλεσµα βέβαια αυτό

σηµαίνει ότι το δίκτυο χρειάζεται µεγάλους χρόνους εκπαίδευσης, πράγµα που το καθιστά µερικές φορές όχι πολύ χρήσιµο.

Page 117: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Στατιστικές Μέθοδοι Εκπαίδευσης

Μέθοδος Ειδικής Θερμότητας

Η ειδική θερµότητα (specific heat), C, στην θερµοδυναµική ορίζεται ως η παράγωγος της ενέργειας ως προς

την θερµοκρασία:

το C δηλώνει κατά πόσο αλλάζει η ενέργεια του συστήµατος µε οποιαδήποτε αλλαγή της θερµοκρασίας. Το C

αλλάζει απότοµα όταν το σύστηµα αλλάζει φάση (λ.χ. από υγρό σε στερεό). Η αλλαγή φάσης γίνεται σε µία

θερµοκρασία που λέγεται κρίσιµη θερµοκρασία, Τc.

Στα νευρωνικά δίκτυα η απότοµη αλλαγή στο C υποδηλώνει ότι το σύστηµα βρέθηκε ξαφνικά σε ένα τοπικό

ελάχιστο. Εδώ το ανάλογο του C είναι η µέση αλλαγή της θερµοκρασίας ως προς την αλλαγή του σφάλµατος.

Όταν η θερµοκρασία είναι πολύ χαµηλή, η ειδική θερµότητα είναι σχεδόν σταθερή και έτσι η θερµοκρασία

µπορεί να αλλάζει µε µεγάλο ρυθµό χωρίς πρόβληµα. Στην κρίσιµη θερµοκρασία, Τc, µία µικρή µεταβολή

θερµοκρασίας προκαλεί µεγάλη µεταβολή στην µέση τιµή του σφάλµατος. Στο σηµείο αυτό χρειάζεται

προσοχή. Το σηµείο αυτό είναι κρίσιµο, γιατί το δίκτυο µπορεί να πάει από το σηµείο Α στο σηµείο Β, αλλά δεν

µπορεί να πάει από το Β στο Α, δηλ. ακριβώς αυτό που θέλουµε. Το σύστηµα µπορεί να ξεφύγει από το

τοπικό ελάχιστο, αλλά εάν βρεθεί στο ολικό ελάχιστο, τότε δεν µπορεί να ξεφύγει. Στο σηµείο αυτό πρέπει να

αλλάζουµε την θερµοκρασία µε πολύ αργό ρυθµό. Σηµασία έχει να αναγνωρίζουµε πότε είµαστε κοντά στο

ολικό ελάχιστο και αυτό το κάνουµε µε το να παρατηρούµε πότε έχουµε απότοµη ελάττωση στο C, δηλ. πότε

έχουµε απότοµη αλλαγή στο ρυθµό αλλαγής θερµοκρασίας ως προς το σφάλµα.

Page 118: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Στατιστικές Μέθοδοι Εκπαίδευσης

Μέθοδος Ειδικής Θερμότητας

Μόλις όµως φθάσουµε κοντά στο σηµείο αυτό της κρίσιµης θερµοκρασίας, από εδώ και πέρα θα αλλάζουµε

την θερµοκρασία σιγά–σιγά, ώστε να βρούµε το ολικό ελάχιστο.

Σε θερµοκρασίες µακριά από την Τc, µπορούµε να χρησιµοποιούµε µεγαλύτερους ρυθµούς ελάττωσης του

Τ, πράγµα που επιταχύνει τη διαδικασία εκπαίδευσης του δικτύου, αλλά όταν φθάνουµε κοντά στην τελική

λύση τότε η µέθοδος αυτή µας βοηθάει να καταλήξουµε σωστά στο τελικό σηµείο της εκπαίδευσης.

Η απότοµη αλλαγή λοιπόν στο C µας ειδοποιεί ότι από εδώ και πέρα πρέπει να αλλάζουµε το Τ πολύ αργά.

Η περίπτωση αυτή είναι απολύτως ανάλογη µε το παράδειγµα της κρυστάλλωσης (προσοµοιωµένη

ανόπτηση) που αναφέραµε παραπάνω.

Page 119: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Στατιστικές Μέθοδοι Εκπαίδευσης

Μη-Γραμμικά Προβλήματα Βελτιστοποίησης

Η βελτιστοποίηση (optimization) είναι µία τεχνική η οποία λύνει διάφορα προβλήµατα, στα οποία το

ερώτηµα που τίθεται έχει την µορφή:

Ποιος είναι ο καλύτερος τρόπος για να γίνει µια διεργασία, η οποία υπόκειται σε κάποιους συγκεκριµένους

περιορισµούς;

Page 120: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Page 121: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Page 122: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Page 123: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Page 124: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Page 125: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Page 126: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει

Διεθνές Πανεπιστήμιο της Ελλάδος - Σχολή Θετικών Επιστημών - Τμήμα Φυσικής

Νευρωνικά Δίκτυα

Στατιστικές Μέθοδοι Εκπαίδευσης

Μη-Γραμμικά Προβλήματα Βελτιστοποίησης

Σε τέτοιες περιπτώσεις τα νευρωνικά δίκτυα µπορεί να δώσουν πιο ικανοποιητικές λύσεις.

Η διαδικασία που ακολουθείται είναι ανάλογη της γνωστής εκπαίδευσης ενός νευρωνικού δικτύου ως εξής:

Βρίσκουµε ορισµένα πρότυπα, τα οποία αποτελούνται από ζεύγη εισόδου–εξόδου.

Το νευρωνικό δίκτυο εκπαιδεύεται στα ζεύγη αυτά µε την γνωστή διαδικασία της αλλαγής των βαρών

w. Ουσιαστικά το νευρωνικό δίκτυο δηµιουργεί µία εσωτερική δοµή ενός αγνώστου συστήµατος. Όσο

µεγαλύτερος είναι ο αριθµός των προτύπων που παρουσιάζουµε τόσο καλύτερη και σωστότερη θα

είναι η δοµή που θα βρεί το νευρωνικό δίκτυο. Τώρα, εάν παρουσιάσουµε ένα άγνωστο πρότυπο στο

επίπεδο εισόδου, το νευρωνικό δίκτυο θα πρέπει να δώσει την ίδια απάντηση όπως θα έδινε το

σύστηµα, του οποίου βρήκαµε την δοµή.

Τέλος, προσπαθούµε να βρούµε µία συνάρτηση που αναπαριστά πόσο επιτυχής είναι η δοµή που

βρήκαµε και ακολούθως η συνάρτηση αυτή µεγιστοποιείται. Οι τιµές των εισόδων τώρα µεταβάλλονται,

όπως προηγουµένως µεταβάλλονταν τα βάρη, µε τον ίδιο ακριβώς αλγόριθµο. Η εκπαίδευση λοιπόν

συνίσταται, αντί να βρούµε τα βάρη που ελαχιστοποιούν το σφάλµα, στο να βρούµε τις εισόδους που

µεγιστοποιούν την συνάρτηση δοµής.

Page 127: Διεθνές Πανεπιστήμιο της Ελλάδος Σχολή ... · 2019-11-29 · Σε συνθήκες ηρεμίας ... ικανότητα του να αυξομειώνει