Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα...

1

Τεχνητή Νοημοσύνη

Γεώργιος Βούρος

Καθηγητής

Τμήμα Ψηφιακών Συστημάτων

Πανεπιστήμιο Πειραιώς

e-mail: [email protected]

Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

2Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Επισκόπηση Μαθήματος

n Κατά τη διάρκεια του μαθήματος θα δοθούν εργασίες. n Οι φοιτητές υποχρεούνται στην παράδοση εργασιών

n Βαθμολόγησηg Εργασίες.g Τελικός Βαθμός = Μέσος Όρος Βαθμών Εργασιών


Επισκόπηση Μαθήματος

Θέματα

gΝοήμονες πράκτορες.

gΑλγόριθμοι αναζήτησης και εξερεύνησης λύσεων

gΑναπαράσταση γνώσης με Λογική.

Οντολογίες

Αβεβαιότητα


Επισκόπηση Μαθήματος - Βιβλιογραφία

n Προτεινόμενα βιβλίαg Τεχνητή Νοημοσύνη: Μια Σύγχρονη Προσέγγιση

Russell & Norvigg Τεχνητή Νοημοσύνη: Βλαχάβας, Κεφαλάς, Βασιλειάδης, Κόκκορας,

Σακελλαρίου

n Άλλες πηγέςg Artificial Intelligence: A Modern Approach, Russell & Norvig

http://www.cs.berkeley.edu/~russell/aima.html http://aima.cs.berkeley.edu/

g Artificial Intelligence: A New Synthesis, Nilssong Essentials of Artificial Intelligence: Ginsberg


Γιατί Τεχνητή Νοημοσύνη?

n Η μελέτη της ανθρώπινης νόησης, του ανθρώπινου τρόπου σκέψης είναι πολύ σημαντικό ζήτημα που απασχολεί πολλές επιστήμες για χιλιάδες χρόνιαg κι ακόμα δεν έχουμε καταλήξει κάπου...

n Η Τεχνητή Νοημοσύνη πάει ένα βήμα πιο μακριά:g προσπαθεί να κατασκευάσει νοήμονες οντότητες

n Υπάρχει ως κλάδος περίπου για 60 χρόνιαg άρα έχει πολύ μέλλον!g συνδυάζει τεράστια ποικιλία επιμέρους πεδίων

Μάθηση και αντίληψη, απόδειξη μαθηματικών θεωρημάτων, διάγνωση ασθενειών, πρόβλεψη καιρού, σκάκι, κτλ., κτλ., κτλ...


Τι είναι η Τεχνητή Νοημοσύνη (ΤΝ)?

n ΤΝ είναι η περιοχή της επιστήμης που προσπαθεί να κατανοήσει και να κατασκευάσει ευφυή συστήματαg Η ΤΝ ξεκίνησε “επίσημα” το 1956

n Τι είναι ένα ευφυές σύστημα ?


Τι είναι η Τεχνητή Νοημοσύνη (ΤΝ)?

n Οι ορισμοί που δίνονται στα βιβλία ΤΝ ανήκουν στις παρακάτω κατηγορίες:

g ΤΝ είναι η περιοχή της επιστήμης που προσπαθεί να κατασκευάσει συστήματα που δρουν όπως οι άνθρωποι

g ... που σκέφτονται όπως οι άνθρωποι

g ... που σκέφτονται ορθολογικά

g ... που δρουν ορθολογικά


Δρώντας όπως οι άνθρωποι

n Παράδειγμα: το τεστ Turingn Για να περάσει το τεστ Turing ένας Η/Υ πρέπει να έχει τις παρακάτω

ικανότητες:

g επεξεργασία φυσικής γλώσσας (natural language processing)g αναπαράσταση γνώσης (knowledge representation)g αυτοματοποιημένο συλλογισμό (automated reasoning)g μηχανική μάθηση (machine learning)g τεχνητή όραση (computer vision)g ρομποτική (robotics)


Σκεπτόμενοι όπως οι άνθρωποι

n Πως σκέφτονται οι άνθρωποι ?

n Υπάρχουν δύο τρόποι για να το ανακαλύψουμε:

g Αυτοανάλυσηg Ψυχολογικά πειράματα

g Παράδειγμα: το GPS πρόγραμμα των Newell και Simon (1961)

n Η ψυχολογία και η γνωστική επιστήμη (cognitive science) είναι πολύ σχετικές


Σκεπτόμενοι Ορθολογικά

n Ποιοι είναι οι νόμοι της σκέψης? g Αυτή η ερώτηση πηγάζει από τους συλλογισμούς του Αριστοτέλη

n Ο τομέας της λογικής στην ΤΝ έχει ακολουθήσει αυτή την προσέγγισηg π.χ. οι πρώτες δουλειές στην απόδειξη θεωρημάτων (theorem proving)g Η έμφαση δίνεται στη σωστή συλλογιστική

n Σχετική δουλειά στην φιλοσοφία είναι πολύ σημαντικήn Προβλήματα?

g Αναπαράσταση γνώσης με λογικήg Συλλογιστική


Δρώντας Ορθολογικά

n Το να δρα κάποιος λογικά σημαίνει να δρα έτσι ώστε να πετύχει τους στόχους του (goals) με δεδομένες τις αντιλήψεις του.g Σε αυτή την προσέγγιση το βασικό πρόβλημα είναι ο σχεδιασμός

λογικών πρακτόρων (rational agents)g Ένας πράκτορας είναι ένα σύστημα που αντιλαμβάνεται και δρα

n Η μελέτη της ΤΝ ως σχεδιασμός λογικών πρακτόρων είναιg πιο γενική από την προσέγγιση της λογικής σκέψηςg πιο “εύκολη” από τις προσεγγίσεις που βασίζονται στην ανθρώπινη

σκέψη και συμπεριφορά

12

Σύγχρονη Τεχνολογία

13n1-13

Αυτόνομος σχεδιασμός και χρονοπρογραμματισμός ενεργειών

(Autonomous planning & scheduling)

n Το πείραμα Remote Agent της NASA υλοποίησε το πρώτο αυτόνομο πρόγραμμα σχεδιασμού ενεργειών (planning program) για τον έλεγχο των λειτουργιών ενός διαστημοπλοίου (1998-2001).

n Το πρόγραμμα:g παρήγαγε πλάνα ενεργειών για την επίτευξη στόχων που του καθορίζονταν από

τη γη (π.χ. φωτογράφιση κομητών), g παρακολουθούσε την εκτέλεσή τους,g προέβαινε στις απαραίτητες διορθωτικές ενέργειες, όταν διαπίστωνε αποκλίσεις.g http://ic.arc.nasa.gov/projects/

remote-agent/

14n1-14

Παιχνίδια (Game Playing)

n Ο υπολογιστής της IBM Deep Blue έγινε ο πρώτος που νίκησε τον παγκόσμιο πρωταθλητή στο σκάκι Garry Kasparov με σκορ 3.5-2.5, σε αγώνα επίδειξης το 1997.

n http://www.research.ibm.com/deepblue/

15n1-15

Αυτόνομος έλεγχος(Autonomous control)

n Το ALVINN είναι ένα σύστημα μηχανικής όρασης το οποίο μαθαίνει να οδηγεί ένα όχημα, παρακολουθώντας έναν άνθρωπο-οδηγό.

n Το ALVINN αποτελείται από ένα νευρωνικό δίκτυο ενός κρυμμένου στρώματος.

n Το σύστημα δέχεται ως είσοδο από τις κάμερες πάνω στο όχημα.

n Η έξοδος είναι η κατεύθυνση προς την οποία πρέπει να κινηθεί το όχημα για να παραμείνει μέσα στο δρόμο.

n Ταξίδευσε 2850 χλμ στις ΗΠΑ διατηρώντας αυτονομία στο 98% του ταξιδιού!

nhttp://www-2.cs.cmu.edu/afs/cs/project/alv/www/navlab_home_page.html

16n1-16

Διάγνωση (Diagnosis)

n Ιατρικά προγράμματα διάγνωσης ασθενειών που βασίζονται σε πιθανοτική ανάλυση έχουν αποκτήσει τις ικανότητες έμπειρων θεραπευτών σε πολλές ειδικότητες.

n Κάποια από αυτά διατίθενται ελεύθερα στο διαδίκτυο, π.χ. http://easydiagnosis.com/ (ελεύθερη/δοκιμαστική χρήση για κάποιες περιπτώσεις).

17n1-17

Σχεδιασμός ενεργειώνγια προβλήματα Logistics

(Logistics planning)n Κατά τη διάρκεια του πολέμου του Περσικού Κόλπου

(1991), οι Η.Π.Α. χρησιμοποίησαν το πρόγραμμα D.A.R.T. (Dynamic Analysis and Replanning Tool) για αυτοματοποιημένο σχεδιασμό και χρονοπρογραμματισμό ενεργειών για τις μεταφορές τους.

n Το πρόγραμμα διαχειρίστηκε 50.000 οχήματα, φορτία και ανθρώπους.

n Παρήγαγε πλάνα σε μερικές ώρες, αντί για εβδομάδες που χρειάζονται οι προηγούμενες μέθοδοι.

n Η υπηρεσία D.A.R.P.A. (Defense Advanced Research Project Agency) δήλωσε ότι η συγκεκριμένη εφαρμογή απέφερε περισσότερο από τις επενδύσεις των Η.Π.Α. στην Τ.Ν. τα τελευταία 30 χρόνια.

nhttp://www.rl.af.mil/div/IFT/IFTB/arpi/arpi.html

18n1-18

Ρομποτική (Robotics) (1/2)

n Ρομποτικοί βοηθοί χρησιμοποιούνται σε μικρο-εγχειρήσεις.g Το σύστημα HipNav (1996) αναπτύχθηκε στο Carnegie Mellon Univ. με σκοπό τη

μείωση του κινδύνου λάθος τοποθέτησης σε εγχειρίσεις πλήρους αντικατάστασης γοφού.

http://www.mrcas.ri.cmu.edu/projects/hipnav.html

19n1-19

Ρομποτική (2/2)

n Σημαντική πρόοδος έχει γίνει και στην κατασκευή ανθρωποειδών ρομπότ.

g http://world.honda.com/robot/n Διαγωνισμοί ποδοσφαίρου RoboCup

g Φιλόδοξος στόχος για το 2050.g http://www.robocup.org/

20n1-20

Κατανόηση Λόγου

n Verbmobil: Σύστημα αυτόματης μετάφρασης, εξαρτημένης από τα συμφαζόμενα, σε πραγματικό χρόνο. g Γλώσσες: Γερμανικά-Αγγλικά-Ιαπωνικάg http://verbmobil.dfki.de/


Ευφυείς Πράκτορες (Intelligent Agents)

n Τι είναι ένας πράκτορας ?

n Πως πρέπει να δρουν οι πράκτορες ?

n Η δομή των ευφυών πρακτόρων

n Περιβάλλοντα πρακτόρων


Τι είναι ένας Πράκτορας ?

n Πράκτορας (Agent) είναι οτιδήποτε μπορεί μπορεί να θεωρηθεί ότι αντιλαμβάνεται το περιβάλλον του μέσα από αισθητήρες (sensors) και δρα σε αυτό το περιβάλλον μέσα από μηχανισμούς δράσης (effectors ή actuators)


Παραδείγματα Πρακτόρων

n Ανθρώπινοι Πράκτορες (human agents)g Sensors? Effectors ?

n Ρομποτικοί Πράκτορες (robotic agents)g Sensors? Effectors ?

n Λογισμικοί Πράκτορες (software agents)g Sensors? Effectors ?


Πως πρέπει να δρουν οι πράκτορες ?

n Οι πράκτορες πρέπει να δρουν ορθολογικά g να εκτελούν τις ενέργειες που προσφέρουν τη μεγαλύτερη επιτυχία

n Αυτό εξαρτάται από τα παρακάτω κριτήρια:g Το μέτρο της απόδοσης που ορίζει το βαθμό επιτυχίας

Ποιος το καθορίζει αυτό?g Όλα όσα έχει αντιληφθεί ο πράκτορας

Η ακολουθία αντιλήψεων (percept sequence)g Την προηγούμενη γνώση του περιβάλλοντος

Που του είχε δώσει ο σχεδιαστήςg Τις πράξεις που είναι διαθέσιμες στον πράκτορα

Δεν μπορεί να κάνει τα πάντα!


Ορίζοντας τους ορθολογικούς πράκτορες

n Για κάθε πιθανή ακολουθία αντίληψης, ένας ιδανικός ορθολογικός πράκτορας θα πρέπει να διαλέξει όποια διαθέσιμη πράξη αναμένεται να μεγιστοποιήσει το μέτρο της απόδοσης, με βάση τη γνώση που προκύπτει από την ακολουθία αντίληψης και όποια προηγούμενη γνώση έχει ο πράκτορας


Ορθολογισμός vs. Πλήρους Γνώσης

n Ένας πράκτορας πλήρους γνώσης (omniscient agent) γνωρίζει το πραγματικό αποτέλεσμα κάθε πιθανής πράξης και μπορεί να δράσει ανάλογαg Αυτό δεν είναι δυνατό στον πραγματικό κόσμο

n Η ορθολογική συμπεριφορά μεγιστοποιεί την αναμενόμενη απόδοση ενώ η πλήρης γνώση μεγιστοποιεί την πραγματική απόδοση

n Η πλήρης γνώση είναι μια ιδιότητα που δε θα απαιτούμε να έχουν οι πράκτορες μας.


Μάθηση και Αυτονομία

n Αν οι πράξεις ενός πράκτορα βασίζονται πλήρως σε ήδη υπάρχουσα (built in) γνώση τότε ο πράκτορας δεν έχει αυτονομία

n Ένας πράκτορας είναι αυτόνομος όταν η συμπεριφορά του εξαρτάται από τις δικές του εμπειρίεςg Οι εμπειρίες αποκτούνται μέσω της μάθησης (learning) του

περιβάλλοντος

n Είναι πολύ αυστηρό να απαιτούμε πλήρη αυτονομίαg Κάποια αρχική built in γνώση πάντα βοηθάει


Ένα Παράδειγμα

Είδος Πράκτορα

Μέτρο Απόδοσης ΠεριβάλλονΜηχανισμοί

ΔράσηςΑισθητήρες

Οδηγός ταξί Ασφάλεια, Ταχύτητα, Νομιμότητα, Άνεση στη διαδρομή, Μεγιστοποίηση κέρδους

Δρόμοι, Πεζοί, Άλλα αυτοκίνητα, Πελάτες

Τιμόνι, Γκάζι, Φρένο, Κόρνα, Κιβώτιο ταχυτήτων

Κάμερες, Μετρητής ταχύτητας, σένσορες μηχανής, GPS, σόναρ


Περισσότερα Παραδείγματα


Περιβάλλοντα

n Είδη περιβάλλοντος:n Πλήρως παρατηρήσιμο και μερικώς παρατηρήσιμο

g Αν οι αισθητήρες ενός πράκτορα του δίνουν πρόσβαση στη πλήρη κατάσταση του περιβάλλοντος την κάθε χρονική στιγμή, το περιβάλλον ονομάζεται πλήρως παρατηρήσιμο (fully observable)

n Αιτιοκρατικό (ντετερμινιστικό) και στοχαστικόg Αν η επόμενη κατάσταση του περιβάλλοντος ορίζεται μόνο από την

τωρινή κατάσταση και τις πράξεις που κάνουν οι πράκτορες τότε το περιβάλλον είναι αιτιοκρατικό (deterministic)

n Επεισοδιακό και μη επεισοδιακόg Σε ένα επεισοδιακό περιβάλλον, η εμπειρία του πράκτορα χωρίζεται σε

επεισόδια που δεν εξαρτώνται μεταξύ τους



n Είδη περιβάλλοντος:n Στατικό, ημιδυναμικό και δυναμικό

g Αν το περιβάλλον μπορεί να αλλάζει καθώς ο πράκτορας συλλογίζεται τότε είναι δυναμικό για αυτόν τον πράκτορα, αλλιώς είναι στατικό

g Αν το περιβάλλον δεν αλλάζει με την πάροδο του χρόνου αλλά αλλάζει το μέτρο απόδοσης του πράκτορα, τότε είναι ημιδυναμικό

n Διακριτό και συνεχέςg Αν υπάρχει ένας περιορισμένος αριθμός διακριτών, καθαρά ορισμένων

πραγμάτων που μπορεί να αντιληφθεί ο πράκτορας καθώς και πράξεων που μπορεί να πράξει τότε το περιβάλλον είναι διακριτό (discrete)

n Μονοπρακτορικά και πολυπρακτορικάg ανταγωνιστικό και συνεργατικό


Δομή των Πρακτόρων

n Η αρχιτεκτονική κάνει τις αντιλήψεις από τους αισθητήρες διαθέσιμες στο πρόγραμμα, τρέχει το πρόγραμμα, και προωθεί τις επιλογές πράξεων στους μηχανισμούς δράσης καθώς δημιουργούνται από το πρόγραμμα

n Θα ασχοληθούμε μόνο με προγράμματα πρακτόρων g Αυτή είναι κυρίως η δουλειά της ΤΝ!!!

Πράκτορας = Αρχιτεκτονική + Πρόγραμμα


Προγράμματα Πρακτόρων

n Πως μπορούμε να υλοποιήσουμε το πρόγραμμα για έναν πράκτορα?g Με χρήση πίνακα (table look-up) ?

Μειονεκτήματα:g Τεράστιος πίνακας (10150 για πράκτορα που παίζει σκάκι)g Έλλειψη αυτονομίαςg Ακόμα κι αν προστεθεί μηχανισμός μάθησης το μέγεθος του πίνακα

είναι προβληματικό

function TableDrivenAgent (percept) returns actionstatic percepts, μια ακολουθία αρχικά κενή table, ένας πίνακας από ακολουθίες αντιλήψεωνπρόσθεσε το percept στο τέλος του perceptsaction LookUp (percepts, table)return action


Απλά Αντιδραστικοί Πράκτορες (Simple Reflex Agents)

Η αντίληψη τουκόσμου τώρα

αισθητήρες

Τι ενέργεια πρέπει να κάνω?

μηχανισμοί δράσης

ΚανόνεςΠροϋπόθεσης - Δράσης

ΠΡΑΚΤΟΡΑΣ


Παράδειγμα – Ο Πράκτορας Καθαριστής

n Η συμπεριφορά αυτού του πράκτορα εξαρτάται μόνο από την αντίληψη του περιβάλλοντος που έχει κάθε δεδομένη στιγμήg φιλοσοφία ερεθίσματος - αντίδρασης

n Στα περισσότερα περιβάλλοντα αυτό δεν είναι αρκετό

function ReflexVacuumCleanerAgent ([location,status]) returns an action

if status = dirty then return cleanelse if location = A then return move rightelse if location = B then return move left


Υλοποίηση Απλά Αντιδραστικών Πρακτόρων

function SimpleReflexAgent (percept) returns actionstatic rules, ένα σύνολο από κανόνες προϋπόθεσης-δράσης state, μια μετάφραση της δεδομένης αντίληψης (percept)state InterpretInput (percept)rule RuleMatch (state,rules)action RuleAction (rule)return action

Ο πράκτορας βρίσκει έναν κανόνα του οποίου η προϋπόθεση ταιριάζει με την τωρινή κατάσταση και μετά εκτελεί την πράξη που συνδέεται με αυτόν τον κανόνα


Αντιδραστικοί Πράκτορες με Εσωτερικό Μοντέλο (Model-based Reflex Agents)






ΠΡΑΚΤΟΡΑΣ

Κατάσταση

Πως εξελίσσεται το περιβάλλον

Τι κάνουν οι πράξεις μου


Υλοποίηση Αντιδραστικών Πρακτόρων με Εσωτερικό Μοντέλο

n Οι πράκτορες με εσωτερικό μοντέλο παρακολουθούν την εξέλιξη της κατάστασης του περιβάλλοντος. Αυτό βοηθάει πολύ!g Πως μπορεί να αναπαρασταθεί γνώση σχετικά με το περιβάλλον σε έναν

πράκτορα ?

function ReflexAgentWithInternalState (percept) returns actionstatic rules, ένα σύνολο από κανόνες προϋπόθεσης-δράσης state, μια μετάφραση της δεδομένης αντίληψης (percept)state UpdateState (state,percept)rule RuleMatch (state,rules)action RuleAction (rule)state UpdateState (state,action)return action


Πράκτορες βασισμένοι σε στόχους (Goal-based Agents)





Στόχοι

ΠΡΑΚΤΟΡΑΣ

Κατάσταση


Τι κάνουν οι πράξεις μου Τι θα γίνει αν κάνωτην ενέργεια Α ?


Goal-based Agents vs. Reflex Agents

n Η συλλογιστική που βασίζεται σε στόχους διαφέρει ουσιαστικά από την συλλογιστική που βασίζεται στην αντίδραση με βάση κανόνες

n Η συλλογιστική που βασίζεται σε στόχους σημαίνει συλλογισμό για το μέλλονg Τι θα γίνει αν κάνω την πράξη Α ?

n Στη συλλογιστική που βασίζεται στην αντίδραση με βάση κανόνες ο σχεδιαστής έχει προϋπολογίσει τη σωστή πράξη για μερικές ενδιαφέρουσες περιπτώσεις

n Η συλλογιστική που βασίζεται σε στόχους είναι υπολογιστικά πιο δύσκολη αλλά πολύ πιο λειτουργική


Πράκτορες βασισμένοι στη χρησιμότητα (Utility-based Agents)





ΠΡΑΚΤΟΡΑΣ

Κατάσταση



Τι θα γίνει αν κάνωτην ενέργεια Α ?

Πόσο ικανοποιημένοςθα είμαι ?

Χρησιμότητα


Πράκτορες βασισμένοι στη χρησιμότητα (Utility-based Agents)

n Η χρησιμότητα (utility) είναι μια συνάρτηση που αποδίδει σε μια κατάσταση (ή μια σειρά καταστάσεων) έναν πραγματικό αριθμό ο οποίος περιγράφει το βαθμό “ικανοποίησης” του πράκτορα για τη δεδομένη κατάσταση

n Πράκτορες που βασίζονται στη χρησιμότητα μπορούν να αποφασίσουν λογικά για πράξεις ακόμα κι όταν υπάρχουν αλληλοσυγκρουόμενοι στόχοι ή όταν υπάρχουν στόχοι που δεν είναι σίγουρο ότι μπορεί να επιτευχθούν


Επισκόπηση μαθήματος ξανά

Θέματα

g Ευφυείς Πράκτορες

g Επίλυση Προβλημάτων με Αναζήτηση

g Προβλήματα Ικανοποίησης Περιορισμών

Προτασιακή Λογική

Σχεδιασμός Ενεργειών

Μηχανική Μάθηση


Ευφυείς Πράκτορες






ΠΡΑΚΤΟΡΑΣ

Κατάσταση




Επίλυση Προβλημάτων με Αναζήτηση





Στόχοι

ΠΡΑΚΤΟΡΑΣ

Κατάσταση




Προτασιακή Λογική





Στόχοι

ΠΡΑΚΤΟΡΑΣ

Κατάσταση




Σχεδιασμός Ενεργειών





Στόχοι

ΠΡΑΚΤΟΡΑΣ

Κατάσταση




Ανακεφαλαίωση

n Η μελέτη της ΤΝ ως σχεδιασμός λογικών πρακτόρων

g Τι είναι ένας πράκτορας ?

g Πως πρέπει να δρουν οι πράκτορες ?

g Περιβάλλοντα πρακτόρων

g Η δομή ορισμένων ειδών ευφυών πρακτόρων

Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα...

Documents

Transcript of Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα...