Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα...

49
1 Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων Πανεπιστήμιο Πειραιώς e-mail: [email protected] Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

description

Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων Πανεπιστήμιο Πειραιώς e-mail: [email protected]. Επισκόπηση Μαθήματος. Κατά τη διάρκεια του μαθήματος θα δοθούν εργασίες. Οι φοιτητές υποχρεούνται στην παράδοση εργασιών Βαθμολόγηση Εργασίες. - PowerPoint PPT Presentation

Transcript of Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα...

Page 1: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

1

Τεχνητή Νοημοσύνη

Γεώργιος Βούρος

Καθηγητής

Τμήμα Ψηφιακών Συστημάτων

Πανεπιστήμιο Πειραιώς

e-mail: [email protected]

Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Page 2: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

2Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Επισκόπηση Μαθήματος

n Κατά τη διάρκεια του μαθήματος θα δοθούν εργασίες. n Οι φοιτητές υποχρεούνται στην παράδοση εργασιών

n Βαθμολόγησηg Εργασίες.g Τελικός Βαθμός = Μέσος Όρος Βαθμών Εργασιών

Page 3: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

3Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Επισκόπηση Μαθήματος

Θέματα

gΝοήμονες πράκτορες.

gΑλγόριθμοι αναζήτησης και εξερεύνησης λύσεων

gΑναπαράσταση γνώσης με Λογική.

Οντολογίες

Αβεβαιότητα

Page 4: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

4Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Επισκόπηση Μαθήματος - Βιβλιογραφία

n Προτεινόμενα βιβλίαg Τεχνητή Νοημοσύνη: Μια Σύγχρονη Προσέγγιση

Russell & Norvigg Τεχνητή Νοημοσύνη: Βλαχάβας, Κεφαλάς, Βασιλειάδης, Κόκκορας,

Σακελλαρίου

n Άλλες πηγέςg Artificial Intelligence: A Modern Approach, Russell & Norvig

http://www.cs.berkeley.edu/~russell/aima.html http://aima.cs.berkeley.edu/

g Artificial Intelligence: A New Synthesis, Nilssong Essentials of Artificial Intelligence: Ginsberg

Page 5: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

5Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Γιατί Τεχνητή Νοημοσύνη?

n Η μελέτη της ανθρώπινης νόησης, του ανθρώπινου τρόπου σκέψης είναι πολύ σημαντικό ζήτημα που απασχολεί πολλές επιστήμες για χιλιάδες χρόνιαg κι ακόμα δεν έχουμε καταλήξει κάπου...

n Η Τεχνητή Νοημοσύνη πάει ένα βήμα πιο μακριά:g προσπαθεί να κατασκευάσει νοήμονες οντότητες

n Υπάρχει ως κλάδος περίπου για 60 χρόνιαg άρα έχει πολύ μέλλον!g συνδυάζει τεράστια ποικιλία επιμέρους πεδίων

Μάθηση και αντίληψη, απόδειξη μαθηματικών θεωρημάτων, διάγνωση ασθενειών, πρόβλεψη καιρού, σκάκι, κτλ., κτλ., κτλ...

Page 6: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

6Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Τι είναι η Τεχνητή Νοημοσύνη (ΤΝ)?

n ΤΝ είναι η περιοχή της επιστήμης που προσπαθεί να κατανοήσει και να κατασκευάσει ευφυή συστήματαg Η ΤΝ ξεκίνησε “επίσημα” το 1956

n Τι είναι ένα ευφυές σύστημα ?

Page 7: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

7Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Τι είναι η Τεχνητή Νοημοσύνη (ΤΝ)?

n Οι ορισμοί που δίνονται στα βιβλία ΤΝ ανήκουν στις παρακάτω κατηγορίες:

g ΤΝ είναι η περιοχή της επιστήμης που προσπαθεί να κατασκευάσει συστήματα που δρουν όπως οι άνθρωποι

g ... που σκέφτονται όπως οι άνθρωποι

g ... που σκέφτονται ορθολογικά

g ... που δρουν ορθολογικά

Page 8: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

8Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Δρώντας όπως οι άνθρωποι

n Παράδειγμα: το τεστ Turingn Για να περάσει το τεστ Turing ένας Η/Υ πρέπει να έχει τις παρακάτω

ικανότητες:

g επεξεργασία φυσικής γλώσσας (natural language processing)g αναπαράσταση γνώσης (knowledge representation)g αυτοματοποιημένο συλλογισμό (automated reasoning)g μηχανική μάθηση (machine learning)g τεχνητή όραση (computer vision)g ρομποτική (robotics)

Page 9: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

9Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Σκεπτόμενοι όπως οι άνθρωποι

n Πως σκέφτονται οι άνθρωποι ?

n Υπάρχουν δύο τρόποι για να το ανακαλύψουμε:

g Αυτοανάλυσηg Ψυχολογικά πειράματα

g Παράδειγμα: το GPS πρόγραμμα των Newell και Simon (1961)

n Η ψυχολογία και η γνωστική επιστήμη (cognitive science) είναι πολύ σχετικές

Page 10: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

10Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Σκεπτόμενοι Ορθολογικά

n Ποιοι είναι οι νόμοι της σκέψης? g Αυτή η ερώτηση πηγάζει από τους συλλογισμούς του Αριστοτέλη

n Ο τομέας της λογικής στην ΤΝ έχει ακολουθήσει αυτή την προσέγγισηg π.χ. οι πρώτες δουλειές στην απόδειξη θεωρημάτων (theorem proving)g Η έμφαση δίνεται στη σωστή συλλογιστική

n Σχετική δουλειά στην φιλοσοφία είναι πολύ σημαντικήn Προβλήματα?

g Αναπαράσταση γνώσης με λογικήg Συλλογιστική

Page 11: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

11Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Δρώντας Ορθολογικά

n Το να δρα κάποιος λογικά σημαίνει να δρα έτσι ώστε να πετύχει τους στόχους του (goals) με δεδομένες τις αντιλήψεις του.g Σε αυτή την προσέγγιση το βασικό πρόβλημα είναι ο σχεδιασμός

λογικών πρακτόρων (rational agents)g Ένας πράκτορας είναι ένα σύστημα που αντιλαμβάνεται και δρα

n Η μελέτη της ΤΝ ως σχεδιασμός λογικών πρακτόρων είναιg πιο γενική από την προσέγγιση της λογικής σκέψηςg πιο “εύκολη” από τις προσεγγίσεις που βασίζονται στην ανθρώπινη

σκέψη και συμπεριφορά

Page 12: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

12

Σύγχρονη Τεχνολογία

Page 13: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

13n1-13

Αυτόνομος σχεδιασμός και χρονοπρογραμματισμός ενεργειών

(Autonomous planning & scheduling)

n Το πείραμα Remote Agent της NASA υλοποίησε το πρώτο αυτόνομο πρόγραμμα σχεδιασμού ενεργειών (planning program) για τον έλεγχο των λειτουργιών ενός διαστημοπλοίου (1998-2001).

n Το πρόγραμμα:g παρήγαγε πλάνα ενεργειών για την επίτευξη στόχων που του καθορίζονταν από

τη γη (π.χ. φωτογράφιση κομητών), g παρακολουθούσε την εκτέλεσή τους,g προέβαινε στις απαραίτητες διορθωτικές ενέργειες, όταν διαπίστωνε αποκλίσεις.g http://ic.arc.nasa.gov/projects/

remote-agent/

Page 14: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

14n1-14

Παιχνίδια (Game Playing)

n Ο υπολογιστής της IBM Deep Blue έγινε ο πρώτος που νίκησε τον παγκόσμιο πρωταθλητή στο σκάκι Garry Kasparov με σκορ 3.5-2.5, σε αγώνα επίδειξης το 1997.

n http://www.research.ibm.com/deepblue/

Page 15: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

15n1-15

Αυτόνομος έλεγχος(Autonomous control)

n Το ALVINN είναι ένα σύστημα μηχανικής όρασης το οποίο μαθαίνει να οδηγεί ένα όχημα, παρακολουθώντας έναν άνθρωπο-οδηγό.

n Το ALVINN αποτελείται από ένα νευρωνικό δίκτυο ενός κρυμμένου στρώματος.

n Το σύστημα δέχεται ως είσοδο από τις κάμερες πάνω στο όχημα.

n Η έξοδος είναι η κατεύθυνση προς την οποία πρέπει να κινηθεί το όχημα για να παραμείνει μέσα στο δρόμο.

n Ταξίδευσε 2850 χλμ στις ΗΠΑ διατηρώντας αυτονομία στο 98% του ταξιδιού!

nhttp://www-2.cs.cmu.edu/afs/cs/project/alv/www/navlab_home_page.html

Page 16: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

16n1-16

Διάγνωση (Diagnosis)

n Ιατρικά προγράμματα διάγνωσης ασθενειών που βασίζονται σε πιθανοτική ανάλυση έχουν αποκτήσει τις ικανότητες έμπειρων θεραπευτών σε πολλές ειδικότητες.

n Κάποια από αυτά διατίθενται ελεύθερα στο διαδίκτυο, π.χ. http://easydiagnosis.com/ (ελεύθερη/δοκιμαστική χρήση για κάποιες περιπτώσεις).

Page 17: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

17n1-17

Σχεδιασμός ενεργειώνγια προβλήματα Logistics

(Logistics planning)n Κατά τη διάρκεια του πολέμου του Περσικού Κόλπου

(1991), οι Η.Π.Α. χρησιμοποίησαν το πρόγραμμα D.A.R.T. (Dynamic Analysis and Replanning Tool) για αυτοματοποιημένο σχεδιασμό και χρονοπρογραμματισμό ενεργειών για τις μεταφορές τους.

n Το πρόγραμμα διαχειρίστηκε 50.000 οχήματα, φορτία και ανθρώπους.

n Παρήγαγε πλάνα σε μερικές ώρες, αντί για εβδομάδες που χρειάζονται οι προηγούμενες μέθοδοι.

n Η υπηρεσία D.A.R.P.A. (Defense Advanced Research Project Agency) δήλωσε ότι η συγκεκριμένη εφαρμογή απέφερε περισσότερο από τις επενδύσεις των Η.Π.Α. στην Τ.Ν. τα τελευταία 30 χρόνια.

nhttp://www.rl.af.mil/div/IFT/IFTB/arpi/arpi.html

Page 18: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

18n1-18

Ρομποτική (Robotics) (1/2)

n Ρομποτικοί βοηθοί χρησιμοποιούνται σε μικρο-εγχειρήσεις.g Το σύστημα HipNav (1996) αναπτύχθηκε στο Carnegie Mellon Univ. με σκοπό τη

μείωση του κινδύνου λάθος τοποθέτησης σε εγχειρίσεις πλήρους αντικατάστασης γοφού.

http://www.mrcas.ri.cmu.edu/projects/hipnav.html

Page 19: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

19n1-19

Ρομποτική (2/2)

n Σημαντική πρόοδος έχει γίνει και στην κατασκευή ανθρωποειδών ρομπότ.

g http://world.honda.com/robot/n Διαγωνισμοί ποδοσφαίρου RoboCup

g Φιλόδοξος στόχος για το 2050.g http://www.robocup.org/

Page 20: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

20n1-20

Κατανόηση Λόγου

n Verbmobil: Σύστημα αυτόματης μετάφρασης, εξαρτημένης από τα συμφαζόμενα, σε πραγματικό χρόνο. g Γλώσσες: Γερμανικά-Αγγλικά-Ιαπωνικάg http://verbmobil.dfki.de/

Page 21: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

21Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Ευφυείς Πράκτορες (Intelligent Agents)

n Τι είναι ένας πράκτορας ?

n Πως πρέπει να δρουν οι πράκτορες ?

n Η δομή των ευφυών πρακτόρων

n Περιβάλλοντα πρακτόρων

Page 22: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

22Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Τι είναι ένας Πράκτορας ?

n Πράκτορας (Agent) είναι οτιδήποτε μπορεί μπορεί να θεωρηθεί ότι αντιλαμβάνεται το περιβάλλον του μέσα από αισθητήρες (sensors) και δρα σε αυτό το περιβάλλον μέσα από μηχανισμούς δράσης (effectors ή actuators)

Page 23: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

23Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Παραδείγματα Πρακτόρων

n Ανθρώπινοι Πράκτορες (human agents)g Sensors? Effectors ?

n Ρομποτικοί Πράκτορες (robotic agents)g Sensors? Effectors ?

n Λογισμικοί Πράκτορες (software agents)g Sensors? Effectors ?

Page 24: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

24Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Πως πρέπει να δρουν οι πράκτορες ?

n Οι πράκτορες πρέπει να δρουν ορθολογικά g να εκτελούν τις ενέργειες που προσφέρουν τη μεγαλύτερη επιτυχία

n Αυτό εξαρτάται από τα παρακάτω κριτήρια:g Το μέτρο της απόδοσης που ορίζει το βαθμό επιτυχίας

Ποιος το καθορίζει αυτό?g Όλα όσα έχει αντιληφθεί ο πράκτορας

Η ακολουθία αντιλήψεων (percept sequence)g Την προηγούμενη γνώση του περιβάλλοντος

Που του είχε δώσει ο σχεδιαστήςg Τις πράξεις που είναι διαθέσιμες στον πράκτορα

Δεν μπορεί να κάνει τα πάντα!

Page 25: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

25Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Ορίζοντας τους ορθολογικούς πράκτορες

n Για κάθε πιθανή ακολουθία αντίληψης, ένας ιδανικός ορθολογικός πράκτορας θα πρέπει να διαλέξει όποια διαθέσιμη πράξη αναμένεται να μεγιστοποιήσει το μέτρο της απόδοσης, με βάση τη γνώση που προκύπτει από την ακολουθία αντίληψης και όποια προηγούμενη γνώση έχει ο πράκτορας

Page 26: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

26Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Ορθολογισμός vs. Πλήρους Γνώσης

n Ένας πράκτορας πλήρους γνώσης (omniscient agent) γνωρίζει το πραγματικό αποτέλεσμα κάθε πιθανής πράξης και μπορεί να δράσει ανάλογαg Αυτό δεν είναι δυνατό στον πραγματικό κόσμο

n Η ορθολογική συμπεριφορά μεγιστοποιεί την αναμενόμενη απόδοση ενώ η πλήρης γνώση μεγιστοποιεί την πραγματική απόδοση

n Η πλήρης γνώση είναι μια ιδιότητα που δε θα απαιτούμε να έχουν οι πράκτορες μας.

Page 27: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

27Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Μάθηση και Αυτονομία

n Αν οι πράξεις ενός πράκτορα βασίζονται πλήρως σε ήδη υπάρχουσα (built in) γνώση τότε ο πράκτορας δεν έχει αυτονομία

n Ένας πράκτορας είναι αυτόνομος όταν η συμπεριφορά του εξαρτάται από τις δικές του εμπειρίεςg Οι εμπειρίες αποκτούνται μέσω της μάθησης (learning) του

περιβάλλοντος

n Είναι πολύ αυστηρό να απαιτούμε πλήρη αυτονομίαg Κάποια αρχική built in γνώση πάντα βοηθάει

Page 28: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

28Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Ένα Παράδειγμα

Είδος Πράκτορα

Μέτρο Απόδοσης ΠεριβάλλονΜηχανισμοί

ΔράσηςΑισθητήρες

Οδηγός ταξί Ασφάλεια, Ταχύτητα, Νομιμότητα, Άνεση στη διαδρομή, Μεγιστοποίηση κέρδους

Δρόμοι, Πεζοί, Άλλα αυτοκίνητα, Πελάτες

Τιμόνι, Γκάζι, Φρένο, Κόρνα, Κιβώτιο ταχυτήτων

Κάμερες, Μετρητής ταχύτητας, σένσορες μηχανής, GPS, σόναρ

Page 29: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

29Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Περισσότερα Παραδείγματα

Page 30: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

30Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Περιβάλλοντα

n Είδη περιβάλλοντος:n Πλήρως παρατηρήσιμο και μερικώς παρατηρήσιμο

g Αν οι αισθητήρες ενός πράκτορα του δίνουν πρόσβαση στη πλήρη κατάσταση του περιβάλλοντος την κάθε χρονική στιγμή, το περιβάλλον ονομάζεται πλήρως παρατηρήσιμο (fully observable)

n Αιτιοκρατικό (ντετερμινιστικό) και στοχαστικόg Αν η επόμενη κατάσταση του περιβάλλοντος ορίζεται μόνο από την

τωρινή κατάσταση και τις πράξεις που κάνουν οι πράκτορες τότε το περιβάλλον είναι αιτιοκρατικό (deterministic)

n Επεισοδιακό και μη επεισοδιακόg Σε ένα επεισοδιακό περιβάλλον, η εμπειρία του πράκτορα χωρίζεται σε

επεισόδια που δεν εξαρτώνται μεταξύ τους

Page 31: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

31Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Περιβάλλοντα

n Είδη περιβάλλοντος:n Στατικό, ημιδυναμικό και δυναμικό

g Αν το περιβάλλον μπορεί να αλλάζει καθώς ο πράκτορας συλλογίζεται τότε είναι δυναμικό για αυτόν τον πράκτορα, αλλιώς είναι στατικό

g Αν το περιβάλλον δεν αλλάζει με την πάροδο του χρόνου αλλά αλλάζει το μέτρο απόδοσης του πράκτορα, τότε είναι ημιδυναμικό

n Διακριτό και συνεχέςg Αν υπάρχει ένας περιορισμένος αριθμός διακριτών, καθαρά ορισμένων

πραγμάτων που μπορεί να αντιληφθεί ο πράκτορας καθώς και πράξεων που μπορεί να πράξει τότε το περιβάλλον είναι διακριτό (discrete)

n Μονοπρακτορικά και πολυπρακτορικάg ανταγωνιστικό και συνεργατικό

Page 32: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

32Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Περιβάλλοντα

Page 33: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

33Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Δομή των Πρακτόρων

n Η αρχιτεκτονική κάνει τις αντιλήψεις από τους αισθητήρες διαθέσιμες στο πρόγραμμα, τρέχει το πρόγραμμα, και προωθεί τις επιλογές πράξεων στους μηχανισμούς δράσης καθώς δημιουργούνται από το πρόγραμμα

n Θα ασχοληθούμε μόνο με προγράμματα πρακτόρων g Αυτή είναι κυρίως η δουλειά της ΤΝ!!!

Πράκτορας = Αρχιτεκτονική + Πρόγραμμα

Page 34: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

34Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Προγράμματα Πρακτόρων

n Πως μπορούμε να υλοποιήσουμε το πρόγραμμα για έναν πράκτορα?g Με χρήση πίνακα (table look-up) ?

Μειονεκτήματα:g Τεράστιος πίνακας (10150 για πράκτορα που παίζει σκάκι)g Έλλειψη αυτονομίαςg Ακόμα κι αν προστεθεί μηχανισμός μάθησης το μέγεθος του πίνακα

είναι προβληματικό

function TableDrivenAgent (percept) returns actionstatic percepts, μια ακολουθία αρχικά κενή table, ένας πίνακας από ακολουθίες αντιλήψεωνπρόσθεσε το percept στο τέλος του perceptsaction LookUp (percepts, table)return action

Page 35: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

35Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Απλά Αντιδραστικοί Πράκτορες (Simple Reflex Agents)

Η αντίληψη τουκόσμου τώρα

αισθητήρες

Τι ενέργεια πρέπει να κάνω?

μηχανισμοί δράσης

ΚανόνεςΠροϋπόθεσης - Δράσης

ΠΡΑΚΤΟΡΑΣ

Page 36: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

36Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Παράδειγμα – Ο Πράκτορας Καθαριστής

n Η συμπεριφορά αυτού του πράκτορα εξαρτάται μόνο από την αντίληψη του περιβάλλοντος που έχει κάθε δεδομένη στιγμήg φιλοσοφία ερεθίσματος - αντίδρασης

n Στα περισσότερα περιβάλλοντα αυτό δεν είναι αρκετό

function ReflexVacuumCleanerAgent ([location,status]) returns an action

if status = dirty then return cleanelse if location = A then return move rightelse if location = B then return move left

Page 37: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

37Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Υλοποίηση Απλά Αντιδραστικών Πρακτόρων

function SimpleReflexAgent (percept) returns actionstatic rules, ένα σύνολο από κανόνες προϋπόθεσης-δράσης state, μια μετάφραση της δεδομένης αντίληψης (percept)state InterpretInput (percept)rule RuleMatch (state,rules)action RuleAction (rule)return action

Ο πράκτορας βρίσκει έναν κανόνα του οποίου η προϋπόθεση ταιριάζει με την τωρινή κατάσταση και μετά εκτελεί την πράξη που συνδέεται με αυτόν τον κανόνα

Page 38: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

38Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Αντιδραστικοί Πράκτορες με Εσωτερικό Μοντέλο (Model-based Reflex Agents)

Η αντίληψη τουκόσμου τώρα

αισθητήρες

Τι ενέργεια πρέπει να κάνω?

μηχανισμοί δράσης

ΚανόνεςΠροϋπόθεσης - Δράσης

ΠΡΑΚΤΟΡΑΣ

Κατάσταση

Πως εξελίσσεται το περιβάλλον

Τι κάνουν οι πράξεις μου

Page 39: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

39Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Υλοποίηση Αντιδραστικών Πρακτόρων με Εσωτερικό Μοντέλο

n Οι πράκτορες με εσωτερικό μοντέλο παρακολουθούν την εξέλιξη της κατάστασης του περιβάλλοντος. Αυτό βοηθάει πολύ!g Πως μπορεί να αναπαρασταθεί γνώση σχετικά με το περιβάλλον σε έναν

πράκτορα ?

function ReflexAgentWithInternalState (percept) returns actionstatic rules, ένα σύνολο από κανόνες προϋπόθεσης-δράσης state, μια μετάφραση της δεδομένης αντίληψης (percept)state UpdateState (state,percept)rule RuleMatch (state,rules)action RuleAction (rule)state UpdateState (state,action)return action

Page 40: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

40Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Πράκτορες βασισμένοι σε στόχους (Goal-based Agents)

Η αντίληψη τουκόσμου τώρα

αισθητήρες

Τι ενέργεια πρέπει να κάνω?

μηχανισμοί δράσης

Στόχοι

ΠΡΑΚΤΟΡΑΣ

Κατάσταση

Πως εξελίσσεται το περιβάλλον

Τι κάνουν οι πράξεις μου Τι θα γίνει αν κάνωτην ενέργεια Α ?

Page 41: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

41Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Goal-based Agents vs. Reflex Agents

n Η συλλογιστική που βασίζεται σε στόχους διαφέρει ουσιαστικά από την συλλογιστική που βασίζεται στην αντίδραση με βάση κανόνες

n Η συλλογιστική που βασίζεται σε στόχους σημαίνει συλλογισμό για το μέλλονg Τι θα γίνει αν κάνω την πράξη Α ?

n Στη συλλογιστική που βασίζεται στην αντίδραση με βάση κανόνες ο σχεδιαστής έχει προϋπολογίσει τη σωστή πράξη για μερικές ενδιαφέρουσες περιπτώσεις

n Η συλλογιστική που βασίζεται σε στόχους είναι υπολογιστικά πιο δύσκολη αλλά πολύ πιο λειτουργική

Page 42: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

42Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Πράκτορες βασισμένοι στη χρησιμότητα (Utility-based Agents)

Η αντίληψη τουκόσμου τώρα

αισθητήρες

Τι ενέργεια πρέπει να κάνω?

μηχανισμοί δράσης

ΠΡΑΚΤΟΡΑΣ

Κατάσταση

Πως εξελίσσεται το περιβάλλον

Τι κάνουν οι πράξεις μου

Τι θα γίνει αν κάνωτην ενέργεια Α ?

Πόσο ικανοποιημένοςθα είμαι ?

Χρησιμότητα

Page 43: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

43Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Πράκτορες βασισμένοι στη χρησιμότητα (Utility-based Agents)

n Η χρησιμότητα (utility) είναι μια συνάρτηση που αποδίδει σε μια κατάσταση (ή μια σειρά καταστάσεων) έναν πραγματικό αριθμό ο οποίος περιγράφει το βαθμό “ικανοποίησης” του πράκτορα για τη δεδομένη κατάσταση

n Πράκτορες που βασίζονται στη χρησιμότητα μπορούν να αποφασίσουν λογικά για πράξεις ακόμα κι όταν υπάρχουν αλληλοσυγκρουόμενοι στόχοι ή όταν υπάρχουν στόχοι που δεν είναι σίγουρο ότι μπορεί να επιτευχθούν

Page 44: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

44Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Επισκόπηση μαθήματος ξανά

Θέματα

g Ευφυείς Πράκτορες

g Επίλυση Προβλημάτων με Αναζήτηση

g Προβλήματα Ικανοποίησης Περιορισμών

Προτασιακή Λογική

Σχεδιασμός Ενεργειών

Μηχανική Μάθηση

Page 45: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

45Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Ευφυείς Πράκτορες

Η αντίληψη τουκόσμου τώρα

αισθητήρες

Τι ενέργεια πρέπει να κάνω?

μηχανισμοί δράσης

ΚανόνεςΠροϋπόθεσης - Δράσης

ΠΡΑΚΤΟΡΑΣ

Κατάσταση

Πως εξελίσσεται το περιβάλλον

Τι κάνουν οι πράξεις μου

Page 46: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

46Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Επίλυση Προβλημάτων με Αναζήτηση

Η αντίληψη τουκόσμου τώρα

αισθητήρες

Τι ενέργεια πρέπει να κάνω?

μηχανισμοί δράσης

Στόχοι

ΠΡΑΚΤΟΡΑΣ

Κατάσταση

Πως εξελίσσεται το περιβάλλον

Τι κάνουν οι πράξεις μου Τι θα γίνει αν κάνωτην ενέργεια Α ?

Page 47: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

47Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Προτασιακή Λογική

Η αντίληψη τουκόσμου τώρα

αισθητήρες

Τι ενέργεια πρέπει να κάνω?

μηχανισμοί δράσης

Στόχοι

ΠΡΑΚΤΟΡΑΣ

Κατάσταση

Πως εξελίσσεται το περιβάλλον

Τι κάνουν οι πράξεις μου Τι θα γίνει αν κάνωτην ενέργεια Α ?

Page 48: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

48Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Σχεδιασμός Ενεργειών

Η αντίληψη τουκόσμου τώρα

αισθητήρες

Τι ενέργεια πρέπει να κάνω?

μηχανισμοί δράσης

Στόχοι

ΠΡΑΚΤΟΡΑΣ

Κατάσταση

Πως εξελίσσεται το περιβάλλον

Τι κάνουν οι πράξεις μου Τι θα γίνει αν κάνωτην ενέργεια Α ?

Page 49: Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων  Πανεπιστήμιο Πειραιώς

49Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Ανακεφαλαίωση

n Η μελέτη της ΤΝ ως σχεδιασμός λογικών πρακτόρων

g Τι είναι ένας πράκτορας ?

g Πως πρέπει να δρουν οι πράκτορες ?

g Περιβάλλοντα πρακτόρων

g Η δομή ορισμένων ειδών ευφυών πρακτόρων