ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

61
1 ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΠΛΗΡΟΦΟΡΙΚΗ ΕΝΑΛΛΑΚΤΙΚΟ ΔΙΔΑΚΤΙΚΟ ΥΛΙΚΟ ΓΙΑ ΤΗ ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ ΠΛΗ31 - ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ ΚΑΙ ΕΦΑΡΜΟΓΕΣ ΣΥΝΟΨΗ στον Τόμο Α΄ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ ΚΑΙ ΕΜΠΕΙΡΑ ΣΥΣΤΗΜΑΤΑ Αδάμ Αδαμόπουλος Αλεξανδρούπολη 2005

description

ΣΥΝΟΨΗ ΤΟΜΟΥ Α

Transcript of ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

Page 1: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

1

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ

ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ∆ΩΝ ΠΛΗΡΟΦΟΡΙΚΗ

ΕΝΑΛΛΑΚΤΙΚΟ ∆Ι∆ΑΚΤΙΚΟ ΥΛΙΚΟ ΓΙΑ ΤΗ ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ

ΠΛΗ31 - ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ ΚΑΙ ΕΦΑΡΜΟΓΕΣ

ΣΥΝΟΨΗ στον Τόµο Α΄

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ ΚΑΙ ΕΜΠΕΙΡΑ ΣΥΣΤΗΜΑΤΑ

Αδάµ Αδαµόπουλος

Αλεξανδρούπολη 2005

Page 2: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

2

0. Πρόλογος

1. Σύνοψη 1ου Κεφαλαίου

2. Σύνοψη 2ου Κεφαλαίου

3. Σύνοψη 3ου Κεφαλαίου

4. Σύνοψη 4ου Κεφαλαίου

5. Σύνοψη 5ου Κεφαλαίου

6. Σύνοψη 6ου Κεφαλαίου

7. Σύνοψη 7ου Κεφαλαίου

8. Σύνοψη 8ου Κεφαλαίου

9. Σύνοψη 9ου Κεφαλαίου

10. Σύνοψη 10ου Κεφαλαίου

11. Βιβλιογραφία

12. Στα Αγγλικά

13. Στα Ελληνικά

Page 3: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

3

0. Πρόλογος

Το παρόν Εναλλακτικό ∆ιδακτικό Υλικό (Ε∆Υ) αφορά σε µια προσπάθεια εισαγωγής

στον τόµο Α΄ υπό τον τίτλο Έµπειρα Συστήµατα και Εφαρµογές, της Θεµατικής

Ενότητας ΠΛΗ31 Τεχνητή Νοηµοσύνη και Εφαρµογές του Προγράµµατος Σπουδών

Πληροφορική της Σχολής Θετικών Επιστηµών και Τεχνολογίας του Ελληνικού Ανοικτού

Πανεπιστηµίου. Ο Τόµος Α΄ της Θεµατικής Ενότητας ΠΛΗ31 γράφηκε από την

Καθηγήτρια του Τµήµατος Πληροφορικής του Πανεπιστηµίου Κύπρου κ. Ελπίδα

Κεραυνού το 2000. Στο υλικό που ακολουθεί, γίνεται µια προσπάθεια παρουσίασης µε

σχετικά απλό και εύληπτο τρόπο των βασικών θεµάτων που αναπτύσσονται στα 11

Κεφάλαια του τόµου Α΄ της ΠΛΗ31 µε τη θεωρητική ανάπτυξη των θεµάτων αυτών να

συνοδεύεται από ένα αριθµό ασκήσεων – παραδειγµάτων που ελπίζουµε ότι θα

βοηθήσουν στην καλύτερη κατανόηση της θεωρίας. Όπως τονίζεται και από τη

συγγραφέα κ. Κεραυνού ο Τόµος Α΄ µπορεί να χωρισθεί σε δυο µέρη. Το πρώτο µέρος,

αποτελούµενο από τα πρώτα 6 Κεφάλαια αφορά στις βασικές, εισαγωγικές έννοιες της

Τεχνητής Νοηµοσύνης και το µεγαλύτερο βάρος πέφτει σε θέµατα που σχετίζονται µε

την αναπαράσταση γνώσης (knowledge representation) και την επίλυση προβληµάτων

(problem solving). Το δεύτερο µέρος του Τόµου Α΄, δηλαδή τα τελευταία τέσσερα

Κεφάλαια από το 7ο έως το 10

ο επικεντρώνονται σε πιο εφαρµοσµένα θέµατα που

σχετίζονται µε την αρχιτεκτονική Εµπείρων Συστηµάτων πρώτης και δεύτερης γενεάς,

καθώς επίσης και µε την Τεχνολογία Γνώσης (Knowledge Engineering) που αναφέρεται

και διέπει τη µεθοδολογία ανάπτυξης των Εµπείρων Συστηµάτων.

Βλέποντάς τη συνολικά, η Θεµατική Ενότητα ΠΛΗ31 πλην του Τόµου Α΄ υπό τον τίτλο

Έµπειρα Συστήµατα και Εφαρµογές, περιλαµβάνει άλλους δυο τόµους. Τον Τόµο Β΄ υπό

τον τίτλο 14. Νευρωνικά ∆ίκτυα και Εφαρµογές και τον Τόµο Γ΄ υπό τον τίτλο 15.

Γενετικοί Αλγόριθµοι και Εφαρµογές. Από τους τίτλους και µόνο των τριών τόµων είναι

φανερό ότι ο Τόµος Α΄ σκοπό έχει να µας εισαγάγει στον αρχικό, βασικό προβληµατισµό

που οδήγησε στην ανάπτυξη του κλάδου της Επιστήµης Υπολογιστών που ονοµάστηκε

Τεχνητή Νοηµοσύνη (Artificial Intelligence) και τις θεµελιώδεις αρχές ανάπτυξης και

κάποια χαρακτηριστικά παραδείγµατα ανάπτυξης εφαρµογών των Εµπείρων Συστηµάτων

(Expert Systems). Οι άλλοι δυο τόµοι αναφέρονται σε θέµατα που τείνουν να

Page 4: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

4

αποτελέσουν κλάδους της λεγόµενης Υπολογιστικής Νοηµοσύνης (Computational

Intelligence) και αναφέρονται στις αρχές θεµελίωσης και ανάπτυξης των Τεχνητών

Νευρωνικών ∆ικτύων (Artificial Neural Networks) που γίνεται στον Τόµο Β΄ και σε

αυτές των Γενετικών Αλγορίθµων (Genetic Algorithms) που γίνεται στον Τόµο Γ΄.

Συνολικά, η ύλη των τριών αυτών τόµων προσφέρει µια σφαιρική παρουσίαση τριών

διαφορετικών τρόπων προσέγγισης και ανάπτυξης αντίστοιχων εφαρµογών για την

επίλυση προβληµάτων.

Είναι σηµαντικό να καταλάβουµε ότι οι τρεις διαφορετικές αυτές µεθοδολογίες και

τρόποι προσέγγισης αν και διαφορετικές, δεν είναι ούτε εντελώς ξένες µεταξύ τους, ούτε

αλληλοαποκλειόµενες. Αντιθέτως όπως θα έχουµε την ευκαιρία να δούµε, πολλά

προβλήµατα µπορούν να επιλυθούν µε τρόπους που προτείνονται και από τρεις

διαφορετικές αυτές µεθοδολογίες. Αρκετές φορές µάλιστα θα δούµε ότι µπορούν να

συνδυαστούν στους λεγόµενους υβριδικούς αλγορίθµους (hybrid algorithms) οι οποίοι

έχουν ενσωµατώσει, ολοκληρώσει και υλοποιήσει επιµέρους τµήµατα και από τις τρεις

αυτές µεθοδολογικές προσεγγίσεις.

Ίσως η κύρια διαφοροποίηση των Εµπείρων Συστηµάτων από τις άλλες δυο

µεθοδολογίες, δηλαδή από τα Τεχνητά Νευρωνικά ∆ίκτυα και τους Γενετικούς

Αλγορίθµους να βρίσκεται στον τρόπο µε τον οποίο κωδικοποιείται η υπάρχουσα γνώση

που θα µας οδηγήσει στην επίλυση ενός προβλήµατος. Για τα µεν Έµπειρα Συστήµατα, ο

τρόπος αναπαράστασης της γνώσης είναι συµβολικός (symbolic knowledge

representation) και η µέθοδος επίλυσης ακολουθεί ντετερµινιστικά τα βήµατα της

µαθηµατικής λογικής, υιοθετώντας συχνά τη χρήση ευρετικών (heuristics) δηλαδή

µηχανισµών ειδικών µηχανισµών πλοήγησης και εστίασης µέσα σε ένα πολύ µεγάλο

χώρο αναζήτησης λύσεων (search space). Αντίθετα, τόσο στα Τεχνητά Νευρωνικά

∆ίκτυα, όσο και στους Γενετικούς Αλγόριθµους η υπάρχουσα γνώση κωδικοποιείται µε

διαφορετικό, µη-συµβολικό τρόπο, ενώ η µέθοδος επίλυσης δεν ακολουθεί αυστηρά

µαθηµατικά βήµατα, αλλά είναι περισσότερο εξελικτική (evolutionary) και

πιθανοκρατική (probabilistic). Στα µεν Τεχνητά Νευρωνικά ∆ίκτυα η αποθήκευση της

γνώσης γίνεται µέσα στην ίδια τη δοµή και τα χαρακτηριστικά του Νευρωνικού ∆ικτύου

Page 5: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

5

που έχει υλοποιηθεί για την επίλυση του προβλήµατος. Στους δε Γενετικούς

Αλγόριθµους η υπάρχουσα γνώση έχει µε κατάλληλο τρόπο κωδικοποιηθεί στην δοµή

των υπό αναζήτηση λύσεων του προβλήµατος, στον τρόπο που οι λύσεις αυτές

συνδυάζονται µεταξύ τους µε την ελπίδα ότι οι προκύπτοντες συνδυασµοί θα είναι

καλύτερες λύσεις και στον µαθηµατικό τρόπο µε τον οποίο οι διάφορες λύσεις τις οποίες

επεξεργάζεται ο Γενετικός Αλγόριθµος αξιολογούνται και χαρακτηρίζονται ως καλές,

καλύτερες, βέλτιστες λύσεις ή αντίθετα ως κακές, χειρότερες ή χείριστες λύσεις του

προβλήµατος.

Είναι επίσης οι διαφορετικές χρονικές περίοδοι ανεξάρτητης εµφάνισης και ανάπτυξης

των τριών αυτών µεθοδολογιών που οδήγησαν στον διαχωρισµό της «κλασικής»

Τεχνητής Νοηµοσύνης που αναφέρεται στον συµβολικό τρόπο αναπαράστασης και

µαθηµατικής επίλυσης των προβληµάτων όπως γίνεται στα Έµπειρα Συστήµατα, από τον

περιγραφικό, µη-συµβολικό, εξελικτικό, υπολογιστικό και σε ένα µεγάλο βαθµό

πιθανοκρατικό τρόπο επίλυσης των προβληµάτων που ακολουθούν οι τεχνικές των

Τεχνητών Νευρωνικών ∆ικτύων και των Γενετικών Αλγορίθµων. Για το λόγο αυτό και

εντελώς περιγραφικά χρησιµοποιούµε τη διάκριση µεταξύ Τεχνητής (εννοώντας

συµβολικής) Νοηµοσύνης που αφορά κυρίως στα Έµπειρα Συστήµατα και

Υπολογιστικής Νοηµοσύνης που αφορά στα Τεχνητά Νευρωνικά ∆ίκτυα και τους

Γενετικούς Αλγόριθµους. Φυσικά, όπως όλες οι διακρίσεις και οι ταξινοµήσεις, έτσι και

η προαναφερθείσα είναι γέννηµα του δικού µας µυαλού και γίνεται περισσότερο για δική

µας ευκολία και όχι γιατί κατ’ ανάγκη υφίσταται κατ’ ουσία. Έτσι, όπως τονίστηκε

προηγουµένως οι τρεις αυτές τεχνικές συχνά µπορούν να συνδυαστούν για την

υλοποίηση υβριδικών αλγορίθµων που παρουσιάζουν συνδυαζόµενες υψηλότερη

απόδοση απ’ ότι η καθεµία από τις µεθόδους αυτές χωριστά.

Μένει λοιπόν σε σας να ανακαλύψετε µέσα από την Θεµατική Ενότητα ΠΛΗ31 του

Ελληνικού Ανοικτού Πανεπιστηµίου τους θαυµαστούς αυτούς τρόπους µε τους οποίους

η Επιστήµη Υπολογιστών συνδυάζεται σε µια καινούργια σύνθεση µε τη Φιλοσοφία, τα

Μαθηµατικά, τη Νευροφυσιολογία, τις Γνωσιακές Νευροεπιστήµες, την Γνωστική

Ψυχολογία, τη Βιολογία και την ∆αρβινική Θεωρία της εξέλιξης των ειδών. Η

Page 6: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

6

καινούργια και συνεχώς εµπλουτιζόµενη αυτή σύνθεση που αφορά στην Τεχνητή /

Υπολογιστική Νοηµοσύνη και τις εφαρµογές της προσπαθεί µε τα µεθοδολογικά της

εργαλεία να απαντήσει στα καίρια ερωτήµατα σχετικά µε τη φύση, τις ιδιότητες, τα

χαρακτηριστικά και τις λειτουργίες της Νοηµοσύνης όπως αυτή απαντάται στα φυσικά-

βιολογικά συστήµατα όπως ο άνθρωπος, αλλά και να καταφέρει να ενσωµατώσει τα

νοήµονα αυτά χαρακτηριστικά και τις νοητικές λειτουργίες στα υπολογιστικά

συστήµατα. Ίσως είναι αυτά τα δυο καίρια ζητήµατα που κάνουν την Θεµατική Ενότητα

ΠΛΗ31 ιδιαιτέρως ενδιαφέρουσα και συναρπαστική.

Page 7: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

7

1. Σύνοψη 1ου Κεφαλαίου

Στο 1ο Κεφάλαιο του Τόµου Α΄ (σελ. 15 - 32), που είναι το εισαγωγικό του τόµου αυτού

δίνονται τέσσερις διαφορετικοί ορισµοί της Τεχνητής Νοηµοσύνης (ΤΝ) σε µια

προσπάθεια καθορισµού και οριοθέτησης του σχετικού επιστηµονικού πεδίου. Πέρα από

την προσπάθεια ορισµού του τι είναι η ΤΝ, γίνεται µια ιστορική αναδροµή των

προσπαθειών ανάπτυξης της, των προβληµάτων που παρουσιάστηκαν, των λανθασµένων

οδών που κατά καιρούς ακολουθήθηκαν αλλά και των επιτυχιών που επιτεύχθηκαν.

Ιδιαίτερη αναφορά γίνεται σε έναν από τους θεωρούµενους ως πατέρες της ΤΝ, δηλαδή

στον Alan Touring και την περίφηµη οµώνυµη δοκιµή Touring (Touring Test) που

πρότεινε προκειµένου για να διαπιστώσει κάποιος αν κάποιο τεχνητό σύστηµα (για

παράδειγµα ένα υπολογιστικό σύστηµα) διαθέτει ευφυΐα ή όχι. Στη συνέχεια

παρουσιάζονται δυο πολύ βασικές έννοιες της ΤΝ, συγκεκριµένα η έννοια του συµβόλου

και της επεξεργασίας συµβόλων (symbolic processing) του και η έννοια του ευρετικού

(heuristic), έννοιες που θα αναπτυχθούν θεωρητικά πιο αναλυτικά στα επόµενα

Κεφάλαια όπου και θα παρουσιασθούν χαρακτηριστικά παραδείγµατα χρήση τους.

1.1 Προσπάθειες Ορισµού της Τεχνητής Νοηµοσύνης

Στο βασικό θέµα του 1ου Κεφαλαίου, δηλαδή στο ερώτηµα «τι είναι η Τεχνητή

Νοηµοσύνη», εύκολα καταλαβαίνει κανείς ότι δεν µπορεί να δοθεί µονοσήµαντη και

οριστική απάντηση. Ίσως ο πιο ευσύνοπτος και µαθηµατικοποιηµένος (άρα καθόλου

περιγραφικός) ορισµός να είναι ο εξής:

ΤΝ = Αναπαράσταση Γνώσης + Αναζήτηση

Παρουσιάζονται τέσσερις διαφορετικοί ορισµοί, γεγονός που επιτείνει την αίσθηση ότι ο

ορισµός της έννοιας Τεχνητή Νοηµοσύνη δεν είναι ούτε εύκολος, πιθανόν ούτε και

µονοσήµαντος. Οι τέσσερις ορισµοί που δίνονται είναι οι εξής:

1. Τεχνητή Νοηµοσύνη είναι ένας κλάδος της Πληροφορικής ο οποίος ασχολείται µε

την αυτοµατοποίηση ευφυούς συµπεριφοράς.

Page 8: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

8

2. Τεχνητή Νοηµοσύνη είναι η µελέτη των µηχανισµών που διέπουν την ευφυή

συµπεριφορά, µέσω της κατασκευής και αξιολόγησης συστηµάτων τα οποία

παριστάνουν τους µηχανισµούς αυτούς.

3. Τεχνητή Νοηµοσύνη είναι η ανάπτυξη υπολογιστικών συστηµάτων για την επίλυση

δύσκολων προβληµάτων, τα οποία δεν µπορούν να επιλυθούν µε την εξαντλητική

εξέταση όλων των πιθανών λύσεων µια και αυτές µπορεί να είναι πάρα πολλές.

4. Τεχνητή Νοηµοσύνη είναι η µελέτη του πως κάνουµε τον υπολογιστή να πράξει κάτι

που επί του παρόντος ο άνθρωπος µπορεί να πράξει καλύτερα.

Από τους παραπάνω τέσσερις ορισµούς, οι πρώτοι δύο εισάγονται από τους Luger και

Stubblefield, ο τρίτος έχει προταθεί από διάφορους ερευνητές, ενώ τον τελευταίο

οφείλουµε στους Rich και Knight. Επιπρόσθετα ίσως είναι χρήσιµο να αναφερθούµε

στους παρακάτω ορισµούς της Τεχνητής Νοηµοσύνης:

5. Τεχνητή Νοηµοσύνη είναι η προσπάθεια να κατασκευάσουµε υπολογιστές µε

διανοητική ικανότητα µε την πλήρη και την κυριολεκτική έννοια του όρου.

6. Τεχνητή Νοηµοσύνη είναι η µελέτη των υπολογισµών που καθιστούν εφικτή την

αντίληψη, τη λογική σκέψη και την αντίδραση.

Ο πέµπτος ορισµός προτάθηκε από τον Haugeland, ενώ ο έκτος από τον Wilson. Ίσως

ισχυριστεί κάποιος ότι οι παραπάνω συνολικά έξι ορισµοί αντί να καλυτερεύουν τα

πράγµατα, µάλλον συσκοτίζουν το θέµα, επιτείνοντας τη σύγχυση. Ωστόσο είναι φανερό

ότι όλοι τους καταφέρνουν και φωτίζουν κάποιες όψεις ή χαρακτηριστικά της Τεχνητής

Νοηµοσύνης, αλλά φαίνεται να αδυνατούν να τα συµπεριλάβουν όλα και να τα

περιγράψουν µε την βαρύτητα που απαιτείται. ∆εν θα πρέπει όµως να απογοητευόµαστε,

αλλά να οδηγηθούµε σε πιο σύνθετες περιγραφές και ορισµούς, όπως αυτός που δίνεται

από τους Βλαχάβα και συνεργάτες:

Page 9: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

9

7. Τεχνητή Νοηµοσύνη είναι ο τοµέας της Επιστήµης Υπολογιστών που ασχολείται µε

τη σχεδίαση και την υλοποίηση προγραµµάτων τα οποία είναι ικανά να µιµηθούν

τις ανθρώπινες γνωστικές ικανότητες, εµφανίζοντας έτσι χαρακτηριστικά που

αποδίδουµε σε ανθρώπινη συµπεριφορά, όπως η επίλυση προβληµάτων, η αντίληψη

µέσω των όρασης, η µάθηση, η εξαγωγή συµπερασµάτων, η κατανόηση φυσικής

γλώσσας, κλπ.

Ο παραπάνω ορισµός αν και αρκετά πιο ανθρωποκεντρικός από τους προηγούµενους,

προσπαθεί να ορίσει την ΤΝ µε βάση κάποιες χαρακτηριστικές ανθρώπινες νοητικές

λειτουργίες και την ανθρώπινη συµπεριφορά. Φυσικά απέχει από το να είναι πλήρης και

περιεκτικός. Θα µπορούσε να γενικευθεί ακόµα περισσότερο, δεδοµένου ότι πολλά από

τα χαρακτηριστικά και τις ιδιότητες που αναφέρει δεν είναι αποκλειστικά ανθρώπινα.

Για παράδειγµα αντίληψη µέσω όρασης έχουν τα περισσότερα από τα ζώα, µάλιστα

κάποια από αυτά σε πολύ υψηλότερα επίπεδα απόδοσης από τα ανθρώπινα. Επιπλέον,

θαλάσσια θηλαστικά όπως τα δελφίνια ή ιπτάµενα θηλαστικά όπως οι νυχτερίδες έχουν

ενσωµατωµένους µηχανισµούς ηχω-ακουστικής αντίληψης (sonar) που τους επιτρέπουν

να έχουν τρισδιάστατη αντίληψη του περιβάλλοντος χώρου όχι µέσω της όρασης αλλά

από την λήψη των ανακλάσεων υψίσυχνων ήχων που τα ίδια εκπέµπουν. Εναλλακτικά θα

µπορούσε να γίνει αναφορά στην ικανότητα αντίληψης µέσω των αισθήσεων (κι όχι της

όρασης αποκλειστικά). Επίσης ιδιότητες µάθησης διαθέτουν λίγο ως πολύ όλα τα έµβια

όντα. Τέλος ούτε η δυνατότητα παραγωγής και επεξεργασίας γλώσσας είναι

αποκλειστικά ανθρώπινο προνόµιο, καθώς απαντάται σε πολλά είδη του ζωικού

βασιλείου και µάλιστα µε πολύ πλούσιο ρεπερτόριο λέξεων.

Παρ’ όλες τις αδυναµίες των ορισµών που παρατέθηκαν προκύπτει ότι το βασικό

πρόβληµα σχετίζεται περισσότερο µε το γεγονός πως η ΤΝ πρέπει να ορισθεί µε βάση

άλλες έννοιες που είναι εξίσου δύσκολο, αν όχι δυσκολότερο να ορισθούν. Έννοιες όπως

ευφυΐα, µάθηση, αντίληψη, κατανόηση, διανοητική ικανότητα, κλπ., που συναντήσαµε

στους παραπάνω ορισµούς είναι εξαιρετικά δύσκολο να ορισθούν από µόνες τους χωρίς

να οδηγηθούµε σε κυκλικές αναφορές και ορισµούς (δηλαδή µια από τις έννοιες να

ορίζεται µε βάση κάποιες από τις υπόλοιπες). Μια επιπλέον δυσκολία είναι ότι η ΤΝ σαν

Page 10: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

10

επιστηµονικός κλάδος είναι ραγδαία αναπτυσσόµενος µε αποτέλεσµα πολλές

προσπάθειες ορισµού της να ξεπερνιούνται από τις ίδιες τις εξελίξεις αυτού ή άλλων

επιστηµονικών πεδίων.

1.2 Η ∆οκιµή Turing

Ήδη από το 1950, κι ενώ ο κλάδος της ανάπτυξης υπολογιστών σε θεωρητικό και

πρακτικό επίπεδο ήταν ακόµα στα σπάργανα, ο άγγλος µαθηµατικός Alan Turing (1912 –

1954) εµπνεύστηκε και πρότεινε την οµώνυµη δοκιµή προκειµένου να προσδιοριστεί αν

κάποιο τεχνητό σύστηµα διαθέτει ή όχι ευφυΐα (νοηµοσύνη). Σύµφωνα µε όσα πρότεινε

ο Turing η δοκιµή περιλαµβάνει τρεις ξεχωριστούς χώρους (δωµάτια), έναν για το υπό

δοκιµή τεχνητό σύστηµα, έναν για έναν άνθρωπο που χρησιµοποιείται ως σύστηµα

αναφοράς και σύγκρισης και τέλος ένα τρίτο χώρο για έναν άνθρωπο που παίζει το ρόλο

του εξεταστή. Ο εξεταστής δεν γνωρίζει σε ποιον από τους τρεις χώρους βρίσκεται το

υπό εξέταση τεχνητό σύστηµα και σε ποιο ο άνθρωπος-σύστηµα αναφοράς. Η δοκιµή

Touring προβλέπει την υποβολή από τον εξεταστή µιας σειράς ερωτήσεων προς τους

εβρισκόµενους στα δυο πρώτα δωµάτια και αξιολόγηση των απαντήσεων που λαµβάνει

από αυτούς. Αν στο τέλος της δοκιµής, δηλαδή αν ο εξεταστής εξαντλήσει τον κατάλογο

των ερωτήσεων και δεν είναι σε θέση να διακρίνει σε ποιο δωµάτιο βρίσκεται το υπό

δοκιµή τεχνητό σύστηµα και σε ποιο χώρο βρίσκεται ο άνθρωπος-σύστηµα αναφοράς,

τότε το τεχνητό σύστηµα διαθέτει ευφυΐα.

Η δοκιµή Touring αποτελεί µια (επίσης ανθρωποκεντρική) προσπάθεια όχι τόσο ορισµού

αλλά εντοπισµού της ευφυΐας. Είναι εξόχως ανθρωποκεντρική, όπως κάποιοι από τους

ορισµούς της ΤΝ που είδαµε στην προηγούµενη παράγραφο 1.1, αλλά και αφοπλιστικά

απλή στη σύλληψή της. Κλειδί της επιτυχίας ή αποτυχίας της δοκιµής Touring είναι το

περιεχόµενο της σειράς των ερωτήσεων που θα τεθούν κατά τη διάρκειά της. Κάποιες

από αυτές θα µπορούσε να είναι ερωτήσεις-παγίδες. Για παράδειγµα, ένα αρκετά

υψηλών επιδόσεων υπολογιστικό σύστηµα θα πρέπει να είναι ικανό για να απαντήσει

σωστά σε ερωτήσεις που θα αφορούσαν στην κατανόηση φυσικής γλώσσας,

αναγνώρισης προτύπων, εξαγωγής συµπερασµάτων, κλπ., αλλά ταυτόχρονα θα έπρεπε

να είναι αρκετά «έξυπνο» ώστε να αργήσει να απαντήσει σε µια ερώτηση που θα

Page 11: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

11

αφορούσε στον πολλαπλασιασµό ή τη διαίρεση πολυψήφιων αριθµών, καθυστερώντας

δηλαδή όπως θα έκανε και ο µέσος άνθρωπος (όπως ο άνθρωπος-σύστηµα αναφοράς που

βρίσκεται στο διπλανό δωµάτιο) αν είχε να αντιµετωπίσει παρόµοιο πρόβληµα και

έπρεπε να κάνει τον ζητούµενο υπολογισµό µε το µυαλό του ή µε µολύβι και χαρτί.

Όπως ήταν φυσικό, η ∆οκιµή Touring δεν βοήθησε µόνο στο να τεθεί µε καθαρά

πρακτικούς όρους το πρόβληµα εντοπισµού και αναγνώρισης της νοηµοσύνης και της

ευφυούς συµπεριφοράς, αλλά ταυτόχρονα έβαλε πολύ υψηλά τον πήχη για την απόδοση

του χαρακτηρισµού ενός συστήµατος ως ευφυές. Ως εκ τούτου κανένα από τα µέχρι

τώρα υπολογιστικά συστήµατα δεν έχει καταφέρει να περάσει επιτυχώς τη ∆οκιµή

Touring, αν και σχετικοί διαγωνισµοί οργανώνονται σε ετήσια βάση. Επιπλέον, ως

ευχάριστη παρενέργεια ενέπνευσε τον κόσµο της Τέχνης όπως πολλά λογοτεχνικά

κείµενα ιδιαίτερα της κατηγορίας της επιστηµονικής φαντασίας, αλλά και

κινηµατογραφικά έργα µε χαρακτηριστικότερο το Blade Runner του Ridley Scott, του

οποίου η αρχική σκηνή είναι η διενέργεια µιας παραλλαγµένης δοκιµής Touring.

1.3 Ιστορική Αναδροµή

Στην ιστορική αναδροµή τονίζονται επιτυχίες των υπολογιστών σε πεδία που κατ’

εξοχήν θεωρούνται ίδιον της ανθρώπινης ευφυΐας, όπως αυτή του υπολογιστή της

εταιρείας IBM µε την κωδική ονοµασία Deep Blue ο ποίος κατόρθωσε το 1996 να

νικήσει τον παγκόσµιο πρωταθλητή Garry Kasparov στο σκάκι. Ωστόσο και αυτό το

αποτέλεσµα που δικαίως θεωρείται η µεγαλύτερη επιτυχία της ΤΝ δεν παύει να µας

υπενθυµίζει ότι είναι άλλο η µηχανική ευφυΐα του Deep Blue που απορρέει από την

γρήγορη ανάλυση κινήσεων και άλλο η ύπαρξη βαθιάς κατανόησης και συνείδησης των

κινήσεων αυτών.

Η αρχική προσέγγιση της προσπάθειας ανάπτυξης συστηµάτων για επίλυση

προβληµάτων ελάχιστα αναγνώρισε τον ουσιαστικό ρόλο που διαδραµατίζει η γνώση και

ο κατάλληλος χειρισµός της για την επίλυση προβληµάτων. Υπήρχε η λανθασµένη όπως

αποδείχθηκε εκ των υστέρων άποψη ότι το µόνο που χρειάζεται είναι η εξερεύνηση ενός

µεγάλου (όσο µεγάλου) αριθµού λύσεων και η επιλογή της καλύτερης. Η αντίληψη αυτή

οδήγησε τους Newell και Simon στην ανάπτυξη του Συστήµατος Γενικής Επίλυσης

Page 12: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

12

Προβληµάτων (General Problem Solver - GPS), που θα µπορούσε να λύσει οποιοδήποτε

πρόβληµα σε οποιοδήποτε τοµέα. Σχέδιο υπερβολικά φιλόδοξο, το οποίο

εγκαταλείφθηκε µετά από µια δεκαετή άγονη προσπάθεια, αλλά βοήθησε στο να υπάρξει

µια ριζική αλλαγή προσανατολισµού µε πιο ανθρωποκεντρική διάθεση. Έτσι

αναπτύχθηκε ενδιαφέρον για την αναπαράσταση γνώσης µε συµβολικό και περιγραφικό

τρόπο που οδήγησε στην ανάπτυξη γλωσσών προγραµµατισµού ειδικών για εφαρµογές

ΤΝ.

1.4 Συστήµατα και Επεξεργασία Φυσικών Συµβόλων

Όπως είδαµε στην προηγούµενη παράγραφο 1.3 η γνώση αποτελεί βασικό µέρος ενός

συστήµατος ΤΝ. Το ίδιο και η αναπαράστασή της µε τη µορφή δοµών συµβόλων (symbol

structures), και η συνακόλουθη υπόθεση του συστήµατος φυσικών συµβόλων (physical

symbol system hypothesis) που προτάθηκε από τους Newell και Simon το 1976. Ένα

τέτοιο σύστηµα αποτελείται από σύµβολα, που απαρτίζουν δοµές συµβόλων οι οποίες

υπόκεινται σε επεξεργασία µέσα από ένα αριθµό διεργασιών που περιλαµβάνει το

σύστηµα, όπως αυτές της δηµιουργίας, τροποποίησης, αναπαραγωγής και καταστροφής.

Οι δοµές συµβόλων του συστήµατος εξελίσσονται δυναµικά. Σύµφωνα µε την υπόθεση

των Newell και Simon (και εδώ είναι το ενδιαφέρον), ένα τέτοιο σύστηµα έχει τα

αναγκαία και επαρκή µέσα για την ανάπτυξη ευφυούς συµπεριφοράς. Η υπόθεση αυτή

δεν µπορεί βέβαια ούτε να αποδειχθεί ούτε να απορριφθεί λογικά. Έτσι, µένει η κατά

περίπτωση πειραµατική της επιβεβαίωση.

1.5 Αλγόριθµοι και ευρετικά

Είναι σηµαντικό να κατανοήσουµε την έννοια του ευρετικού και τη χρησιµότητά του

στην επίλυση προβληµάτων µε χρήση ΤΝ. Για να γίνει κατανοητό το ευρετικό πρέπει να

αντιδιαστείλουµε τις καθαρά αυστηρές αλγοριθµικές τεχνικές µε τις λεγόµενες ευρετικές

υπολογιστικές µεθόδους. Μια καθαρά αλγοριθµική µέθοδος είναι µια βήµα-προς-βήµα

µέθοδος που ανάλογα µε τα δεδοµένα του προβλήµατος θα αναζητήσει εξαντλητικά το

ζητούµενο αποτέλεσµα. Στον πραγµατικό κόσµο αυτό δεν είναι πάντα εφικτό, καθώς

υπάρχουν προβλήµατα που ο χώρος αναζήτησης (search or problem space) µπορεί να

αποδειχθεί τεράστιος και έξω από τις δυνατότητες του υπολογιστικού συστήµατος. Άλλα

Page 13: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

13

προβλήµατα είναι η αβεβαιότητα (uncertainty) και η ηµιτέλεια (incompleteness) των

δεδοµένων. Η ύπαρξη τέτοιων προβληµάτων µπορεί να οδηγήσει σε ατέρµονη

αναζήτηση, να καταστήσει αδύνατη την κατάληξη σε λύση ή να οδηγήσει σε

λανθασµένη λύση του προβλήµατος.

Σε αυτές τις περιπτώσεις µια ευρετική µέθοδος µπορεί να οδηγήσει σε λύση είτε στη

βέλτιστη, είτε σε λύση κοντά στη βέλτιστη (το οποίο είναι προτιµότερο από το να µην

έχουµε λύση). Οι ευρετικές µέθοδοι ενσωµατώνουν τα λεγόµενα ευρετικά που δεν είναι

τίποτα περισσότερο παρά κανόνες που παρέχουν µια χρήσιµη και πολλές φορές πιο

γρήγορη πλοήγηση και καθοδήγηση στον χώρο αναζήτησης του προβλήµατος οδηγώντας

σε βέλτιστες ή υποβέλτιστες λύσεις. Χρειάζεται προσοχή και πρέπει να είναι κατανοητό

ότι τα ευρετικά δεν εγγυώνται αναγκαστικά την επιτυχία, ούτε είναι κατ’ ανάγκη

αλάνθαστα. Μπορούν δηλαδή να οδηγήσουν πιο γρήγορα µεν αλλά να καταλήξουν σε

σηµεία που να µην υπάρχει λύση. Συνεπώς µπορεί να αυξάνουν την ταχύτητα σύγκλισης

του αλγορίθµου, ενδεχοµένως όµως σε βάρος της πληρότητας του.

Αν εξαιρέσουµε τις καθολικές αλήθειες (universal truths), όλη η υπόλοιπη γνώση που

χρησιµοποιούµε είναι ουσιαστικά ευρετικά µια και πρόκειται για εµπειρική γνώση και

απέχει πολύ από το να θεωρηθεί αλάνθαστη. Σε ένα σύστηµα ΤΝ ενδεχοµένως να

υπάρχουν διάφορα σηµεία και επίπεδα που εφαρµόζονται ευρετικά. Στη γενική

περίπτωση µπορεί να έχουµε τα λεγόµενα µετα-ευρετικά (meta-heuristics), δηλαδή

ευρετικά που καθοδηγούν τη χρήση άλλων ευρετικών.

Φυσικά ευρετικά χρησιµοποιούµε και στην καθηµερινή µας ζωή. Όταν οδηγούµε στο

δρόµο για να πάµε από το σηµείο Α στο σηµείο Β υπάρχουν πολλές διαφορετικές

διαδροµές που µπορούµε να ακολουθήσουµε εναλλακτικά. Το σύνολο αυτών των

διαδροµών αποτελεί το χώρο αναζήτησης, µέσα στον οποίο πρέπει να ερευνήσουµε για

να βρούµε τη βέλτιστη ή κάποιες υποβέλτιστες λύσεις. Εδώ σαν βέλτιστη λύση είναι η

διαδροµή που θα µας πάει στον προορισµό µας στο λιγότερο χρόνο. Όταν αποφασίζουµε

να µην περάσουµε από κάποιο σηµείο που εµπειρικά γνωρίζουµε ότι υπάρχει

συνωστισµός (π.χ. γίνεται τη συγκεκριµένη µέρα γίνεται λαϊκή αγορά, ή τη

Page 14: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

14

συγκεκριµένη ώρα έχει πολύ αυξηµένη κίνηση, κλπ), ουσιαστικά κάνουµε χρήση ενός

ευρετικού για να αποκλείσουµε κάποια ή κάποιες πιθανές διαδροµές από το σύνολο

λύσεων που υπάρχουν στο χώρο αναζήτησης. Συνεπώς η υιοθέτηση του συγκεκριµένου

ευρετικού µειώνει το χώρο αναζήτησης, άρα µειώνει το χρόνο που θα χρειαστούµε για να

επεξεργαστούµε τα δεδοµένα και να καταλήξουµε στην βέλτιστη διαδροµή-λύση.

Το παραπάνω είναι παράδειγµα ευρετικού που λειτουργεί ως κλαδευτήρι (pruning

heuristics) καθώς φαίνεται ότι η λειτουργία του είναι να ψαλιδίζει το χώρο αναζήτησης

του προβλήµατος. Υπάρχουν όµως και ευρετικά που οδηγούν απ’ ευθείας σε κάποια

λύση (homing heuristics). Ανεξάρτητα από τη λειτουργία τους, τα ευρετικά πρέπει να

διατυπώνονται µε κατά το δυνατόν γενικότερους όρους.

Για τη χρήση (απλής) λογικής στην επίλυση προβληµάτων δείτε την 16. Άσκηση 1: Το

νησί των εντίµων και των απατεώνων και την 17. Άσκηση 2: Καπέλα µε φτερά.

Page 15: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

15

2. Σύνοψη 2ου Κεφαλαίου

Το 2ο Κεφάλαιο αναφέρεται στην Επίλυση Προβληµάτων (problem solving). ∆εδοµένου

ότι η ΤΝ ασχολείται µε προβλήµατα πολύπλοκων προβληµάτων των οποίων η επίλυση

συχνά απαιτεί διερεύνηση σε πολύ µεγάλους χώρους αναζήτησης, τίθενται επιτακτικά

ζητήµατα που αφορούν σε θέµατα αναπαράστασης του υπό διερεύνηση προβλήµατος και

των αναζητούµενων λύσεων. Σε ότι αφορά τις µεθόδους αναζήτησης λύσεων,

συζητούνται δυο από τις πιο χαρακτηριστικές τυφλές µεθόδους αναζήτησης (blind search

methods), όπως η αναζήτηση σε βάθος (depth-first search) και η αναζήτηση σε πλάτος

(breadth-first search). Σαν επόµενο βήµα περιγράφεται ο αλγόριθµος Α* ο οποίος

υλοποιεί αναζήτηση µε χρήση ευρετικών. Παρουσιάζονται οι έννοιες της ενέργειας και

του τελεστή δράσης που οδηγεί από µια κατάσταση αναζήτησης σε κάποια άλλη, όπως

και το πρόβληµα πλαισίου (frame problem) που περιγράφει τις αλλαγές που επέρχονται

σε µια κατάσταση από την εφαρµογή µιας ενέργειας (τελεστή δράσης). Τέλος, γίνεται

αναφορά στα προβλήµατα ταξινόµησης και τα προβλήµατα σύνθεσης και τη

διαφοροποίησή τους.

2.1 Αναπαράσταση ενός προβλήµατος και το πρόβληµα της αναπαράστασης

Για την επίλυση ενός προβλήµατος µέσω αναζήτησης µιας σειράς καταστάσεων,

απαιτούνται τα εξής:

• αναπαράσταση των καταστάσεων του προβλήµατος

• προσδιορισµός των ενεργειών, δηλαδή τελεστών δράσης που µας οδηγούν από

µια κατάσταση σε µια άλλη

• ένας µηχανισµός πλοήγησης στον χώρο αναζήτησης, ο οποίος πιθανόν να

υιοθετεί τη χρήση ευρετικών

Τα παραπάνω τρία στοιχεία αποτελούν το λεγόµενο πρόβληµα αναπαράστασης

(representation problem) ενός υπό εξέταση προβλήµατος, πράγµα που σηµαίνει πως για

να λύσουµε ένα πρόβληµα, πρέπει πρώτα να λύσουµε το πρόβληµα της αναπαράστασης

του προβλήµατος αυτού. Είναι σηµαντικό να κατανοήσουµε ότι η επίλυση του

προβλήµατος της αναπαράστασης ενός προβλήµατος, ουσιαστικά οδηγεί στη λύση το

υπό εξέταση πρόβληµα. Το πρόβληµα της αναπαράστασης ενός προβλήµατος δεν είναι

Page 16: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

16

πάντοτε εύκολη υπόθεση καθώς µπορεί να προκύψουν µεγάλοι ή εναλλακτικοί χώροι

αναζήτησης για τους οποίους δεν µπορούµε να αποφανθούµε ποιος είναι ο προτιµότερος.

Ας σηµειωθεί επίσης ότι από τα τρία προαναφερόµενα στοιχεία του προβλήµατος

αναπαράστασης τα δυο πρώτα (δηλαδή η αναπαράσταση των καταστάσεων και ο

προσδιορισµός των τελεστών δράσης) εξαρτώνται άµεσα από το υπό εξέταση πρόβληµα.

Αντίθετα, το τρίτο στοιχείο, δηλαδή ο µηχανισµός πλοήγησης και οι γενικές µέθοδοι στις

οποίες βασίζεται ένας τέτοιος µηχανισµός είναι εν γένει ανεξάρτητος από το υπό εξέταση

πρόβληµα.

Όπως και σε οποιοδήποτε άλλο πρόβληµα, έτσι και το πρόβληµα της αναπαράστασης

του υπό εξέταση προβλήµατος πρέπει να διέπεται από τις αρχές της οικονοµίας, της

απλότητας και της γενικότητας. Αν και γενικά δεν τίθεται περιορισµός σε σχέση µε την

πολυπλοκότητα της δοµής αναπαράστασης των καταστάσεων ενός προβλήµατος, ούτε

τίθεται κάποιος περιορισµός σε σχέση µε τον αριθµό και τη δοµή των τελεστών δράσης,

είναι αυτονόητο πως και ο χώρος αναζήτησης του προβλήµατος και οι τελεστές δράσης

πρέπει να είναι κατά το δυνατόν µικρότεροι αριθµητικά και απλούστεροι ως προς τη

δοµή του. Αντίστοιχη προσέγγιση πρέπει να υιοθετείται στην περίπτωση που έχει

επιλεγεί η χρήση ευρετικών για την καθοδήγηση της πλοήγησης στο χώρο αναζήτησης.

Έτσι, τόσο οι τελεστές δράσης, όσο και τα ευρετικά, πρέπει να είναι όσο πιο γενικά

γίνεται.

Όπως ειπώθηκε προηγούµενα, ένας τελεστής δράσης µας οδηγεί από µια κατάσταση σε

µια άλλη. Στη γενική του µορφή, ένας τελεστής δράσης περιγράφεται ως εξής:

Τελεστής ∆ράσης : Προκείµενο → Ενέργειας

όπου το προκείµενο είναι µια συνθήκη που πρέπει να ικανοποιείται ως βασική

προϋπόθεση για την εφαρµογή της συγκεκριµένης δράσης. Στη γενική περίπτωση οι

ενέργειες µπορεί να λειτουργούν αθροιστικά ή µη-αθροιστικά, ανάλογα µε το αν

συνεπάγονται απλώς την προσθήκη ενός νέου στοιχείου στη δοµή των καταστάσεων ή

αν έχουν σαν αποτέλεσµα την προσθήκη νέων δεδοµένων και τη διαγραφή (αναίρεση)

Page 17: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

17

παλιότερων δεδοµένων. Η περιγραφή των αλλαγών που επέρχονται σε µια κατάσταση

µετά από την εφαρµογή µιας ενέργειας είναι το λεγόµενο πρόβληµα πλαισίου.

Κλείνοντας σε σχέση µε το πρόβληµα της αναπαράστασης πρέπει να διακρίνουµε τις

διάφορες καταστάσεις σε ανοικτές και κλειστές σε σχέση µε το σηµείο πλοήγησης στο

οποίο βρισκόµαστε. Οι ανοικτές καταστάσεις είτε δεν έχουν διερευνηθεί, είτε χρήζουν

περαιτέρω διερεύνησης. Οι κλειστές καταστάσεις είναι αυτές που επί του παρόντος

θεωρούνται πως έχουν διερευνηθεί. Επίσης πρέπει να έχουν προσδιοριστεί η αρχική, όσο

και η τελική κατάσταση (ή τελικές καταστάσεις, γιατί στη γενική περίπτωση µπορεί να

είναι περισσότερες από µια).

2.2 Μηχανισµοί πλοήγησης

Οι µέθοδοι πλοήγησης µας επιτρέπουν τη διερεύνηση του χώρου αναζήτησης και την

εξέταση των διαφόρων καταστάσεων που αυτός περιέχει, µε σκοπό την µετάβαση από

µια αρχική κατάσταση σε µια (ικανοποιητική) τελική κατάσταση που θεωρούµε λύση

του υπό εξέταση προβλήµατος. Στην πιο απλή µορφή τους οι µέθοδοι πλοήγησης µπορεί

να είναι εξαντλητικοί, επισκεπτόµενοι όλες τα πιθανά σηµεία (καταστάσεις) του χώρου

αναζήτησης. Μπορεί όµως να είναι πιο συστηµατικοί, όπως επίσης και να έχουν

υιοθετήσει διάφορα ευρετικά µε σκοπό την ταχύτερη εύρεση µιας αποδεκτής (ή της

µοναδικής) λύσης του υπό εξέταση προβλήµατος. Ως ελάχιστο λειτουργικό

χαρακτηριστικό, ένας µηχανισµός πλοήγησης πρέπει να είναι σε θέση να εντοπίζει

κυκλικές διαδροµές, διαφορετικά ενέχεται ο κίνδυνος η πλοήγηση να εγκλωβιστεί σε

ατέρµονης διάρκειας βρόχους. Επιπλέον για κάθε µηχανισµό πλοήγησης πρέπει να

εξετάζονται ζητήµατα που σχετίζονται µε τη χρήση πόρων του συστήµατος (απαιτήσεις

σε µνήµη και υπολογιστική ισχύ). Για την περιγραφή ενός µηχανισµού πλοήγησης πρέπει

να υιοθετήσουµε τους εξής όρους:

• ανοικτές καταστάσεις, δηλαδή αυτές που προς το παρόν δεν έχουν διερευνηθεί ή

χρειάζονται περαιτέρω διερεύνηση

• κλειστές καταστάσεις, δηλαδή αυτές που επί του παρόντος έχουν διερευνηθεί

Page 18: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

18

• προκάτοχος s΄ µιας κατάστασης s είναι η κατάσταση που οδηγεί στην s µέσω µιας

µοναδικής ενέργειας ενώ ισχύει πως η διαδροµή από την αρχική κατάσταση προς

την s, µέσω της s΄ είναι προς το παρόν η καλύτερη

• διάδοχοι της κατάστασης s είναι καταστάσεις για τις οποίες η s είναι προκάτοχος

• αδιέξοδο που είναι µια µη-τελική κατάσταση η οποία δεν έχει διαδόχους ή όλες οι

διάδοχοί της οδηγούν σε αδιέξοδο

Ως παραδείγµατα µηχανισµών πλοήγησης παρουσιάζονται στη συνέχεια η αναζήτηση σε

βάθος και η αναζήτηση σε πλάτος (που είναι τυφλές, συστηµατικές µέθοδοι) και η

µέθοδος Α* που υιοθετεί ευρετικά.

2.3 Αναζήτηση σε βάθος (depth-first search)

Αυτή η µέθοδος πλοήγησης στο χώρο αναζήτησης είναι µια γενική, τυφλή µέθοδος η

οποία εισχωρεί γρήγορα σε βάθος του χώρου αναζήτησης, θεωρώντας ότι όσο προχωρά

σε βάθος τόσο εγγύτερα βρίσκεται στην τελική κατάσταση. Η µέθοδος δεν έχει

υπερβολικές απαιτήσεις σε µνήµη και µπορεί να λειτουργήσει αποδοτικά. Μπορεί όµως

να χαθεί στο χώρο αναζήτησης ή να οδηγήσει σε αδιέξοδο χωρίς απαραιτήτως να µπορεί

να φτάσει στη βέλτιστη λύση. Σε επίρρωση αυτών των αδυναµιών µπορεί να υιοθετηθεί

ένα άνω φράγµα στο µήκος διαδροµής (δηλαδή στο βάθος) που διανύει η µέθοδος το

οποίο να τερµατίζει την περαιτέρω διερεύνηση στο σηµείο αυτό και να ξεκινά τη

διερεύνηση από την επόµενη ανοικτή κατάσταση. Για την αποφυγή του εγκλωβισµού σε

αδιέξοδο µπορεί να υιοθετηθεί η ενέργεια της οπισθοδρόµησης (backtracking), της

επιστροφής δηλαδή πίσω κατά ένα βήµα και της συνέχισης από νέα ανοικτή κατάσταση.

2.4 Αναζήτηση σε πλάτος (breadth-first search)

Σε αντίθεση µε την προηγούµενη µέθοδο αναζήτησης, η αναζήτηση σε πλάτος διερευνά

πρώτα όλες τις καταστάσεις µήκους Ν, (δηλαδή απέχουν Ν βήµατα από την αρχική

κατάσταση) πριν ξεκινήσει τη διερεύνηση καταστάσεων µήκους Ν+1. Εύκολα µπορεί να

αποδειχθεί ότι η µέθοδος οδηγεί σε βέλτιστη λύση, δηλαδή σε λύση όσο το δυνατόν

εγγύτερα στην αρχική κατάσταση. Έχει όµως υψηλότερες απαιτήσεις σε µνήµη και

χρόνο διερεύνησης, µεγέθη τα οποία αυξάνονται εκθετικά. Πράγµατι, για την εξέταση

Page 19: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

19

καταστάσεων σε απόσταση β από την αρχική η πολυπλοκότητα της αναζήτησης (σε

µνήµη, αλλά και χρόνο επεξεργασίας) είναι τάξης Ο(δβ), όπου δ ο συντελεστής

διακλάδωσης, δηλαδή ο µέσος αριθµός των διαδόχων µιας κατάστασης.

2.5 Ευρετική Αναζήτηση και ο Αλγόριθµος Α*

Οι δυο µέθοδοι πλοήγησης που αναφέρθηκαν στις παραγράφους 2.3 και 2.4 αποτελούν

συστηµατικές, τυφλές τεχνικές. Η υιοθέτηση ευρετικών σα σκοπό έχει τη µείωση των

υπό εξέταση καταστάσεων στο χώρο αναζήτησης, δηλαδή την αποφυγή επίσκεψης

συγκεκριµένων τµηµάτων του χώρου αναζήτησης µε στόχο την ταχύτερη εξεύρεση

λύσης. Σε κάθε βήµα αναζήτησης, οι ανοικτές καταστάσεις αξιολογούνται και η

διερεύνηση συνεχίζεται προς την περισσότερο «υποσχόµενη» διάδοχο κατάσταση. Η

συνάρτηση αξιολόγησης f µιας κατάστασης si ορίζεται ως:

f(si) = g(si) + h(si)

όπου η συνάρτηση g είναι το πραγµατικό (και γνωστό) κόστος µετάβασης από την

αρχική κατάσταση s0 στην κατάσταση si , ενώ η συνάρτηση h είναι µια εκτίµηση του

(άγνωστου) κόστους µετάβασης από την si στην τελική κατάσταση sg. Η επιλογή της

ευρετικής συνάρτησης πρέπει να γίνεται πολύ προσεκτικά. Τυχόν επιλογή της h που

υπερεκτιµά το κόστος µετάβασης µπορεί να οδηγήσει σε απόρριψη της κατάστασης si ,

ενώ αντίθετα, υποεκτίµηση του κόστους µπορεί να οδηγήσει σε άκαρπη διερεύνηση. Η

ευρετική συνάρτηση είναι ένας τρόπος ενσωµάτωσης γνώσης (π.χ προϋπάρχουσα

εµπειρία) σε κάποια µορφή. Ο βασικός ρόλος της γνώσης στη διαδικασία της πλοήγησης

έχει τονισθεί στο 1ο Κεφάλαιο.

Ο αλγόριθµος Α* υιοθετεί ακριβώς αυτή τη συνάρτηση αξιολόγησης και όπως

αποδεικνύεται σε περίπτωση που η τιµή της h είναι µικρότερη ή το πολύ ίση µε το

πραγµατικό κόστος µετάβασης στην τελική κατάσταση, τότε βρίσκει πάντα τη βέλτιστη

λύση. Ένας τέτοιος ευρετικός µηχανισµός ονοµάζεται αποδεκτός (admissible) καθώς

ικανοποιεί το κριτήριο αποδοχής (admissibility criterion).

Page 20: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

20

2.6 Προβλήµατα ταξινόµησης και σύνθεσης

Ως τελευταίο ζήτηµα, εξετάζεται η διαφορά των προβληµάτων ταξινόµησης

(classification problems) από αυτά της σύνθεσης (constructive problems). Η βασική

διαφορά αυτών των δυο κατηγοριών προβληµάτων είναι ότι στα προβλήµατα

ταξινόµησης η λύση επιλέγεται από ένα προκαθορισµένο σύνολο λύσεων ή κατηγοριών

µε την αναγνώριση του υπό εξέταση προβλήµατος ως περιστατικού (instance) της

συγκεκριµένης κατηγορίας (class). Έτσι, η διαδροµή προς τη λύση δεν έχει ιδιαίτερη

σηµασία. Αντίθετα η λύση ενός προβλήµατος σύνθεσης, ουσιαστικά κατασκευάζεται από

απλούστερα στοιχεία. Σε αυτή την περίπτωση, η διαδροµή προς τη λύση έχει ουσιαστική

σηµασία γιατί αποτελεί η ίδια τη λύση του προβλήµατος.

Για την καλύτερη κατανόηση της λειτουργίας των διαφόρων µεθόδων αναζήτησης και

της χρήσης των ευρετικών δείτε την 18. Άσκηση 16: Το ροµπότ και τα κουτάκια, την 19.

Άσκηση 17: The 8-puzzle, την 20. Άσκηση 18: Τρίλιζα, την 21. Άσκηση 21: Βασίλισσες

στη σκακιέρα και την 22. Άσκηση 22: Από πόλη σε πόλη µε τον Α*.

Page 21: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

21

3. Σύνοψη 3ου Κεφαλαίου

Απ’ όσα έχουµε δει στο 1ο Κεφάλαιο, όπου επιχειρήθηκε να δοθεί ένας ορισµός της ΤΝ

ως πεδίου της Επιστήµης Υπολογιστών, είναι φανερό ότι η γνώση, η αναπαράσταση

γνώσης και η Τεχνολογία Γνώσης διαδραµατίζουν καθοριστικό ρόλο στα συστήµατα ΤΝ.

Το 3ο Κεφάλαιο αποτελεί µια θεωρητική εισαγωγή στα ζητήµατα της γνώσης και της

αναπαράστασή της, έτσι ώστε να δηµιουργηθεί το απαραίτητο υπόβαθρο για να

προχωρήσουµε στα επόµενα Κεφάλαια στους βασικούς τρόπους φορµαλισµού της

αναπαράστασης γνώσης. Έτσι, στο 3ο Κεφάλαιο αναπτύσσονται οι έννοιες των

δεδοµένων, της πληροφορίας και της γνώσης µε στόχο τη διάκριση µεταξύ τους και την

κατανόηση του τρόπου µε τον οποίο δοµείται η γνώση από τα δεδοµένα και τις

πληροφορίες. Στη συνέχεια αναπτύσσονται τα διάφορα είδη γνώσης που συνήθως

αποτελούν όψεις της γνώσης που της εµπειρογνωµοσύνης που κατέχει κάποιο άτοµο. Τα

διάφορα είδη γνώσης συγκροτούν µια πυραµιδοειδή διάταξη που οδηγεί στην

εµπειρογνωµοσύνη. Μετά από αυτά εξετάζονται η αναπαράσταση γνώσης και οι

διάφορες πρακτικές και θεωρητικές ιδιότητές της. Τέλος παρουσιάζεται η ιστορική

αντιπαράθεση µεταξύ της περιγραφικής και της διαδικαστικής αναπαράσταση γνώσης.

3.1 ∆εδοµένα, Πληροφορία και Γνώση

Απαιτείται να γίνει ένας διαχωρισµός των τριών αυτών εννοιών. Ως δεδοµένο (data)

µπορούµε να ορίσουµε τη µετρήσιµη ή υπολογίσιµη τιµή µιας ιδιότητας. Τα δεδοµένα

δηλαδή αφορούν συγκεκριµένες καταστάσεις ή οντότητες και µπορούν να

συγκεντρωθούν στις αποκαλούµενες βάσεις δεδοµένων (databases). Τα δεδοµένα από

µόνα τους δεν αποτελούν πληροφορία. Χρειάζεται κάποιο πλαίσιο αναφοράς γι’ αυτό. Η

πληροφορία (information) δεν αποθηκεύεται απ’ ευθείας στη βάση δεδοµένων, αλλά

παράγεται (εξάγεται) από ένα σύνολο δεδοµένων και αποτελεί ένα τρόπο συµπερίληψης

των δεδοµένων αυτών. Είναι φανερό ότι ενώ τα δεδοµένα είναι στατικά, συγκεκριµένα

και µονοσήµαντα, οι πληροφορίες είναι δυναµικές και συγκεκριµένες. Κινούνται δε, σε

υψηλότερο βαθµό αφαίρεσης και γενικότητας από τα δεδοµένα τα οποία συνοψίζουν. Το

συγκεκριµένο σύνολο δεδοµένων από το οποίο εξάγεται η πληροφορία αποτελεί την

εµβέλεια της αλήθειας της (truth scope). Σε ακόµα υψηλότερο επίπεδο αφαίρεσης και

γενίκευσης από την πληροφορία, βρίσκεται η γνώση (knowledge). Σε αντίθεση µε την

Page 22: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

22

πληροφορία που η εµβέλεια αλήθειας της είναι τοπική (local), η εµβέλεια αλήθειας της

γνώσης πρέπει να είναι καθολική (universal), καλύπτοντας όλα τα σχετικά περιστατικά.

Η γνώση είναι δυναµική στο βαθµό που είναι εµπειρική και προσαρµόζεται για να έλθει

εγγύτερα µε την πραγµατική αλήθεια. Θεωρητικά, η πραγµατική γνώση εκτός από

καθολική είναι και διαχρονική. Κατά κανόνα, µια βάση δεδοµένων είναι πολύ

µεγαλύτερη από µια βάση γνώσης (knowledge base) µια και η δεύτερη κινείται σε

υψηλότερο επίπεδο αφαίρεσης από την πρώτη. Ο κλάδος της εξόρυξης δεδοµένων (data

mining) αφορά στην επεξεργασία µεγάλων βάσεων δεδοµένων µε σκοπό τον εντοπισµό

προτύπων και την εξαγωγή γνώσης από αυτά.

3.2 Είδη γνώσης

Είναι λογικό να υπάρχουν περισσότερα του ενός είδη γνώσης, όπως αυτά που διαθέτει

ένας άνθρωπος. Μπορούµε να διακρίνουµε τα διάφορα είδη γνώσης σε γενικές και

εξειδικευµένες γνώσεις. Στις γενικές γνώσεις µπορούµε να συµπεριλάβουµε τα εξής είδη

γνώσης:

• Αυτονόητη γνώση (commonsense knowledge): ίσως είναι αυτό που αποκαλούµε

«εγκυκλοπαιδικές γνώσεις», δηλαδή στοιχεία που αφορούν τη φύση, τη

λειτουργία και τη συµπεριφορά του κόσµου, αλλά και του ανθρώπου, τις

ιδιότητες του χώρου και του χρόνου. Η αυτοµατοποίηση της γνώσης αυτής, όπως

και του αυτονόητου συλλογισµού είναι υπόθεση ιδιαίτερα δύσκολη λόγω του

µεγάλου εύρους της.

• Γνώση υποδοµής (background knowledge): είναι η βασική, θεµελιώδης γνώση

που σχετίζεται µε το συγκεκριµένο γνωστικό ή επαγγελµατικό πεδίο κάποιου.

• Γνώση άλλων τοµέων: είναι ουσιαστικά συµπλήρωµα του προηγούµενου µια και

δεν σχετίζεται άµεσα µε τη γνώση υποδοµής, αλλά αφορά άλλους συγγενικούς ή

συναφείς τοµείς. Η γνώση αυτή µας επιτρέπει να αναγνωρίζουµε σε ένα

πρόβληµα κατά πόσο ανήκει σε ένα πεδίο ή σε κάποιο άλλο συναφές πεδίο.

• Γνώση αιτίου – αποτελέσµατος: αφορά άµεσα όλα τα πεδία που η αλλαγή και ο

συλλογισµός αναφορικά µε αλλαγή και η αιτιολογική σχέση (clausal relation) έχει

σηµασία.

Page 23: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

23

Στις εξειδικευµένες γνώσεις µπορούµε να συµπεριλάβουµε τα εξής είδη γνώσεων:

• Θεωρητική γνώµη: αποτελείται από δοµικά και σχεσιακά µοντέλα, βασικές αρχές,

µαθηµατικές σχέσεις, όπως επίσης ταξινοµίες και µερονοµίες εννοιών. Η γνώση

αυτή είναι η βαθιά γνώση, δηλαδή η γνώση των πρωτευόντων αρχών (first

principles).

• Γνώση από πηγές αναφοράς: προέρχεται από υλικό αναφοράς (έγγραφα,

επιστηµονικές δηµοσιεύσεις) και άλλα έµπειρα άτοµα.

• Πρακτική ή λειτουργήσιµη (operational) γνώση: αφορά γνώση σε πρακτικά

θέµατα αναφορικά µε την επίλυση προβληµάτων. ∆ιαδικασιακή γνώση επίλυσης

προβληµάτων µε συγκεκριµένη µεθοδολογία, διάφορα ευρετικά, µεταγλωττισµένη

(compiled) ή συµπιεσµένη (compressed) γνώση της µορφής «Αν Α, τότε Β» είναι

αυτής της µορφής γνώση.

• Γνώση περιστατικών: αν και είναι σαφής η διάκριση µεταξύ δεδοµένων,

πληροφορίας και γνώσης (βλ. § 3.1) είναι σαφές ότι η ύπαρξη εκτενούς και

πλατειάς εµπειρίας πραγµατικών περιστατικών του προβλήµατος βοηθά στην

εµπειρογνωµοσύνη.

• Μετά-γνώση (meta-knowledge): ουσιαστικά πρόκειται για αναπαράσταση της

γνώσης των γνώσεων που έχει κάποιος και έχει δυο όψεις, την στρατηγική όψη

(strategic view) και την στοχαστική όψη (reflective view). Η στρατηγική όψη

ενσωµατώνει στρατηγικές για την αποδοτικότερη και αποτελεσµατικότερη

εφαρµογή των γνώσεων. Η στοχαστική όψη είναι η γνώση του τι γνωρίζω και

κατά συνέπεια του τι δεν γνωρίζω, είναι δηλαδή η επίγνωση των ορίων της

γνώσης µου και των ικανοτήτων µου στην επίλυση προβληµάτων.

Τα περιεχόµενα των παραπάνω ειδών γνώσης πολύ απέχουν από το να θεωρηθούν

αµετάβλητα και στατικά. Αντιθέτως µεταβάλλονται δυναµικά και τα διάφορα είδη

αλληλεπιδρούν µεταξύ τους. Μπορούν δε σχηµατικά, να αναπαρασταθούν ως να

συγκροτούν ένα είδος πυραµίδας, µε τα είδη των γενικών γνώσεων να στηρίζουν τα είδη

εξειδικευµένων γνώσεων µε κορωνίδα τη µετά-γνώση.

3.3 Μέθοδοι αναπαράστασης γνώσης

Page 24: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

24

Όπως θα έχουµε την ευκαιρία να αναπτύξουµε σε επόµενα Κεφάλαια, υπάρχουν πολλοί

τρόποι αναπαράστασης γνώσης, µεταξύ των οποίων είναι οι βασιζόµενοι στη Λογική,

στις ∆οµηµένες Αναπαραστάσεις και σε Κανόνες, ως εξής:

Λογική

• Προτασιακή Λογική (propositional logic)

• Κατηγορηµατική Λογική (predicate logic)

• ∆ιαζευκτική µορφή της Λογικής (clausal form of logic)

∆οµηµένες αναπαραστάσεις

• Σηµασιολογικά ∆ίκτυα (semantic networks)

• Πλαίσια (frames)

• Εννοιολογική εξάρτηση (conceptual dependency)

• Σενάρια (scripts)

Κανόνες (if-then-else rules)

3.4 Ιδιότητες της αναπαράστασης γνώσης

Υπάρχουν διάφορες ιδιότητες που είναι επιθυµητές να υπάρχουν σε µια αναπαράσταση

γνώσης και που η ύπαρξή τους µας επιτρέπει να αξιολογήσουµε µια αναπαράσταση

γνώσης. Οι ιδιότητες αυτές διακρίνονται σε πρακτικές και θεωρητικές.

Στις πρακτικές ιδιότητες µια αναπαράστασης µπορούµε να συµπεριλάβουµε τις εξής:

• Λογική επάρκεια (representational adequacy): η δυνατότητα να εκφράσουµε όλα

τα είδη γνώσης που αναφέρθηκαν στην § 3.2 και να µπορούµε να κάνουµε

σηµασιολογικούς διαχωρισµούς.

• ∆ιευκόλυνση συµβολισµού ή αποδοτικότητα απόκτησης (acquisitional efficiency):

εξαρτάται από πόσο κοντά βρίσκεται το επίπεδο αναπαράστασης στο επίπεδο

γνώσης γεγονός που σχετίζεται µε την απόκτηση νέας γνώσης εύκολα και

γρήγορα.

Page 25: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

25

• Ευρετική επάρκεια: σχετίζεται µε τη δυνατότητα να εξάγονται συµπερασµατικά

πορίσµατα µε αποδοτικό και αποτελεσµατικό τρόπο από την ανάκληση

υπάρχουσας γνώσης ενός προβλήµατος.

Στις θεωρητικές ιδιότητες µια αναπαράστασης µπορούµε να συµπεριλάβουµε τις εξής:

• Εγκυρότητα (soundness): που δηλώνει ότι τα εξαγόµενα συµπεράσµατα είναι

έγκυρα, δηλαδή δεν µπορούν ταυτόχρονα να εξαχθούν δυο αντικρουόµενα

συµπεράσµατα (για παράδειγµα η πρόταση p και η πρόταση ~p που αποτελεί την

άρνηση της p).

• Πληρότητα (completeness): η ικανότητα του µηχανισµού εξαγωγής

συµπερασµάτων να αποδείξει ότι αν µια πρόταση είναι αληθής, τότε αυτό ισχύει,

χωρίς τη χρήση εξωγενών υποθέσεων / µηχανισµών.

• Αποφασισιµότητα (decidability): η ικανότητα του µηχανισµού εξαγωγής

συµπερασµάτων να απαντήσει θετικά ή αρνητικά σε οποιαδήποτε ερώτηµα

επαλήθευσης.

Οι ιδιότητες της εγκυρότητας και της πληρότητας είναι εκ των ουκ άνευ για την εγγύηση

της ορθότητας του συλλογισµού. Φυσικά, θεµελιώδης προϋπόθεση είναι η βάση γνώσης,

η οποία αντιπροσωπεύει ένα «µικρόκοσµο» είναι συνεπής και δεν περιέχει αντιλογίες.

3.5 Περιγραφική v’s διαδικασιακή αναπαράσταση

Στο αρχικό στάδιο ανάπτυξης του πεδίου της αναπαράστασης γνώσης έλαβε χώρα µια

ιδιότυπη αντιπαράθεση ανάµεσα σε δυο διαφορετικές προσεγγίσεις: την περιγραφική

(declarative) και την διαδικασιακή (procedural) µορφή αναπαράστασης γνώσης.

Σε σχέση µε την πρώτη µορφή, δίνεται ιδιαίτερη έµφαση στην στατική (κάθε φορά) όψη

της γνώσης και το περιγραφικό σώµα διερµηνεύεται µε βάση κάποιους γενικούς κανόνες

συλλογισµού για την εξαγωγή συµπερασµατικών πορισµάτων. Για παράδειγµα, η

γλώσσα προγραµµατισµού PROLOG µια από τις πιο δηµοφιλής στο χώρο της ΤΝ, είναι

µια περιγραφική γλώσσα αναπαράστασης γνώσης µια και βασίζεται σε ένα υποσύνολο

της κατηγορηµατικής λογικής η οποία αποτελεί µια καθαρά περιγραφική αναπαράσταση

Page 26: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

26

µε γενικούς κανόνες συλλογισµού. Σηµαντικά πλεονεκτήµατα της περιγραφικής

αναπαράστασης είναι τα εξής:

• αποθήκευση ενός τµήµατος γνώσης µια φορά, χρήση του πολλές φορές

• απουσία πλεονασµού που διευκολύνει την ενηµέρωση της βάσης γνώσης

• υψηλή διαφάνεια στο τι αναπαριστά, πράγµα που διευκολύνει τον συµβολισµό

Από την άλλη πλευρά, η καθαρά διαδικασιακή αναπαράσταση παρουσίαζε το

πλεονέκτηµα της παρουσίασης της δυναµικής όψης της γνώσης και σύµφωνα µε τους

υποστηρικτές της σε αυτό το χαρακτηριστικό υπερτερεί από την περιγραφική

αναπαράσταση, καθώς η γνωστική συµπεριφορά αναπαρίσταται καλύτερα σε µορφή

διαδικασιών που διατυπώνουν πως χρησιµοποιείται η γνώση κι όχι ποια είναι η γνώση.

Βασικά µειονεκτήµατα της διαδικασιακής αναπαράστασης είναι τα αντίθετα των

πλεονεκτηµάτων της περιγραφικής αναπαράστασης, δηλαδή η πολλαπλή αποθήκευση

γνώση σε κάθε διαδικασία, ο πλεονασµός και η έλλειψη διαφάνειας. Υπάρχουν όµως και

πλεονεκτήµατα όπως:

• είναι ευκολότερο να εκφραστεί το πώς να κάνεις κάτι παρά τι γνωρίζεις γι’ αυτό

σε αφηρηµένο επίπεδο

• υπάρχει άµεση σχέση ανάµεσα στη γνώση και την συγκεκριµένη εργασία, ενώ

στην περιγραφική αναπαράσταση µπορεί εκ των υστέρων να φανεί πως ένα

µεγάλο τµήµα της δεν χρειαζόταν

• µπορεί να υιοθετήσει ευρετικά, δηλαδή εύλογες υποθέσεις µε πιθανότητα όλα να

µπορούν να εκφραστούν ευκολότερα µέσω διαδικασιών

• η υλοποίηση µε χρήση µεταγλώττισης παρά διερµήνευσης οδηγεί σε ταχύτερη

επεξεργασία

Ιστορικά, είναι η περιγραφική αναπαράσταση αυτή που έχει επικρατήσει, κυρίως για

λόγους διαφάνειας. Αναµφίβολα καλύτερος τρόπος αναπαράστασης της στατικής γνώσης

είναι ο περιγραφικός, αλλά η γνώση ελέγχου µπορεί να εκφραστεί είτε µε περιγραφικό,

είτε µε διαδικασιακό τρόπο, οπότε κάποιες φορές µπορεί κάλλιστα να υπάρξει

συνδυασµός των δυο µορφών αναπαράστασης.

Page 27: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

27

4. Σύνοψη 4ου Κεφαλαίου

Είδαµε στο προηγούµενο Κεφάλαιο (§ 3.3) ότι υπάρχουν διάφοροι τρόποι

αναπαράστασης γνώσης µεταξύ αυτών και η Κατηγορηµατική Λογική που είναι το

αντικείµενο του 4ου Κεφαλαίου. Πιο συγκεκριµένα παρουσιάζεται ο φορµαλισµός της

µεθόδου αυτής, οι κανονικές µορφές προτάσεων, οι ισοδυναµίες και οι τρόποι

συλλογισµού. Ειδικότερα δε, παρουσιάζεται το σχήµα συµπερασµατικού συλλογισµού,

γνωστού ως αναγωγή µέσω της αντίκρουσης της αντίφασης. Τέλος γίνεται αναφορά στα

Horn Clauses, µια ειδική υποκατηγορία της Clausal Form και τη σχέση τους µε το λογικό

προγραµµατισµό και γλώσσες προγραµµατισµού όπως η PROLOG.

4.1 Σύνταξη και ορολογία

Η Κατηγορηµατική Λογική είναι µια τυπική γλώσσα, όπου η εγκυρότητα των

συλλογισµών βασίζεται στη µορφή τους κι όχι στο περιεχόµενό τους. Το λεξιλόγιό της

περιλαµβάνει σταθερές (constants), που συµβολίζονται µε κεφαλαία γράµµατα (π.χ. Α,

Β), µεταβλητές (variables) που συµβολίζονται µε µικρά γράµµατα (π.χ. x, y) και

συναρτήσεις (functions). Επεκτείνει την Προτασιακή Λογική µε την εισαγωγή όρων

(terms) που µπορεί να είναι µια σταθερή, ή µια µεταβλητή, ή µια συνάρτηση µε τα

ορίσµατά της, κατηγορηµάτων (predicates) των οποίων τα ονόµατα δίνονται µε κεφαλαία

γράµµατα και ποσοδεικτών (quantifiers) όπως οι ,∃ ∀ . Ένα γεγονός αναπαρίσταται από

ένα ατοµικό τύπο (atomic formula) της µορφής:

P( A1, A2, … , An)

Για κάθε πρόταση P µπορούµε να έχουµε την άρνησή της ~P. Η συντακτική κατηγορία

των κυριολεκτικών (literals) αποτελείται από ατοµικές προτάσεις και τις αρνήσεις τους.

Τέλος, έχουµε τη συντακτική κατηγορία των καλώς σχηµατιζόµενων προτάσεων (well

defined formulae – wff) ο ορισµός της οποίας χρησιµοποιεί αναδροµικότητα και εµπλέκει

λογικά συνθετικά (π.χ. ^ για τη σύζευξη, ~ ή ¬ για την άρνηση, ⇒ή ⊃ για τη

συνεπαγωγή, κλπ.). Ισχύει ότι:

• κάθε ατοµική πρόταση είναι wff

Page 28: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

28

• αν είναι Α µια wff, τότε ~Α, x∀ Α και x∃ Α, είναι wff

• αν Α και Β είναι wff, τότε Α ^ Β, Α v B και Α ⇒ Β είναι επίσης wff

Οι σταθερές αντιπροσωπεύουν αντικείµενα ή οντότητες. Οι µεταβλητές

αντιπροσωπεύουν πεδία σταθερών. Οι συναρτήσεις αντιπροσωπεύουν αντιστοιχίες

ανάµεσα σε πεδία σταθερών.

Κατηγορήµατα χωρίς ορίσµατα (0-place predicates) είναι απλές λογικές προτάσεις που

µπορεί να είναι είτε αληθείς, είτε ψευδείς. Κατηγορήµατα µε τουλάχιστον ένα όρισµα

αντιπροσωπεύουν σχέσεις.

Η πρόταση: κάθε άνθρωπος είναι θνητός µπορεί να διατυπωθεί:

x∀ ΑΝΘΡΩΠΟΣ(x) ⇒ΘΝΗΤΟΣ(x)

Η πρόταση: η ντοµάτα είναι κόκκινη, µπορεί να διατυπωθεί µε διαφόρους τρόπους:

ΚΟΚΚΙΝΟ(ΝΤΟΜΑΤΑ_1)

ΧΡΩΜΑ(ΝΤΟΜΑΤΑ_1, ΚΟΚΚΙΝΟ)

ΤΙΜΗ(ΧΡΩΜΑ, ΝΤΟΜΑΤΑ_1, ΚΟΚΚΙΝΟ)

όπου η ΝΤΟΜΑΤΑ_1, αναφέρεται στη συγκεκριµένη ντοµάτα.

4.2 Κανονικές µορφές προτάσεων

Η χρήση των λογικών συνθετικών επιτρέπει τη έκφραση υψηλής πολυπλοκότητας

προτάσεων. Ωστόσο είναι προτιµότερη η απλότητα στην έκφραση, η οποία µπορεί να

οδηγήσει σε απλότητα του συλλογισµού µε ενδεχόµενο την αποτελεσµατική

αυτοµατοποίηση. Παρουσιάζονται τρεις απλοποιήσεις έκφρασης ή τρεις κανονικές

µορφές (normal forms) της κατηγορηµατικής λογικής:

• Συζευκτική Κανονική Μορφή (ΣΚΜ) – Conjunctive Normal Form (CNF)

• ∆ιαζευκτική Κανονική Μορφή (∆ΚΜ) – Disjunctive Normal Form (CNF)

• Clausal Form που είναι κατ’ ουσία ΣΚΜ

Page 29: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

29

Το σηµαντικό είναι πως οποιαδήποτε wwf µπορεί να µετασχηµατιστεί σε οποιαδήποτε

από τις παραπάνω τρεις κανονικές µορφές. Και στις τρεις περιπτώσεις η απλοποίηση

έκφρασης επιτρέπει την εφαρµογή ενός συµπερασµατικού κανόνα (resolution).

Μια πρόταση σε ΣΚΜ είναι η σύζευξη ατοµικών διαζεύξεων, δηλαδή της µορφής:

1 2 ... nA A A∧ ∧ ∧

µε κάθε A να είναι της µορφής:

1 2 ... mB B B∨ ∨ ∨

και κάθε Β είναι κυριολεκτικό (literal) δηλαδή είτε ατοµική πρόταση είτε η άρνηση

ατοµικής πρότασης.

Αντίστροφα µε το προηγούµενο, µια ∆ΚΜ είναι µια διάζευξη ατοµικών συζεύξεων,

δηλαδή της µορφής:

1 2 ... nA A A∨ ∨ ∨

µε κάθε A να είναι της µορφής:

1 2 ... mB B B∧ ∧ ∧

και κάθε Β είναι κυριολεκτικό.

Τέλος η clausal form αποτελείται από ένα σύνολο προτάσεων (clause), όπου η κάθε

πρόταση είναι της µορφής:

1 2 1 2... ...n mA A A B B B∨ ∨ ∨ ⇐ ∧ ∧ ∧

Page 30: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

30

όπου 0n ≥ και 0m ≥ και κάθε φορά τα Α και Β είναι ατοµικές προτάσεις. Τα γεγονότα Β

αποτελούν υποθέσεις και τα γεγονότα Α είναι τα συµπεράσµατα. Όπως επισηµάνθηκε

νωρίτερα, η clausal form είναι ένας απευθείας µετασχηµατισµός της ΣΚΜ µε χρήση της

ισοδυναµίας:

A B A B⇒ ≡ ∨∼

µε στόχο την απάλειψη της άρνησης.

4.3 Ισοδυναµίες και κανόνες συλλογισµού

∆υο wff είναι ισοδύναµες, αν για οποιαδήποτε ερµηνεία έχουν την ίδια τιµή αλήθειας.

Μια πρώτη ισοδυναµία παρουσιάστηκε στο τέλος της αµέσως προηγούµενης

παραγράφου. Ακολουθεί µια λίστα µε λογικές ισοδυναµίες.

A B A B⇒ ≡ ∨∼

~(~Α) ≡ Α

De Morgan

~(A^B) ≡ ~A v ~B

~(A v B) ≡ ~A ^ ~B

Επιµερισµού (Distributive Laws)

A ^ ( B v C ) ≡ ( A ^ B ) v ( A ^ C )

A v ( B ^ C ) ≡ ( A v B ) ^ ( A v C )

Αντιµετάθεσης

Α ^ Β ≡ Β ^ Α

Α v Β ≡ Β v Α

Προσεταιρισµού

(Α ^ Β ) ^ C ≡A ^ ( B ^ C)

(Α v Β ) v C ≡A v ( B v C)

Page 31: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

31

Αναίρεσης ή Αντιθετικότητας (modus tollens)

A B B A⇒ ≡ ⇒∼ ∼

Ισοδυναµίες µε ποσοδείκτες

xA x A∃ ≡ ∀∼ ∼

xA x A∀ ≡ ∃∼ ∼

x A B xA xB∀ ∧ ≡∀ ∧∀

x A B xA xB∃ ∨ ≡ ∃ ∨ ∃

Από υπάρχουσες wff µπορούν να εξαχθούν νέες wff µε χρήση κανόνων συλλογισµού:

Modus ponens (τρόπος του θέτειν)

Από ( ) ( )x x x∀ Φ ⇒Ψ και Φ(Α), τότε µπορεί να εξαχθεί Ψ(Α)

Καθολική Ειδίκευση (Universal Specialization)

Από x∀ Φ(x), τότε µπορεί να εξαχθεί Φ(Α)

Αναγωγή (Resolution)

Από Α v B και ~Α v C µπορεί να εξαχθεί Β v C

4.4 Μετασχηµατισµός σε ΣΚΜ

Για το µετασχηµατισµό µιας wff σε ΣΚΜ ακολουθούµε τον εξής αλγόριθµο:

• Εξάλειψη του συνθετικού συνεπαγωγής ( ⇒ ) µε βάση την ισοδυναµία

Α⇒Β ≡ ~Α v B

• Μετακίνηση των αρνήσεων στο επίπεδο ατοµικών προτάσεων

• Εξάλειψη δεικτών ύπαρξης

• Επονόµαση των (καθολικά ποσοτικοποιηµένων) µεταβλητών, ώστε κάθε

µεταβλητή να έχει διαφορετική ονοµασία

• Μετακίνηση των καθολικών ποσοδεικτών ∀ αριστερά

• Μετακίνηση των διαζεύξεων στο επίπεδο των κυριολεκτικών

Page 32: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

32

• Απάλειψη των συµβόλων ∀ και v και επονόµαση των µεταβλητών, ώστε κάθε

ονοµασία να εµφανίζεται µόνο σε µια διαζευκτική πρόταση (clause)

4.5 Αναγωγή µέσω αντίκρουσης της αντίφασης

Για να αποδείξουµε ότι µια wff, την οποία έστω ότι συµβολίζουµε µε W λογικά

συνεπάγεται από ένα σύνολο S από wff αρκεί να αποδείξουµε ότι το σύνολο S W∪ ∼

είναι ασυνεπές. Ένα σύνολο είναι ασυνεπές, αν ταυτόχρονα συνεπάγονται από αυτό µια

πρόταση (π.χ. η W) και η άρνησής της ( ~W). Η διαδικασία αυτή ονοµάζεται απόδειξη

µέσω αντίφασης. Η διαδικασία αναγωγής µέσω αντίκρουσης της αντίφασης συνοψίζεται

ως εξής:

Σε ένα σύνολο S διαζευκτικών προτάσεων

Επανέλαβε:

Επέλεξε δυο προτάσεις ci και cj πάνω στις οποίες µπορεί να εφαρµοστεί

αναγωγή

∆ηµιούργησε την απόγονο πρόταση rij από τις γονικές προτάσεις ci και cj

Πρόσθεσε την πρόταση rij στο σύνολο S

Μέχρις ότου η κενή πρόταση να είναι µέλος του συνόλου S.

4.6 Horn Clauses και η γλώσσα προγραµµατισµού PROLOG

Όπως έχουµε αναφέρει στη γενική µορφή η Clausal Form είναι:

1 2 1 2... ...n mA A A B B B∨ ∨ ∨ ⇐ ∧ ∧ ∧

όπου 0n ≥ και 0m ≥ και κάθε φορά τα Α και Β είναι ατοµικές προτάσεις. Τα γεγονότα Β

αποτελούν υποθέσεις και τα γεγονότα Α είναι τα συµπεράσµατα.

Οι Horn Clauses είναι ειδική υποκατηγορία της Clausal Form για 1 0n≥ ≥ , δηλαδή δεν

επιτρέπονται περισσότερες από µια ατοµικές προτάσεις Α στο αριστερό µέρος. Ίσως να

µειώνεται η δύναµη εκφρασιµότητας και κατά συνέπεια η λογική επάρκεια, ωστόσο

πιστεύεται ότι αυτό γίνεται προς όφελος της διευκόλυνσης για υπολογισιµότητα σε

Page 33: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

33

βάθος. Σε ότι αφορά την άρνηση που απουσιάζει από την Clausal Form, άρα και από τα

Horn Clauses, αυτή εισάγεται αλλά µε κάπως ιδιόµορφη ερµηνεία, δηλαδή µε την έννοια

της άρνησης ως αποτυχία. Αυτή η διευρυµένη αναπαράσταση διέπει το λογικό

προγραµµατισµό και συνεπώς γλώσσες προγραµµατισµού όπως η PROLOG. Όπως θα

δείτε στην PROLOG, η άρνηση µιας πρότασης δεν µπορεί να υπάρχει στην κεφαλή

(αριστερό µέρος) µιας πρότασης. Έτσι η ερµηνεία που έχει δοθεί για την άρνηση στο

λογικό προγραµµατισµό είναι άρνηση ως αποτυχία (negation as failure). Ένα γεγονός

θεωρείται αναληθές αν δεν µπορεί να αποδειχθεί αληθές. Έτσι πρώτα επιχειρείται να

δειχθεί ότι ένα γεγονός είναι αληθές. Αν η προσπάθεια αποτύχει, τότε το γεγονός

θεωρείται αναληθές.

Για το φορµαλισµό και τη χρήση της κατηγορηµατικής λογικής δείτε την 23. Άσκηση

14: Negation Normal Form σε Clausal Form, καθώς και την 24. Άσκηση 19: Μετατροπή

wff σε clausal form.

Για τον τρόπο απόδειξης µιας πρότασης µε χρήση µεθόδων της µαθηµατικής λογικής

δείτε την 25. Άσκηση 10: ∆ιαδικασίες Απόδειξης και την 26. Άσκηση 23: Και µια

Απόδειξη.

Για τη χρήση της γλώσσας προγραµµατισµού Prolog στην αναπαράσταση (περιγραφή)

γνώσης, την επίλυση προβληµάτων και την υλοποίηση εµπείρων συστηµάτων µε τη

γλώσσα αυτή, δείτε την 27. Άσκηση 3: Πλανητικό Σύστηµα, την 28. Άσκηση 4: Κύκλος

των Ατρειδών, την 29. Άσκηση 5: Πλεγµατικές θέσεις, την 30. Άσκηση 6: Αναδροµή,

την 31. Άσκηση 7: ∆ιατροφολόγιο, την 32. Άσκηση 8: London Underground, την 33.

Άσκηση 9: Κάτοψη ορόφου, την 34. Άσκηση 12: Ορίζοντας την ώρα, την 35. Άσκηση

13: Πανεπιστηµιακές σπουδές, και την 36. Άσκηση 25: Ταξιδάκι στα νησιά.

Για τον τρόπο εξαγωγής µιας απάντησης µε χρήση της γλώσσας Prolog δείτε την 37.

Άσκηση 11: Εξαγωγή Απάντησης σε ορισµένη πρόταση και την 38. Άσκηση 15: Η καφέ

αρκούδα.

Page 34: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

34

5. Σύνοψη 5ου Κεφαλαίου

Όπως είδαµε στο 3ο Κεφάλαιο σχετικά µε την αναπαράσταση της γνώσης, πέρα από τη

Λογικής Μορφής αναπαραστάσεις της γνώσης, όπως η Κατηγορηµατική Λογική που

εξετάσαµε στο αµέσως προηγούµενο Κεφάλαιο, υπάρχει και τρόποι ∆οµηµένης

Αναπαράστασης της γνώσης. ∆ύο από αυτές της µορφές δοµηµένης αναπαράστασης

γνώσης είναι τα δίκτυα συσχέτισης (associative networks) και τα πλαίσια (frames) που

παρουσιάζονται στο 5ο Κεφάλαιο. Τα δίκτυα συσχέτισης είναι περιγραφικός

φορµαλισµός, ενώ τα πλαίσια µπορούν να θεωρηθούν ως σύνθετα δίκτυα συσχέτισης και

συνδυάζουν περιγραφική και διαδικασιακή αναπαράσταση, έννοιες που έχουν

παρουσιασθεί στην § 3.5. Βασικό χαρακτηριστικό της δόµησης γνώσης είναι η

ταξινοµίες και µερονοµίες εννοιών που επιτρέπουν την κληρονόµηση ιδιοτήτων,

χαρακτηριστικά που παρουσιάζονται στη συνέχεια του 5ου Κεφαλαίου.

5.1 Ταξινοµίες, µερονοµίες και ιεραρχικές σχέσεις

Πριν προχωρήσουµε στην παρουσίαση των δικτύων συσχέτισης και των πλαισίων ως

δοµηµένων αναπαραστάσεων γνώσης καλό είναι να δούµε τις δυο πλέον κοινές και

χρήσιµες δοµές ιεραρχικής δόµησης: τις ταξινοµίες και τις µερονοµίες.

Η ταξινοµία βασίζεται σε σχέσεις (δεσµούς) της γενικής µορφής «ΕΙΝΑΙ», (is_a – ISA)

που δηλώνει ότι ένα αντικείµενο είναι του είδους της τάδε κλάσης (οµάδας)

αντικειµένων. Επιπρόσθετα, µια παρόµοια σχέση µπορεί να έχει τη µορφή

«ΕΙΝΑΙ_ΣΤΙΓΜΙΟΤΥΠΟ_ΤΟΥ» (is_instance_of) που δηλώνει ότι ένα αντικείµενο είναι

ένα στιγµιότυπο, ένα αντιπροσωπευτικό δείγµα µια κλάσης (ενός συνόλου)

αντικειµένων. Είναι δηλαδή µια σχέση µεταξύ αντικειµένων και γενικότερων κλάσεων.

Μια τρίτη παρόµοια σχέση είναι της µορφής «ΕΙΝΑΙ_ΕΙ∆ΟΣ_ΤΟΥ» (is_kind_of –

AKO) που δηλώνει σχέση µεταξύ κλάσεων αντικειµένων. Η τρεις αυτές σχέσεις,

µπορούν για λόγους απλότητας µπορούν να οµαδοποιηθούν ως σχέσεις της µορφής

«ΕΙΝΑΙ», βοηθούν στην ταξινοµία, δηλαδή την οργάνωση κατηγοριών και

υποκατηγοριών. Για παράδειγµα ο σκύλος µου ο Τζακ, είναι (ράτσας) Γερµανικός

Ποιµενικός, ο Γερµανικός Ποιµενικός είναι σκύλος, ο σκύλος είναι θηλαστικό (όπως οι

γάτες και οι τίγρεις, που και τα δυο τους είναι αιλουροειδή) και το θηλαστικό είναι ζώο.

Page 35: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

35

Από το παράδειγµα αυτό φαίνεται και η διαφοροποίηση των τριών σχέσεων «ΕΙΝΑΙ».

Το ότι ο Τζακ είναι Γερµανικός Ποιµενικός δηλώνεται µε τη σχέση

«ΕΙΝΑΙ_ΣΤΙΓΜΙΟΤΥΠΟ_ΤΟΥ», ενώ το ότι ο Γερµανικός Ποιµενικός είναι σκύλος,

δηλώνεται µε τη σχέση «ΕΙΝΑΙ_ΕΙ∆ΟΣ_ΤΟΥ». Το σχηµατιζόµενο δίκτυο συσχέτισης

φαίνεται στο σχήµα που ακολουθεί.

Με τις σχέσεις αυτές είναι φανερό πως δηµιουργούνται ιεραρχίες που είναι

κληρονοµικές. Αν διατρέχουµε µια τέτοια ιεραρχική δοµή από κάτω προς τα πάνω, τότε

ο συλλογισµός οδηγείται σε ολοένα και ευρύτερες έννοιες µέσα από τη γενίκευση.

Αντίθετα, όταν διατρέχουµε µια τέτοια ιεραρχική δοµή από πάνω προς τα κάτω, ο

συλλογισµός συγκεκριµενοποιεί και εξειδικεύει. Αυτή η προς τα κάτω ροή δεν είναι

µονοτονική. Για παράδειγµα στην κατηγορία των πτηνών ένα από τα χαρακτηριστικά

είναι ότι πετούν, αλλά υποκατηγορίες όπως οι στρουθοκάµηλοι και οι πιγκουΐνοι

αναιρούν το χαρακτηριστικό αυτό. Η µεταβίβαση (κληρονόµηση) ιδιοτήτων από πάνω

προς τα κάτω (property inheritance) βασίζεται σε εύλογες υποθέσεις που ενδεχοµένως

µπορεί να αποδειχθούν αβάσιµες. Χαρακτηριστικό είναι το παράδειγµα της πρότασης

«όλοι οι κύκνοι είναι άσπροι» που έχει µείνει στην ιστορία της επιστήµης, γιατί αυτό

έλεγε η κοινή λογική καθώς όλοι οι κύκνοι ήταν άσπροι µέχρι που ανακαλύφθηκε στην

Αυστραλία ένα είδος κύκνων µε µαύρο φτέρωµα. ∆εδοµένων αυτών των προβληµάτων,

η πρακτική που ακολουθείται είναι πως οτιδήποτε δεν προσδιορίζεται ρητά ως µη

κληρονοµήσιµο θεωρείται κληρονοµήσιµο.

Page 36: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

36

Από την άλλη πλευρά, η σχέση «ΕΙΝΑΙ_ΜΕΡΟΣ» (is_part) βοηθά στην δόµηση µιας

οργάνωσης συστατικών στοιχείων. Έτσι ο ρόδα και το τιµόνι είναι µέρη του

αυτοκινήτου, οπότε για τα δυο αυτά αντικείµενα ισχύει η σχέση «ΕΙΝΑΙ_ΜΕΡΟΣ» µε το

αντικείµενο αυτοκίνητο. Και στην περίπτωση των µερονοµιών µπορεί να ισχύει η

κληρονοµικότητα. Για παράδειγµα µια βίδα πάνω σε ένα τροχό, ικανοποιεί τη σχέση

ΕΙΝΑΙ_ΜΕΡΟΣ(βίδα, τροχός), οπότε ικανοποιεί και τη σχέση ΕΙΝΑΙ_ΜΕΡΟΣ(βίδα,

Τζακ

Γερµανικός

Ποιµενικός

σκύλος λιοντάρι

θηλαστικά

αιλουροειδή

γάτα

ζώα

Page 37: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

37

αυτοκίνητο), επειδή ο τροχός είναι µέρος του αυτοκινήτου, άρα ισχύει η σχέση

ΕΙΝΑΙ_ΜΕΡΟΣ(τροχός, αυτοκίνητο). Αυτά φαίνονται σχηµατικά στο παρακάτω σχήµα.

Στις µερονοµίες ο συλλογισµός µε ροή από πάνω προς τα κάτω διασπά το αντικείµενο

στα συστατικά µέρη που το απαρτίζουν, γεγονός που δηλώνει εκλέπτυνση ή διάσπαση.

Αντίθετα ο συλλογισµός µε ροή από κάτω προς τα πάνω συνθέτει το αντικείµενο από τα

στοιχεία που το αποτελούν, γεγονός που δηλώνει αφαιρετικότητα ή σύνθεση.

Για τις ιεραρχικές σχέσεις µπορούν να διατυπωθούν διάφοροι κανόνες συλλογισµού

(αξιώµατα), όπως οι ακόλουθοι:

• αν µια κατηγορία αποκλειστεί, αυτοµάτως αποκλείονται όλες οι υποκατηγορίες

της

• αν µια υποκατηγορία υπάρχει (δηλαδή υπάρχει τουλάχιστον ένα στιγµιότυπό

της), τότε όλες οι κατηγορίες στις οποίες ανήκει υπάρχουν επίσης

• αν ένα σύνθετο αντικείµενο είναι σε λειτουργήσιµη κατάσταση, τότε όλα τα

συστατικά του είναι σε λειτουργήσιµη κατάσταση

5.2 ∆ίκτυα συσχέτισης

Έχοντας δώσει στην προηγούµενη παράγραφο βασικές σχέσεις που οδηγούν στην

ιεραρχική δόµηση αναπαράστασης γνώσης, µπορούµε τώρα να αναφερθούµε στα δίκτυα

βίδα

τροχός τιµόνι

αυτοκίνητο

Page 38: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

38

συσχέτισης. Τα δίκτυα συσχέτισης αποτελούνται από κόµβους (nodes) και σχέσεις

µεταξύ των κόµβων οι οποίοι ονοµάζονται δεσµοί (links) και δηλώνονται µε βέλη. Οι

κόµβοι µπορεί να αναφέρονται σε µεµονωµένα αντικείµενα (objects) ή στιγµιότυπα

(στιγµιότυπα), σε συµβάντα, σε κλάσεις αντικειµένων (classes), σε τιµές ιδιοτήτων

(values), σε έννοιες (concepts), κλπ. Οι δεσµοί (βέλη) αναφέρονται σε σχέσεις (relations)

µεταξύ των κόµβων ή ιδιότητες που συνδέουν αντικείµενα µε τιµές.

Ως µέθοδος συλλογισµού στα δίκτυα συσχέτισης χρησιµοποιείται η αναζήτηση τοµής

(intersection search) µε σκοπό την ανακάλυψη σχέσεων ανάµεσα στα αντικείµενα.

Εκκινώντας από τους κόµβους που αντιπροσωπεύουν αντικείµενα διατρέχουµε

(αµφίδροµα) τα τόξα που τα ενώνουν, ελέγχοντας σε ποια σηµεία τέµνονται οι

διαδροµές.

Για να είναι ρεαλιστική η προσέγγιση αναπαράστασης γνώσης µε δίκτυα συσχέτισης

πρέπει εκτός από τη δυνατότητα οργάνωσης σε πολλαπλά επίπεδα, να υπάρχει και η

δυνατότητα της διαµέρισης (partition) η οποία µας δίνει τη δυνατότητα της

αναπαράστασης γνώσης που αποτελείται από χιλιάδες προτάσεις. Η πρόσβαση σε κάποια

διαµέριση του δικτύου συσχέτισης διέπεται από κανόνες ορατότητας (εµβέλειας), οι

οποίοι καθορίζουν ότι µια δεδοµένη αναζήτηση ανιχνεύει τους κόµβους και τα τόξα που

περιέχονται στο χώρο από τον οποίο ξεκίνησε η αναζήτηση, ή σε άλλους χώρους που

περιέχουν τα αρχικά σηµεία. Με τον τρόπο αυτό πετυχαίνουµε λογική επάρκεια ίδια µε

αυτή της Κατηγορηµατικής Λογικής και παράλληλα επάρκεια συµβολισµού υψηλότερη

από αυτή της Κατηγορηµατικής Λογικής.

5.3 Πλαίσια

Προτάθηκαν από τον Marvin Minsky και αποτελούν ίσως τον πιο προσφιλή τρόπο

αναπαράστασης γνώσης. Μοιράζονται πολλά χαρακτηριστικά µε τους άλλους τρόπους

αναπαράστασης γνώσης και δεδοµένων και ακολουθούν την αντικειµενοστραφή

προσέγγιση (object oriented) στην αναπαράσταση γνώσης, θυµίζοντας αµυδρά τις

εγγραφές (records) των δοµών δεδοµένων, αλλά σε πιο αφαιρετική και πλουραλιστική

µορφή, καθώς ούτε είναι κατ΄ ανάγκη όλα ίδια µεταξύ τους (όπως συµβαίνει µε τις

Page 39: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

39

εγγραφές), ούτε περιέχουν µόνο απλά δεδοµένα ή του ίδιου τύπου πληροφορίες, ούτε

οργανώνονται σειριακά, αλλά ιεραρχικά.

Από δοµική άποψη ένα πλαίσιο αποτελείται από ιδιότητες ή σχισµές (slots) που

αντιπροσωπεύουν τα χαρακτηριστικά της οντότητας. Κάθε σχισµή συνδέεται άµεσα µε

την τιµή της (fillers). Το γέµισµα κάθε σχισµής καθοδηγείται από τις διάφορες όψεις

(facets) οι οποίες περιγράφουν το εύρος και τα είδη των τιµών που µπορούν να λάβουν οι

σχισµές. Μια σχισµή µπορεί να λαµβάνει µια τιµή (single-valued) ή πολλές τιµές (multi-

valued). Η δυνατότητα για γενίκευση των πλαισίων φαίνεται από το γεγονός ότι η τιµή

µιας σχισµής µπορεί να είναι το όνοµα ενός άλλου πλαισίου. ∆εν υπάρχει περιορισµός

στο τι µπορεί να είναι οι όψεις µιας σχισµής. Μπορεί να είναι τιµές (π.χ. ότι το χρώµα

του κύκνου είναι άσπρο), εύλογες υποθέσεις (π.χ. ότι τα πτηνά πετούν), ή διαδικασίες µε

τη µορφή των οποίων διατυπώνεται συλλογιστική γνώση (π.χ. αν προστεθεί πληροφορία,

αν αφαιρεθεί πληροφορία, υπολογισµός της τιµής της σχισµής). Είναι σηµαντικό ότι

κάθε διαδικασία παρέχει έλεγχο σε τοπικό επίπεδο (βλ. αντικειµενοστραφή

προγραµµατισµό), αλλά µια αρχική ενεργοποίησή της µπορεί να οδηγήσει σε ανάλογη

ενεργοποίηση µιας ολόκληρης αλυσίδας τέτοιων διαδικασιών σε διάφορες σχισµές.

Η κύρια διαφορά των πλαισίων από τα δίκτυα συσχέτισης είναι το γεγονός ότι ένα

πλαίσιο περιέχει όλη την πληροφορία και τις ιδιότητες για τη συγκεκριµένη έννοια που

προσδιορίζει, σε αντίθεση µε τα δίκτυα συσχέτισης των οποίων οι κόµβοι µεταφέρουν

µόνο την έννοια που αναπαριστούν. Επιπλέον, όπως είδαµε, ένα άλλο µέρος της γνώσης

που εµπεριέχει ένα πλαίσιο περιγράφει τη χρήση της οντότητας που αναπαριστά. Τα

πλαίσια µπορούν να συνδέονται µεταξύ τους ιεραρχικά, να αποτελέσουν δηλαδή

αντικείµενα-κόµβους ενός δικτύου. Εκτός από τα πλαίσια αντικειµένων (object frames)

µπορεί να έχουµε και πλαίσια ελέγχου (control frames) τα οποία περιέχουν συλλογιστική

γνώση και ορίζουν πως χρησιµοποιούνται άλλα πλαίσια. Και αυτά τα πλαίσια µπορεί να

είναι οργανωµένα σε ιεραρχική δοµή, όπου τα υψηλότερης ιεράρχησης πλαίσια

ενεργοποιούν τα χαµηλότερης ιεράρχησης, µέχρι την ενεργοποίηση των πλαισίων

αντικειµένων. Μια οργανωµένη βάση πλαισίων ελέγχου και πλαισίων αντικειµένων

συγκροτεί ένα σύστηµα πλαισίων (frame system) για δεδοµένο σκοπό. Σε µια τέτοια

Page 40: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

40

δοµή, κόµβοι είναι τα πλαίσια και τα τόξα είναι σύνδεσµοι µεταξύ τους. Μπορούµε να

έχουµε διαφόρων ειδών συνδέσµους ανάµεσα σε πλαίσια, όπως:

• ιεραρχικοί σύνδεσµοι που αναπαριστούν σχέσεις της µορφής «ΕΙΝΑΙ» ή

«ΕΙΝΑΙ_ΜΕΡΟΣ»

• αντίπαλοι σύνδεσµοι που συνδέουν αντίπαλα πλαίσια και προσδιορίζουν

διαφοροποιήσεις ανάµεσα σε πλαίσια µε πολλά κοινά χαρακτηριστικά

• συµπληρωµατικοί σύνδεσµοι που λειτουργούν αντίθετα µε τους αντίπαλους

συνδέσµους, συνδέοντας δυο πλαίσια που είναι συµπληρωµατικά

• ενεργοποιητικοί σύνδεσµοι που εισηγούνται ποια πλαίσια θα ενεργοποιηθούν,

ιδίως στην αρχή.

Ουσιαστικά ένα σύστηµα πλαισίων αποτελεί ένα χώρο αναζήτησης µε στόχο τη

συγκεκριµενοποίηση πλαισίων αντικειµένων που παρέχουν τη λύση σε ένα πρόβληµα. Η

πλοήγηση µπορεί να κατευθύνεται είτε σε τοπικό, είτε σε καθολικό επίπεδο µε τα

πλαίσια ελέγχου να παρέχουν τον καθολικό έλεγχο και τις διαδικασίες που

ενσωµατώνονται στα πλαίσια αντικειµένων να παρέχουν τον τοπικό έλεγχο.

5.4 Κληρονόµηση

Είδαµε ότι τόσο τα δίκτυα συσχέτισης, όσο και τα πλαίσια µπορούν να συγκροτήσουν

ιεραρχικές δοµές µέσω των οποίων κληρονοµούνται χαρακτηριστικά. Η κληρονόµηση

επιτρέπει τη ροή πληροφορίας από τάξεις σε περιπτώσεις, δηλαδή από το γενικό προς το

ειδικό (µερικό). Μπορούµε να διακρίνουµε δυο περιπτώσεις: της απλής κληρονόµησης

και της πολλαπλής κληρονόµησης. Στην πρώτη περίπτωση έχουµε κληρονόµηση σε

αυστηρές ταξινοµίες, όπου κάθε πλαίσιο έχει ένα και µοναδικό άµεσο προκάτοχο, οπότε

τα πράγµατα είναι σχετικά εύκολα. Αντίθετα, στην περίπτωση της πολλαπλής

κληρονόµησης οι ταξινοµίες δεν είναι αυστηρές, καθώς ένα πλαίσιο µπορεί να έχει

περισσότερους του ενός άµεσους προκατόχους. Σε µια τέτοια περίπτωση µπορεί να

υπάρχουν αντιφατικές προτάσεις ως προς την τιµή που θα πάρει ένα χαρακτηριστικό και

θα πρέπει να ενεργοποιηθεί ειδικός αλγόριθµος για την επιλογή της µιας από τις πολλές

προτεινόµενες τιµές. Μια τέτοια µέθοδος κάνει χρήση της απόστασης συλλογισµού που

λαµβάνει υπόψη ότι µια κατηγορία C1 είναι (συλλογιστικά) πιο κοντά στην κατηγορία

Page 41: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

41

C2, απ’ ότι στην κατηγορία C3 αν και µόνο η C1 έχει µια διαδροµή προς τη C3 µέσω της

C2.

Για ένα παράδειγµα χρήσης δικτύων συσχέτισης για την αναπαράσταση γνώσης δείτε

την 39. Άσκηση 20: ∆ίκτυα Συσχέτισης.

Page 42: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

42

6. Σύνοψη 6ου Κεφαλαίου

Οι Κανόνες Παραγωγής (Production Rules) που είναι το αντικείµενο του 6ου Κεφαλαίου

αρχικά χρησιµοποιήθηκαν στη θεωρία αυτοµάτων (Automata Theory) και στη σχεδίαση

γλωσσών προγραµµατισµού. Επί του παρόντος παραµένουν µια δηµοφιλής µέθοδος

αναπαράστασης γνώσης στα έµπειρα συστήµατα. Είναι ίσως ο φορµαλισµός που

βρίσκεται εγγύτερα στον ανθρώπινο τρόπο σκέψης και συλλογισµού και η εξαγωγή

συµπερασµάτων γίνεται µε σχετικά εύκολο τρόπο. Παρουσιάζονται η βασική

αρχιτεκτονική ενός συστήµατος παραγωγής (production system) και οι µηχανισµοί

συλλογισµού µέσω εφαρµογής κανόνων όπως η ορθή και η ανάστροφη αλυσίδωση. Η

συζήτηση γενικεύεται µε την παρουσίαση του µοντέλου του µαυροπίνακα ως ενός

σύνθετου συστήµατος παραγωγής.

6.1 Κανόνες και Σύστηµα παραγωγής

Ένα σύστηµα παραγωγής αποτελείται από τρία µέρη:

• τη βάση (µνήµη) γνώσης που εκφράζεται υπό τη µορφή κανόνων (βάση κανόνων)

• το χώρο (µνήµη) εργασίας όπου περιέχονται τα δεδοµένα και τα ενδιάµεσα

συµπεράσµατα του υπό εξέταση προβλήµατος τη δεδοµένη στιγµή και αποτελούν

τα στοιχεία της µνήµης εργασίας

• το µηχανισµό ελέγχου που είναι υπεύθυνος για την εφαρµογή των κανόνων

ενσωµατώνοντας αντίστοιχο µηχανισµό, όπως και µηχανισµό επίλυσης

συγκρούσεων

Ένας κανόνας είναι της µορφής Εάν – τότε (if – then). Αποτελείται από δυο µέρη, το

αριστερό (Εάν) που είναι το προκείµενο ή η συνθήκη του κανόνα και το δεξί (τότε) που

είναι το συµπέρασµα ή η ενέργεια του κανόνα. Στη γενική µορφή µπορεί να είναι ως:

P1, P2, … , Pm, → Q1 , Q2 …, Qn

όπου m, n ≥ 1.

Η σηµασιολογία της παραπάνω έκφρασης είναι η εξής: αν τα προκείµενα (συνθήκες) P

είναι αληθή, τότε να συµπεράσµατα Q (ενέργειες) µπορούν να εξαχθούν (εκτελεστούν).

Οι προτάσεις P και Q είναι δοµές συµβόλων.

Page 43: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

43

Ένα σύστηµα που ακολουθεί τη δοµή κανόνων ξεκινά από τη µια πλευρά των κανόνων

για να εξετάσει την άλλη. Στα συστήµατα παραγωγής η γνώση µπορεί να είναι

οργανωµένη µε ορθή συλλογιστική (forward reasoning) που ξεκινά από τα δεδοµένα για

να καταλήξει σε συµπεράσµατα µέσω της σύνθεσης (synthesis). Αυτά τα συστήµατα

ονοµάζονται συστήµατα οδηγούµενα από τα δεδοµένα (data driven). Αντίθετα, συστήµατα

δοµηµένα µε ανάστροφη συλλογιστική (backward reasoning) η οργάνωση της γνώσης

ξεκινά από πιθανά συµπεράσµατα για να φτάσει στις αιτίες που τα στηρίζουν. Τότε

έχουµε σύστηµα το οποίο κάνει ανάλυση (analysis) ή σύστηµα προσανατολισµένο στα

συµπεράσµατα (goal driven). Ανεξάρτητα από τα παραπάνω, µπορούµε να διαχωρίσουµε

κατά πόσο ο συλλογισµός είναι συµπερασµατικής (deductive) ή απαγωγικής (abductive)

µορφής. Ο συµπερασµατικός συλλογισµός οδηγεί σε συµπεράσµατα µε κατηγορηµατικό

τρόπο, όπως η κατηγορηµατική λογική. Ο απαγωγικός συλλογισµός είναι υποθετικός

συλλογισµός και οδηγεί σε υποθέσεις για περαιτέρω διερεύνηση. Συνήθως, η ανάστροφη

συλλογιστική είναι συµπερασµατικής µορφής, ενώ η ορθή συλλογιστική µπορεί να είναι

και απαγωγικής µορφής.

6.2 Ορθή αλυσίδωση (forward chaining)

Για την εφαρµογή ενός κανόνα ορθής αλυσίδωσης χρειάζονται κάποια δεδοµένα.

Εξετάζονται αν οι συνθήκες / προκείµενα στα αριστερά ενός κανόνα είναι αληθείς για να

καταλήξει αν τα συµπεράσµατα / ενέργειες στο δεξί µέρος του κανόνα είναι αληθή. Αυτό

ονοµάζεται εκτέλεση του κανόνα από τα αριστερά προς τα δεξιά. Οι συµβολικές

εκφράσεις στα προκείµενα των κανόνων ταυτίζονται µε συµβολικές εκφράσεις στη

µνήµη εργασίας του συστήµατος παραγωγής. Ακολουθεί ένας κύκλος ενεργειών της

µορφής «αναγνώρισε – ενέργησε» όπου µια συγκεκριµενοποίηση επιλέγεται και

εφαρµόζεται, εκτελείται δηλαδή η ενέργειά της, µέχρις ότου να εξαντληθούν οι

συγκεκριµενοποιήσεις ή να µην υπάρχει καµιά επιπλέον πρόοδος. Γλώσσες

προγραµµατισµού όπως η OPS5 και η CLIPS παρέχουν µόνο ορθή αλυσίδωση, γεγονός

που δεν αποτελεί µειονέκτηµα, καθώς τόσο ο ορθός τρόπος συλλογισµού (σύνθεση), όσο

και ο ανάστροφος τρόπος συλλογισµού (ανάλυση) µπορούν να υλοποιηθούν µε την ορθή

αλυσίδωση.

Page 44: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

44

6.3 Ανάστροφη αλυσίδωση (backward chaining)

Αντίθετα µε την ορθή αλυσίδωση, στην ανάστροφη αλυσίδωση οι κανόνες εφαρµόζονται

προς την αντίθετη κατεύθυνση, δηλαδή από τις ενέργειες / συµπεράσµατα, προς τα

προκείµενα / συνθήκες. Αυτό ονοµάζεται εκτέλεση του κανόνα από τα δεξιά προς τα

αριστερά. Για την ανάστροφη αλυσίδωση η µνήµη εργασίας µπορεί να είναι αρχικά κενή.

Η διαδικασία εξαγωγής συµπερασµάτων ξεκινά από το δεξί µέρος του κανόνα και

προσπαθεί να διερευνήσει αν οι προϋποθέσεις είναι αληθείς.

6.4 Το µοντέλο του µαυροπίνακα

Μια περιγραφική εικόνα του µοντέλου του µαυροπίνακα (blackboard model) είναι αυτή

ενός δασκάλου που διαδραµατίζει το ρόλο του συντονιστή σε µια οµάδα µαθητών που

αποτελούν µια οµάδα εργασίας και προσπαθούν να επιλύσουν ένα πρόβληµα από κοινού,

συνεισφέροντας ο καθένας µε ένα µέρος της λύσης. Υπάρχουν διάφορες πηγές γνώσης

που έχουν συντονιστικό ρόλο και ελέγχουν τη διεξαγωγή της συνεργατικής διεργασίας,

αλλά και άλλες πηγές γνώσης που επεκτείνουν τη σύνθεση της λύσης. Κάθε πηγή

γνώσης µπορεί να θεωρηθεί ως ένα βαθµό αυτόνοµη, µε τη δική της µνήµη παραγωγής,

µνήµη εργασίας και ελέγχου το οποίο αφορά στην επίλυση και το συντονισµό κάποιου

υποπροβλήµατος. Οι πηγές γνώσης αποτελούνται από ένα ιδιωτικό και ένα δηµόσιο

µέρος. Το δηµόσιο µέρος δηλώνει τη διεπαφή µε τον µαυροπίνακα, δηλαδή το είδος και

το χώρο πρόσβασης της πηγής γνώσης στο µαυροπίνακα. Το ιδιωτικό µέρος της πηγής

γνώσης µπορεί να θεωρηθεί ως µαύρο κουτί (black box).Το µοντέλο του µαυροπίνακα

επιτρέπει την ετερογένεια, δηλαδή κάποια πηγή γνώσης να µην είναι σύστηµα

παραγωγής, αλλά κάποιας άλλης µορφής σύστηµα βάσης γνώσης, για παράδειγµα ένα

πλαίσιο. Κάθε πηγή γνώσης αγνοεί την ύπαρξη των υπολοίπων πηγών γνώσης και

αναζητά ευκαιρίες εµπλοκής στη λύση του προβλήµατος µέσω του µαυροπίνακα. Εκ

κατασκευής το µοντέλο του µαυροπίνακα υποστηρίζει την παράλληλη επεξεργασία και

το συνεργατικό µοντέλο. Παρ’ όλα αυτά µπορεί να εµφανιστεί και ανταγωνισµός όταν

εµφανιστούν πολλαπλές πηγές για την ίδια υποεργασία. Ο µαυροπίνακας είναι µια

καθολική δοµή αποτελούµενη από ένα αριθµό επιπέδων, µε κάθε επίπεδο να έχει

τουλάχιστον δυο στρώµατα (το κάτω στρώµα για τις παρατηρήσεις και το άνω στρώµα

Page 45: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

45

για τα συµπεράσµατα). Στη γενική περίπτωση µπορούµε να έχουµε πολλά στρώµατα

αφαιρετικότητας. Ανάµεσα στα στρώµατα του ίδιου επιπέδου υπάρχουν δυο βασικές

σχέσεις: της αφαίρεσης (από κάτω προς τα πάνω) και της προσδοκίας (από πάνω προς τα

κάτω). Από την καταχώριση αρχικών πληροφοριών στο κατώτερο στρώµα του

κατωτέρου επιπέδου οδηγούµαστε στη λύση του προβλήµατος που θα παραχθεί στα

υψηλότερο στρώµα του υψηλότερου επιπέδου.

Page 46: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

46

7. Σύνοψη 7ου Κεφαλαίου

Με το 7ο Κεφάλαιο περνάµε στο δεύτερο µέρος του τόµου Α΄ που αναφέρεται στις

βασικές έννοιες και στην τεχνολογία των εµπείρων συστηµάτων, όπως και σε

συγκεκριµένα παραδείγµατα εµπείρων συστηµάτων 1ης και 2

ης γενεάς τα οποία

παρουσιάζονται στα επόµενα Κεφάλαια. Όπως έχουµε δει µέχρι τώρα τα έµπειρα

συστήµατα αποτελούν το κραταιό µέρος εφαρµογών της ΤΝ. Ένα έµπειρο σύστηµα

κατέχει γνώση (σώµα γνώσης ή βάση γνώσης) που αποτελεί εµπειρογνωµοσύνη κάποιου

πεδίου, καθώς επίσης και ένα µηχανισµό συλλογισµού. Μαζί µε την παρουσίαση των

βασικών χαρακτηριστικών των εµπείρων συστηµάτων εξετάζονται τρεις βασικές µορφές

συλλογισµού, το συµπέρασµα, η απαγωγή και η επάγωγη.

7.1 Έµπειρα συστήµατα

Όπως είδαµε από το 1ο εισαγωγικό κεφάλαιο, έννοιες όπως η ευφυΐα, η νοηµοσύνη, η

γνώση, κλπ., είναι δύσκολο να ορισθούν. Είδαµε επίσης ότι η πρώτες προσπάθειες για τα

δηµιουργία συστηµάτων επίλυσης προβληµάτων γενικώς και αδιακρίτως οδηγήθηκαν σε

αποτυχία και κατέληξαν σε πιο ρεαλιστική στοχοθέτηση και στην αναγκαιότητα για την

ενσωµάτωση και τη χρήση συγκεκριµένης γνώσης µε τη δηµιουργία συστηµάτων

βασισµένα στη γνώση (knowledge based system).

Ένα έµπειρο σύστηµα είναι ένα υπολογιστικό πρόγραµµα το οποίο µπορεί να επιλύσει

αποδοτικά και ρεαλιστικά διάφορα προβλήµατα επιδεικνύοντας εµπειρογνωµοσύνη ή/

και νοήµονα συµπεριφορά σε συγκεκριµένους τοµείς. Στην πιο γενική και απλή µορφή η

αρχιτεκτονική ενός εµπείρου συστήµατος περιλαµβάνει µια βάση γνώσης, τα δεδοµένα

του προβλήµατος και ένα µηχανισµό εξαγωγής συµπερασµάτων. Με δεδοµένο ότι για

πολλές κατηγορίες προβληµάτων είναι λίγοι οι ειδικοί εµπειρογνώµονες, και ότι η

απόκτηση εµπειρογνωµοσύνης είναι, δύσκολη, επίπονη και συχνά µακροχρόνια

διαδικασία, η τεχνολογία των εµπείρων συστηµάτων (διακηρύσσει ότι) στοχεύει στην

εξάπλωση της µηχανικής επίλυσης προβληµάτων που απαιτούν εµπειρογνωµοσύνη. Από

τις απαρχές ανάπτυξης του κλάδου εµφανίστηκαν αντιρρήσεις σε πρακτικό, αλλά κυρίως

σε φιλοσοφικό επίπεδο, καθώς και οξύτατα ηθικά προβλήµατα, ειδικά σε σχέση µε ότι

αφορά τη χρησιµότητα και τη χρήση των αποτελεσµάτων που εξάγονται από ένα έµπειρο

Page 47: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

47

σύστηµα. Θα έπρεπε τα αποτελέσµατα αυτά να υιοθετούνται άκριτα, ή απλά θα έπρεπε

να λειτουργούν ως βάση υποστήριξης αποφάσεων από κάποιους ειδικούς που θα

µπορούσαν να τα αξιολογήσουν; Έτσι ναι µεν η απόδοση ενός εµπείρου συστήµατος από

πλευράς και αξίας των αποτελεσµάτων πρέπει να είναι συγκρίσιµη µε αυτές ενός

εµπειρογνώµονα, αλλά ο τυπικός χρήστης ενός τέτοιου συστήµατος, χωρίς να είναι

έµπειρος ο ίδιος, πρέπει να µπορεί να αξιολογήσει τα διάφορα εξαγόµενα. Με αυτή την

έννοια τα έµπειρα συστήµατα κατατάσσονται στα συστήµατα υποστήριξης αποφάσεων

(decision support systems), αλλά µπορούν να έχουν ρόλο κριτή (critic) ή φροντιστή

(tutor). Επιπλέον, στο βαθµό που επιτρέπουν τη συνδιάλεξη µε το χρήστη, είναι

διαλογικά συστήµατα.

Ένα σηµαντικό στοιχείο στα έµπειρα συστήµατα είναι να είναι µανθάνοντα συστήµατα,

δηλαδή να καταφέρνουν να µιµούνται επαρκώς, ένα από τα βασικά χαρακτηριστικά της

ανθρώπινης εµπειρογνωµοσύνης, που είναι δυναµικής φύσης και χαρακτηρίζεται από τη

διαρκή αυτοβελτίωση, µέσα από τις προσωπικές εµπειρίες, την απόκτηση νέων γνώσεων.

Στη γενική τους περιγραφή τα χαρακτηριστικά των εµπείρων συστηµάτων συνοψόζονται

ως εξής:

• παρέχουν ικανοποιητική προσοµοίωση του ανθρωπίνου συλλογισµού

• επιλύουν προβλήµατα µε χρήση ευρετικών ή προσεγγιστικών µεθόδων

• απαντούν σε προβλήµατα που η επίλυσή τους απαιτεί εµπειρογνωµοσύνη

• παρέχουν ορθές λύσεις µε υψηλή ταχύτητα κα απόδοση

• συνδιαλέγονται µε το χρήστη

• έχουν τη δυνατότητα επεξήγησης και τεκµηρίωσης των αποτελεσµάτων τους

• αυτοβελτιώνονται

7.2 Βασικές µορφές συλλογισµού

Οφείλουµε στο φιλόσοφο C.S. Peirce τη διάκριση σε τρεις µορφές συλλογισµού:

• το συµπέρασµα (deduction) που αντιστοιχεί στην πρόβλεψη (prediction)

• την απαγωγή (abduction) που αντιστοιχεί στην εξήγηση (explanation)

• την επαγωγή (induction) που αντιστοιχεί στην µάθηση (learning)

Page 48: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

48

Το συµπέρασµα είναι µορφή συλλογισµού που έχουµε ήδη συναντήσει: ο συλλογισµός

στην κατηγορηµατική λογική (βλ. 4ο Κεφάλαιο) είναι συµπερασµατικός, το ίδιο και οι

κανόνες modus ponens. Με βάση την υπάρχουσα βάση γνώσης και κάποια αρχικά

δεδοµένα µπορούµε να προβλέψουµε τις συνέπειες. Έτσι αν γνωρίζουµε από τη βάση

γνώσης ότι κάποιος που έχει γρίπη εµφανίζει πυρετό, είναι εύκολο να συµπεράνουµε

(άρα να προβλέψουµε) ότι ο Χ που έχει γρίπη θα εµφανίσει και πυρετό.

Η απαγωγή είναι υποθετικός συλλογισµός (βλ. § 6.1). Αν έχουµε σα δεδοµένο ότι ο Χ

εκδηλώνει πυρετό, τότε µπορούµε να διατυπώσουµε διάφορες αξιόπιστες υποθέσεις

σχετικά µε τα αίτια εκδήλωσης του πυρετού (π.χ. λόγω γρίπης, ιλαράς, ή άλλης

πυρετογόνου ασθένειας). Ενδεχοµένως, όπως στο παράδειγµά µας οι υποθέσεις να είναι

περισσότερες από µια, οπότε πρέπει να ακολουθήσει περαιτέρω διερεύνηση µε στόχο την

αξιολόγηση των διαφόρων υποθέσεων. Σε αυτή τη διερεύνηση µπορεί να χρειαστεί η

προσφυγή σε συµπερασµατικό λογισµό. Αν για παράδειγµα ο Χ έχει εµφανίσει και

πονοκέφαλο, τότε ενισχύεται η υπόθεση της γρίπης. Αντίθετα, αν ο Χ έχει εµφανίσει

κόκκινα στίγµατα στο δέρµα του τότε ενισχύεται η υπόθεση της ιλαράς.

Η επαγωγή, δηλαδή ο επαγωγικός συλλογισµός αφορά τη µάθηση και στοχεύει στην

ανάπτυξη θεωριών και την ανακάλυψη γνώσης. Από πολλές παρόµοιες παρατηρήσεις,

(για παράδειγµα ότι κάποια συγκεκριµένα άτοµα που προσβλήθηκαν από γρίπη

ανέπτυξαν πυρετό), µπορεί να καταλήξει επαγωγικά, στο συµπέρασµα ότι όλοι όσοι

έχουν γρίπη θα εκδηλώσουν πυρετό. Έτσι η απαγωγή αφορά την ικανότητα του

συστήµατος για αυτοβελτίωση µε βάση τις εµπειρίες του στην επίλυση προβληµάτων. Αν

το έµπειρο σύστηµα έχει τη δυνατότητα καταγραφής των εµπειριών του, δηλαδή τα

περιστατικά του προβλήµατος που εξέτασε, το συλλογισµό που ακολούθησε και την

ορθότητα ή µη των συµπερασµάτων στα οποία κατέληξε, τότε µπορεί να έχει την

ικανότητα της µάθησης κατά προσαύξηση (incremental learning), η οποία σταδιακά

οδηγεί σε εκλέπτυνση της γνώσης και την αποφυγή απόσπασης γνώσης από

εµπειρογνώµονες. Η διαδικασία αυτή είναι δυναµική και διαφέρει από τη στατική

παραδοσιακή µέθοδο της µηχανικής µάθησης, όπου ένας πολύ µεγάλος όγκος δεδοµένων

χρησιµοποιούνται για την εξαγωγή κάποιων γενικών κανόνων οι οποίοι στη συνέχεια

Page 49: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

49

ενσωµατώνονται σε κάποιο έµπειρο σύστηµα. Η διαφορά είναι στο ότι η κατά

προσάυξηση µάθηση είναι ενδογενής και δυναµική δυνατότητα του συστήµατος για

εξαγωγή νέας γνώσης.

Page 50: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

50

8. Σύνοψη 8ου Κεφαλαίου

Όπως φανερώνει και ο τίτλος του Κεφαλαίου αυτού αναφέρεται στα έµπειρα συστήµατα

1ης γενεάς, τα οποία αναπτύχθηκαν από τα τέλη της δεκαετίας του 1960 έως τα τέλη της

δεκαετίας του 1970. Παρουσιάζονται τα χαρακτηριστικά τριών εµπείρων συστηµάτων

της γενεάς αυτής (MYCIN, PROSPECTOR, INTERNIST-1). Μέσα από την παρουσίαση

της αρχιτεκτονικής των συστηµάτων αυτών και της φιλοσοφίας ανάπτυξής τους

εντοπίζονται οι εγγενείς αδυναµίες των συστηµάτων αυτών σε θέµατα που αφορούν τόσο

σε θέµατα ουσίας (όπως η σχετική δυσκαµψία στο συλλογισµό και η περιορισµένη

επεκτασιµότητα), όσο και σε θέµατα που αφορούσαν στην ανεπάρκεια της διασύνδεσης

του συστήµατος µε το χρήστη. Ωστόσο, δεν θα πρέπει να βιαστούµε να καταδικάσουµε

τις προσπάθειες αυτές. Και αυτό για δυο λόγους: πρώτον γιατί ο εντοπισµός και η

παραδοχή των µειονεκτηµάτων αυτών οδήγησε µέσα από µια σοβαρή αυτοκριτική

διάθεση σε ουσιαστικές βελτιώσεις της µεθοδολογίας που οδήγησε στα έµπειρα

συστήµατα 2ης γενεάς (βλ. Κεφ. 9) και δεύτερον στη συνολική αναθεώρηση της

προσέγγισης του τρόπου δηµιουργίας τους (βλ. Κεφ 10).

Τα περισσότερα έµπειρα συστήµατα 1ης γενεάς όπως το MYCIN και το PROSPECTOR

ήταν συστήµατα παραγωγής. Η βασιζόµενη σε κανόνες παραγωγής αναπαράσταση της

γνώσης (βλ. Κεφ. 6) χρησιµοποιεί απλό φορµαλισµό µε το µειονέκτηµα πολλές φορές η

γνώση να µην δηλώνεται ρητά αλλά µε έµµεσο τρόπο, κρυµµένη πίσω από µια σειρά

συνθηκών και κανόνων που εν τέλει δεν τεκµηριώνονται. Ένα δεύτερο χαρακτηριστικό

των συστηµάτων 1ης γενεάς είναι η εκτεταµένη χρήση του συλλογισµού ταξινόµησης σε

σχέση µε το συλλογισµό σύνθεσης (βλ. Κεφ. 2). Τέλος ένα 3ο χαρακτηριστικό τους είναι

η χρήση συγκεντρωτικής µορφής δοµή ελέγχου (µηχανισµός συλλογισµού) σε αντίθεση

µε µεταγενέστερα συστήµατα που υπεισέρχεται ο κατανεµηµένος και τοπικός έλεγχος σε

ένα αποκεντρωτικό σχήµα.

Λαµβάνοντας υπόψη ότι οι καθολικές αλήθειες είναι συγκριτικά σπάνιες, ειδικά σε ένα

έµπειρο σύστηµα που βασίζεται σε γνώση εµπειρικής µορφής, είναι επόµενο η

αβεβαιότητα να αποτελεί ένα κύριο χαρακτηριστικό της γνώσης αυτής. Αυτός ο

παράγοντας δεν µπορεί να παραληφθεί, αλλά αντίθετα πρέπει να ληφθεί σοβαρά υπόψη

για την ανάπτυξη µοντέλων συλλογισµού µε αβεβαιότητα. Ο τοµέας αυτός της

Page 51: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

51

επιστηµονικής έρευνας δεν σχετίζεται µόνο µε τα έµπειρα συστήµατα, αλλά γενικότερα

µε την Περιοχή της Τεχνητής Νοηµοσύνης και των Μαθηµατικών.

8.1 Το σύστηµα MYCIN

Αναπτύχθηκε στο Πανεπιστήµιο του Stanford µε κύριο στόχο την υποβοήθηση των

ιατρών (ιδίως των λιγότερο έµπειρων) σε θέµατα διάγνωσης και θεραπείας

µικροβιολογικών µολύνσεων του αίµατος, όπως για παράδειγµα η µηνιγγίτιδα. Από τα

βασικά κίνητρα ανάπτυξης του συστήµατος ήταν η ανάγκη εξάπλωσης της

εµπειρογνωµοσύνης, έλλειψη της οποίας οδηγεί σε συχνά λάθη µε τραγική κατάληξη

(ακόµα και στις µέρες µας τα θανατηφόρα κρούσµατα µηνιγγίτιδας δυστυχώς δεν

απουσιάζουν), αλλά και ο καλύτερος σχεδιασµός της θεραπευτικής αγωγής έτσι ώστε να

εξαλειφθεί το φαινόµενο της υπερβολικής και άσκοπης χρήσης αντιβιοτικών που

συντελούν στην ανάπτυξη ιδιαίτερα φαρµακο-ανθεκτικών µικροβίων. Τέλος ένας τρίτος

λόγος είναι ότι η για πολλές από τις παθήσεις αυτές η έγκαιρη διάγνωση και η

αναγνώρισης της ταυτότητας των παθογόνων µικροβίων είναι ζωτικής σηµασίας για τον

πάσχοντα.

Το MYCIN αποτελείται από το συµβουλευτικό σύστηµα και από ένα αριθµό

δορυφορικών υποσυστηµάτων που σχετίζονται µε την παροχή εξηγήσεων, την ηµι-

αυτόµατη απόκτηση γνώσης (υποσύστηµα TEIRESIAS), τη διδασκαλία (υποσύστηµα

GUIDON) και την έννοια του συστήµατος κελύφους (EMYCIN). Το συµβουλευτικό

σύστηµα αποτελείται από δυο σκέλη, το πρώτο για τη διάγνωση και το δεύτερο για τη

θεραπεία. Η βάση γνώσης ή µνήµη παραγωγής, αφού πρόκειται για σύστηµα παραγωγής)

αποτελείται από περίπου 600 κανόνες και ως νέο χαρακτηριστικό εισάγεται η

αβεβαιότητα µε την οποία εξάγεται ένα συµπέρασµα. Η µνήµη εργασίας (ή δένδρο

αντικειµένων) είναι ιεραρχική ( α ασθενής συνδέεται µε µικροβιολογικές καλλιέργειες,

παθογόνους οργανισµούς, φάρµακα, κλπ). Στο διαγνωστικό του µέρος το MYCIN

εφαρµόζει ανάστροφη συλλογιστική (συµπερασµατικό συλλογισµό) µε ανάστροφη

αλυσίδωση (βλ. § 6.3). Σε σχέση µε το θεραπευτικό σκέλος του MYCIN έχει υλοποιηθεί

µε διαδικασίες LISP χωρίς να αποδίδει ιδιαίτερη διαφάνεια στο µέρος αυτό της

εµπειρογνωµοσύνης κι έτσι δεν παρουσιάζει ιδιαίτερο ενδιαφέρον από πλευράς

αρχιτεκτονικής εµπείρων συστηµάτων. Τέλος η αβεβαιότητα εµφανίζεται σε δυο

Page 52: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

52

επίπεδα: ως αβεβαιότητα κανόνων και ως αβεβαιότητα στις τιµές των χαρακτηριστικών

που εξετάζονται από το σύστηµα. Οι πρώτες ως εγγενές χαρακτηριστικό των κανόνων

προσδιορίζονται εκ των προτέρων από τους έµπειρους, ενώ οι δεύτερες προσδιορίζονται

δυναµικά κατά τη διαδικασία της αλληλεπίδρασης µε το σύστηµα

8.2 Το σύστηµα PROSPECTOR

Αναπτύχθηκε από της εταιρεία SRI International σχετικά µε την υποβοήθηση γεωλόγων

στην αξιολόγηση εδαφών για πιθανή ύπαρξη αποθεµάτων σε διάφορα ορυκτά. Πρόκειται

για ένα επίσης σύστηµα παραγωγής, αλλά διαφέρει από το MYCIN καθώς υιοθετείται

ένα υβριδικό σχήµα για την αναπαράσταση γνώσης όπου συνδυάζονται οι κανόνες

παραγωγής µε τα δίκτυα συσχέτισης. Τα προκείµενα και τα συµπεράσµατα των κανόνων

αναπαριστώνται ως διαµερίσεις (βλ. Κεφ. 5). Η χρήση δικτύων συσχέτισης επιτρέπει την

ρητή αναπαράσταση ταξινοµιών εννοιών που στο PROSPECTOR αποτελούνται από είδη

βραχωµάτων, ορυκτών, φυσικές µορφές, γεωλογικές ηλικίες, κλπ. Η βάση γνώσης

περιέχει γύρω στα 15 µοντέλα ορυκτών, το καθένα αποτελούµενο από περισσότερους

από 150 κανόνες. Το σύστηµα υιοθετεί υποθετικό-συµπερασµατικό συλλογισµό και ένα

µοντέλο αβεβαιότητας που βασίζεται στο βασικό θεώρηµα του Bayes. Συνδυάζει

συλλογιστική οδηγούµενη από δεδοµένα (ορθή συλλογιστική), και συλλογιστική

οδηγούµενη από στόχους (ανάστροφη συλλογιστική) που υλοποιούνται µε χρήση

µεικτής αλυσίδωσης ( (ορθή και ανάστροφη αλυσίδωση). Αυτό επιτρέπει τη διεξαγωγή

µεικτής-πρωτοβουλίας διαλόγου, όπου τόσο το σύστηµα θέτει ερωτήµατα προς το

χρήστη σχετικά µε απευθείας µαρτυρίες, όσο και ο χρήστης µπορεί να εισάγει

εθελοντικά παρατηρήσεις ή να ζητήσει τη διερεύνηση κάποιας συγκεκριµένης υπόθεσης.

8.3 Το σύστηµα INTERNIST-1

Αναπτύχθηκε στο Πανεπιστήµιο του Pittsburg σχετικά µε την υποβοήθηση ιατρών στη

διαφορική διάγνωση στην γενική παθολογία. Λόγω της ευρύτητας του θέµατος που θέλει

να καλύψει, διαθέτει την εκτενέστερη βάση γνώσης ανάµεσα στα ιατρικά έµπειρα

συστήµατα, που χρειάστηκε πολυετή προσπάθεια για να αναπτυχθεί ώστε να καλύπτει το

80% των περιπτώσεων της γενικής παθολογίας. Παρέχει γνώση για συνολικά 600

κατηγορίες ασθενειών ή ασθένειες µε 2600 συνδέσµους ανάµεσά τους και 3550 ενδείξεις

Page 53: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

53

µε 6500 συνδέσµους ανάµεσά τους. Κεντρικές έννοιες είναι οι ασθένειες και οι ενδείξεις.

Ανάµεσα τους αναπτύσσονται οι σχέσεις Εκδηλώνει (συσχέτιση ασθενειών µε ενδείξεις

που εκδηλώνονται) και οι σχέσεις ∆ιεγείρει (ενδείξεις διεγείρουν υποθέσεις για κάποιες

ασθένειες). Η γνώση για µια ασθένεια αναπαρίσταται στην ολότητά της µε χρήση

πλαισίου (βλ. Κεφ. 5). Υιοθετούνται συµπληρωµατικές σχέσεις που χρησιµοποιούνται

για τη σύνθεση διαγνώσεων αποτελούµενων από πολλές ασθένειες. Λόγω της µεγάλης

έκτασης της βάσης γνώσης κρίθηκε αναγκαία η οργάνωση των ασθενειών µε ιεραρχικό

τρόπο για τη µείωση του αριθµού των ενεργών υποθέσεων. Ο συλλογισµός του

συστήµατος βασίζεται στο υποθετικο-συµπερασµατικό σχήµα µε τις µαρτυρίες να

αναφέρονται σε θετικές ή αρνητικές ενδείξεις. Οι ενεργές υποθέσεις αξιολογούνται µε

χρήση κάποιας συνάρτησης βαθµολόγησης και χωρίζονται σε αξιόπιστες και µη. Οι

πλέον αξιόπιστες υποθέσεις διακρίνονται σε αντίπαλες και συµπληρωµατικές και

διερευνούνται µε χρήση τριών στρατηγικών που ενσωµατώνουν τα ευρετικά του

Αποκλεισµού, του ∆ιαχωρισµού και της Επιδίωξης.

Page 54: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

54

9. Σύνοψη 9ου Κεφαλαίου

Χωρίς να υπάρχει σαφής διάκριση και διαχωριστική γραµµή ανάµεσα στα έµπειρα

συστήµατα 1ης και 2

ης γενεάς, µπορούµε να πούµε ότι ο εντοπισµός των αδυναµιών των

πρώτων οδήγησε στην ανάπτυξη των δεύτερων. Τα συστήµατα 1ης γενεάς παρουσιάζουν

κατά πλειοψηφία οµοιόµορφη αναπαράσταση γνώσης βασισµένη κυρίως σε κανόνες

παραγωγής και απλούς µηχανισµούς συλλογισµού. ∆εν παρουσίαζαν ικανοποιητική

ευελιξία στην επίλυσης προβληµάτων, η απόδοσή τους έπεφτε απότοµα σε σχέση µε τα

δύσκολα προβλήµατα του πεδίου τους, παρουσίαζαν περιορισµένη ικανότητα µάθησης

και απόκτησης γνώσης και αδυναµία έκφρασης και τεκµηρίωσης επεξηγήσεων σε

επίπεδο αφηρηµένο, όπως αυτό του συλλογισµού. Η σηµαντική γνώση ήταν απούσα ή

υπονοούνταν, χωρίς να εµφανίζεται ρητά, ειδικά σε θέµατα που αφορούσαν τη γνώση

«Πως» (γνώση ελέγχου ή στρατηγική γνώση), τη γνώση «Τι» (περιγραφική γνώση

λειτουργίας) και τη γνώση «Γιατί» (γνώση τεκµηρίωσης ή αιτιολογική γνώση). Γι’ αυτό

άλλωστε και χαρακτηρίστηκαν «ρηχά» συστήµατα. Τα συστήµατα 2ης γενεάς στοχεύουν

στην απαλοιφή αυτών των αδυναµιών. Για το σκοπό αυτό, ως κύρια χαρακτηριστικά των

συστηµάτων αυτών υιοθετούνται (α) η χρήση πολλαπλών µοντέλων και αντίστοιχων

µηχανισµών συλλογισµού (συνήθως ένα ευρετικό και ένα βαθύτερο αιτιολογικό) γεγονός

που συνεπάγεται τη χρήση υβριδικών αναπαραστάσεων για την υλοποίηση των

µοντέλων αυτών, και (β) ακολουθείται σχεδιασµός προσανατολισµένος στο επίπεδο

γνώσης, άρα υψηλότερο επίπεδο αφαίρεσης στον τρόπο επίλυσης των προβληµάτων.

Επίσης δίνεται έµφαση στην ικανότητα µάθησης και αυτοβελτίωσης του συστήµατος

και στο διαχωρισµό, την µοντελοποίηση και αναπαράσταση περισσοτέρων ειδών γνώσης

ώστε να επιτυγχάνεται υψηλότερος βαθµός επεξήγησης και επαναχρησιµοποίησης

(ικανότητες που ήταν πολύ περιορισµένες στα συστήµατα 1ης γενεάς). Ως

χαρακτηριστικά παραδείγµατα συστηµάτων 2ης γενεάς αναφέρονται το NEOMYCIN και

το MDX.

9.1 Το σύστηµα NEOMYCIN

Το NEOMYCIN αναπτύχθηκε στο Πανεπιστήµιο του Stanford και αποτελεί

ανακατασκευή του MYCIN (βλ. Κεφ. 8). Ένα από τα βασικά µειονεκτήµατα του

MYCIN αποτελεί η περιορισµένη δυναµικότητα του διδακτικού δορυφορικού του

Page 55: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

55

υποσυστήµατος GUIDON η οποία οφείλεται τόσο σε διάφορες ελλείψεις αλλά και σε

εγγενή προβλήµατα που συνδέονται µε τον σχεδιασµό τους και τη χρήση ανάστροφης

αλυσίδωσης κανόνων που δεν ταυτίζεται µε τον ανθρώπινο συλλογισµό και την

δυσκολία παραγωγής ικανοποιητικών επεξηγήσεων λόγω της δόµησης της γνώσης σε

κανόνες, δηλαδή µε υπονοούµενο τρόπο.

Με βάση τα παραπάνω ο βασικός στόχος ανάπτυξης του NEOMYCIΝ είναι το πέρασµα

από την υπονοούµενη µε βάση κανόνες στη ρητή µοντελοποίηση στρατηγικής γνώσης ως

βασική προϋπόθεση τόσο για την αποδοτικότερη διδασκαλία διαγνωστικού

συλλογισµού, όσο και στην ακριβέστερη επεξήγηση της συµπεριφοράς κάποιου µαθητή

κατά την επίλυση προβληµάτων. Έτσι το ζητούµενο, που είναι η παροχή διάγνωσης σε

δεδοµένο πρόβληµα, διαχωρίζεται σε υποεργασίες µε το συλλογισµό που εµπλέκεται και

τις επιµέρους στρατηγικές που υιοθετούνται για την επίτευξη των στόχων των επιµέρους

υποεργασιών να εκφράζονται σε αφηρηµένο επίπεδο. Από την άλλη πλευρά ο

συλλογισµός του συστήµατος καταγράφεται στο δένδρο συλλογισµού, για παράδειγµα

τις αλυσίδες εργασιών και υποεργασιών που ενεργοποιήθηκαν για την απάντηση ενός

ερωτήµατος που τέθηκε από το χρήστη. Αυτός ο τρόπος αναπαράστασης της

στρατηγικής γνώσης επιτρέπει στο σύστηµα να παρέχει στρατηγικές επεξήγησης, τόσο

σε συγκεκριµένο, όσο και σε αφηρηµένο επίπεδο. Όπως και στο MYCIN τα ήδη

επεξηγήσεων είναι δυο: επεξηγήσει «Γιατί» και επεξηγήσεις «Πως».

Πέρα από τη ρητή µοντελοποίηση της στρατηγικής γνώσης, αυτή καθαυτή η γνώση

περιγράφεται µε δυο τρόπους στη βάση δυο ξεχωριστών µοντέλων, του ταξινοµικού

µοντέλου (το οποίο αποτελεί τη γνώση δόµησης) και του αιτιολογικού µοντέλου (το

οποίο αποτελεί τη γνώση υποστήριξης). Το ταξινοµικό µοντέλο παρέχει µια ιεραρχική

οργάνωση της γνώσης µε βάση κατηγορίες και υποκατηγορίες ασθενειών. Το

αιτιολογικό µοντέλο παρέχει µια βαθύτερου επιπέδου παρουσίαση της γνώσης µε βάση

ένα αιτιολογικό δίκτυο που συνδέει ορατές ενδείξεις µε πιθανές, απώτερες αιτίες

διαµέσου ενδιάµεσων παθοφυσιολογικών καταστάσεων. Έτσι, το πρώτο θεωρείται ως το

«ευρετικό» µοντέλο και το δεύτερο το «βαθύ» µοντέλο του συστήµατος. Ευκαιρίας

δοθείσης, και στα πλαίσια της ριζικής ανακατασκευής, το NEOMYCIN επέκτεινε το

εύρος της βάσης γνώσης ώστε πέρα από την κατηγορία των µικροβιολογικών µολύνσεων

του αίµατος να συµπεριλάβει και άλλες κατηγορίες µολύνσεων.

Page 56: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

56

9.2 Το σύστηµα MDX

Το σύστηµα αυτό αναπτύχθηκε στο Πολιτειακό Πανεπιστήµιο του Ohio µε στόχο τη

διάγνωση του συνδρόµου του ήπατος γνωστού ως χολέσταση. Βασικά χαρακτηριστικά

του MDX είναι η αναδιατύπωση της έννοιας της µεταγλωττισµένης γνώσης (βλ. Κεφ. 8)

και η συνεργατική αρχή που υιοθετεί. Η µεταγλωττισµένη γνώση τοποθετείται ως

ενδιάµεση στο φάσµα που από τη µια άκρη βρίσκεται η «ρηχή», εµπειρικής µορφής,

γνώση και από την άλλη άκρη η «βαθιά», αποτελούµενη από τις θεµελιώδεις αρχές του

σχετικού πεδίου, γνώση. Η «ρηχή» γνώση είναι άµεσα εξαρτώµενη από δεδοµένη

εργασία, εκφράζεται από προκείµενες και συµπεράσµατα βάσει κανόνων, είναι δηλαδή

εξαιρετικά λειτουργική, αλλά ελλιπής, ιδιαίτερα σε σχέση µε τα δύσκολα προβλήµατα

του πεδίου. Η «βαθιά» γνώση είναι περιεκτική αλλά όχι στον ίδιο βαθµό αποδοτική όπως

η «ρηχή» γνώση. Στο σύστηµα MDX η µεταγλωττισµένη γνώση εµπεριέχει τα θετικά

χαρακτηριστικά και των δυο αυτών κατηγοριών, δηλαδή την περιεκτικότητας της

«βαθιάς» γνώσης και τη λειτουργικότητα της «ρηχής» γνώσης. Επιπλέον, το σύστηµα

αποτελείται από τρεις ξεχωριστές µονάδες: την κυρίως µονάδα, δηλαδή το σύστηµα

διάγνωσης που ονοµάζεται MDX, και δυο βοηθητικές µονάδες, το διαχειριστή

δεδοµένων (PATREC) και το ραδιολόγο (RADEX). Ο διαγνώστης αποτελεί την

διευθύνουσα µονάδα. Καθένα από τα τρία συστήµατα θεωρείται ειδικός σε µια πτυχή του

προβλήµατος και αποτελείται από µια κοινότητα ειδικών που είναι οργανωµένοι

ιεραρχικά και συνεργάζονται µε βάση συγκεκριµένο πρωτόκολλο. Το σύστηµα MDX δεν

υιοθετεί εναλλακτικά µοντέλα µοντελοποίησης και αναπαράστασης της γνώσης, αλλά το

σώµα της γνώσης έχει κατάλληλα κατανεµηθεί σε τρία ξεχωριστά µοντέλα που

σχετίζονται µε τις διαγνωστικές έννοιες, τα ιατρικά δεδοµένα και τις έννοιες τις

ραδιολογίας, σε αντιστοιχία µε τα τρεις µονάδες του συστήµατος, το διαγνώστη, τον

διαχειριστή δεδοµένων και το ραδιολόγο. Οι προτείνοντες το σύστηµα, θεωρούν ότι

ανταποκρίνεται σε µια καλή προσοµοίωση της πραγµατικότητας και ότι ο

κατανεµηµένος τρόπος οργάνωσης της γνώσης και του συλλογισµού είναι η

µεταγλώττιση της «βαθιάς» γνώσης ώστε να γίνει αποδοτικότερη η χρήση της.

Page 57: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

57

10. Σύνοψη 10ου Κεφαλαίου

Το κεφάλαιο αυτό είναι το τελευταίο του 2ου µέρους του Τόµου Α΄ που αναφέρεται στην

τεχνολογία των εµπείρων συστηµάτων. Παρουσιάζονται µε σφαιρικό τρόπο οι διεργασίες

που εµπλέκονται στην ανάπτυξη ενός εµπείρου συστήµατος 2ης γενεάς. Γίνεται αναφορά

στην Τεχνολογία Γνώσης (Knowledge Enginnering) και πως αυτή συνδυάζεται αλλά

ταυτόχρονα αντιδιαστέλλεται µε την Τεχνολογία Λογισµικού (Software Engineering). Για

περισσότερη εµβάθυνση στα ζητήµατα αυτά χρησιµοποιείται η µεθοδολογία

CommonKADS ως παράδειγµα µεθοδολογίας Τεχνολογίας Γνώσης.

Αφετηριακό σηµείο στη σχεδίαση ενός εµπείρου συστήµατος είναι το γεγονός ότι

αποτελεί ένα µοντέλο εµπειρογνωµοσύνης που σαν τέτοιο συνεπάγεται την ανάλυση

ποιοτικών χαρακτηριστικών και δεδοµένων και το σχεδιασµό µιας αφηρηµένης δοµής

του µοντέλου. ∆ύο είναι τα κρίσιµα βήµατα στη διαδικασία αυτή. Το πρώτο βήµα αφορά

στην έκφραση του µοντέλου εµπειρογνωµοσύνης µε τρόπο κατανοητό από τους

έµπειρους του γνωστικού πεδίου. Το δεύτερο βήµα αφορά την αναπαράσταση σε

συµβολικό επίπεδο και υλοποίηση του µοντέλου µε χρήση τεχνικών της Τεχνητής

Νοηµοσύνης.

Για τη δόµηση της περιγραφικής γνώσης, της στρατηγικής γνώσης και των ευρετικών για

την αµεσότερη και αποδοτικότερη χρήση της γνώσης είναι αλληλένδετες συνιστώσες του

µοντέλου της εµπειρογνωµοσύνης που όµως ούτε ορατές είναι ούτε µπορούν να

εξαχθούν άµεσα. Έτσι απαιτείται µελέτη των διαλόγων που διεξάγονται ανάµεσα στον

έµπειρο και τον άπειρο χρήστη που χρειάζεται συµβουλή. Τα δείγµατα των διαλόγων

αυτών αποτελούν σηµαντικό στοιχείο των ποιοτικών δεδοµένων που πρέπει να

αναλυθούν. Μέθοδοι όπως οι ολοκληρωτικές διερευνήσεις εργασιών (total task

investigations) στόχο έχουν τη διερεύνηση της αναζήτησης πληροφοριών που οδηγεί σε

συµπεράσµατα και αποφάσεις, διαδικασία που είναι ακολουθιακού χαρακτήρα. Πιο

συγκεκριµένα στοχεύουν στην απόσπαση των δυο συνιστωσών του µοντέλου

εµπειρογνωµοσύνης, των στρατηγικών αναζήτησης και των δοµών µνήµης.

Στο ερώτηµα «Πως µοντελοποιείται η εµπειρογνωµοσύνη;» που αποτελεί το πλέον

προκλητικό και κεντρικό θέµα στην τεχνολογία των εµπείρων συστηµάτων η

µεθοδολογία CommonKADS προτείνει: (α) το διαχωρισµό των διαφόρων ειδών

γενικευµένης γνώσης σύµφωνα µε τους διαφορετικούς ρόλους που παίζει η γνώση στις

Page 58: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

58

διεργασίες συλλογισµού και (β) την οργάνωση των ειδών γνώσης σε διάφορα στρώµατα

και συγκεκριµένα (από το χαµηλότερο προς το υψηλότερο) στην περιγραφική γνώση, τη

γνώση των ειδών συλλογισµού, την γνώση στοιχειωδών εργασιών και τέλος τη

στρατηγική γνώση. Τα τέσσερα αυτά στρώµατα αλληλεπιδρούν χαλαρά µεταξύ τους και

συγκεκριµένα το στρώµα της περιγραφικής γνώσης εκφράζεται ανεξάρτητα από τους

πιθανούς τρόπους χρήσης του, το αµέσως επόµενο στρώµα της γνώσης των βασικών

συλλογισµών αναθέτει ρόλους στην περιγραφική γνώση ανάλογα µε την χρήση της στα

πλαίσια συγκεκριµένων συλλογισµών, το στρώµα της γνώσης των στοιχειωδών εργασιών

το οποίο ενεργοποιεί συγκεκριµένους µηχανισµούς βασικών συλλογισµών για την

επίτευξη συγκεκριµένων στόχων και τέλος το στρώµα της στρατηγικής γνώσης το οποίο

το οποίο επιλέγει και θέτει συγκεκριµένους στόχους για την επίλυση συγκεκριµένων

προβληµάτων και σε σχέση µε αυτά καταρτίζει σχέδια δράσης και ενεργοποιεί

µηχανισµούς ελέγχου των εργασιών που εµπλέκονται στα σχέδια δράσης.

Page 59: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

59

Βιβλιογραφία

∆ίνεται παρακάτω ενδεικτική βιβλιογραφία στην αγγλική και την Ελληνική γλώσσα.

Όπως θα διαπιστώσετε, εκτός των καθαρά επιστηµονικών βιβλίων και πανεπιστηµιακών

συγγραµµάτων σχετικά µε την Τεχνητή και Υπολογιστική Νοηµοσύνη και τα Έµπειρα

Συστήµατα και τις εφαρµογές τους, περιλαµβάνονται και βιβλία που αναφέρονται πιο

γενικά και πιο σφαιρικά στο θέµα της νόησης, της λειτουργίας του εγκεφάλου, των

φιλοσοφικών προεκτάσεων που αυτά συνεπάγονται, καθώς άλλα συναφή θέµατα. Με τις

κατάλληλες κάθε φορά λέξεις κλειδιά µπορεί να αναζητηθεί υλικό στο διαδίκτυο όπου

υπάρχει πλήθος παρουσιάσεων τόσο των γενικών όσο και των ειδικότερων θεµάτων,

αναφορών, λυµένων παραδειγµάτων και προβληµάτων προς επίλυση και εξάσκηση.

Βιβλιογραφία στα Αγγλικά

Asimov, Isaac. I, Robot. Gnome Press, 1950.

Bratko, Ivan. PROLOG – Programming in Artificial Intelligence. Addison-Wesley, 2001.

Flach, Peter. Simply Logical. . John Wiley & Sons, 1994.

Fogel, D. Evolutionary Computation: Toward a new Philosophy of Machine Intelligence.

IEEE Press, 1995.

Ginsberg, Matt. Essentials of Artificial Intelligence. Morgan Kaufmann Publishers, 1993.

Goldberg, David. Genetic Algorithms in Search, Optimization and Machine Learning. Addison

Wesley Publishing Company, Inc., 1989.

Haykin S. Neural Networks, A Comprehensive Foundation, 2nd

edition. Prentice Hall,

1999.

Holland, J.H. Adaptation in Natural and Artificial Systems. University of Michigan Press,

1975.

Jackson, Philip C. Jr. Introduction to Artificial Intelligence. Mason/Charter Publishers,

1974.

Koza, J.R. Genetic Programming I & II. MIT Press, 1992, 1994.

Lifschitz, Vladimir (ed). Formalizing Common Sense. Papers by John McCarthy.

Intellect Ltd., 1998.

Michalewicz, Z. Genetic Algorithms + Data Structures = Evolution Programs. Springer,

1999.

Michalewicz, Z., and Fogel D. How to Solve it: Modern Heuristics. Springer, 2000.

Page 60: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

60

Mitchell, Melanie. An Introduction to Genetic Algorithms. MIT Press, 1998.

Nilsson, Nils J. Principles of Artificial Intelligence. Tioga Publishing.

Nilsson, Nils J. Artificial Intelligence: A new synthesis. Morgan Kaufmann Publishers,

1998.

Nilsson, Ulf & Maluszynski, Jan. Logic, Programming and PROLOG. John Wiley &

Sons, 1995.

Poole, David, Mackworth Alan, and Goebel Randy. Computational Intelligence – a

logical approach. Oxford University Press, 1998.

Ramsay, Allan. Formal Methods in Artificial Intelligence. Cambridge University Press,

1988.

Russel, Stuart and Norvig Peter. Artificial Intelligence – A Modern Approach. Prentice

Hall, 1995.

Shapiro, Stuart C. Techniques of Artificial Intelligence. D. van Nostrand Company, 1979.

Slagle, James R. Artificial Intelligence: The Heuristic Program Approach. McGraw-Hill,

1971.

Spencer-Smith, Richard. LOGIC and PROLOG. Harvester Wheatsheaf, 1991.

Winston, Patrick H. Artificial Intelligence. Addison-Wesley, 1984.

Βιβλιογραφία στα Ελληνικά

Αργυράκης, Παναγιώτης. Νευρωνικά ∆ίκτυα και Εφαρµογές. Εκδόσεις Ελληνικού

Ανοικτού Πανεπιστήµιου, 2000.

Asimov, Isaac. Εγώ το Ροµπότ. Εκδόσεις Κάκτος, 1984.

Βλαχάβας, Ιωάννης, Κεφάλας Πέτρος, Βασιλειάδης Νικόλαος, Ρεφανίδης Ιωάννης,

Κόκκορας Φώτιος και Σακελλαρίου Ηλίας. Τεχνητή Νοηµοσύνη. Εκδόσεις

Γαρταγάνης, 2002.

Changeux, Jean-Pierre, και Connes, Alan. Τα Μαθηµατικά και ο εγκέφαλος. Εκδόσεις

Κάτοπτρο, 1995.

Cyrulnik, Boris. Η γέννηση του νοήµατος. Εκδόσεις Κάτοπτρο, 1995.

∆ουκίδης, Γεώργιος και Αγγελίδης, Μάριος. Έµπειρα Συστήµατα, Τεχνητή Νοηµοσύνη

και LISP. Εκδόσεις Ι. Σιδέρης, 1998.

Graham, Ian. Τεχνητή Νοηµοσύνη. Εκδόσεις Σαββάλας, 2004.

Haugeland, John. Τεχνητή Νοηµοσύνη. Εκδόσεις Κάτοπτρο, 1991.

Hofstadter, Douglas and Dennett, Daniel. Το Εγώ της Νόησης. Εκδόσεις Κάτοπτρο,

1993.

Page 61: ΣΥΝΟΨΗ ΤΟΜΟΥ Α PL31

61

Johnson, George. Τα παλάτια της µνήµης. Εκδόσεις Κάτοπτρο, 1993.

Κεραυνού, Ελπίδα. Τεχνητή Νοηµοσύνη και Έµπειρα Συστήµατα. Εκδόσεις Ελληνικού

Ανοικτού Πανεπιστήµιου, 2000.

Κεφαλής, Χρήστος. Σκάκι και κουλτούρα. Εκδόσεις Κέδρος, 2004.

Lakatos, Imre. Αποδείξεις και Ανασκευές. Εκδόσεις Τροχαλία, 1996.

Lazorthes, Guy. Εγκέφαλος και Πνεύµα. Εκδόσεις Γκοβόστης, 1991.

Λυκοθανάσης, Σπυρίδων. Γενετικοί Αλγόριθµοι και εφαρµογές. Εκδόσεις Ελληνικού

Ανοικτού Πανεπιστήµιου, 2000.

Maturana, Humberto, και Varela, Francisco. Το δένδρο της Γνώσης. Εκδόσεις Κάτοπτρο,

1992.

Μητακίδης, Γεώργιος. Από τη Λογική στο Λογικό Προγραµµατισµός και την Prolog.

Εκδόσεις Καρδαµίτσα, 1992.

Minsky, Marvin. Η Κοινωνία της Νόησης. Εκδόσεις Κάτοπτρο, 1995.

Penrose, Roger. Ο νέος αυτοκράτορας(;). Εκδόσεις Γκοβόστης.

Penrose, Roger. Σκιές του Νου. Εκδόσεις Γκοβόστης, 1997.

Penrose, Roger. Το µεγάλο, το µικρό και η ανθρώπινη νόηση. Εκδόσεις Κάτοπτρο, 1999.

Plotkin, Henry. Η Φύση της γνώσης. Εκδόσεις Κάτοπτρο, 1996.

Russel, Stuart και Norvig Peter. Τεχνητή Νοηµοσύνη – Μια Σύγχρονη Προσέγγιση.

Εκδόσεις Κλειδάριθµος, 2004.

Simon, Herbert. Οι Επιστήµες του Τεχνητού. Εκδόσεις Σύναλµα, 1999.

Young, John. Ο Εγκέφαλος και οι Φιλόσοφοι. Εκδόσεις Κάτοπτρο, 1991.