Κεφάλαιο 7 - NTUA

27
Κεφάλαιο 7 ΤΕΧΝΗΤΗ ΟΡΑΣΗ KAI BIOMHXANIKOΣ ΑΥΤΟΜΑΤΙΣΜΟΣ 7.0 Εισαγωγή Η λειτουργία των συστημάτων τεχνητής όρασης βασίστηκε στην ανθρώπινη λειτουργία απόκτησης,καταγραφήςκαι επεξεργασίας οπτικών εικόνων.Σήμερα, τα συστήματα τεχνητής όρασης εκτελούν ένα μεγάλο αριθμό πολύπλοκων βιομηχανικών εφαρμογών. Ενα τυπικό βιομηχανικό σύστημα τεχνητής όρασης που χρησιμοποιείται για την αυτοματοποίηση μίας συγκεκριμένης παραγωγικής διαδικασίας χαρακτηρίζεται από μία κάμερα που εποπτεύει μία μεταφορική ταινία, από ένα σύστημα φωτισμού και από έναν Η/Υ εφοδιασμένο με μία ειδική κάρτα επεξεργασίας εικόνων. Το σύστημα τεχνητής όρασης παρατηρεί τα αντικείμενα πάνω στην μεταφορική ταινία και προσδιορίζει κατά πόσο τηρούν τις προδιαγραφές ποιότητας. Στην συνέχεια ανάλογα με το αποτέλεσμα της επεξεργασίας, που λαμβάνει χώρα στην ειδική κάρτα ανάλυσης ψηφιακών εικόνων (Digital Signal/Image Processor), παράγεται από τον Η/Υ ένα σήμα αποδοχής ή απόρριψης. Τά "σωστά" προϊόντα προωθούνται στο επόμενο στάδιο της γραμμής παραγωγής, ενώ τα "σκάρτα" απορρίπτονται. Το Σχήμα 7-1 δείχνει ένα σύστημα τεχνητής όρασης που χρησιμοποιείται για ποιοτικό έλεγχο προϊόντων με παρόμοια διαδικασία με αυτήν που περιγράφηκε προηγουμένως. Στην συνέχεια θα προσπαθήσουμε να αξιολογήσουμε αυτά τα συστήματα, αλλά και θα παρουσιάσουμε το μεγάλο εύρος των πιθανών εφαρμογών τους. Σχήμα 7-1 Βιομηχανικό σύστημα τεχνητής όρασης 7.0.1 Ανθρώπινη όραση vs Τεχνητής όρασης Ένας ενδιαφέρον τρόπος να αξιολογηθεί η τεχνητή όραση (Machine Vision) αποτελεί η σύγκριση της με την ανθρώπινη όραση σε μία διαδικασία οπτικού ποιοτικού ελέγχου βάσει των κάτωθι κριτηρίων: Προσαρμοστικότητα ( Adaptability ) Λήψη απόφασης ( Decision making ) Ποιότητα αποτελεσμάτων ( Quality of measurements ) Ανάλυση 2D & 3D εικόνων ( Τwo and three dimensional capability ) Εξοικονόμιση χρημάτων ( Economical considerations )

Transcript of Κεφάλαιο 7 - NTUA

Page 1: Κεφάλαιο 7 - NTUA

Κεφάλαιο 7

ΤΕΧΝΗΤΗ ΟΡΑΣΗ KAI BIOMHXANIKOΣ ΑΥΤΟΜΑΤΙΣΜΟΣ

7.0 Εισαγωγή

Η λειτουργία των συστημάτων τεχνητής όρασης βασίστηκε στην ανθρώπινη λειτουργία απόκτησης,καταγραφήςκαι επεξεργασίας οπτικών εικόνων.Σήμερα, τα συστήματα τεχνητής όρασης εκτελούν ένα μεγάλο αριθμό πολύπλοκων βιομηχανικών εφαρμογών. Ενα τυπικό βιομηχανικό σύστημα τεχνητής όρασης που χρησιμοποιείται για την αυτοματοποίηση μίας συγκεκριμένης παραγωγικής διαδικασίας χαρακτηρίζεται από μία κάμερα που εποπτεύει μία μεταφορική ταινία, από ένα σύστημα φωτισμού και από έναν Η/Υ εφοδιασμένο με μία ειδική κάρτα επεξεργασίας εικόνων. Το σύστημα τεχνητής όρασης παρατηρεί τα αντικείμενα πάνω στην μεταφορική ταινία και προσδιορίζει κατά πόσο τηρούν τις προδιαγραφές ποιότητας. Στην συνέχεια ανάλογα με το αποτέλεσμα της επεξεργασίας, που λαμβάνει χώρα στην ειδική κάρτα ανάλυσης ψηφιακών εικόνων (Digital Signal/Image Processor), παράγεται από τον Η/Υ ένα σήμα αποδοχής ή απόρριψης. Τά "σωστά" προϊόντα προωθούνται στο επόμενο στάδιο της γραμμής παραγωγής, ενώ τα "σκάρτα" απορρίπτονται.

Το Σχήμα 7-1 δείχνει ένα σύστημα τεχνητής όρασης που χρησιμοποιείται για ποιοτικό έλεγχο προϊόντων με παρόμοια διαδικασία με αυτήν που περιγράφηκε προηγουμένως.

Στην συνέχεια θα προσπαθήσουμε να αξιολογήσουμε αυτά τα συστήματα, αλλά και θα παρουσιάσουμε το μεγάλο εύρος των πιθανών εφαρμογών τους.

Σχήμα 7-1 Βιομηχανικό σύστημα τεχνητής όρασης

7.0.1 Ανθρώπινη όραση vs Τεχνητής όρασης

Ένας ενδιαφέρον τρόπος να αξιολογηθεί η τεχνητή όραση (Machine Vision) αποτελεί η σύγκριση της με την ανθρώπινη όραση σε μία διαδικασία οπτικού ποιοτικού ελέγχου βάσει των κάτωθι κριτηρίων:

Προσαρμοστικότητα ( Adaptability )

Λήψη απόφασης ( Decision making )

Ποιότητα αποτελεσμάτων ( Quality of measurements )

Ανάλυση 2D & 3D εικόνων ( Τwo and three dimensional capability )

Εξοικονόμιση χρημάτων ( Economical considerations )

Page 2: Κεφάλαιο 7 - NTUA

Προσαρμοστικότητα

Πρόκειται για τη δυνατότητα του συστήματος να μεταβάλει αυτόματα τις παραμέτρους λειτουργίας του κάθε φορά που διαφοροποιείται το περιβάλλον του.

Ένα παράδειγμα προσαρμοστικότητας εμφανίζει η ανθρώπινη όραση σε συνθήκες “κακού” φωτισμού. Θα παρατηρήσει δύο και περισσότερες φορές το αντικείμενο πριν το αναγνωρίσει.

Αντίθετα, η λειτουργία της τεχνητής όρασης είναι “στερεότυπη”. Καθορίζεται δε από την κατασκευή του συστήματος (hardware) και από τα προγράμματα εφαρμογών (software). Eαν εμφανιστεί μία λειτουργική κατάσταση με σημαντική απόκλιση απο την αναμενόμενη το σύστημα τεχνητής όρασης θα την εξομοιώσει με τις υπόλοιπες. Θα προχωρήσει, δηλαδή, εφαρμόζοντας την ίδια τακτική με λανθασμένα βέβαια αποτελέσματα. Η μόνη λύση είναι να σταματήσει την λειτουργία του και να τροποποιηθεί ανάλογα με τις καινούργιες απαιτήσεις.

Λήψη απόφασης

Μία μηχανή εφοδιασμένη με σύστημα τεχνητής όρασης αποφασίζει σε “ κλάσματα δευτερολέπτου”. Αντίθετα, ο άνθρωπος θα χρειαστεί να σκεφτεί λίγη ώρα πρίν αποφασίσει.

Πάντως, στον παραπάνω κανόνα υπάρχει μία σημαντική εξαίρεση. Σε δύσκολα προβλήματα όπου απαιτείται η χρησιμοποίηση μνήμης οι ισορροπίες αλλάζουν. Η ανθρώπινη μνήμη είναι η πιο εξελιγμένη βάση δεδομένων που υπάρχει στον κόσμο, κυρίως λόγω του μεγέθους της και του χρόνου προσπέλασής της. Ο άνθρωπος θα αναγνωρίσει αμέσως πρόσωπα και αντικείμενα που έχει συναντήσει στο παρελθόν, ακόμα και εαν έχουν περάσει πολλά χρόνια. Αντίθετα, η μηχανή περιορίζεται από περιορισμένες μνήμες ταχείας πρόσβασης (RAM).

Ποιότητα αποτελεσμάτων

Ένα σύστημα παρατήρησης πρέπει να πληρεί δύο προϋποθέσεις:

Ακρίβεια

Αξιοπιστία.

Η ακρίβεια σχετίζεται με μία μέτρηση. Αποτελεί το μέτρο της προσέγγισης της μετρούμενης τιμής στην πραγματική. Αντίθετα, η αξιοπιστία σχετίζεται με πολλές μετρήσεις. Αποτελεί το μέτρο της “αντοχής” του συστήματος να μετράει σωστά μετά από αρκετή ώρα λειτουργίας.

Η καθημερινή εμπειρία δείχνει ότι οι ανθρώπινες παρατηρήσεις υπολείπονται και στην ακρίβεια και την αξιοπιστία των συστημάτων τεχνητής όρασης. Παραδείγματος χάριν όταν η δουλειά είναι μονότονη και καθιστική ένας άνθρωπος γρήγορα χάνει την αυτοσυγκέντρωση του. Το πρόβλημα αυτό είναι κυρίως ψυχολογικό. Τα συστήματα Τ.Ο δεν έχουν τέτοιου είδους προβλήματα.

Ανάλυση 2D και 3D εικόνων

Το ανθρώπινο σύστημα όρασης παρέχει και στερεοσκοπικές πληροφορίες. Για αυτό τον λόγο ο άνθρωπος μπορεί να κάνει σωστές εκτιμήσεις βάθους και πρόβλεψης πορείας. Πολύπλοκα προβλήματα όπως είναι το πιάσιμο ενός κινούμενου αντικειμένου αποτελούν καθημερινές δραστηριότητες με απόλυτη επιτυχία.

Τα συνήθη συστήματα τεχνητής όρασης αδυνατούν να κάνουν εκτιμήσεις των παραπάνω μεγεθών, τουλάχιστον με τον τυπικό εξοπλισμό (μονοδιάστατα).

Εξοικονόμιση χρημάτων

Η απάντηση σε αυτό το ερώτημα είναι ανάλογη με την απάντηση στο τελικό ερώτημα ποιό από τα δύο συστήματα όρασης υπερτερεί. Από τα παραπάνω προκύπτει ότι σε Βιομηχανικές εφαρμογές με απόλυτα ελεγχόμενο περιβάλλον λειτουργίας και απλά κριτήρια επιτυχίας και στα δυο ερωτήματα ο τεχνικός οπτικός ποιοτικός έλεγχος υπερτερεί. Για παράδειγμα σε μία γραμμή ελέγχου παραγωγής μαρμάρινων πλακιδίων το σύστημα τεχνητής όρασης θα προσφέρει και καλύτερο έλεγχο και χαμηλότερο κόστος λειτουργίας.

Page 3: Κεφάλαιο 7 - NTUA

7.0.2 Βιομηχανικά συστήματα τεχνητής όρασης

Η τεχνογνωσία, η σχετική με τη τεχνολογία τεχνητής όρασης, αναπτύχθηκε με αφορμή την προσπάθεια του ανθρώπου να επιτύχει την αναγνώριση μορφών (pattern recognition). Οι πρώτες εφαρμογές τεχνητής όρασης ήταν σχετικές με την ανάγνωση τυπογραφικών χαρακτήρων και αργότερα επεκτάθηκαν στον έλεγχο της βιομηχανικής παραγωγής. Η χρονολογική σειρά υλοποίησης αυτών των εφαρμογών καθορίστηκε από τις ιδιαιτερότητες, που χαρακτηρίζουν την κάθε εφαρμογή. Για παράδειγμα, κινούμενα αντικείμενα πάνω σε μεταφορική ταινία μπορούν να έχουν τοποθετηθεί με τυχαίο τρόπο σ΄αυτήν και έτσι η παρουσίασή τους στο πεδίο όρασης της κάμερας να γίνεται σε ποικιλόμορφες θέσεις και προσανατολισμούς, αντίθετα με τους τυπογραφικούς χαρακτήρες, που βρίσκονται σε προκαθορισμένες αποστάσεις μεταξύ τους και με συγκεκριμένο προσανατολισμό.

Ο καθορισμός παραμέτρων θέσεως και προσανατολισμού του ελεγχόμενου αντικειμένου αποτελεί μία επιθυμητή ικανότητα ενός συστήματος τεχνητής όρασης, που εφαρμόζεται στη βιομηχανία. Ετσι μπορούμε να εντοπίσουμε τα τυποποιημένα προϊόντα και να τα περιγράψουμε με το γεωμετρικό τους σχήμα και το μέγεθός τους. Κάθε παρέκλιση από αυτά τα οριακά χαρακτηριστικά μπορεί να θεωρηθεί σαν λάθος, που έγινε κατά τη διάρκεια παραγωγής του προϊόντος και έτσι να το απορρίψουμε.

ΠΙΝΑΚΑΣ 7-1: Παραδείγματα εφαρμογής ψηφιακής επεξεργασίας εικόνας σε διάφορους τομείς έρευνας.

ΠΕΡΙΟΧΗ

ΕΡΕΥΝΑΣ

ΑΝΤΙΚΕΙΜΕΝΟ

ΕΡΕΥΝΑΣ

ΤΡΟΠΟΣ

ΠΡΟΣΕΓΓΙΣΗΣ

ΑΝΤΙΚΕΙΜΕΝΟΥ

ΕΦΑΡΜΟΓΗ ΠΗΓΕΣ

ΔΕΔΟΜΕΝΩΝ

Ρομποτική 3-D

εξωτερικοί

χώροι

εσωτερικοί

χώροι

μηχανικά μέρη

Φωτισμός περιβάλ-

λοντος (ambient)

Ακτίνες-Χ

Δομημένος φωτι-

σμός (structured)

Aναγνώριση

Περιγραφή

αντικειμένων

του χώρου

Βιομηχανικές

εφαρμογές

Πρότυπα

αντικειμένων

Πρότυπα

μελέτης της

ανάκλασης του

φωτός από τα

αντικείμενα

Εναέριες

εικόνες

Μορφολογία

Τοπογραφία

Χαρτογράφηση

περιοχών

Φωτισμός περιβάλ-

λοντος

Υπέρυθρος φωτι-

σμός Radar

Ανάλυση

Βελτίωση

δεδομένων

εικόνων

Πρόγνωση

καιρού

Κατασκοπεία

Οδήγηση

πυραύλων

Χάρτες

Γεωμετρικά

πρότυπα

σχημάτων

Γνώση του

τρόπου παρου-

σίασης του

αντικειμένου

στην εικόνα

Αστρονο-

μία

Αστρα

Πλανήτες

Φωτισμός

περιβάλλοντος

Χημική

σύνθεση

Βελτίωση

Γεωμετρικά

πρότυπα

σχημάτων

Ενα πιο πολύπλοκο πρόβλημα αναγνώρισης είναι η πιθανότητα ύπαρξης περισσοτέρων από ένα αντικειμένων σε μία εξεταζόμενη εικόνα. Πρόκειται για το πρόβλημα διακριτοποίησης αντικειμένων (object segmentation), που καλείται να αντιμετωπίσει το σύστημα τεχνητής όρασης.

Page 4: Κεφάλαιο 7 - NTUA

Αλλα σημαντικά προβλήματα, που καλούμαστε να λύσουμε σε ένα πρόβλημα ανάλυσης εικόνας, είναι η ανάλυση της υφής μίας επιφανείας (texture analysis), ο εντοπισμός του προσανατολισμού της (surface orientation estimation), ο τρόπος αναπαράστασης αντικειμένων σε δύο και τρείς διαστάσεις, αλλά και ο κατάλληλος συνδιασμός παραγόντων, όπως: φωτισμός, επιλογή και τοποθέτηση αισθητήρων, ανάλυση εικόνας (spatial, brightness resolution). Αυτοί οι παράγοντες καθορίζουν την ποιότητα των δεδομένων, που εισάγονται στο σύστημα ανάλυσης εικόνας και διαφοροποιούνται από πρόβλημα σε πρόβλημα.

Οι περιοχές της έρευνας στις οποίες έχουν εφαρμοστεί τεχνικές ανάλυσης εικόνας είναι πολυάριθμες (ρομποτική, ιατρική, βιολογία, αστρονομία, αεροφωτογραφία κ.α.). Στον Πίνακα 7-1 παρουσιάζονται μερικά παραδείγματα των μεθόδων, που χρησιμοποιούμε στην εφαρμογή τεχνικών επεξεργασίας εικόνας σε διάφορες περιοχές έρευνας.

ΠΙΝΑΚΑΣ 7-1 (συνέχεια) : Παραδείγματα εφαρμογής ψηφιακής επεξεργασίας εικόνας σε διάφορους τομείς έρευνας.

ΠΕΡΙΟΧΗ

ΕΡΕΥΝΑΣ

ΑΝΤΙΚΕΙΜΕΝΟ

ΕΡΕΥΝΑΣ

ΤΡΟΠΟΣ

ΠΡΟΣΕΓΓΙΣΗΣ

ΑΝΤΙΚΕΙΜΕΝΟΥ

ΕΦΑΡΜΟΓΗ ΠΗΓΕΣ

ΔΕΔΟΜΕΝΩΝ

Ιατρική

Μακρο-

Μικρο-

Ανθρώπινα

όργανα

Αλυσίδες

πρωτεινών

Χρωματοσώματα

Ακτίνες-Χ

Υπέρηχοι

Ισότοπα

Υπέρυθρη

Υπεριώδης

ακτινοβολία

Ηλεκτρονικό

μικροσκόπιο

Φωτισμός

περιβάλλοντος

Διάγνωση

ανωμαλιών

Χειρουργικές

επεμβάσεις

Παθολογία

Ανατομικά

πρότυπα

Γνώση του

τρόπου

παρουσίασης

του αντικειμένου

Προτυπα

σχημάτων

Χημεία Μόρια Ηλεκτρονικό

μικροσκόπιο

Ανάλυση

σύνθεσης

μορίων

Χημικά

πρότυπα

Πρότυπα

δόμησης

μορίων

Νευρο-

ανατομία

Νευρώνες Φωτισμός περιβάλ-

λοντος

Ηλεκτρονικό

μικροσκόπιο

Καθορισμός

της θέσης των

νευρώνων

Πρότυπα

δόμησης

νευρώνων

7.1 Απόκτηση / Καταγραφή εικόνας

Απόκτηση / Καταγραφή εικόνας, είναι η διαδικασία μετατροπής της οπτικής εικόνας ενός φυσικού αντικειμένου και των εσωτερικών του χαρακτηριστικών σε ένα σύνολο ψηφιακών δεδομένων , τα οποία στην συνέχεια αναλύονται από την μονάδα επεξεργασίας του συστήματος όρασης. Η διαδικασία αυτή πραγματοποιείται σε τέσσερεις φάσεις :

Page 5: Κεφάλαιο 7 - NTUA

1. Φωτισμός

2. Σχηματισμός εικόνας και εστίαση

3. Ανίχνευση εικόνας

4. Διαμόρφωση (formatting) σήματος εξόδου

Σχήμα 7-2 Φάσμα ηλεκτρομαγνητικής ακτινοβολίας

Page 6: Κεφάλαιο 7 - NTUA

7.1.1 Μέθοδοι φωτισμού

Ο φωτισμός μίας σκηνής (scene) ή ενός αντικειμένου είναι αδιαμφισβήτητα μιά παράμετρος κλειδί για την μετέπειτα συμπεριφορά ενός συστήματος όρασης. Σε πολλές περιπτώσεις η προσπάθεια επίτευξης κατάλληλων φωτιστικών συνθηκών, απαιτεί το 30% του χρόνου που απαιτείται για την ολοκλήρωση μιάς εφαρμογής. Ο σχεδιασμός ενός συστήματος φωτισμού εξαρτάται αποκλειστικά από τις απαιτήσεις τις εκάστοτε εφαρμογής. Στο παρελθόν, τα περισσότερα συστήματα τεχνητής όρασης χρησιμοποιούσαν το ορατό φάσμα της ηλεκτρομαγνητικής ακτινοβολίας εξ΄αιτίας και του γεγονότος, ότι οι δυνατότητες των αισθητήρων όρασης (Vidicon, CCD) περιορίζονταν μόνο σε αυτό. Σήμερα, που η εξέλιξη των αισθητήρων CCD έχει διευρύνει το πεδίο λειτουργίας τους και στη μή- ορατή περιοχή του ηλεκτρομανητικού φάσματος (υπέρυθρες κάμερες, κάμερες ακτίνων - Χ κλπ), επιτρέπει την χρήση συστημάτων φωτισμού που χρησιμοποιούν πηγές όπως: ακτίνων Χ, υπεριώδους ακτινοβολίας υπέρυθρης ακτινοβολίας κ.ο.κ. (Σχήμα 7.2).

Οι εφαρμοζόμενες μέθοδοι τεχνητού φωτισμού μπορούν να ταξινομηθούν σε τέσσερεις κατηγορίες:

1. Φωτισμός μπροστά από το αντικείμενο (Front lighting)

2. Φωτισμός πίσω από το αντικείμενο (back lighting)

3. Στροβοσκοπικός φωτισμός (strobe lighting)

4. Δομημένος φωτισμός (structured lighting).

Iδιαίτερη προσοχή κατά το σχεδιασμό ενός συστήματος φωτισμού, πρέπει να δοθεί στην επίδραση του περιβάλλοντος φωτισμού (ambient light). Ο περιβάλλον φωτισμός επηρεάζει όλους τους προαναφερθέντες τρόπους φωτισμού λόγω του γεγονότος ότι τροποποιεί το επίπεδο φωτισμού στο αντικείμενο, κάτι που έχει ως αποτέλεσμα να εμφανίζεται θόρυβος στα δεδομένα (data) της εικόνας (image). Επίσης η διάρκεια απόδοσης των πηγών φωτισμού, επηρρεάζει και αυτή με τη σειρά της την αποτελεσματικότητα ενός αυτοματοποιημένου συστήματος μηχανικής όρασης σε συνθήκες παραγωγής. Π.χ. στις λάμπες φθορισμού μειώνεται κατά 15% η απόδοσή τους τις πρώτες 100 ώρες λειτουργίας, και στη συνέχεια με χαμηλότερο ρυθμό από ημέρα σε ημέρα.

Ενα ικανοποιητικό επίπεδο φωτισμού μπορεί εύκολα να καθορισθεί, από το βαθμό κορεσμού (light saturation) του φωτισμού. Το μέγεθος αυτό του παράγοντα μπορεί να επιφέρει σημαντική απώλεια πληροφοριών σε μία εικόνα, και είναι δυνατόν να ελεγχθεί είτε μέσω του monitor είτε μέσω μία μονάδας παλμογράφου. Στο Σχήμα 7.3 παρουσιάζονται οι πιθανές φωτιστικές συνθήκες ενός αντικειμένου.

Φωτισμός μπροστά από το αντικείμενο.

Στην περίπτωση αυτή η φωτιστική πήγή και η κάμερα βρίσκονται στην ίδια πλευρά του αντικειμένου (Σχήμα 7.4). Με αυτήν τη μέθοδο μπορούμε να πάρουμε πληροφορίες σχετικά με την υφή της επιφανείας (surface texture) ενός αντικειμένου, καθώς επίσης και για άλλα χαρακτηριστικά του όπως λ.χ. τις διαστάσεις του.

Φωτισμός πίσω από το αντικείμενο.

Σε αυτήν την περίπτωση το αντικείμενο τοποθετείται ανάμεσα στη φωτεινή πηγή και την κάμερα (Σχήμα 7.5). Με την κάμερα εποπτεύουμε το αντικείμενο στη σκιασμένη του κατάσταση, σαν μία σκοτεινή φιγούρα. Συνήθως, για καλύτερα αποτελέσματα τοποθετούμε ένα γυαλί διάχυσης ανάμεσα στη φωτεινή πηγή και το αντικείμενο.

Το πλεονέκτημα της μεθόδου είναι η παραγωγή εικόνων με έντονη αντίθεση (contrast). Η εικόνα που δημιουργείται μέσω αυτής της μεθόδου είναι κυρίως μονοχρωματική, διότι καταγράφεται η σιλουέττα ή η σκιαγραφία (περίγραμμα) του αντικειμένου. Ενα μειονέκτημα της μεθόδου είναι ότι στην περίπτωση που οι ακμές του αντικειμένου δεν ταυτίζονται με τα όρια των pixel του αισθητήρα, τα pixel του ορίου του αντικειμένου παίρνουν τιμές μεταξύ του ελάχιστου και του μέγιστου επιπέδου του γκρί του συστήματος όρασης.

Για παράδειγμα, όπως φαίνεται στο Σχήμα 7.6, η τιμή ενός pixel στο όριο του αντικειμένου που καλύπτεται κατά 50% θα είναι 7 σε ένα σύστημα όρασης με 16 επίπεδα του γκρί.

Page 7: Κεφάλαιο 7 - NTUA

Σχήμα 7.3 Πιθανές φωτιστικές συνθήκες ενός αντικειμένου

Σχήμα 7.4 Φωτισμός μπροστά από το αντικείμενο.

Η φωτιστική πηγή και η κάμερα βρίσκονται στην

ίδια πλευρά του αντικειμένου.

Page 8: Κεφάλαιο 7 - NTUA

Σχήμα 7.5 Φωτισμός πίσωαπό το αντικείμενο.

Το αντικείμενο τοποθετείται ανάμεσα στην

φωτιστική πηγή και την κάμερα.

(α) (β)

Σχήμα 7.6 Φωτισμός πίσω από το αντικείμενο

(α) αντικείμενο

(β) πίνακας εισόδου

Στροβοσκοπικός φωτισμός.

Σε αυτή την περίπτωση το αντικείμενο φωτίζεται με φώς σύντομων παλμών (διάρκειας 5 μs έως 500 μs), υψηλής φωτιστικής ισχύος (lux). Η μέθοδος αυτή χρησιμοποιείται κυρίως για "πάγωμα" της κίνησης ενός αντικειμένου κατά τη διάρκεια απόκτησης (acquisition) μιάς εικόνας αλλά και για την μείωση της επίδρασης του περιβάλλοντος φωτισμού (ambient light). Για τον λόγο αυτό, η φωτιστική ισχύς (lux) του παλμού πρέπει να είναι τουλάχιστον δέκα φορές μεγαλύτερη της ισχύος του περιβάλλοντος φωτισμού.

Η σύντομη διάρκεια του παλμού απαιτεί τον κατάλληλο συγχρονισμό της στροβοσκοπικής πηγής φωτισμού και της κάμερας. Η διάρκεια του παλμού έχει μεγάλη σημασία, εξ αιτίας του γεγονότος ότι το αντικείμενο που μεταφέρεται πάνω σε μία μεταφορική ταινία, ουσιαστικά θα παρουσιάζεται ως στατικό κατά την διάρκεια του παλμού.

Παράδειγμα:

Page 9: Κεφάλαιο 7 - NTUA

Ενα αντικείμενο μήκους 10 cm κινείται με ταχύτητα 10 cm/sec μέσω μίας μεταφορικής ταινίας. Ο αισθητήρας της κάμερας έχει ανάλυση 100x100 pixels. Γνωρίζοντας ότι οι κάμερες τύπου RS-170 παράγουν 30 frames/sec (συχνότητα = 30Hz), το χρονικό διάστημα που μεσολαβεί μεταξύ δύο διαδοχικών πλαισίων (frames) θα είναι 1/30Hz = 0.033 sec.

Αρα η εικόνα (image) θα έχει μιά μετάθεση 10 cm/sec x 0.033 sec = 0.33 cm ή 3.3 pixels στο διάστημα μεταξύ δύο διαδοχικών πλαισίων (frames).

Εάν ο παλμός φωτισμού (strobe pulse) , έχει διάρκεια 5 μs, τότε το αντικείμενο θα διανύσει μία απόσταση 50 μcm ή 0.0005 pixels κατά τη διάρκεια του παλμού. Είναι λοιπόν εύκολα αντιληπτό ότι το αντικείμενο κατά τη διάρκεια του παλμού εμφανίζεται ως ακίνητο (stationary).

Δομημένος φωτισμός.

Κατά την εφαρμογή δομημένου φωτισμού σε ένα αντικείμενο, υπερθέτουμε μία ελεγχόμενη προβαλλόμενη μορφή (pattern) στο εξεταζόμενο αντικείμενο. Ο έλεγχος των παραμορφώσεων της μορφής (pattern) μπορεί να μας οδηγήσει στον ικανοποιητικό εντοπισμό των γεωμετρικών χαρακτηριστικών του αντικειμένου. Στο Σχήμα 7.6 παρουσιάζεται το παράδειγμα προσδιορισμού του ύψους ενός αντικειμένου χρησιμοποιώντας δομημένο σύστημα φωτισμού. Η προβαλλόμενη γεωμετρική μορφή (pattern), σε αυτή την περίπτωση, είναι μια γραμμή φωτός πάνω στο αντικείμενο.

Σχήμα 1.2-6 Δομημένος φωτισμός

7.1.2 Σχηματισμός εικόνας και εστίαση

Το είδωλο ενός αντικειμένου εστιάζεται πάνω στον αισθητήρα όρασης της κάμερας (CCD, επιφάνεια πρόσπτωσης καθοδικού σωλήνα κ.α.) μέσω ενός φακού, με τρόπο παρόμοιο αυτού της φωτογραφικής μηχανής. Η διαφορά μεταξύ μιάς φωτογραφικής κάμερας και ενός συστήματος μηχανικής όρασης έγκειται στο γεγονός ότι η φωτογραφική μηχανή χρησιμοποιεί φίλμ αντίθετα με το σύστημα μηχανικής όρασης που χρησιμοποιεί έναν αισθητήτα όρασης. Ο αισθητήρας αυτός μετατρέπει το οπτικό σήμα

(visual image) σε ηλεκτρικό σήμα.

Page 10: Κεφάλαιο 7 - NTUA

Η κάμερα μηχανικής όρασης συνήθως επιλέγεται ανεξάρτητα από το σύστημα όρασης, καθώς οι χαρακτηριστικές ιδιότητες που καθορίζουν την απόδοσή της, εξαρτώνται από τις απαιτήσεις της εκάστοτε εφαρμογής. Επιπροσθέτως, οι παραμετρικές ιδιότητες του φακού (lens) πρέπει να έχουν καθορισθεί με ακρίβεια διότι είναι το στοιχείο το οποίο προσαρμόζει την κάμερα στις ανάγκες μιάς συγκεκριμένης εφαρμογής. Οι βασικές παράμετροι του οπτικού φακού ενός συστήματος όρασης είναι:

1. Μεγέθυνση

2. Εστιακή Απόσταση

3. Βάθος Πεδίου

4. Δακτύλιοι προσάρτησης φακού

Στη συνέχεια θα αναπτύξουμε εν συντομία τις βασικές αρχές της οπτικής που χρησιμοποιούνται στις βιομηχανικές εφαρμογές συστημάτων τεχνητής όρασης.

Το Σχήμα 7.8 παρουσιάζει τους διαφορετικούς τύπους φακών που χρησιμοποιούνται στις βιομηχανικές εφαρμογές τεχνητής όρασης.

Σχήμα 7.8 Τύποι φακών

Οταν μία φωτεινή ακτίνα περνάει κάθετα μέσα από ένα κομμάτι γυαλί με μή παράλληλες πλευρές, αλλάζει κατεύθυνση. Ενας συγκλίνων φακός στην ουσία, ενεργεί ως μία σειρά από πρίσματα. Οι φωτεινές ακτίνες καμπυλώνονται περισσότερο στις άκρες και λιγότερο στο κέντρο, όπου οι πλευρές είναι σχεδόν παράλληλες. Με αυτόν τον τρόπο, μία ομάδα φωτεινών ακτίνων που αντανακλάται από ένα σημείο ενός αντικειμένου, συγκεντρώνεται σ΄ένα εστιακό σημείο.

Το φώς από υψηλότερα ή χαμηλότερα τμήματα του αντικειμένου, εστιάζεται κάτω ή πάνω από αυτό το σημείο και δημιουργείται ένα ευκρινές, ανάποδο είδωλο το οποίο προβάλλεται πάνω στον αισθητήρα της κάμερας.

Ενας φακός απόκλισης (αμφίκοιλος ή αρνητικός φακός) διασκορπίζει τις φωτινές ακτίνες και δεν μπορεί να σχηματίσει είδωλο πάνω στον αισθητήρα εστίασης της κάμερας. Οταν όμως το μάτι βλέπει

Page 11: Κεφάλαιο 7 - NTUA

το αντικείμενο μέσω ενός τέτοιου φακού, γίνεται ορατό ένα μικροσκοπικό όρθιο είδωλο. Αυτού του είδους οι φακοί χρησιμοποιούνται κυρίως σε φωτογραφικές μηχανές "απευθεία σκόπευσης". Οι φωτογραφικές μηχανές αυτές αποτελούνται από δύο φακούς, όπου η μεν σκηνή (scene) βλέπεται από τον επάνω φακό, ενώ η φωτογραφία τραβιέται από τον κάτω φακό. Τέλος, ο σύνθετος φακός είναι ένα σύστημα φακών που αποτελείται από δύο ή περισσότερα στοιχεία. Παρόλο που οι σχεδιάσεις των σύνθετων φακών μπορούν να είναι πιό πολύπλοκες απ΄ότι φαίνεται από τον ορισμό, επιτρέπουν στο σχεδιαστή να κάνει μεγαλύτερα τα μέγιστα διαφράγραμα, να βελτιώνει τη διαχωριστική ικανότητα (λεπτομέρεια) και να ελαττώνει τις παραμορφώσεις.

Μεγέθυνση (magnification)

Μεγέθυνση (m) είναι το μέγεθος της εικόνας σε σχέση με το μέγεθος του αντικειμένου που αναπαράγεται. Είναι μία έκφραση του λόγου της απόστασης φακού - ειδώλου προς την απόσταση φακού - αντικειμένου:

mD

D

H

Hi

o

i

o

Επίσης μεγέθυνση (m) αναφέρεται και ως ο λόγος του μεγέθους του ειδώλου Hi (image plane) δια του

μεγέθους της εικόνας Ηo (object plane), όπως φαίνεται στο Σχήμα 7.9.

Οταν η απόσταση του αντικειμένου είναι ίση με την απόσταση του ειδώλου τότε η μεγέθυνση είναι ίση με 1.

Τα χαρακτηριστικά μεγέθυνσης ενός συστήματος εξαρτώνται από το μέγιστο μέγεθος Ηο ή από την

μέγιστη απόσταση Do. Η τιμή μεγέθυνσης (m) θα είναι μικρότερη από 1 στις περισσότερες

περιπτώσεις βιομηχανικών εφαρμογών, επειδή οι διαστάσεις του αισθητήρα είναι μικρότερες από αυτές του προς εξέταση αντικειμένου. Η τιμή m θα είναι μεγαλύτερη της μονάδος στις περιπτώσεις μικροσκοπικών εφαρμογών.

Παράδειγμα

Ο αισθητήρας CCD ενός συστήματος τεχνητής όρασης έχει ανάλυση 100 x 100 pixels και διαστάσεις 0.15 x 0.15 ίντσες. Να προσδιορισθούν.

α) η μεγέθυνση (m) του συστήματος όρασης

β) το μέγεθος του pixel στον αισθητήρα CCD (image pixel size)

γ) το μέγεθος του pixel στο αντικείμενο (οbject pixel size)

αν το αντικείμενο που εξετάζεται έχει διαστάσεις 3 x 3 ίντσες.

Λύση

Μεγέθυνση: Η μεγέθυνση ορίζεται ως ο λόγος του μεγέθους του ειδώλου δια του μεγέθους του αντικειμένου

mH

Hi

o

0 15

30005

.

..

Image Pixel Size: Το μέγεθος του pixel στον αισθητήρα είναι ίσο με την απόσταση μεταξύ των στοιχείων του αισθητήρα. Προσδιορίζεται δε ως ο λόγος της διάστασης του αισθητήρα δια του αριθμού των στοιχείων στην ίδια διεύθυνση.

Im. "

. "age Pixel size

015

1000 0015

Object Pixel Size: Το μέγεθος του pixel στο αντικείμενο προσδιορίζεται από τη μεγέθυνση του συστήματος.

Object Pixel size HH

moi

0 0015

0 050 03

. "

.. "

Page 12: Κεφάλαιο 7 - NTUA

Σχήμα 7.9 Μεγέθυνση

Εστακή Απόσταση

Οπως αναφέρθηκε προηγουμένως, όλες οι παράλληλες φωτεινές ακτίνες που περνούν μέσα από ένα φακό θα συγκλίνουν σε ένα σημείο, που ονομάζεται σημείο εστίασης (focal point) όπως φαίνεται στο Σχήμα 7.9.Oι φωτεινές ακτίνες από το αντικείμενο θα συνεχίσουν σε ευθείες γραμμές περνώντας από το σημείο εστίασης και θα δημιουργήσουν το ανάστροφο είδωλο του αντικειμένου στο επίπεδο ειδώλου. Το μέγεθος του ειδώλου θα αυξάνει όσο αυξάνει και η απόσταση από τον φακό. Το επίπεδο ειδώλου ( αισθητήρας όρασης ) του συστήματος όρασης είναι τοποθετημένο σε σταθερή απόσταση στην περιοχή του οπτικού συστήματος της κάμερας . H θέση του αισθητήρα όρασης είναι σταθερή και καθορίζεται από τον κατασκευαστή της κάμερας.

Η θέση του σημείου εστίασης (focal point) δίδεται από τη σχέση:

1 1 1

1 2F r r

Επίσης η εστιακή απόσταση (F) δίδεται από τη σχέση:

FD

mo

1 1/

όπου Do η απόσταση φακού - αντικειμένου και m η μεγέθυνση του συστήματος.

Ο προσδιορισμός μιας συγκεκριμένης εστιακής απόστασης ενός φακού καθορίζει την απόσταση μεταξύ της κάμερας και του αντικειμένου για μια συγκεκριμένη μεγέθυνση του φακού.

Φακοί μικρότερης εστιακής απόστασης (ευρυγώνιοι) και φακοί μεγαλύτερης εστιακής απόστασης (τηλεφακοί), συχνά μπορούν να αντικαταστήσουν τον κανονικό φακό του συστήματος.

Οι ευρυγώνιοι φακοί προσφέρουν τη δυνατότητα για μία ευρύτερη γωνία όρασης και κοντύτερη εστίαση απ΄ότι ο κανονικός φακός, ενώ οι τηλεφακοί δίνουν μία μικρότερη γωνία και πιό μακρινή εστίαση.

Παράδειγμα: Προσδιορίστε την εστιακή απόσταση του φακού ενός συστήματος όρασης με μεγέθυνση ίση με 0.05 και απόσταση μεταξύ του αντικειμένου και της κάμερας ίση με 30 ίντσες

Λύση

Page 13: Κεφάλαιο 7 - NTUA

FD

mo

1 1

30

1 1 0 051428

/

"

/ .. "

Αυτό σημαίνει ότι διδιάστατες εικόνες σε απόσταση 30 ιντσών από το φακό, θα είναι τέλεια εστιασμένες στο επίπεδο ειδώλου ή επίπεδο αισθητήρα CCD (Image plane), με την προϋπόθεση ότι ο φακός απέχει από τον αισθητήρα 1.428"και δεν παρουσιάζει διαταραχές. Ομως, οι περισσότερες βιομηχανικές εφαρμογές ασχολούνται με αντικείμενα τριών διαστάσεων.

Η επίδραση που θα έχει ένα σημείο ενός αντικειμένου που μας ενδιαφέρει, και που δεν θα βρίσκεται πάνω στο επίπεδο της πραγματικής εικόνας ή στο επίπεδο του αντικειμένου (object plane) θα είναι να θαμβώσει το είδωλο του αντικειμένου. Η μόνη περίπτωση να μη συμβεί κάτι τέτοιο, είναι το σημείο που μας ενδιαφέρει και ευρίσκεται εκτός επιπέδου αντικειμένου να είναι μέσα στην περιοχή που ονομάζεται "βάθος πεδίου" (depth of field) του οπτικού μας συστήματος.

Σχήμα 7.10 συγκλίνων φακός

Βάθος πεδίου (depth of field)

Είναι ο χώρος πάνω και κάτω από το επίπεδο του αντικειμένου (object plane) όπου ο φακός διατηρεί την εστίαση του ειδώλου μέσα σε αποδεκτά όρια.

Κάθε σημείο ενός τρισδιάστατου αντικειμένου τοποθετημένου σε μία επιφάνεια επιθεώρησης (work surface) πρέπει να ανήκει στην ζώνη βάθους πεδίου της κάμερας, όπως δείχνει το σχήμα 7.11. Η απόσταση Do λαμβάνεται από το κέντρο της ζώνης βάθους πεδίου μέχρι το κέντρο του φακού της

κάμερας.

Στη φωτογραφία, το βάθος πεδίου αναφέρεται στα κοντινότερα και μακρύτερα από το αντικείμενο μέρη που μπορούν να καταγραφούν καθαρά με μία ρύθμιση εστίασης. Το βάθος πεδίου επεκτείνεται περισσότερο προς το πίσω μέρος του αντικειμένου απ΄ότι μπροστά (σε αναλογίες 1/3 μπροστά και 2/3 προς τα πίσω, περίπου).

Το βάθος πεδίου ενός συστήματος όρασης είναι συνάρτηση του αριθμού διαφράγματος (f-stop), της μεγέθυνσης, και του μεγέθους των pixel του αισθητήρα.

Το βάθος πεδίου μεγαλώνει καθώς το διάγραγμα μικραίνει, αλλά συγχρόνως η μεταφερόμενη ποσότητα φωτός μειώνεται.

Ενας αριθμός διαφράγματος 16 (f-stop 16) αντιστοιχεί στο μικρότερο άνοιγμα του διαφράγματος της κάμερας. Το μέγεθος του ανοίγματος αυξάνει καθώς το f-stop ελλατώνεται. Οσο μικραίνει ο αριθμός διαφράγματος διαδοχικά, αυξάνεται η ποσότητα φωτός κατά ένα παράγοντα ίσο με 2. Τα τυποποιημένα F-stops είναι 16, 11, 8, 5.6, 4, 2.8, 2, 1.5.

Page 14: Κεφάλαιο 7 - NTUA

Σχήμα 7.11 Βάθος πεδίου

Οι δύο βασικές επιδράσεις του αριθμού διαφράγματος σε ένα σύστημα όρασης είναι:

Μικρότερο άνοιγμα φακού έχει ως αποτέλεσμα

1. μεγαλύτερο το βάθος πεδίου

2. μικρότερη η ποσότητα του φωτός που φθάνει στον αισθητήρα.

Ενας μεγάλος αριθμός f-stop μας επιτρέπει να αυξήσουμε το ύψος του πεδίου εργασίας, με την προϋπόθεση ότι πρέπει να αυξήσουμε, συγχρόνως και τον χρόνο έκθεσης του αισθητήρα στο περιβάλλοντα φωτισμό. Μακρύτερη έκθεση δεν δημιουργεί κάποιο σοβαρό πρόβλημα σε ακίνητες εικόνες, αλλά σαφώς επιρεάζει την ικανότητα αξιόπιστων μετρήσεων κάτω από δυναμικές συνθήκες (αντικείμενα πάνω σε κινούμενη μεταφορική ταινία).

Επίσης, όσο μικραίνει το μέγεθος του pixel στον αισθητήρα όρασης (CCD) της κάμερας, τόσο μικραίνει και το βάθος πεδίου του συστήματος.

Η σχέση που διέπει τις παραμέτρους της κάμερας και το βάθος πεδίου είναι:

2 1

2

af m

m

( )

( )

όπου α είναι το μέγεθος του pixel, f είναι ο αριθμός διαφράγματος (f-stop του φακού), και m είναι ο παράγοντας μεγέθυνσης.

Στον ίδιο αριθμό f-stop (άνοιγμα διαφράγματος), ο ευρυγώνιος φακός δίνει περισσότερο βάθος πεδίου, ενώ ο τηλεφακός λιγότερο βάθος πεδίου απ΄ότι ο κανονικός φακός.

Συνοψίζοντας, η σχέση μεταξύ εστιακής απόστασης και γωνίας όρασης, η σχέση μεταξύ διαφράγματος και βάθους πεδίου, και η σχέση της εστιακής απόστασης και του βάθους πεδίου φαίνονται στο σχήμα 7.12 (α), (β) και (γ) αντίστοιχα.

Καταλήγοντας θα πρέπει να αναφερθεί, ότι ο πιό κοινός τύπος δακτυλίου προσάρτησης φακού στα συστήματα μηχανικής όρασης είναι ο τύπος C-mount. Η απόσταση μεταξύ της φλάντζας του δακτυλίου C-mount και του επιπέδου ειδώλου (image plane) είναι 17.5 mm. Η διάμετρος της μέγιστης επιφάνειας είναι κατάλληλη ώστε αισθητήρες CCD 1/2 (0.512 της ίντσας) μπορούν να χρησιμοποιηθούν. Σήμερα οι περισσότερες κάμερες του εμπορίου χρησιμοποιούν αισθητήρες CCD μεγέθους 1/3 της ίντσας (οριζόντια διάσταση).

Page 15: Κεφάλαιο 7 - NTUA

Παράδειγμα: Προσδιορίστε το βάθος πεδίου ενός συστήματος τεχνητής όρασης, που έχει αισθητήρα CCD διαστάσεων 0.30 x 0.30 ιντσών και ανάλυση 200 x 200 pixels, F-stop 16 και μεγέθυνση ίση με 0.05.

Λύση: Το μέγεθος του pixel στον αισθητήρα είναι

pixel size

x x x

0 30

2000 0015

2 0 0015 16 1 0 05

0 0520162

.. "

. ( . )

( . ). "

Εάν το ύψος του αντικειμένου είναι το μισό του βάθους πεδίου, η απόσταση μεταξύ του φακού και της επιφάνειας εργασίας (work surface) μπορεί να χρησιμοποιηθεί για τον προσδιορισμό της εστιακής απόστασης του φακού. Στις εφαρμογές όπου ο παράγοντας μεγέθυνσης είναι μεγαλύτερος του 1, το βάθος πεδίου είναι σχετικά μικρό.

(α)

(β)

Page 16: Κεφάλαιο 7 - NTUA

(γ)

Σχήμα 7.12 Σχ έσεις μεταξύ: (α) εστιακής απόστασης και γωνίας όρασης

(β) διαφράγματος και βάθους πεδίου

(γ) εστιακής απόστασης και βάθους πεδίου

7.1.3 Απόκτηση/καταγραφή εικόνας

Στα περισσότερα συστήματα επεξεργασίας η απόκτηση/καταγραφή (detection) της εικόνας επιτυγχάνεται μέσω μιάς κάμερας video.

Υπάρχουν δύο βασικοί τύποι κάμερας που μπορούν να χρησιμοποιηθούν σε συστήματα τεχνητής όρασης:

(α) κάμερες τύπου καθοδικού σωλήνα (tube type ή vidicons)

(β) κάμερες τύπου στερεάς κατάστασης (solid state).

Vidicons

H κάμερα τύπου vidicon χρησιμοποιείται συχνά σε συστήματα τεχνητής όρασης, καθώς επίσης και για τη δημιουργία σημάτων τηλεόρασης. Η αρχή λειτουργίας της στηρίζεται στη μετατροπή του φωτός σε ηλεκτρομαγνητικά κύματα και τελικά σε ηλεκτρικό ρεύμα με τη βοήθεια του καθοδικού σωλήνα (Σχήμα 7.13). Πίσω από το φακό μίας κάμερας vidicon υπάρχει το διάφανο λεπτό παράθυρο του καθοδικού σωλήνα.

Πάνω σε αυτήν την επιφάνεια έχει εναποτεθεί ένα λεπτό στρώμα φωτοευαίσθητου υλικού αποτελούμενο από μεγάλο πλήθος μικροσκοπικών σφαιρικών αντιστάσεων (φωσφόροι), των οποίων η αντίσταση ελαττώνεται με τη έκθεσή τους στο φώς.

Το φώς διερχόμενο στον σωλήνα μεταβάλλει την κατάσταση του κυκλώματος του καθοδικού σωλήνα, δημιουργώντας ένα ρεύμα στο πίσω μέρος του, που διαμορφώνει το αναλογικό σήμα της εικόνας.

Το αναλογικό σήμα video σε φόρμα (format) RS-170 που έχουν ως έξοδο οι κάμερες τύπου καθοδικού σωλήνα (vidicons) φαίνεται στο Σχήμα 7.14. Οι κάμερες vidicon είναι φθηνές εξ΄αιτίας του υψηλού όγκου παραγωγής τους για μαζική χρήση. Ομως είναι εύθραυστες και παρουσιάζουν περιορισμένη ζωή καθοδικού σωλήνα (το φωτοευαίσθητο υλικό καταστρέφεται μετά από εκθέσεις σε δυνατό φώς - φαινόμενο burnin).

Solid state

Οι κάμερες τύπου CTDs (charge transfer devices) είναι οι πιό διαδεδομένες σήμερα στις περισσότερες

βιομηχανικές εφαρμογές. Αυτές οι κάμερες χρησιμοποιούν ανιχνευτές στερεάς κατάστασης (solid - state) αντί για καθοδικό σωλήνα. Υπάρχουν δύο βασικοί τύποι:

- CCDs (charge - coupled devices)

Page 17: Κεφάλαιο 7 - NTUA

- CIDs (charge - injection devices)

Σχήμα 7.13 Καθοδικός σωλήνας vidicon

Σχήμα 7.14 Σήμα εξόδου κάμερας τύπου vidicon

Οι ανιχνευτές CCDs μοιάζουν με τα τρανζίστορ τύπου MOFSET, στο ότι περιέχουν ένα τμήμα

"πηγής" (source-region) και ένα τμήμα "εκροής" (drain-region), συζευγμένα με ένα κανάλι περιοχών αυξομείωσης (depletition-region channel), όπως φαίνεται στο Σχήμα 7.15(α).

Μπορούν να θεωρηθούν σαν διανύσματα πυκνωτών MOS τοποθετημένων πολύ κοντά και διαμορφώνουν έναν καταχωρητή μετάθεσης (shift register), Σχήμα 7.15(β).

Οι φορτίσεις στην περιοχή αυξομειώσεων μεταφέρονται στην έξοδο με την εφαρμογή μίας σειράς από παλμούς ρολογιού σε μία σειρά από ηλεκτρόδια, που βρίσκονται ανάμεσα στην πηγή και την εκροή. Τα φωτόνια που πέφτουν πάνω στον ημιαγωγό δημιουργούν μία σειρά από φορτίσεις στον πίνακα του CCD. Αυτές οι φορτίσεις μεταφέρονται στην έξοδο περιγράφοντας είτε μία γραμμή (line transfer), όπου κάθε γραμμή μεταφέρεται ακαριαία, είτε τμήμα εικόνας (frame transfer), με τη προσωπική αποθήκευσή της. Στην τελευταία περίπτωση, απαιτείται η αποθήκευση της περιοχής της εικόνας, γιατί ο πίνακας CCD ανιχνεύεται ταχύτερα από τη διαμόρφωση του σήματος εξόδου.

Το Σχήμα 7.16 δείχνει το διακριτό αναλογικό σήμα εξόδου μιάς CCD κάμερας καθώς και τη μετατροπή του σε συνεχές αναλογικό σήμα video RS-170. Η διαμόρφωση του πίνακα εισόδου (input image) με τις αντίστοιχες τιμές φωτεινότητας των pixels από μία CCD κάμερα με μέγεθος αισθητήρα 5 x 5 φωτοστοιχείων παρουσιάζεται στο Σχήμα 7.17.

Page 18: Κεφάλαιο 7 - NTUA

Η τεχνολογία των CTD προσφέρει μία σειρά πλεονεκτημάτων έναντι της παραδοσιακής τεχνολογίας των καθοδικών σωλήνων:

ελαφριά κατασκευή

χαμηλές απαιτήσεις ισχύος

δεν καταστρέφονται από εκθέσεις σε δυνατό φώς

πολύ καλή ανάλυση εικόνας

υψηλή ευαισθησία σε χαμηλές φωτιστικές συνθήκες

μεγαλύτερο φασματικό και δυναμικό εύρος

σταθεροποίηση εικόνας για ανεπαίσθητες κινήσεις στο σώμα της κάμερας

Το μειονέκτημα που παρουσιάζουν οι solid - state κάμερες έναντι των vidicon είναι το υψηλότερο κόστος τους.

Σχήμα 7.15 (α) Charged Coupled Device

(β) CCD array (μεταφορά γραμμής)

Page 19: Κεφάλαιο 7 - NTUA

Σχήμα 7.16 Σήμα εξόδου κάμερας τύπου CCD

Σχήμα 7.17 Μετατροπή αναλογικού σήματος CCD κάμερας σε ψηφιακή μορφή

7.2 RS 170 στάνταρτ τηλεοπτικό/video σήμα

Αυτό που καλούμε φόρμα (format) στάνταρτ τηλεοπτικού/video σήματος, είναι ο καθορισμός προδιαγραφών γιά το πως πρέπει να δείχνει το σήμα από ηλεκτρικής άποψης. Στην περίπτωση της κάμερας video, παράγεται ένα ηλεκτρικό σήμα ανάλογο της έντασης του φωτός που δέχεται η κάμερα. Στη συνέχεια, όλες οι πληροφορίες που περιέχονται στο ηλεκτρικό σήμα διαμορφώνονται σε στάνταρτ φόρμα (standard format) και διοχετεύονται στη μονάδα επεξεργασίας, η σε ένα τηλεοπτικό μόνιτορ.

Μαζί όμως με τις πληροφορίες της έντασης του φωτός (light intensity), προστίθενται και διάφοροι παλμοί συγχρονισμού (synchronization pulses), έτσι ώστε η συσκευή που δέχεται το ηλεκτρικό σήμα (τηλεοπτικό μόνιτορ, μονάδα ψηφιακής επεξεργασίας κλπ) να έχει τη δυνατότητα αναγνώρισης της αλληλουχίας των δεδομένων του πλαισίου (frame).

Page 20: Κεφάλαιο 7 - NTUA

Μια εικόνα σε φόρμα στάνταρτ video διαβάζεται γραμμή προς γραμμή από τα αριστερά προς τα δεξιά, ξεκινώντας αρχικά από το πάνω αριστερό μέρος του πλαισίου που ορίζει την εικόνα και καταλήγοντας στο κάτω δεξιό. Αρα τελικά για να σχηματιστεί η εικονα, χρειαζόμαστε πληροφορίες τόσο για την οριζόντια όσο και για την κατακόρυφη θέση, καθώς και για τη φωτεινότητα και το χρώμα κάθε εικονοστοιχείου όπως θα δούμε αναλυτικότερα στο επόμενο κεφάλαιο. Επειδή η σάρωση της εικόνας απαιτεί κάποιο χρόνο, αν είναι πολύ γρήγορη η εκπομπή της, απαιτεί μεγάλο εύρος φάσματος. Αν πάλι είναι αργή, παρατηρείται τρεμόσβημα στην εικόνα.

Το γεγονός ότι το μάτι του ανθρώπου δέν είναι πολύ ευαίσθητο σε τέτοιου είδους τρεμόσβημα της εικόνας, οι τεχνικοί για να μειώσουν το εύρος φάσματος εκπομπής (για οικονομικούς λόγους κυρίως), επινόησαν την πλεκτή σάρωση (intelaced). (Σχήμα 7.18). Με την πλεκτή σάρωση, οι γραμμές του πλαισίου της εικόνας σαρώνονται εναλλάξ, δηλαδή πρώτα οι περιττές και στη συνέχεια οι άρτιες. Ετσι η εικόνα συντίθεται από δύο πλαίσια, ένα των άρτιων και ένα των περιττών γραμμών που ονομάζονται και πεδία (field). Aμεσο αποτέλεσμα της πλεκτής σάρωσης είναι η συχνότητα ανανέωσης της εικόνας να μειώνεται στο μισό. Ατό σημαίνει ότι το μάτι ξεγελιέται, έχοντας την εντύπωση ότι κάθε πλαίσιο σαρώνεται δύο φορές συχνότερα από ότι συμβαίνει στην πραγματικότητα.

Σχήμα 7.18 Πλεκτή σάρωση

Η στάνταρτ τηλεοπτική φόρμα RS-170 καθιερώθηκε στο τέλος της δεκαετίας του 50 από την Ε.Ι.Α. (Εlectronic Industries Association). Προδιαγράφει δε όλες τις απαιτήσεις χρονισμού αλλά και το επίπεδο τάσεων (voltage level) για μαυρόασπρο ή μονόχρωμο τηλεοπτικό σήμα.

Page 21: Κεφάλαιο 7 - NTUA

Κάθε σήμα video αποτελείται από σειρές αναλογικών τηλεοπτικών γραμμών. Κάθε γραμμή διαχωρίζεται από την επόμενη μέσω ενός παλμού συγχρονισμού που ονομάζεται horizontal sync.

Επιπροσθέτως τα πεδία του πλαισίου της εικόνας (οdd frame, even frame) διαχωρίζονται μέσω ενός μεγαλύτερου σε διάρκεια παλμού που ονομάζεται vertical sync.

H λειτουργία των δύο αυτών παλμών συγχρονισμού έχει ως εξής: Στην περίπτωση που ένα μόνιτορ δέχεται ένα τηλεοπτικό σήμα, ο καθοδικός σωλήνας του monitor σαρώνει την φωτοευαίσθητη επιφάνεια του σωλήνα με τον τρόπο που περιγράψαμε προηγουμένως (δηλ. αριστερά-δεξιά, πάνω-κάτω), με την φωτεινότητα του καθοδικού σωλήνα να ελέγχεται από το εύρος του σήματος video. Μόλις ανιχνευθεί ένας παλμός horizontal sync, ο σωλήνας επανατοποθετείται στο αριστερό άκρο της οθόνης και μετακινείται προς τα κάτω στην αμέσως επόμενη γραμμή. Ο παλμός vertical sync που είναι μεγαλύτερης διάρκειας, επανατοποθετεί τον σωλήνα στο πάνω αριστερό μέρος της οθόνης έτσι ώστε να ξεκινήσει η σάρωση του επόμενου πλαισίου.

Ενα ολόκληρο πλαίσιο video αποτελείται από 525 γραμμές και διοχετεύεται προς το monitor κάθε 1/30 του δευτερολέπτου ή κάθε 33.33 msec (για συχνότητα εκπομπής 30 Hz). Αυτό σημαίνει ότι κάθε

πεδίο εικόνας (odd frame, even frame) περιέχει 2621/2 γραμμές και χρειάζεται 16.67 msec για να διοχετευθεί στο monitor. Διαιρώντας τον χρόνο μεταφοράς του πεδίου με τον αριθμό των γραμμών που περιέχονται σε αυτό βρίσκουμε τον χρόνο που απαιτείται για την μεταφορά κάθε γραμμής video στο monitor.

Aρα 16.67 ms/262.5=63.49 μs.

H στάνταρτ τηλεοπτική συχνότητα γραμμής σάρωσης είναι το αντίστροφο του χρόνου που απαιτείται για την μεταφορά κάθε γραμμής δηλαδή 15750 Hz.

Η συχνότητα γραμμής σάρωσης έχει μεγάλη σημασία κατά τη διαδικασία της ψηφιοποίησης, διότι μας καθορίζει την ταχύτητα δειγματοληψίας του αναλογικού σήματος, δηλαδή τον αριθμό των pixels σε κάθε γραμμή, ανάλογα με τις απαιτήσεις του συστήματος επεξεργασίας.

Στο σχήμα 7.19 απεικονίζεται ο χρονισμός και το εύρος του αναλογικού σήματος σύμφωνα με τις προδιαγραφές RS-170. Το διάστημα που λαμβάνει χώρα ο παλμός vertical sync καταλαμβάνει τις πρώτες 9 γραμμές του πεδίου της εικόνας και έχει διάρκεια 571 μs. Στην συνέχεια υπάρχουν 11

γραμμές χωρίς πληροφορία video και τέλος ακολουθούν 242 1/2 ενεργές γραμμές video. Το σύνολο

των 2621/2 γραμμών συνθέτουν ένα ολόκληρο πεδίο εικόνας.

Μέσα σε κάθε γραμμή υπάρχει ένα διάστημα που λαμβάνει χώρα ο παλμός horizontal sync και που έχει διάρκεια 10.9 μs. Αυτό αφήνει 52.59 μs ενεργού χρόνου σε κάθε γραμμή, όπου και υπάρχει το τμήμα της οπτικής πληροφορίας του σήματος video. Κάνοντας τώρα δειγματοληψία μέσα σ΄αυτό το χρονικό διάστημα (active line time) σε κάθε γραμμή, δημιουργούμε την ψηφιακή εικόνα.

Επιπροσθέτως η φόρμα RS-170 καθορίζει και τις διαστάσεις που θα έχει το τηλεοπτικό πλαίσιο (television frame), ή αλλιώς το aspect ratio που είναι 4:3. Αυτό σημαίνει ότι η οριζόντια διάσταση του frame είναι 4/3 της καθέτου (Σχήμα 7.20).

Αυτό έχει ως αποτέλεσμα κατά την δειγματοληψία να δημιουργούνται μή - τετράγωνα εικονοστοιχεία (pixels) με χωρικές διαστάσεις 4/3 μονάδων οριζοντίως και 1 μονάδα καθέτως. Επειδή όμως, πολλοί τελεστές επεξεργασίας εικόνας χρησιμοποιούν τετράγωνα εικονοστοιχεία (pixels), αποτυγχάνουν στην ανωτέρω περίπτωση. Συνήθως τα συστήματα επεξεργασίας εικόνας "δουλεύουν" με εικόνες με aspect ratio 1:1. Για να λάβουμε aspect ratio 1:1 κατά τη δειγματοληψία ενός RS-170 σήματος video πρέπει να διαιρέσουμε τον ενεργό χρόνο γραμμής με 4/3, δηλαδή να χρησιμοποιήσουμε έναν καινούργιο ενεργό χρόνο γραμμής ίσο με 39.44 μs.

Αυτό κατορθώνεται, καθυστερώντας τη δειγματοληψία κατά 6.575μs στην αρχή και αφήνοντας 6.575 μs μετά το τέλος της δειγματοληψίας.

Η RS-170 όμως δεν είναι η μοναδική φόρμα (format) εκπομπής τηλεοπτικών/video σημάτων. Υπάρχει η RS-343, η οποία ασχολείται επίσης με μονόχρωμα συστήματα εκπομπής/λήψης σημάτων αλλά με ανάλυση μεταξύ 675 και 1023 γραμμών.

Page 22: Κεφάλαιο 7 - NTUA

Σχήμα 7.19 Χρονισμός RS-170 : (a) vertical sync

(b) horizontal sync

Η στάνταρτ φόρμα για έγχρωμα σήματα είναι γνωστή ως NTSC για ορισμένες χώρες ή PAL για την Ευρώπη. Οι φόρμες NTSC και PAL τροποποιούν την RS-170 προσθέτοντας πληροφορίες χρώματος στις ήδη υπάρχουσες για την φωτεινότητα. Πολλά δε συστήματα που χρησιμοποιούν έγχρωμα σήματα απλώς χρησιμοποιούν τρία σήματα τύπου RS-170, έναν τύπο γιά κάθε ένα από τα τρία πρωτογενή χρώματα - κόκκινο (red), πράσινο (green), μπλέ (blue). Αυτά τα συστήματα έχουν καθιερωθεί και ως συστήματα που δημιουργούν το συμβατό σήμα RGB (Red Green Blue). Αυτή είναι και η πιό διαδεδομένη τεχνική διότι εξαλείφει τις χρωματικές παραμορφώσεις που παρουσιάζονται στα συστήματα που χρησιμοποιούν φόρμα NTSC και PAL.

Επανερχόμενοι στο aspect ratio θα πρέπει να αναφερθεί ότι η συντριπτική πλειοψηφία των τηλεοπτικών δεκτών που υπάρχουν στην παγκόσμια αγορά έχουν aspect ratio 4:3.

Τα τελευταία δύο χρόνια έχουν κάνει την εμφάνισή τους τηλεοπτικοί δέκτες με aspect ratio 16:9 και ονομάζονται τηλεοράσεις ευρείας οθόνης (widescreen television).

Οι τηλεοράσεις αυτές έχουν ανάλυση 576 ενεργών γραμμών στο σύστημα εκμπομπής PAL plus, αντίθετα με τις συμβατικές που έχουν ανάλυση 432 γραμμών στο σύστημα PAL.

Στην ουσία το σύστημα PAL plus είναι μία βελτίωση του σύνθετου (composite) τηλεοπτικού σήματος PAL. Ενα σύνθετο (composite) τηλεοπτικό σήμα περιέχει την πληροφορία του χρώματος (chrominance) και τηνπληροφορία φωτεινότητας (luminance).

Page 23: Κεφάλαιο 7 - NTUA

Σχήμα 7.20 Διαστάσεις τηλεοπτικού πλαισίου (4:3 vs 1:1)

7.3 Αρχιτεκτονική συστήματος τεχνητής όρασης

Για τη δημιουργία τεχνητής όρασης σε μία κατασκευή είναι απαραίτητη η χρήση κάρτας επεξεργασίας εικόνας (Digital Signal/Image Proccesor). Πρόκειται για ένα περιφερειακό εξάρτημα που δεν ανήκει στον τυπικό εξοπλισμό ενός Η.Υ. Η σύνδεσή του με το σύστημα τεχνητής όρασης γίνεται μέσω των σειριακών θυρών της μητρικής κάρτας (motherboard) του Η/Υ. Η εξέλιξη των D.S.P (Digital Signal Processor) πέρασε από τρία στάδια.

Οι πρώτες κάρτες εμφανίστηκαν στα τέλη του 1970. Ονομάζονται Hardwired Frame Grabbers. Το κυριότερο χαρακτηριστικό τους είναι η λειτουργική αυτονομία σε θέματα επεξεργασίας εικόνας. Η κάρτα διαθέτει το κατάλληλο hardware για να υλοποιεί στο εσωτερικό της κάθε λειτουργία. Ώστόσο, η χρησιμοποίηση της είναι επίπονη διότι ο προγραμματισμός γίνεται σε γλώσσα χαμηλού επιπέδου (Low - Level language/ Assembly). Οι κάρτες αυτής της κατηγορίας υπάρχουν μόνο σε εργαστήρια.

Στη συνέχεια εμφανίστηκαν τα Modular Image Processing Systems with a Pipelined Video Bus. Η σημαντικότερη διαφοροποίηση τους από τις προηγούμενες κάρτες είναι η μετατόπιση όλης της υπολογιστικής δραστηριότητας στον Η.Υ. Έτσι οι κανούργιες κάρτες απελευθερώθηκαν από το εξειδικευμένο hardware. Γεγονός που οδήγησε σε μεγάλη μείωση του κόστους αγοράς και επέτρεψε σε πολλούς απλούς χρήστες να τις αποκτήσουν. Αυτό που πρέπει να σημειωθεί είναι ότι η μετετόπιση της υπολογιστικής δραστηριότητας στον Η.Υ. δεν είχε αρνητικές επιπτώσεις στους χρόνους εκτέλεσης γιατί οι καινούργιες κάρτες συνδέονται σε γρηγορότερους διαύλους επικοινωνίας (PCI-bus).

Τέλος, υπάρχουν οι Frame Grabbers with Programmable Processor. H κατασκευαστική τους φιλοσοφία μοιάζει με τις πρώτες κάρτες επεξεργασίας εικόνας. Είναι σε θέση να πραγματοποιούν πολλές λειτουργίες στο εσωτερικό τους. Η εξέλιξη συνίσταται στην τοποθέτηση πάνω στην κάρτα ενός προγραμματιζόμενου επεξεργαστή. Αυτά τα ηλεκτρονικά εξαρτήματα δέχονται εντολές σε γλώσσες υψηλού επιπέδου, για παράδειγμα C. Βέβαια, από τις τρεις κατηγορίες καρτών η τελευταία επιτυγχάνει τους καλύτερους χρόνους εκτέλεσης, αλλά τόση υπολογιστική ισχύ σε μία περιφερειακή συνιστώσα δικαιολογούν μόνο Βιομηχανικές και Επιστημονικές εφαρμογές. Γεγονός που επιβεβαιώνει και το κόστος τους.

Το Σχήμα 7.21 δείχνει το δομικό διάγραμμα μίας τυπικής κάρτας επεξεργασίας εικόνων.

Στη συνέχεια περιγράφονται τα διάφορα τμήματα μίας τυπικής κάρτας επεξεργασίας εικόνας, που είναι τα εξής:

Page 24: Κεφάλαιο 7 - NTUA

Σχήμα 7.21 Δομικό διάγραμμα κάρτας επεξεργασίας εικόνας

Page 25: Κεφάλαιο 7 - NTUA

η μονάδα - εισόδου

οι Frame Buffers

η μονάδα - εξόδου

ο περιφερειακός επεξεργαστής

ο δίαυλος επικοινωνίας της κάρτας με τον μητρικό υπολογιστή

Από τα παραπάνω εξαρτήματα μία κάρτα πρέπει να διαθέτει τουλάχιστον: μονάδα - εισόδου, μονάδα -εξόδου, frame buffer και δίαυλο επικοινωνίας.

Μονάδα Εισόδου (Input Unit)

Στις περισσότερες κάρτες επεξεργασίας εικόνας η διαμόρφωση αυτού του τμήματος είναι κοινή. Υπάρχουν τρείς λόγοι που επιβάλλουν την ύπαρξη του. Πρώτον, ενισχύει το αναλογικό σήμα εισόδου. Δεύτερον, καθορίζει τις προτεραιότητες στην περίπτωση πολλαπλών εισόδων. Τρίτον, κάνει την ψηφιοποίηση.

Συνήθως, το πρώτο βήμα σε κάθε περίπτωση επεξεργασίας σήματος είναι η ενίσχυση του σήματος (amplification). Έτσι οι μεταβολές τάσεις του σήματος εισόδου μετατοπίζονται εντός του πεδίου διέγερσης του ΑD μετατροπέα και η ψηφιοποίηση του είναι ακριβέστερη.

Πολλές φορές η κάρτα επεξεργασίας εικόνας δέχεται εισόδους από πολλές πηγές (κάμερες και video). Όμως οι δυνατότητες αποθήκευσης και επεξεργασίας περιορίζονται σε ένα σήμα τη φορά. Άρα πρέπει να υπάρχει ένα σύστημα που θα παρακολουθεί την δραστηριότητα στο εσωτερικό της κάρτας και μόλις ολοκληρωθεί η πορεία ενός σήματος να περάσει το επόμενο. Το ηλεκτρονικό εξάρτημα που ελέγχει τις θυρίδες εισόδου ονομάζεται πολυπλέκτης (Multiplexer).

Όμως, η σημαντικότερη λειτουργία της μονάδας εισόδου είναι η ψηφιοποίηση του αναλογικού σήματος. Η τρέχουσα τεχνολογία επιβάλει “ηλεκτρικές συσκευές” που παράγουν αναλογικό σήμα. Αντίθετα, ο Η.Υ. επεξεργάζεται αποκλειστικά ψηφιακό σήμα (ακολουθίες 0 και 1). Η κάρτα επεξεργασίας εικόνας αναλαμβάνει την μετατροπή από την μία μορφή στην άλλη σε σήματα εικόνας. Σε κάθε ψηφιοποίηση αναπόφευχτα ένα μέρος της αρχικής αναλογικής πληροφορίας χάνεται. Το ζητούμενο είναι το τελικό ψηφιακό σήμα να διατηρεί τα βασικά χαρακτηριστικά του αρχικού αναλογικού.

Μονάδα Εξόδου (Output Unit)

Η κάρτα επεξεργασίας εικόνας έχει δύο δυνατότητες όσoν αφορά τη διαχείριση του τελικού σήματος. Η μία είναι να το στείλει για αποθήκευση και η άλλη είναι να το εμφανίσει σε μία οθόνη (monitor).

Η αποθήκευση ενός αρχείου εικόνας μπορεί να γίνει είτε σε ψηφιακό μέσο είτε σε αναλογικό. Η πιο εύκολη επιλογή είναι το σήμα μετά την επεξεργασία του να κατευθυνθεί στο σκληρό δίσκο (Hard Disc) του υπολογιστή. Όμως, τα αρχεία εικόνας έχουν μεγάλο μέγεθος με αποτέλεσμα σύντομα να “γεμίσει” ο δίσκος. Για αυτό τον λόγο τα ολοκληρωμένα συστήματα επεξεργασίας εικόνας περιλαμβάνουν ειδικά αποθηκευτικά μέσα που η λειτουργία τους μοιάζει σε μεγάλο βαθμό με την λειτουργία των video στην φάση εγγραφής. Οι τελικές εικόνες γράφονται σε κασσέτες που είναι φτηνές στην αγορά και εύκολες στην αρχειοθέτηση.

Όταν η επεξεργασία εικόνας γίνεται με αλληλεπίδραση του ανθρώπου και της μηχανής (interactively), τα ενδιάμεσα και τα τελικά αποτελέσματα πρέπει να εμφανίζονται σε μία οθόνη. Τονίζεται ότι η οθόνη που προβάλει η κάρτα και η οθόνη του υπολογιστή δεν ταυτίζονται. Η κάθε συνιστώσα έχει τη δικιά της συσκευή. Σαν κυριότερος λόγος κατατίθεται η πλήρη ασυμβατότητα των σημάτων εξόδου της κάρτας και του υπολογιστή. Η πρώτη παράγει εικόνα, ο δεύτερος κείμενο και γραφικά.

Frame Buffer

Γνωρίζουμε ότι όλες οι εικόνες δεν έχουν την ίδια διάσταση. Μία συνηθισμένη διάσταση είναι 256 γραμμές (rows) x 256 στήλες (columns) ή 512 x 512. Υπάρχουν όμως εικόνες με μικρότερο μέγεθος: 128 x 128, και μεγαλύτερο 1024 x 1024. Επιπροσθέτως, όλες οι εικόνες δεν έχουν την ίδια ποιότητα. Σαν ποιότητα θεωρείται το πλήθος των ψηφίων (bits) που χρησιμοποιούνται για την αναπαράσταση μίας φωτεινότητας. Το βάθος της πληροφορίας καθορίζει και το πλήθος των δυνατών χρωματικών αναπαραστάσεων. Για παράδειγμα βάθος πληροφορίας ίσο με ένα byte επιτρέπει την απεικόνιση 256 αποχρώσεων του γκρι.

Page 26: Κεφάλαιο 7 - NTUA

Με τον όρο frame buffer περιγράφονται οι αποθηκευτικοί χώροι της κάρτας επεξεργασίας εικόνας. Η εικόνα πριν σταλεί στον υπολογιστή συγκεντρώνεται σε αυτό τον χώρο. Έχει ήδη αναφερθεί σαν ένα από τα κυριότερα χαρακτηριστικά των αρχείων εικόνας το μεγάλο μέγεθος τους. Μάλιστα, με τη βελτίωση της εικόνας το μεγέθος αυξάνει με γεωμετρικούς ρυθμούς. Σαν βελτίωση λογίζεται η μετάβαση από τη μαυρόασπρη εικόνα (grayscale image) στην έγχρωμη (RGB image). Η κατάσταση μπορεί να φτάσει σε οριακές συνθήκες όταν δεν επεξεργάζονται στατικές εικόνες (still images) αλλά διαδοχικά στιγμιότυπα (image sequences).

Γίνεται λοιπόν φανερή η ανάγκη που υπάρχει στις κάρτες επεξεργασίας εικόνας για μεγάλη μνήμη. Tον frame buffer ο χρήστης μπορεί να τον θεωρήσει και ως ένα μεγάλο πλήθος από bytes, που η διάταξη τους εξαρτάται από την εικόνα εισόδου.

Το δομικό διάγραμμα ενός frame buffer φαίνεται στο Σχήμα 7.22.

Σχήμα 7.22 Δομικό διάγραμμα frame buffer

Δίαυλος Επικοινωνίας

Η κάρτα επεξεργασίας εικόνας αποτελεί περιφερειακό εξάρτημα του υπολογιστή. Τα περισσότερα περιφερειακά εξαρτήματα αγοράζονται εκ των υστέρων και είναι εξοπλισμένα με κατάλληλο hardware για την υλοποίηση εξεζητημένων αναγκών του χρήστη, όπως είναι η επεξεργασία ήχου και εικόνας. Εφαρμόζονται στην μητρική κάρτα με την βοήθεια υποδοχών (sockets). Για την επικοινωνία τους με τον υπολογιστή χρησιμοποιούν δίαυλους επικοινωνίας. Ένα σημαντικό χαρακτηριστικό του περιφεριακού εξαρτήματος είναι ο τύπος του δίαυλου επικοινωνίας γιατί καθορίζει τον ρυθμό διαμεταγωγής πληροφοριών. Στους σημερινούς υπολογιστές υπάρχουν πολλών κατηγοριών δίαυλοι επικοινωνίας. Παραδείγματος χάριν, δίαυλοι παλιάς τεχνολογίας με πολύ αργούς ρυθμούς διαμεταγωγής (ΑΤ - bus) και σύγχρονοι με εκατοντάδες φορές ταχύτερους ρυθμούς διαμεταγωγής (PCI - bus).

Page 27: Κεφάλαιο 7 - NTUA