ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΓΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ · 2008-06-06 ·...

14
ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΑ ΤΕΙ 2.2.2.3ζ ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΓΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ Εγχειρίδιο χρήσης λογισμικού ΕΠΙΣΤΗΜΟΝΙΚΟΣ ΥΠΕΥΘΥΝΟΣ: ΣΤΡΟΥΘΟΠΟΥΛΟΣ ΧΑΡΑΛΑΜΠΟΣ ΣΕΡΡΕΣ, ΜΑΙΟΣ 2007

Transcript of ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΓΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ · 2008-06-06 ·...

Page 1: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΓΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ · 2008-06-06 · εγγράφου σύμφωνα με την τεχνική που προτείνεται

ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΑ ΤΕΙ

2.2.2.3ζ

ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΓΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ

Εγχειρίδιο χρήσης λογισμικού

ΕΠΙΣΤΗΜΟΝΙΚΟΣ ΥΠΕΥΘΥΝΟΣ: ΣΤΡΟΥΘΟΠΟΥΛΟΣ ΧΑΡΑΛΑΜΠΟΣ

ΣΕΡΡΕΣ, ΜΑΙΟΣ 2007

Page 2: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΓΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ · 2008-06-06 · εγγράφου σύμφωνα με την τεχνική που προτείνεται

ΠΕΡΙΕΧΟΜΕΝΑ 1. Εισαγωγή 2. Κύριες λειτουργίες του προγράμματος

2.1 Ανίχνευση περιοχών κειμένου 2.2 Εξαγωγή αντικειμένων κειμένου

3. Βοηθητικές λειτουργίες του προγράμματος

3.1 Χειρισμός παραθύρων 3.2 Βοηθητικές επεξεργασίες

4. Παρουσίαση αλγορίθμων 5. Αναφορές

Page 3: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΓΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ · 2008-06-06 · εγγράφου σύμφωνα με την τεχνική που προτείνεται

1 . Εισαγωγή

Οι τεχνικές που αναπτύχθηκαν στα πλαίσια του παρόντος ερευνητικού έργου έχουν υλοποιηθεί με τη βοήθεια του πακέτου ανάπτυξης εφαρμογών DELPHI 7. Το πρόγραμμα που υλοποιήθηκε λειτουργεί σε περιβάλλον Windows και ανήκει στη κατηγορία των MDI (Multiple Document Interface - Περιβάλλον εργασίας πολλών εγγράφων) εφαρμογών. Η προτεινόμενη ανάλυση οθόνης είναι 1024x768 ή μεγαλύτερη.

Εκτός από τις λειτουργίες που αφορούν τις τεχνικές που σχετίζονται με το ερευνητικό έργο, έχουν ενσωματωθεί επιπλέον και κάποιες συνήθεις τεχνικές επεξεργασίας εικόνων. Αυτές είναι:

• Ανίχνευση ακμών (Sobel,Prewitt και LoG filter).

• Μάσκες για εξομάλυνση της εικόνας (mean και Gaussian).

• Ιστόγραμμα.

• Δυαδικοποίηση ( Binarization ) με απόλυτο κατώφλι.

• Μετατροπή από color σε gray scale με βάση τα μεγέθη I ( Intensity ), L,

( Lightness ), V ( Value) και Υ (φωτεινότητα χρωματικού μοντέλου YIQ).

• Καταμέτρηση χρωμάτων εικόνας.

Το περιβάλλον του προγράμματος αποτελείται από τρία κύρια μέρη: το μενού, τη γραμμή εργαλείων και τον κύριο χώρο εργασίας. Από το μενού είναι δυνατή η εκτέλεση όλων των λειτουργιών του προγράμματος ενώ η γραμμή εργαλείων αφορά κυρίως βοηθητικές λειτουργίες όπως για παράδειγμα η μεγέθυνση εικόνας, η αντιγραφή και η επικόλληση κ.τ.λ. Στον κύριο χώρο εργασίας εμφανίζονται οι εικόνες, τα πλαίσια διαλόγου καθώς και τα αποτελέσματα της εφαρμογής των τεχνικών. Στο Σχήμα 1 δίνεται ένα παράδειγμα του περιβάλλοντος εργασίας του προγράμματος. Σημειώνεται ότι οι κύριες λειτουργίες είναι απενεργοποιημένες όταν δεν υπάρχει ανοικτή εικόνα.

Page 4: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΓΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ · 2008-06-06 · εγγράφου σύμφωνα με την τεχνική που προτείνεται

Σχήμα 1. Το περιβάλλον εργασίας του προγράμματος.

Page 5: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΓΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ · 2008-06-06 · εγγράφου σύμφωνα με την τεχνική που προτείνεται

2. Κύριες λειτουργίες

2.1 Ανίχνευση περιοχών κειμένου

Στην ενότητα αυτή περιγράφεται αναλυτικά βήμα προς βήμα η διαδικασία που πρέπει να ακολουθηθεί ώστε να εξάγουμε τις περιοχές κειμένου ενός έγχρωμου εγγράφου σύμφωνα με την τεχνική που προτείνεται στην εργασία [1].

Αρχικά, ανοίγουμε μία εικόνα χρησιμοποιώντας την εντολή του μενού "File —> Open

Image". Από το πλαίσιο διαλόγου που θα εμφανιστεί (Σχήμα 2), επιλέγουμε την

εικόνα και πατάμε το κουμπί "Open". Εναλλακτικά, η ίδια διαδικασία μπορεί να

εκτελεστεί χρησιμοποιώντας το αντίστοιχο κουμπί της γραμμής εργαλείων.

Σχήμα 2. Το παράθυρο διαλόγου για την επιλογή της εικόνας/εικόνων που θα εισαχθούν στο περιβάλλον του προγράμματος.

Σύμφωνα με την τεχνική [1], θα πρέπει αρχικά να εκτιμηθεί το πλήθος των βασικών χρωμάτων της εικόνας. Το δεδομένο αυτό θα χρησιμοποιηθεί στο επόμενο στάδιο της

μεθόδου από το νευρωνικό δίκτυο Kohonen για τη μείωση των χρωμάτων. Επιλέγοντας την εντολή του μενού “Color Reduction —> Estimate Histogram Peaks”

εμφανίζεται το πλαίσιο διαλόγου του Σχήματος 3(β), με τη βοήθεια του οποίου το

πρόγραμμα θα εκτιμήσει το πλήθος των βασικών χρωμάτων της εικόνας πατώντας το κουμπί “Estimate Peaks”

Page 6: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΓΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ · 2008-06-06 · εγγράφου σύμφωνα με την τεχνική που προτείνεται

(α) (β)

Σχήμα 3. Παράδειγμα εκτίμησης πλήθους βασικών χρωμάτων. (α)έγχρωμο έγγραφο, (β) αποτέλεσμα εκτίμησης (2 χρώματα).

Στο Σχήμα 3 δίνεται ένα παράδειγμα εκτίμησης του πλήθους των βασικών

χρωμάτων της εικόνας που φαίνεται στο Σχήμα 3(α). Η μεθοδολογία που

ακολουθείται για την εκτίμηση του πλήθους των χρωμάτων περιγράφεται στην

εργασία [2].

Στη συνέχεια, από το μενού "Tools →· Text Localization" εμφανίζουμε το πλαίσιο διαλόγου που αφορά την εφαρμογή της τεχνικής ανίχνευσης των περιοχών του κειμένου. Αυτό φαίνεται στο Σχήμα 4(α). Οι επιλογές που παρέχει η συγκεκριμένη φόρμα αφορά τον τρόπο με τον οποίο θα εμφανιστεί το τελικό αποτέλεσμα καθώς και την τεχνική μείωσης χρωμάτων που θα εφαρμοστεί. Για την περίπτωση της μείωσης χρωμάτων δίνονται δύο επιλογές:

• Χρήση του Kohonen SOFM

• Χρήση του αλγορίθμου “LM method” [3]

Για τους δύο αλγόριθμους μείωσης χρωμάτων δίνεται η δυνατότητα επιθεώρησης και

αλλαγής των παραμέτρων τους. Στο Σχήμα 4(β) φαίνεται το πλαίσιο διαλόγου για την

ρύθμιση των παραμέτρων του Kohonen το οποίο εμφανίζεται πατώντας το κουμπί

“Kohonen Settings”.

Page 7: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΓΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ · 2008-06-06 · εγγράφου σύμφωνα με την τεχνική που προτείνεται

(α) (β)

Σχήμα 4. Πλαίσια διαλόγου εφαρμογής της τεχνικής ανίχνευσης περιοχών κειμένου και ρύθμισης των παραμέτρων του νευρωνικού δικτύου Kohonen.

Για να εξαχθεί το τελικό αποτέλεσμα πατάμε το κουμπί “Apply”. Ο τρόπος εμφάνισης των περιοχών κειμένου που ανιχνεύθηκαν από το πρόγραμμα καθορίζεται από τις επιλογές του πεδίου “Export”. Παρακάτω δίνεται η σημασία της κάθε επιλογής:

• “BBs Over Original Image”. Ορθογώνια παραλληλόγραμμα πάνω από την εικόνα με τα μειωμένα χρώματα.

• “BBs On Binary Image”. Ορθογώνια παραλληλόγραμμα με μαύρο χρώμα.

• “Original Pixels”. Ορθογώνια παραλληλόγραμμα που περιέχουν τα

εικονοστοιχεία της εικόνας με τα μειωμένα χρώματα.

• “Only BBs”. Μόνο τα ορθογώνια παραλληλόγραμμα.

Στο Σχήμα 5 δίνονται τα αποτελέσματα της ανίχνευση κειμένου για την εικόνα του Σχήματος 3(α) με τις πιο πάνω επιλογές εμφάνισης.

Page 8: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΓΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ · 2008-06-06 · εγγράφου σύμφωνα με την τεχνική που προτείνεται

(α) BBs Over Original Image (β) BBs On Binary Image

(γ) Original Pixels (δ) Only BBs

Σχήμα 5. Αποτελέσματα ανίχνευσης περιοχών κειμένου.

2.2 Εξαγωγή αντικειμένων κειμένου

Στην ενότητα αυτή περιγράφεται η διαδικασία δυαδικοποίησης των έγχρωμων εγγράφων σύμφωνα με την τεχνική που προτείνεται στην εργασία Σφάλμα! Το αρχείο προέλευσης της αναφοράς δεν βρέθηκε.. Σε αυτή την περίπτωση εφαρμόζεται κάποιος αλγόριθμος δυαδικοποίησης τοπικά στις περιοχές που έχουν χαρακτηριστεί ως περιοχές κειμένου σύμφωνα με τη μεθοδολογία που περιγράφεται στην τεχνική Σφάλμα! Το αρχείο προέλευσης της αναφοράς δεν βρέθηκε..

Αρχικά φορτώνουμε μία εικόνα ακολουθώντας τη διαδικασία που περιγράφεται στην ενότητα 2. Στη συνέχεια επιλέγουμε από το μενού την εντολή “Tools → Color Binarization” για να εμφανίσουμε το πλαίσιο διαλόγου του Σχήματος 6. Από εδώ επιλέγουμε τη μέθοδο δυαδικοποίησης των περιοχών κειμένου που θα ανιχνευθούν από τη μέθοδο. Πατώντας το κουμπί “Apply” λαμβάνουμε την τελική δυαδική εικόνα καθώς και αυτήν με τα μειωμένα χρώματα. Στο Σχήμα 7 δίνεται το αποτέλεσμα της εφαρμογής της μεθόδου για την εικόνα του Σχήματος 3(α).

Page 9: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΓΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ · 2008-06-06 · εγγράφου σύμφωνα με την τεχνική που προτείνεται

Σημειώνεται ότι όλοι οι αλγόριθμοι δυαδικοποίησης μπορούν να εφαρμοστούν ανεξάρτητα με τη βοήθεια του μενού “Binarization”.

Σχήμα 6. Το πλαίσιο διαλόγου για την επιλογή της μεθόδου δυαδικοποίησης των περιοχών κειμένου.

(α) (β)

Σχήμα 7. Παράδειγμα δυαδικοποίησης έγχρωμου εγγράφου. (α)Εικόνα με μειωμένα χρώματα, (β)αποτέλεσμα δυαδικοποίησης.

Page 10: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΓΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ · 2008-06-06 · εγγράφου σύμφωνα με την τεχνική που προτείνεται

3. Βοηθητικές λειτουργίες του προγράμματος

3.1 Χειρισμός παραθύρων

Το λογισμικό που αναπτύχθηκε λειτουργεί με πολλαπλά παράθυρα που περιέχουν έγγραφα και εικόνες πριν και μετά από τις επεξεργασίες που εφαρμόζονται από τον

χρήστη. Το περιεχόμενο είναι δυνατόν να αντιγραφεί σε νέα παράθυρα και να εφαρμοσθούν επεξεργασίες ανάλογα με την επιθυμία του χρήστη. Η τακτοποίηση των παραθύρων γίνεται με τις τυποποιημένες τεχνικές

• Arrange Horizontal

• Arrange Vertical

• Cascade

της επιλογής Window του προγράμματος. Οι ίδιες λειτουργίες παρέχονται άμεσα με το πάτημα ενός από τα πλήκτρα της γραμμής εργαλείων που δείχνονται στο Σχ.8

Η προβολή των εικόνων που περιέχονται στα παράθυρα μπορεί να γίνει σε διαφορετικά μεγέθη που μπορεί να επιλεχθούν από το χρήστη με το πάτημα ενός από τα πλήκτρα της γραμμής εργαλείων που δείχνονται στο Σχ.9.

συνήθεις εργασίες αντιγραφής, επικόλλησης, δημιουργίας αντιγράφου και επαναφόρτωσης μιας εικόνας διατίθενται ως επιλογές του μενού και των πλήκτρων

Page 11: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΓΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ · 2008-06-06 · εγγράφου σύμφωνα με την τεχνική που προτείνεται

της γραμμής εργαλείων όπως φαίνονται στο Σχήμα 10.

3.2 Βοηθητικές επεξεργασίες

Υλοποιήθηκαν και ενσωματώθηκαν στο πρόγραμμα σύγχρονες τεχνικές επεξεργασίας ψηφιακών εικόνων που απαιτούνται συχνά με σκοπό να προ-επεξεργάζονται την εικόνα για να βελτιωθεί το τελικό αποτέλεσμα και να δίνουν την δυνατότητα στο χρήστη να διερευνά εναλλακτικούς αλγορίθμους. Παρακάτω θα αναφερθούμε στην χρήση των τεχνικών αυτών μέσα από το πρόγραμμα, στο σκοπό που επιτελούν και στις ενδεχόμενες παραμέτρους τους που τυχόν πρέπει να καθορισθούν από το λογισμικό μας.

Η πρώτη ομάδα αυτών των τεχνικών αφορούν το χρώμα της εικόνας και βρίσκονται

στη επιλογή colors του μενού του προγράμματος (Σχήμα 11). Η παραγωγή του

«αρνητικού» της εικόνας επιτυγχάνεται με την επιλογή colors→Negative. Η

μετατροπή της έγχρωμης εικόνας σε εικόνα αποχρώσεων του γκρι (gray level) γίνεται με

την επιλογή Colors→ Gray Scale με τέσσερις εναλλακτικές παραλλαγές (Intensity,

Lightness, Value, Luminance ) που επιλέγονται από το χρήστη όπως δείχνεται στο

Page 12: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΓΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ · 2008-06-06 · εγγράφου σύμφωνα με την τεχνική που προτείνεται

Σχ.11. Η επιλογή Color→Thresholding δίνει τη δυνατότητα στο χρήστη να μετατρέψει την

εικόνα σε δυαδική αφού επιλέξει την κατάλληλη τιμή κατωφλίωσης από την παλέτα των αποχρώσεων του γκρι. Αυτό γίνεται με την χρήση του δρομέα στο παράθυρο Binarization που εμφανίζεται μετά την επιλογή Color→Thresholding. Αν η εικόνα είναι έγχρωμη, ο χρήστης μπορεί αυτομάτως να επιλέξει την τεχνική μετατροπής της σε εικόνα αποχρώσεων του γκρι από την επιλογή Channel που υπάρχει στο ίδιο παράθυρο. Στο Σχ. 12 φαίνεται η παραπάνω διαδικασία και η εφαρμογή της.

10

Page 13: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΓΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ · 2008-06-06 · εγγράφου σύμφωνα με την τεχνική που προτείνεται

Η μετατροπή μιας εικόνας σε δυαδική μορφή μπορεί να γίνει και αυτόματα με την εφαρμογή κατάλληλων των τεχνικών που επιλέγονται από το μενού Binarization (Σχ.13). Στο ίδιο μενού με την επιλογή Define Binarization Parametres, δίνεται η δυνατότητα στο χρήστη να αποδώσει τιμές στις παραμέτρους των διαφόρων τεχνικών (Σχ.14)

Ο χρήστης πληροφορείται το πλήθος των χρωμάτων της εικόνας που φιλοξενείται σε κάποιο παράθυρο (όχι της χρωματικής παλέτας), από την επιλογή Color-

Page 14: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΓΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ · 2008-06-06 · εγγράφου σύμφωνα με την τεχνική που προτείνεται

>Count.