Εισαγωγή

666
1 Εισαγωγή Κεφάλαιο 1 ΕΠΛ 445 – Ψηφιακή Επεξεργασία Εικόνας

description

ΕΠΛ 445 – Ψηφιακή Επεξεργασία Εικόνας. Εισαγωγή. Κεφάλαιο 1. ΠΕΡΙΕΧΟΜΕΝΑ. Εισαγωγή Τύποι Εικόνων Γεωμετρία Απεικόνισης Όργανα Απεικόνισης Απόκτηση Εικόνας Αν απαράσταση Εικόνας. Σκοπός Του Μαθήματος (1/2). - PowerPoint PPT Presentation

Transcript of Εισαγωγή

Page 1: Εισαγωγή

1

Εισαγωγή

Κεφάλαιο 1

ΕΠΛ 445 – Ψηφιακή Επεξεργασία Εικόνας

Page 2: Εισαγωγή

2

ΠΕΡΙΕΧΟΜΕΝΑ

1. Εισαγωγή

2. Τύποι Εικόνων

3. Γεωμετρία Απεικόνισης

4. Όργανα Απεικόνισης

5. Απόκτηση Εικόνας

6. Αναπαράσταση Εικόνας

Page 3: Εισαγωγή

3Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σκοπός Του Μαθήματος (1/2)

Να μεταφέρει τις βασικές ιδέες της Ψηφιακής Επεξεργασίας Εικόνας (ΨΕΕ) από μια λειτουργική όψη με κάποια επαφή στην θεωρία. Οι βασικές αυτές ιδέες είναι:

- Ανάληψη: κάμερες, διασύνδεση, και υπολογιστές.

- Επεξεργασία, αλγόριθμοι και θεωρία.

- Πρακτικές εφαρμογές της ΨΕΕ.

- Βασικοί αλγόριθμοι ανάλυσης εικόνας. Κάνει προσιτή την ψηφιακή επεξεργασία εικόνας. Παρουσιάζει το αντικείμενο με λογική μαθηματική ευκολία. Παρουσιάζει τα αποτελέσματα πολλαπλών παραδειγμάτων οπτικών

εικόνων στην μορφή της ακριβούς ΨΕΕ, όπως αυτά έχουν αναλυθεί στο Laboratory for Vision Systems στο University of Texas at Austin, και στο Τμήμα Πληροφορικής του Πανεπιστημίου Κύπρου.

Page 4: Εισαγωγή

4Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

• Να γίνονται ερωτήσεις όσον αφορά το αντικείμενο του μαθήματος

• Να μη διστάζουν οι φοιτητές να δείξουν τη μη κατανόηση κάποιου θέματος

• Να γίνονται σχόλια για την ταχύτητα διδαχής του μαθήματος• Να γίνονται σχόλια για το επίπεδο διδαχής

Σκοπός Του Μαθήματος (2/2)

Page 5: Εισαγωγή

5Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σχόλια Για Το Βιβλίο

Το βιβλίο που καλύπτει την ύλη του μαθήματος είναι το:

Digital Image Processing, R.C. Gonzalez and R.E. Woods

Πολύ ευπρόσιτο βιβλίο – Φιλικό προς το χρήστη Πολύ καλά εικονογραφημένο - με χρήσιμα παραδείγματα

εφαρμογών Οι σημειώσεις της τάξης είναι αυτόνομες. Εντούτοις, το βιβλίο

είναι καλό για διάβασμα.

Page 6: Εισαγωγή

6Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Άλλα Προτεινόμενα Βιβλία

• Digital Image Processing, W.K. Pratt, Wiley, 1992, Encyclopedic, somewhat dated. There is a new edition.

• Digital Picture Processing, Rosenfeld & Kak, Academic 1982, Encyclopedic but readable

• Fundamentals of Digital Image Processing, Jain, Prentice 1989, Handbook-style, meant for advanced level.

• Machine Vision, Jain, Kasturi, and Schunk, McGraw-Hill, 1995, Beginner’s book on computer vision.

• Robot Vision, B.K.P. Horn, MIT Press, 1986, Advanced-level book on computer vision

• Digital Video Processing, M. Tekalp, Prentice-Hall, 1995, Only book devoted to digital video; high-level; excellent.

Page 7: Εισαγωγή

7Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Δημοσιεύσεις - Journals

·        IEEE Transactions on:- Image Processing- Pattern Analysis and Machine Intelligence- Medical Imaging- Remote Sensing

·        Computer Vision, Graphics, and Image Processing- Image Understanding- Graphics and Image Processing 

·        Pattern Recognition·        Journal of Visual Communication and Image Representation ·        Image and Vision Computing

Page 8: Εισαγωγή

8Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εφαρμογές της ΨΕΕ (1/2)

Υπάρχουν αμέτρητες περιοχές εφαρμογών της ΨΨΕ, οι οποίες εξελίσσσονται ραγδαία. Θα δώσουμε πιο κάτω μερικές από αυτές.

Page 9: Εισαγωγή

9Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Που χρησιμοποιείται? (2/2)

ΨΨΕ – Μια επιστήμη με πολλές εφαρμογές:

Page 10: Εισαγωγή

10Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εξέλιξη της ΨΨΕ

Είναι σημαντική στις περιοχές με στοιχεία πολλών διαστάσεωνΗ απεικόνιση είναι ανεκτίμητο μέσο και μετάφραση δεδομένωνΗ όραση είναι η πιο σημαντική αίσθηση μας και είναι πανταχού παρώνΕφαρμογές σε σταθμούς εργασίας και προσωπικούς υπολογιστέςΣημαντική πρόοδος σε αλγορίθμους και επιπρόσθετα στοιχεία του υλικού των υπολογιστών

Πλεονεκτήματα της ΨΨΕ σε σταθμούς εργασίας

Χειρισμός – κόστος των προσωπικών σταθμών εργασίας είναι ιδανικό για εργαστηριακή δουλειάΤεράστια ικανότητα μείωσης χρόνουΜπορεί να επιβλέπει και να ελέγχει πολλαπλές διεργασίεςΙκανότητα εντολών των σταθμών εργασίας για την καλπάζουσα ΨΕΕ

Page 11: Εισαγωγή

11Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Τι Είναι οι Ψηφιακές Εικόνες?

Υπάρχουν τόσων ειδών εικόνες όσοι και οι τύποι της ακτινοβολίας και οι τρόποι που δείχνουν πώς η ακτινοβολία αντιδρά με τα αντικείμενα.

Page 12: Εισαγωγή

12Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γενικοί τύποι εικόνων (1/2)

Μπορούμε να διακρίνουμε τρεις τύπους εικόνας, οι οποίοι δημιουργούν διαφορετικούς τύπους πληροφορίας εικόνας.

Απεικόνιση Αντανάκλασης: Η πληροφορία της εικόνας είναι η πληροφορία της επιφάνειας, δηλαδή πως ένα αντικείμενο αντανακλά/απορροφά ακτινοβολία

- Οπτική (ορατή, φωτογραφική, με βάση ακτίνων laser) - Radar - Sonar, ultrasound (non-EM) Υπέρηχοι - Electron microscopy Ηλεκτρονικό Μικροσκόπιο

Page 13: Εισαγωγή

13Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γενικοί τύποι εικόνων (2/2)

Απεικόνιση εκπομπής: Η πληροφορία εικόνας είναι εσωτερική πληροφορία, δηλαδή πως ένα αντικείμενο δημιουργεί ακτινοβολία.

- Θερμική, υπέρυθρη (γεωφυσική, ιατρική, στρατιωτική)       - Αστρονομία (άστρα, γαλαξίες, κλπ.)       - Πυρηνική (εκπομπή σωματιδίων

Απεικόνιση Απορρόφησης: Η πληροφορία της εικόνας είναι εσωτερική πληροφορία, δηλαδή πως ένα αντικείμενο αλλάζει / απορροφά ακτινοβολία που περνά διαμέσου του.

- Ακτίνες Χ σε πολλές χρήσεις - Οπτική μικροσκοπία σε χρήσεις εργαστηρίου - Τομογραφία στην ιατρική - “Vibro-Seis” στην γεωφυσική έρευνα

Page 14: Εισαγωγή

14Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ηλεκτρομαγνητική Ακτινοβολία (1/2)

Το ηλεκτρομαγνητικό φάσμα καλύπτει πολλές χρήσιμες ακτινοβολίες που χρησιμοποιούνται στην απεικόνιση:

Page 15: Εισαγωγή

15Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ηλεκτρομαγνητική Ακτινοβολία (2/2)

Μερικοί κλάδοι της επιστήμης, π.χ. αστρονομία, περιέχουν εικόνες απο όλο το φάσμα.

Συνήθως θα χρησιμοποιήσουμε παραδείγματα εικόνων από το ορατό φάσμα.

Αυτό είναι ένα πολύ μικρό κομμάτι του φάσματος ακτινοβολίας!

Page 16: Εισαγωγή

16Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κλίμακες Απεικόνισης

Μεταβάλλονται ανάλογα με τις κλίμακες που υπάρχουν στην φύση:

Page 17: Εισαγωγή

17Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διαστάσεις Εικόνων

Οι εικόνες είναι πολύ-διαστατά σήματα ( 2 διαστάσεις) Ο αριθμός των διαστάσεων μιας εικόνας είναι ο αριθμός των συντεταγμένων

που χρειάζονται για ένα σημείο

Page 18: Εισαγωγή

18Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γεωμετρία οπτικής εικονοληψίας (1/2)

object

lens

image

sensingplate,

emulsion, etc

light source(point source)

emitted rays

reflectedrays

focallength

Απλοποιημένη γεωμετρία φωτογραφικής απεικόνισης

Page 19: Εισαγωγή

19Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γεωμετρία Οπτικής Απεικόνισης (2/2)

ΟΠΤΙΚΗ ΑΠΕΙΚΟΝΙΣΗ 3-Δ ΣΕ 2-Δ

"field-of-view"

lens center

2D image

Η απεικόνιση περιλαμβάνει μείωση διαστάσεων, έτσι κάποια 3-Δ πληροφορία χάνεται.

Page 20: Εισαγωγή

20Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Προβολή: είναι η μείωση των διαστάσεων

Σκηνογραφική προβολή: είναι η μείωση διαστάσεων από 3-Δ σε 2-Δ

Συστήματα συντεταγμένων:

Συντεταγμένες πραγματικού χώρου (Χ,Υ,Ζ) : δηλώνουν σημεία στο 3-Δ χώρο Το σημείο αναφοράς (Χ,Υ,Ζ)=(0,0,0) χρησιμοποιείται σαν το κέντρο του φακού

Συντεταγμένες εικόνας (x,y) : δηλώνουν σημεία σε 2-Δ εικόνα Το πεδίο x - y είναι παράλληλο του πεδίου Χ – Υ Ο οπτικός άξονας περνά και από τα δυο σημεία αναφοράς

Σκηνογραφική προβολή

Page 21: Εισαγωγή

21Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γεωμετρία προβολής οπής

Z

Y

X

f = focal length

image plane

Idealized "Pinhole"Camera Model

lens center

(X, Y, Z) = (0, 0, 0)

Ο φακός θεωρείται σαν μια οπή από την οποία περνούν όλες οι ακτίνεςφωτός που κτυπούν το πεδίο εικόνας.

Πρόβλημα: σε αυτό το μοντέλο, αλλά και στην πραγματικότητα η εικόνα είναι αντιστραμμένη. Έτσι, αλλάζουμε το μοντέλο.

Page 22: Εισαγωγή

22Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γεωμετρία αντεστραμμένης προβολής (1/3)

X

Y

Z

lens center

f = focal lengthimage plane

Upright Projection Model

x

y

(X, Y, Z) = (0, 0, 0)

Παρατήρηση: το διάγραμμα δεν είναι σε κλίμακα.

Page 23: Εισαγωγή

23Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γεωμετρία αντεστραμμένης προβολής (2/3)

X

Y

Z

f = focal lengthimage plane x

y

(0, 0, 0)

(X, Y, Z) = (A, B, C)

A

B

C

(x, y) = (a, b)

Το πιο πάνω διάγραμμα δείχνει όλους τους άξονες συντεταγμένων

Page 24: Εισαγωγή

24Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γεωμετρία αντεστραμμένης προβολής (3/3)

a

b

A

B

C

f

Το ισοδύναμο απλουστευμένο διάγραμμα περιέχει μόνο τα στοιχεία που σχετίζουν το (Χ,Υ,Ζ) = (A,B,C) με την προβολή

(x,y) = (a,b).

Page 25: Εισαγωγή

25Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Όμοια Τρίγωνα

Δυο τρίγωνα είναι όμοια όταν οι αντίστοιχες γωνίες τους είναι ίσες

Θεώρημα: τα όμοια τρίγωνα έχουν τις αντίστοιχες πλευρές τους ανάλογες

D

E

F

d

e

f

D = d , E = e , F = fE e F f D d

Page 26: Εισαγωγή

26Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λύση σκηνογραφικής προβολής (1/2)

• Χρησιμοποιώντας όμοια τρίγωνα μπορούμε να βρούμε τη σχέση μεταξύ 3-Δ συντεταγμένων χώρου και 2-Δ συντεταγμένων εικόνας• Ξανασχεδιάζουμε τη γεωμετρική εικόνα φανερώνοντας δυο ζεύγη από όμοια τρίγωνα

b

f

B

C

a

f

A

C

a

b

A

B

C

f

Page 27: Εισαγωγή

27Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λύση σκηνογραφικής προβολής (2/2)

Από το θεώρημα των ομοίων τριγώνων συμπεραίνουμε:

af

= AC και

bf

= BC

ή

(a,b) = f . (A,B) = (fA/C, fB/C) C

Page 28: Εισαγωγή

28Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εξίσωση Σκηνογραφικής Προβολής

Έτσι, έχουμε την ακόλουθη σχέση:

(x,y) = f . (X,Y) Z

όπου f = εστιακή απόσταση

Η αναλογία f είναι ο συντελεστής μεγέθυνσης, ο οποίος μεταβάλλεται Ζμε την απόσταση Ζ από το κέντρο του φακού μέχρι το πεδίο του αντικειμένου

Page 29: Εισαγωγή

29Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα 1

Υπάρχει ένας άνθρωπος σε απόσταση 10 μέτρων μπροστά μας.Έχει 2 μέτρα ύψος.Η εστιακή απόσταση του ματιού μας είναι 17mm.

Ερώτηση: ποιο είναι το ύψος Η της εικόνας που σχηματίζεται στη ρέτινα;

H2 m

10 m 17 mm

Από τα όμοια τρίγωνα: 2 m = H 10 m 17mm

H = 3.4 mm

Page 30: Εισαγωγή

30Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα 2 (1/3)

Γιατί οι ευθείες (ή τμήματα ευθειών) σε 3-Δ χώρο προβάλλονται σεευθεία γραμμή στη 2-Δ εικόνα;

X

Y

Z

image plane

x

y

(0, 0, 0)

3-D line

2-D line

Page 31: Εισαγωγή

31Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα 2 (2/3)

Παρατηρούμε ότι όλες οι γραμμές που περνούν από το κέντρο του φακού (σημείο αναφοράς) και την 3-Δ ευθεία πρέπει να είναι στο ίδιο επίπεδο (ένα σημείο και μια ευθεία προσδιορίζουν ένα επίπεδο).Η διασταύρωση αυτού του επιπέδου με το επίπεδο της εικόνας δίνει την προέκταση της ευθείας.Η διασταύρωση δυο οποιονδήποτε μη παράλληλων επιπέδων είναιμια ευθεία.

Page 32: Εισαγωγή

32Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα 2 (3/3)

Έτσι, η προβολή μιας 3-Δ ευθείας είναι σε μια 2-Δ ευθεία.

3-D line

2-D line

Page 33: Εισαγωγή

33Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ψηφιοποίηση Εικόνας

Τι είναι;Η μετατροπή μιας δυσδιάστατης φυσικής εικόνας

(στην ουσία μιας κατανομής φωτεινοτήτων) σε ηλεκτρικό σήμα και έπειτα σε ψηφιακή πληροφορία

Αισθητήρες CCD (Charged Couple Devices)Μετατρέπουν την φωτεινότητα σε ηλεκτρικό φορτίοΟι πλείστες κάμερες αυτούς χρησιμοποιούν

Page 34: Εισαγωγή

34Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αισθητήρες Charged Couple Device (1/3)

photosensitive array

shift register

amplifieranalog

video out(NTSC, RS-170)

vertical scangenerator

Τα στοιχεία του CCD πίνακα φορτίζονται ανάλογα με την φωτεινότητα η οποία προσπίπτει επάνω τους

Κάθε παλμός του Vertical Scan Generator αναγκάζει τα φορτία από κάθε γραμμή του πίνακα να μετακινηθούν σε ένα Shift Register

Ο Shift Register μεταφέρει τα φορτία σε ένα ενισχυτή, γραμμή προς γραμμή. Για το παραπάνω παράδειγμα, ο Shift Register θα μεταφέρει στον ενισχυτή τα φορτία της πρώτης γραμμής, έπειτα της δεύτερης, της τρίτης κ.ο.κ

Page 35: Εισαγωγή

35Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αισθητήρες Charged Couple Devices (2/3)

Φ ω ς

C C D s

Shif t R e gis te r Κάθε CCD συσκευή διαθέτει τρεις «πηγές δυναμικού» (potential wells). Η μεσαία παράγει φορτίο (ροή ηλεκτρονίων) ανάλογα με το πλήθος των φωτονίων (δηλαδή την ένταση του φωτός) τα οποία προσπίπτουν επάνω της

Έπειτα το φορτίο της μεσαίας πηγής

μεταπηδά στις άλλες δύο. Τέλος καταλήγει

στον Shift Register από όπου θα οδηγηθεί στον

ενισχυτή

Page 36: Εισαγωγή

36Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αισθητήρες Charged Couple Devices (3/3)

Με τον ίδιο τρόπο, το φορτίο του Shift Register μεταβιβάζεται στον ενισχυτή, ο οποίος παράγει ηλεκτρικό ρεύμα ανάλογο με την τάση του αριθμού ηλεκτρονίων που λαμβάνει: Η έξοδος του ενισχυτή είναι μια γραμμή – προς – γραμμή αναλογική

κυματομορφή η οποία συνήθως έχει προκαθορισμένη μορφή (NTSC: 525 γραμμές/πλαίσιο , 30 πλαίσια/sec, RS-170).

Τα τηλεοπτικά σήματα συνήθως ακολουθούν την NTSC Οι ψηφιακές εικόνες που δημιουργούνται από εργαστηριακές κάμερες και

κάμερες ασφαλείας είναι συνήθως της μορφής RS-170 Για να μπορεί να τύχει επεξεργασίας από υπολογιστή, η αναλογική εικόνα πρέπει

να μετατραπεί σε ψηφιακό σήμα από μια συσκευή ADC – Analog to Digital Converter

Page 37: Εισαγωγή

37Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μετατροπέας Αναλογικού σε Ψηφιακού(Analog to Digital Converter – ADC)

Διεξάγει Δειγματοληψία και Κβαντοποίηση για να μετατρέψει μια συνεχής κυματομορφή τάσης σε διακριτές τιμές σημαντική η Συχνότητα Δειγματοληψίας και το Διάστημα Κβαντοποίησης

Οι κάρτες ψηφιοποίησης βίντεο (video digitizer board) συνήθως μπορούν να ενωθούν με την βιντεοκάμερα

Οι νέες «εντελώς ψηφιακές» κάμερες περιλαμβάνουν ενσωματωμένο ADC

Page 38: Εισαγωγή

38Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εικόνα Από Δειγματοληψία (1/4)

Τα αποτελέσματα τα οποία προκύπτουν από τη δειγματοληψία αποθηκεύονται ως πίνακες από τιμές. Κάθε τιμή αντιπροσωπεύει τη φωτεινότητα της εικόνας στο συγκεκριμένο σημείο. Δίπλα απεικονίζεται ένας 10x10 πίνακας εικόνας

Κάθε ένα από τα κελιά του πίνακα ονομάζεται εικονοστοιχείο – (“pixel” από τις λέξεις «picture element»)

Στην ΨΕΕ συνήθως χρησιμοποιούμε τετραγωνικούς πίνακες NxN με διαστάσεις δύναμη του 2 (N=2M) - είναι πιο εύκολοι στον χειρισμό και μερικοί αλγόριθμοι είναι αποδοτικότεροι για τέτοιες διαστάσεις

M=7 27 x 27 = 128 x 128 σύνολο: 214 =16384 pixelsM=10 210 x 210 = 1024 x 1024 σύνολο: 220 =1048576 pixels

Page 39: Εισαγωγή

39Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εικόνα Από Δειγματοληψία (2/4)

Η δειγματοληψία πρέπει να είναι επαρκώς πυκνή αλλιώς: μεγάλη απώλεια πληροφορίας μεγάλη αλλοίωση της εικόνας

Παρακάτω απεικονίζονται οι προκύπτουσες ψηφιακές εικόνες με δειγματοληψία σε τρεις διαφορετικές συχνότητες – 600, 200 και 75 DPI)

Ποιά είναι κατάλληλη συχνότητα δειγματοληψίας; Θεώρημα Δειγματοληψίας του Nyquist (Nyquist Sampling Theorem)

Παρόμοια, το διάστημα κβαντοποίησης πρέπει να είναι αρκετά μικρό

600 DPI 200 DPI 75 DPI

Page 40: Εισαγωγή

40Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εικόνα Από Δειγματοληψία (3/4)

Κβαντοποίηση: η φωτεινότητα κάθε pixel παίρνει μια τιμή από ένα πεπερασμένο σύνολο K αριθμών (συνήθως ακεραίων, από 0 έως K-1)

Τυπικά, το πλήθος επιπέδων φωτεινότητας είναι δύναμη του 2: K=2Β

Άρα με B bits μπορούμε να κρατάμε την φωτεινότητά σε κάθε pixel

a pixel 8-bit representation

Στις εικόνες τόνων γκρίζου συνήθως Στις εικόνες τόνων γκρίζου συνήθως B=8B=8, , άραάρα έχουμε 256 πιθανά επίπεδα έχουμε 256 πιθανά επίπεδα φωτεινότητας (τιμές 0 έως 255) με 8 φωτεινότητας (τιμές 0 έως 255) με 8 bit bit ανά ανά pixelpixel

Όπως και με την συχνότητα δειγματοληψίας, οι τιμές φωτεινότητας της εικόνας θα πρέπει να κβαντοποιηθούν επαρκώς πυκνά (μικρό διάστημα κβαντοποίησης) ώστε να μην χαθεί σημαντική πληροφορία φωτεινότητας

8-Bit Κβαντοποίηση 5-Bit Κβαντοποίηση 3-Bit Κβαντοποίηση

Page 41: Εισαγωγή

41Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εικόνα Από Δειγματοληψία (4/4)

Αναπαράσταση εικόνας ως σύνολο επιπέδων bits

=• • • •

Page 42: Εισαγωγή

42Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Η Επανάσταση Της Ψηφιακής Εικόνας (1/4)

Χώρος που απαιτείται για αποθήκευση ψηφιακής εικόνας: Ανάλυση εικόνας H x W pixels (Height, Width) B bits για αποθήκευση της φωτεινότητας σε κάθε pixel Χώρος = H x W x B (σε bits)

Για εικόνες τόνων γκρίζου, συνήθως: Οι διαστάσεις είναι H = W = 2M, Μ = 9 (512 x 512 pixels) B = 8 (256 επίπεδα φωτεινότητας γκρίζου) Χώρος = B x 2M x 2M

= 8 x 218 = 2097152 bits = 0.4 Mbytes

Για βίντεο, συνήθως έχουμε 30 πλαίσια (καρέ εικόνας) να μεταδίδονται ανά δευτερόλεπτο. Χρησιμοποιώντας μια τεχνική για μείωση των αναγκών σε bandwidth (Πεπλεγμένη Σάρωση 2:1 - Interlaced Scanning 2:1), μια κινούμενη γκρι εικόνα με τις παραπάνω διαστάσεις και επίπεδα φωτεινότητας απαιτεί περίπου 7.5 Mbytes για 1 δευτερόλεπτο βίντεο

Για μια έγχρωμη ταινία 2 ωρών χρειάζονται περίπου 27000 Mbytes. Η ποσότητα αυτή είναι υπερβολική. Για αυτό χρειάζονται τεχνικές μείωσης των αναγκών σε αποθηκευτικό χώρο και bandwidth

Συμπίεση (θα τη δούμε σε άλλα κεφάλαια)

Page 43: Εισαγωγή

43Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Η Επανάσταση Της Ψηφιακής Εικόνας (2/4)

Τα συστήματα ΨΕΕ κατά κανόνα χρησιμοποιούν Καρτεσιανή (ορθογώνια) δειγματοληψία. Δηλαδή οι εικόνες αναπαριστούνται ως πίνακες με σειρές και στήλες. Τα pixels δεικτοδοτούνται με βάση τον αριθμό στήλης και γραμμής όπου βρίσκονται Γιατί; Για απλοποίηση των αλγορίθμων

Εντούτοις, η «δειγματοληψία» στον αμφιβληστροειδή χιτώνα του ανθρώπινου ματιού προσεγγίζεται περισσότερο από εξαγωνική δειγματοληψία, όπου τα pixels είναι πιο συμπαγή μεταξύ τους

Εξαγωνικές εικόνες μπορούν επίσης να αναπαρασταθούν ως πίνακες με σειρές και στήλες, αλλά οι άξονες δεν είναι ορθογώνιοι

Οι εξαγωνικές εικόνες έχουν πλεονεκτήματα:– Δεν υπάρχει αμφιλεγόμενη διασύνδεση (θα το δούμε στην επόμενη διαφάνεια)– Είναι ευκολότερη η υλοποίηση κυκλικά συμμετρικών τελεστών

Page 44: Εισαγωγή

44Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Η Επανάσταση Της Ψηφιακής Εικόνας (3/4)

Παράδοξα Σύνδεσης (Connectivity Paradoxes) Σύνδεση: αφορά τον τρόπο με τον οποίο αποφασίζουμε κατά πόσον

ένα pixel είναι ενωμένο με κάποιο άλλο. Τα Παράδοξα Σύνδεσης συχνά συγχύζουν αλγόριθμους οι οποίοι

χρησιμοποιούν περιγράμματα. Πως αποφασίζουμε αν ένα pixel είναι ενωμένο με κάποια

άλλα; Δύο τρόποι: 4 – Connectivity: το pixel συνδέεται

μόνο με τα 4 γειτονικά του pixelπάνω, κάτω, αριστερά και δεξιά.

8 – Connectivity: το pixel συνδέεταιμε τα 8 γειτονικά pixel που τοπεριτριγυρίζουν.

Page 45: Εισαγωγή

45Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Η Επανάσταση Της Ψηφιακής Εικόνας (4/4)

Προβλήματα που Δημιουργούνται:Ας υποθέσουμε ότι θέλουμε να διεξάγουμε

κάποια λειτουργία στον διπλανό κύκλοβασιζόμενοι στο περίγραμμά του. Χρησιμοποιώντας 4 – Connectivity:

Η λειτουργία θα θεωρήσει τον κύκλο ως 4 ασύνδετα τμήματα Χρησιμοποιώντας 8 – Connectivity:

Τα μπλε pixels θεωρούνται συνδεδεμένα, όμως το ίδιο και τα άσπρα: επικάλυψη μεταξύ συνδεδεμένων τμημάτων !

Πιθανή λύση: 4-Connectivity στο φόντο, 8-Connectivity στον κύκλο

4-Connectivity 8-Connectivity

Η εξαγωνική Η εξαγωνική δειγματοληψίδειγματοληψί

α δενα δενυποφέρει από υποφέρει από

τέτοιου τέτοιου είδους είδους

ασάφειες:ασάφειες:

Page 46: Εισαγωγή

46Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Χρώμα

Μια έγχρωμη εικόνα αναπαρίσταται ως διάνυσμα τιμών. Σε κάθε pixel έχουμε τρεις τιμές φωτεινότητας: Κόκκινο, Πράσινο και Μπλε.

Αυτό συνήθως εκφράζεται ως τρεις διαφορετικές εικόνες: μια για το Κόκκινο, μια για το Πράσινο και μια για το Μπλε χρώμα. Η αναπαράσταση αυτή ονομάζεται RGB. Υπάρχουν και άλλες, όπως η HSL και η CMYK.

=+

+Έγχρωμη Εικόνα

Μπλε Εικόνα

Πράσινη Εικόνα

Κόκκινη Εικόνα(Στις παραπάνω τρεις εικόνες το λευκό χρώμα είναι ψηλή φωτεινότητα, και το μαύρο χαμηλή)

Συνήθως επεξεργαζόμαστε την εικόνα συνολικής φωτεινότητας (intensity image) I = R + G + B.

Οι περισσότεροι αλγόριθμοι οι οποίοι χρησιμοποιούν χρώμα, επεξεργάζονται τις RGB εικόνες ξεχωριστά ως εικόνες τόνων γκρίζου και έπειτα τις προσθέτουν για να πάρουν το τελικό αποτέλεσμα.

Page 47: Εισαγωγή

47Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κάρτες Συλλογής Πλαισίων (Frame Grab Boards)

Υπάρχουν κάρτες συλλογής πλαισίων για μικρούς και μεγάλους υπολογιστές και για διαφορετικά περιβάλλοντα εργασίας Κάρτες με FIFO Buffers – συνήθως 1 μέχρι 8 Kb μνήμη Με ενσωματωμένη μνήμη – αρκετά Megabytes (Matrox Meteor II: 4MB SGRAM)

Τέτοιες κάρτες συνήθως υποστηρίζουν: Είσοδο βίντεο RS-170 Συνεχής ψηφιοποίηση εικόνας στα 30 πλαίσια ανά δευτερόλεπτο Επαναδιαμόρφωση ψηφιακού βίντεο για προβολή σε οθόνη Αποθήκευση εικόνων σε ενσωματωμένη στην συσκευή μνήμη (on-board memory) Διεξαγωγή ορισμένων βασικών λειτουργιών επεξεργασίας εικόνας

Μερικές εταιρείες: Matrox (http://www.matrox.com/) Imaging Technology, Inc. Datacube Data Translation

Page 48: Εισαγωγή

48Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αναπαράσταση Και Αποθήκευση Ψηφιακής Εικόνας (1/4)

Όπως είπαμε, μια εικόνα αποθηκεύεται συνήθως ως ένας πίνακας από ακέραιους αριθμούς

Χρήση πινάκων για αναπαράσταση ψηφιακής εικόνας Έστω τετραγωνικός πίνακας εικόνας

I = [ I(i, j); 0 ≤ i, j ≤ N-1 ]

Ο δείκτης i αντιπροσωπεύει αριθμό γραμμής στον πίνακα

Ο δείκτης j αντιπροσωπεύει αριθμό στήλης στον πίνακα Αυτό είναι σε αντίθεση με την συνήθη σημειογραφία των μαθηματικών,

όπου χρησιμοποιούμε συνήθως την σύμβαση I(x,y), με το x να υποδηλώνει τον αριθμό στήλης και το y να υποδηλώνει τον αριθμό γραμμής.

Το I(i,j) αντιπροσωπεύει την τιμή του pixel στην γραμμή i, στήλη j

Page 49: Εισαγωγή

49Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αναπαράσταση Και Αποθήκευση Ψηφιακής Εικόνας (2/4)

Μορφή Πίνακα Εικόνας Διαστάσεων NxN

I = I(0, 0) I(0, 1)

I(1, 0) I(1, 1)···

···

I(N-1, 0)

· · ·

· · ·

· · ·

)

)···

I(N-1, N-1)

I(0, N-1

I(1, N-1

I(N-1, 1)

Πίνακας Εικόνας Διαστάσεων NxN με Τιμές Pixel

Page 50: Εισαγωγή

50Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αναπαράσταση Και Αποθήκευση Ψηφιακής Εικόνας (3/4)

Ο αριθμός των Bits ανά pixel ο οποίος χρησιμοποιείται καθορίζει το πλήθος χρωμάτων (ή φωτεινότητας) τα οποία μπορεί να πάρει. 4 bits: εικόνες 16 χρωμάτων 8 bits: εικόνες 256 χρωμάτων ή εικόνες τόνων γκρίζου 16, 24, 32 bits: εικόνες πραγματικού χρώματος

κλπ 2 bits ανά pixel: δυαδικές εικόνες (binary images)

Περιέχουν μόνο δύο χρώματα (συνήθως άσπρο και μαύρο) Θα μας απασχολήσουν περισσότερο στο κεφάλαιο 2.

Page 51: Εισαγωγή

51Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αναπαράσταση Και Αποθήκευση Ψηφιακής Εικόνας (4/4)

Μορφή πίνακα δυαδικής εικόνας (δεξιά)

· · ·· · ·· · ·· · ·

· · ·

· ·

·

columns

rows

· ·

··

· ·

· ·

··

· ·

· ·

··

· ·

· ·

··

· ·

· ·

·

Image I

0 0

00

1 0 1 1 1 1 1 1

0

0

0

0 0 1 1 1 1 1 1

0 0 0 0 1 1 1 1 1

0 1 1 0 1 0 1 1 1

0 0 0 0 1 1 1 1 1

10

23

N-1

0 1 2 3 4 5 6 7 8 N-1

· · ·· · ·· · ·· · ·

· · ·

· ·

·

columns

rows

· ·

·

· ·

·

· ·

·

· ·

·

· ·

·

· ·

·

· ·

·

· ·

·

· ·

·

Image I

10

23

N-1

0 1 2 3 4 5 6 7 8 N-1

Εναλλακτικός τρόπος απεικόνισης πίνακα δυαδικής εικόνας (αριστερά)

Page 52: Εισαγωγή

52Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παρατηρήσεις

Οι εικόνες φωτεινότητας τόνων γκρίζου (grey-level images) τυγχάνουν χειρισμού ως πίνακες ακεραίων στους οποίους διεξάγονται αριθμητικές λειτουργίες

Οι δυαδικές εικόνες τυγχάνουν χειρισμού (συνήθως) ως λογικοί πίνακες πάνω στους οποίους εφαρμόζονται λογικοί τελεστές και λειτουργίες Στις σημειώσεις του μαθήματος ακολουθείται η σύμβαση:

– Λογική τιμή 1 = Μαύρο– Λογική τιμή 0 = Άσπρο

Στο MATLAB και στις πλείστες εφαρμογές ΨΕΕ χρησιμοποιείται το ανάποδο: 1 = Άσπρο, 0 = Μαύρο.

– Αυτό μπορεί να αλλάξει με την κατάλληλη εντολή

Page 53: Εισαγωγή

53Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Τέλος Πρώτου Κεφαλαίου

1. Εισαγωγή

2. Τύποι Εικόνων

3. Γεωμετρία Απεικόνισης

4. Όργανα Απεικόνισης

5. Απόκτηση Εικόνας

6. Αναπαράσταση Εικόνας

Page 54: Εισαγωγή

54Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

ΕΠΛ 445 – Ψηφιακή Επεξεργασία Εικόνας

Κεφάλαιο 2

Εισαγωγή

Page 55: Εισαγωγή

55

Δυαδική Επεξεργασία Εικόνας

Δημιουργία Δυαδικών Εικόνων Λογικές Λειτουργίες Χρωματισμός Μερών Δυαδική Μορφολογία Συμπίεση Δυαδικής Εικόνας

Κεφάλαιο 2

Page 56: Εισαγωγή

56Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Δυαδικές Εικόνες (1/4)

Μια ψηφιακή εικόνα είναι ένας πίνακας από αριθμούς: δείγματα από τη φωτεινότητα της εικόνας

Κάθε επίπεδο φωτεινότητας κβαντοποιείται: του δίνεται ένας αριθμός από κάποιο πεπερασμένο σύνολο αριθμών (γενικά ακέραιοι αριθμοί με δείκτες από 0 μέχρι K-1)

Page 57: Εισαγωγή

57Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Πίνακας εικόνας 10 x 10 γκρι-επιπέδων φωτεινότητας

rows

columns

Δυαδικές Εικόνες (2/4)

Page 58: Εισαγωγή

58Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Υπάρχουν K = 2^Β πιθανά επίπεδα φωτεινότητας Κάθε στίγμα αντιπροσωπεύεται από B bits Οι δυαδικές εικόνες έχουν B = 1

Μια 10 x 10 δυαδική εικόνα

Δυαδικές Εικόνες (3/4)

Page 59: Εισαγωγή

59Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Πως εμφανίζονται οι δυαδικές εικόνες;

Δυαδικό = δύο-τιμές

‘1’ = μαύρο

‘0’ = άσπρο

Οι λογικές τιμές 0 ή 1 συνήθως δείχνουν την απουσία ή την παρουσία σε κάποιο χαρακτηριστικό της εικόνας σε μια εικόνα γκρι-επιπέδων φωτεινότητας: Σημεία από υψηλή ή χαμηλή ένταση Σημεία όπου ένα αντικείμενο είναι παρόν ή απόν Αφηρημένα χαρακτηριστικά όπως ομαλότητα σε αντίθεση με

μη ομαλότητα

Δυαδικές Εικόνες (4/4)

Page 60: Εισαγωγή

60Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Δημιουργία Δυαδικών Εικόνων (1/2)

Είσοδος με Βάση Πινακίδα Οι δυαδικές εικόνες μπορούν να παραχθούν από ένα

απλό όργανο αίσθησης με δυαδική έξοδο Απλούστερο παράδειγμα: πινακίδα, resistive pad με

πέννα φωτός Όλα τα στίγματα αρχικά παίρνουν την τιμή ‘0’

I = [I(i, j)], I(i, j) = '0' για όλα (i, j) = (γραμμές,στήλες)

Page 61: Εισαγωγή

61Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Δημιουργία Δυαδικών Εικόνων (2/2)

Όταν πίεση η φως πέφτει πάνω στο (i0, j0), η εικόνα παίρνει την τιμή '1':

I(i0, j0) = ‘1’ Αυτό συνεχίζεται μέχρι ο χρήστης τελειώσει το σχέδιο

Χρήσιμο για σχέδια μηχανικών, καταχώρηση χειρόγραφων χαρακτήρων, κλπ.

Page 62: Εισαγωγή

62Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κατωφλίωση Γκρι-επιπέδων Φωτεινότητας (1/24)

Συνήθως μια δυαδική εικόνα δημιουργείται από μια γκρι-επιπέδων εικόνα

Πλεονεκτήματα B-fold μείωση στον χώρο αποθήκευσης Απλή αφαιρετικότητα των πληροφοριών Γρήγορη επεξεργασία – λογικές λειτουργίεςΜπορεί να συμπιεστεί περισσότερο

Page 63: Εισαγωγή

63Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Απλή Κατωφλίωση Η απλούστερη λειτουργία στην επεξεργασία εικόνας Μια ακραία μορφή κβαντοποίησης γκρι-επιπέδων

φωτεινότητας Ορίζουμε ένα ακέραιο κατώφλι T (στην περιοχή της

γκρι-κλίμακας επιπέδων φωτεινότητας) Συγκρίνουμε την ένταση κάθε στίγματος με το T

Κατωφλίωση Γκρι-επιπέδων Φωτεινότητας (2/24)

Page 64: Εισαγωγή

64Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κατωφλίωση

Ας υποθέσουμε ότι μια γκρι-επιπέδων εικόνα I έχει K γκρι-επίπεδα φωτεινότητας: 0, 1, 2, ...., K-1 Επιλέγουμε το κατώφλι T T ανήκει { 0, 1, 2, ...., K-1} Συγκρίνουμε κάθε επίπεδο φωτεινότητας στην γκρι-

επιπέδων εικόνα I με το T

Κατωφλίωση Γκρι-επιπέδων Φωτεινότητας (3/24)

Page 65: Εισαγωγή

65Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ορίζουμε μια νέα δυαδική εικόνα J ως ακολούθως

J(i, j) = '0' εάν I(i, j) ≥ T

J(i, j) = '1' εάν I(i, j) < T Μια νέα δυαδική εικόνα J δημιουργείται από την γκρι-

επιπέδων εικόνα I

I JThreshold

T

Κατωφλίωση Γκρι-επιπέδων Φωτεινότητας (4/24)

Page 66: Εισαγωγή

66Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Επιλογή Κατωφλίου Η ποιότητα της δυαδικής εικόνας J που παίρνουμε από

την κατωφλίωση της εικόνας I, εξαρτάτε πάρα πολύ από το κατώφλι T

Πραγματικά είναι πολύ χρήσιμο να παρατηρήσουμε τα αποτελέσματα κατωφλίωσης μιας εικόνας σε πολλά διαφορετικά επίπεδα σε σειρά

Διαφορετικά κατώφλια μπορούν να δημιουργήσουν διαφορετικές σημαντικές εικόνες αφαιρετικότητας

Κατωφλίωση Γκρι-επιπέδων Φωτεινότητας (5/24)

Page 67: Εισαγωγή

67Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μερικές εικόνες δεν δίνουν ενδιαφέροντα αποτέλεσματα όταν κατωφλιώνονται με οποιοδήποτε Τ

Επομένως: Πως αποφασίζει κάποιος αν είναι δυνατή η κατωφλίωση;

Πως αποφασίζει κάποιος για το κατώφλι Τ;

Παράδειγμα κατωφλίωσης στο MATLABI = imread(‘exampleim.tif’);b = im2bw(I,map,0.4);figure1,imshow(I,map);figure2, imshow(b);

Κατωφλίωση Γκρι-επιπέδων Φωτεινότητας (6/24)

Page 68: Εισαγωγή

68Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ιστόγραμμα Γκρι-Επιπέδων Εικόνας Το Ιστόγραμμα HI της εικόνας Ι είναι μια γραφική

παράσταση κάθε πεδίου φωτεινότητας στην εικόνα Ι Το HI είναι μια μονοδιάστατη συνάρτηση με πεδίο

ορισμού 0, ... , K-1 HI(k) = n αν I περιέχει ακριβώς n φορές το επίπεδο

φωτεινότητας k, για κάθε k = 0, ... K-1

Κατωφλίωση Γκρι-επιπέδων Φωτεινότητας (7/24)

Page 69: Εισαγωγή

69Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εμφάνιση Ιστογράμματος Η εμφάνιση του ιστογράμματος φανερώνει πολλά

στοιχεία για την εικόνα

H I (k)

0 K-1gray level k

predominantlydark image

Κατωφλίωση Γκρι-επιπέδων Φωτεινότητας (8/24)

Page 70: Εισαγωγή

70Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα ιστογράμματος σκοτεινής εικόνας

Κατωφλίωση Γκρι-επιπέδων Φωτεινότητας (9/24)

Page 71: Εισαγωγή

71Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αυτά μπορεί να είναι τα ιστογράμματα από μια υποφωτισμένη - σκοτεινή και μια υπερφωτισμένη - φωτεινή εικόνα, αντίστοιχα

H I (k)

0 K-1gray level k

predominantlylight image

Κατωφλίωση Γκρι-επιπέδων Φωτεινότητας (10/24)

Page 72: Εισαγωγή

72Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αυτό το ιστόγραμμα δείχνει καλύτερη χρήση της περιοχής της γκρι-κλίμακας πεδίων φωτεινότητας

H I (k)

0 K-1gray level k

well-distributedhistogram

Κατωφλίωση Γκρι-επιπέδων Φωτεινότητας (11/24)

Page 73: Εισαγωγή

73Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα ιστογράμματος καλής κατανομής

Κατωφλίωση Γκρι-επιπέδων Φωτεινότητας (12/24)

Page 74: Εισαγωγή

74Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ιστόγραμμα Δύο Κατανομών Η κατωφλίωση συνήθως δουλεύει καλύτερα όταν

υπάρχουν σκούρα αντικείμενα σε φωτεινό φόντο Ή όταν υπάρχουν φωτεινά αντικείμενα σε ένα

σκοτεινό φόντο Οι εικόνες αυτού του τύπου τείνουν να έχουν

ιστογράμματα με πολλές διακριτές κορυφές Αν οι κορυφές είναι καλά χωρισμένες, η επιλογή του

κατωφλίου είναι εύκολη

Κατωφλίωση Γκρι-επιπέδων Φωτεινότητας (13/24)

Page 75: Εισαγωγή

75Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

H I (k)

0 K-1gray level k

bimodal histogrampoorly separated

Κατωφλίωση Γκρι-επιπέδων Φωτεινότητας (14/24)

Page 76: Εισαγωγή

76Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα ιστογράμματος κακώς διαχωρισμένου

Κατωφλίωση Γκρι-επιπέδων Φωτεινότητας (15/24)

Page 77: Εισαγωγή

77Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Το κατώφλι T καθορίζεται κάπου μεταξύ των κορυφών. Μπορεί να είναι μια διαδικασία προσπάθειας και λάθους

H I (k)

0 K-1gray level k

bimodal histogramwell separated peaks

Κατωφλίωση Γκρι-επιπέδων Φωτεινότητας (16/24)

Page 78: Εισαγωγή

78Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα ιστογράμματος καλά διαχωρισμένου

Κατωφλίωση Γκρι-επιπέδων Φωτεινότητας (17/24)

Page 79: Εισαγωγή

79Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Επιλογή Κατωφλίου από το Ιστόγραμμα Τοποθετώντας το κατώφλι T μεταξύ κορυφών μπορεί

να οδηγήσει σε επιθυμητά αποτελέσματα Ακριβώς που μεταξύ μπορεί να είναι δύσκολο να

βρεθεί

H I (k)

0 K-1gray level k

thresholdselection

thresholdT

Κατωφλίωση Γκρι-Επιπέδων Φωτεινότητας (18/24)

Page 80: Εισαγωγή

80Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ένα ιστόγραμμα εικόνας μπορεί να περιέχει πολλές κορυφές. Τοποθετώντας το κατώφλι σε διαφορετικά σημεία δημιουργεί πολύ διαφορετικά αποτελέσματα.

H I (k)

0 K-1gray level k

multi-modalhistogram

T ? T ?

Κατωφλίωση Γκρι-επιπέδων Φωτεινότητας (19/24)

Page 81: Εισαγωγή

81Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Το ιστόγραμμα μπορεί να είναι ‘επίπεδο’ κάνοντας την επιλογή κατωφλίου δύσκολη

H I (k)

0 K-1gray level k

flat histogram

Κατωφλίωση Γκρι-επιπέδων Φωτεινότητας (20/24)

Page 82: Εισαγωγή

82Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συζήτηση για τους τύπους Ιστογράμματος Θα επιστρέψουμε στο ιστόγραμμα μετά, μέσα στα πλαίσια

των ποσοτικών ιδιοτήτων των γκρι-πεδίων φωτεινότητας.

Τα ιστογράμματα που περιέχουν δύο κατανομές συχνά δείχνουν αντικείμενα σε φόντο με σημαντική διαφορά στην μέση φωτεινότητα.

Τα ιστογράμματα που περιέχουν δύο περιοχές κατανομών κατωφλιώνονται πολύ εύκολα.

Κατωφλίωση Γκρι-Επιπέδων Φωτεινότητας (21/24)

Page 83: Εισαγωγή

83Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Το αποτέλεσμα της κατωφλίωσης ενός ιστογράμματος που περιέχει δύο κατανομές είναι ιδανικά, μια απλή δυαδική εικόνα που δείχνει τον διαχωρισμό του αντικειμένου με το φόντο

Παράδειγμα εικόνες από: ΕκτυπωτήΚύτταρα αίματος σε διάλυμαΜηχανικά εργαλεία σε μια γραμμή

συναρμολόγησης

Κατωφλίωση Γκρι-επιπέδων Φωτεινότητας (22/24)

Page 84: Εισαγωγή

84Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Τα ιστογράμματα με πολλές περιοχές διαφορετικών κατανομών δημιουργούνται συχνά όταν η εικόνα περιέχει διαφορετικά αντικείμενα από διαφορετικούς μέσους όρους φωτεινότητας σε ένα ομογενές φόντο.

Τα επίπεδα ιστογράμματα συνήθως δηλώνουν πιο πολύπλοκες εικόνες, περιέχοντας λεπτομέρειες, με μη-ομοιογενές φόντο, κ.λ.π

Κατωφλίωση Γκρι-Επιπέδων Φωτεινότητας (23/24)

Page 85: Εισαγωγή

85Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Η κατωφλίωση σπάνια δίνει καλά αποτελέσματα. Συνήθως, μερικοί τύποι διόρθωσης μέρους της εικόνας πρέπει να χρησιμοποιηθούν

Θα μελετήσουμε τεχνικές διόρθωσης μέρους της εικόνας αργότερα σε αυτό το κεφάλαιο

Κατωφλίωση Γκρι-επιπέδων Φωτεινότητας (24/24)

Page 86: Εισαγωγή

86Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λογικές Λειτουργίες Σε Δυαδικές Εικόνες

Για τις δυαδικές εικόνες που θα χρησιμοποιήσουμε δεν χρειάζεται να δείξουμε την ψηφιοποίηση τους σε στίγματα.

Page 87: Εισαγωγή

87Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βασικές Λογικές Λειτουργίες (1/5)

Λογικό Συμπλήρωμα:NOT(X1) = complement of X1

X1

1 0

10

NOT( )X1

ΠΙΝΑΚΑΣ ΑΛΗΘΕΙΑΣ

Page 88: Εισαγωγή

88Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λογικό ΚΑΙ:AND (X1, X2) = X1 Λ X2

X1

0

X2 X1 X2

0 0

0 1 0

1 0 0

1 1 1

ΠΙΝΑΚΑΣ ΑΛΗΘΕΙΑΣ

Βασικές Λογικές Λειτουργίες (2/5)

Page 89: Εισαγωγή

89Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λογικό Ή:OR (X1, X2) = X1 V X2

X1 X2X1

0

X2

0 0

0 1 1

1 0 1

1 1 1

ΠΙΝΑΚΑΣ ΑΛΗΘΕΙΑΣ

Βασικές Λογικές Λειτουργίες (3/5)

Page 90: Εισαγωγή

90Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Δυαδική Πλειοψηφία:(περιττός # μεταβλητών μόνο)

X1 X2

0 0 0

0 0 1

0 1 0

0 1 1

X3 MAJ(X1, X2, X3)0

0

0

1

1 0 0

1 0 1

1 1 0

1 1 1

0

1

1

1

ΠΙΝΑΚΑΣ ΑΛΗΘΕΙΑΣ

Βασικές Λογικές Λειτουργίες (4/5)

Page 91: Εισαγωγή

91Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ιδιότητες Άλγεβρας Boole: NOT [NOT(X)] = X X1ΛX2ΛX3 = (X1ΛX2)ΛX3 = X1Λ(X2ΛX3) X1VX2VX3 = (X1VX2)VX3 = X1V(X2VX3) X1ΛX2 = X2ΛX1 X1VX2 = X2VX1 (X1ΛX2)VX3 = (X1VX3)Λ(X2VX3) (X1VX2)ΛX3 = (X1ΛX3)V(X2ΛX3) NOT(X1ΛX2) = NOT(X1)VNOT(X2) NOT(X1VX2) = NOT(X1)ΛNOT(X2)

Βασικές Λογικές Λειτουργίες (5/5)

Page 92: Εισαγωγή

92Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λογικές Λειτουργίες στις Εικόνες (1/9)

Το συμπλήρωμα μιας εικόνας:

J1 = NOT( I1), if J1(i, j) = NOT[ I1(i, j) ] for all (i, j)

Αυτό αντιστρέφει την αντίθεση - δημιουργεί ένα

δυαδικό αρνητικό.

Page 93: Εισαγωγή

93Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λογικές Λειτουργίες στις Εικόνες (2/9)

Η τομή δυο εικόνων:J2 = AND(I1, I2) = I1 Λ I2,

if J2(i, j) = AND[ I1(i, j), I2(i, j) ] for all (i, j)

I 1 I 2 J = I 1 I 22

Δείχνει την επικάλυψη των ΜΑΥΡΩΝ περιοχών στις

εικόνες I1 και I2.

Page 94: Εισαγωγή

94Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λογικές Λειτουργίες στις Εικόνες (3/9)

Η ένωση δυο εικόνων:J3 = OR(I1, I2) = I1 V I2,

if J3(i, j) = OR[ I1(i, j), I2(i, j) ] for all (i, j)

I 1 I 2 J = I 1 I 23

Δείχνει την επικάλυψη των ΛΕΥΚΩΝ περιοχών στις

εικόνες I1 και I2.

Page 95: Εισαγωγή

95Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λογικές Λειτουργίες στις Εικόνες (4/9)

Παράδειγμα:Μια γραμμή-συναρμολόγησης ελεγχόμενη από σύστημα

εικόνας. Παρόμοιο με πολλά συστήματα της βιομηχανίας

camera computer

stored model image

I model

Iacquired image

conveyer

Page 96: Εισαγωγή

96Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λογικές Λειτουργίες στις Εικόνες (5/9)

Στόχος:Αριθμητική σύγκριση της αποθηκευμένης εικόνας

Imodel και της εικόνας λήψης I.

I model I

Παρατηρούμε ότι το αντικείμενο στην εικόνα I έχει

μετακινηθεί πολύ λίγο.

Page 97: Εισαγωγή

97Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λογικές Λειτουργίες στις Εικόνες (6/9)

Λογικό ΚΑΙ:Όπως φαίνεται και στο πιο κάτω σχήμα το λογικό ΚΑΙ

θα μας δώσει την επικάλυψη:

I model I

Page 98: Εισαγωγή

98Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λογικές Λειτουργίες στις Εικόνες (7/9)

Μια μέτρηση της μετακίνησης δίνεται από το

exclusive or (XOR).

XOR(I,Imodel)= OR{AND[Imodel,NOT(I)],AND[NOT(Imodel), I ]}

I model INOT( ) II modelNOT( )

Page 99: Εισαγωγή

99Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λογικές Λειτουργίες στις Εικόνες (8/9)

XOR(I, Imodel)

Το XOR δείχνει που είναι το λάθος της μετακίνησης.

Page 100: Εισαγωγή

100Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λογικές Λειτουργίες στις Εικόνες (9/9)

Για να αποφασίσουμε κατά πόσο υπάρχει πρόβλημα, ήελάττωμα, έχουμε το λόγο ή την ποσοστιαία αναλογία:

PERCENT = [#μαύρων στιγμάτων XOR(I, Imodel)] / [#άσπρων στιγμάτων Imodel]

Αυτό το ποσοστό μπορεί να συγκριθεί με μια προ-υπολογισμένη ανοχή, έστω P, στο σφάλμα της εκατοστιαίας αναλογίας.Αν Percent > P, τότε το εξάρτημα μπορεί είτε να είναι ελαττωματικό, είτε λανθασμένα τοποθετημένο.

Page 101: Εισαγωγή

101Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Blob Coloring Χρωματισμός Μερών

Είναι μια απλή τεχνική για ταξινόμηση κάποιας περιοχής της εικόνας, καθώς επίσης και διόρθωσης της.

Κίνητρο: Η κατωφλίωση εικόνων γκρι δημιουργεί συνήθως μια ατελή δυαδική εικόνα, όπου υπάρχουν:

Άσχετα μέρη ή οπές λόγο θορύβου. Άσχετα μέρη από κατωφλίωση αντικειμένων μικρού ενδιαφέροντος. Μη ομαλή ανάκλαση επιφάνειας αντικειμένου.

Page 102: Εισαγωγή

102Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Χρωματισμός Μερών

Συνήθως είναι επιθυμητό να εξάγουμε ένα μικρό

αριθμό αντικειμένων ή ένα μόνο αντικείμενο μετά την

κατωφλίωση.

typical thresholdedimage result

Page 103: Εισαγωγή

103Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Χρωματισμός Μερών (1/2)

Αλγόριθμος:Έστω δυαδική εικόνα Ι. Ορίζουμε σαν μια έγχρωμη περιοχή, τον πίνακα R: R(i, j) = αριθμός περιοχής από στίγματα I(i, j) Αρχικά θέτουμε R = 0 και k = 1, όπου k = μετρητής αριθμού περιοχής Στη συνέχεια θα σαρώσουμε την εικόνα μας από αριστερά προς δεξιά και από πάνω προς τα κάτω, και θα υπολογίσουμε τα εξής:

Page 104: Εισαγωγή

104Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Χρωματισμός Μερών (2/2)

if I(i, j) = 1 and I(i, j-1) = 0 and I(i-1, j) = 0 then set R(i, j) = k and k = k + 1; if I(i, j) = 1 and I(i, j-1) = 0 and I(i-1, j) = 1 then set R(i, j) = R(i-1, j); if I(i, j) = 1 and I(i, j-1) = 1 and I(i-1, j) = 0 then set R(i, j) = R(i, j-1); if I(i, j) = 1 and I(i, j-1) = 1 and I(i-1, j) = 1 then set R(i, j) = R(i-1, j);

if R(i, j-1) ≠ R(i-1, j) then set R(i, j-1), R(i-1, j) as equals

Ενημέρωση ολων των περιοχών που είναι ισοδύναμες

Page 105: Εισαγωγή

105Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Χρωματισμός Μερών Παράδειγμα

Από το

παράδειγμα αυτό

βλέπουμε ότι το

χρώμα του

μεγαλύτερου

μέρους είναι το 2.

blob coloring result

12

3

4

5

blob counting result

79311346

1327171

312

Page 106: Εισαγωγή

106Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αφαίρεση ασήμαντων περιοχών (1/5)

Θέτουμε m = "χρώμα" της μεγαλύτερης περιοχής

Ενώ σαρώνουμε την εικόνα από αριστερά προς δεξιά και από πάνω προς τα κάτω υπολογίζουμε

if I( i, j) = 1 and R( i, j) ≠ m

then set I( i, j) = 0;

Page 107: Εισαγωγή

107Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αφαίρεση ασήμαντων περιοχών (2/5)

minor region removal

Μετά από την αφαίρεση των ασήμαντων περιοχών!

Η διαδικασία δεν έχει τελειώσει ακόμα! Για να πάρουμε ένα συνεκτικό, συνδεδεμένο αντικείμενο επαναλαμβάνουμε την διαδικασία στα ΛΕΥΚΑ στίγματα.

Page 108: Εισαγωγή

108Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αφαίρεση ασήμαντων περιοχών (3/5)

Υπολογίζουμε το συμπλήρωμα του τελευταίου αποτελέσματος

complementσυμπλήρωμα

Page 109: Εισαγωγή

109Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αφαίρεση ασήμαντων περιοχών (4/5)

Τότε επαναλαμβάνουμε όλα τα ίδια βήματα:

blob counting126471 673

511821

‘Χρώμα’ του μεγαλύτερου μέρους: 1

Page 110: Εισαγωγή

110Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αφαίρεση ασήμαντων περιοχών (5/5)

minor region removal

complementΣυμπλήρωμα

Απλό και αποτελεσματικό, αλλά δεν τα διορθώνει όλα!

Αφαίρεση ασήμαντων περιοχών

Page 111: Εισαγωγή

111Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Δυαδική Μορφολογία (1/2)

Η πιο δυνατή τάξη από δυαδικές λειτουργίες εικόνων ονομάζεται μαθηματική μορφολογία

Οι μορφολογικές λειτουργίες επηρεάζουν το σχήμα των αντικειμένων και περιοχών στις δυαδικές εικόνες.

Όλη η επεξεργασία γίνεται σε τοπική βάση, δηλαδή περιοχές η μορφές αντικειμένων επηρεάζονται με τοπικό τρόπο.

Page 112: Εισαγωγή

112Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Δυαδική Μορφολογία (2/2)

Μορφολογικές λειτουργίες:Μεγέθυνση - Διαστολή αντικειμένων (Dilate)Σμίκρυνση – Συστολή αντικειμένων (Erode)Ομαλοποίηση ορίων αντικειμένων και

περιορισμός μικρών περιοχών η οπώνΓέμισμα κενών και περιορισμός ‘χερσονήσων’

Όλα κατορθώνονται χρησιμοποιώντας τοπικές λογικές λειτουργίες!

Page 113: Εισαγωγή

113Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Δομικά Στοιχεία ή Παράθυρα Structuring Elements or Windows

Ένα δομικό στοιχείο είναι μια γεωμετρική συσχέτιση μεταξύ στιγμάτων.

Μερικά παραδείγματα δομικών στοιχείων:

Page 114: Εισαγωγή

114Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Οι μορφολογικές λειτουργίες ορίζονται από την μετακίνηση ενός παραθύρου πάνω στη συγκεκριμένη εικόνα, με τέτοιο τρόπο ώστε το παράθυρο να κεντράρεται πάνω σε κάθε ένα από τα στίγματα της

Συνήθως αυτό γίνεται σειρά προς σειρά, στήλη προς στήλη

Το δομικό στοιχείο συχνά αναφέρεται ως κινητό παράθυρο.

Δυαδική Μορφολογία Δομικά Στοιχεία ή Παράθυρα

Page 115: Εισαγωγή

115Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Όταν το δομικό στοιχείο κεντραριστεί πάνω σε μια περιοχή της εικόνας, μια λογική λειτουργία εκτελείται στα στίγματα που καλύπτει το δομικό στοιχείο, οδηγώντας σε μια δυαδική έξοδο πάνω στο κεντρικό στίγμα που καλύπτει το παράθυρο

Συνήθως τα δομικά στοιχεία ορίζονται να έχουν κυκλικά σχήματα, αφού είναι επιθυμητό ότι αντιδρούν με τον ίδιο τρόπο με ένα αντικείμενο ακόμα και αν το αντικείμενο περιστραφεί.

Δυαδική Μορφολογία Δομικά Στοιχεία ή Παράθυρα

Page 116: Εισαγωγή

116Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Δομικά Στοιχεία ή Παράθυρα (1/2)

=>=>

=>=>

=>=>

=>=>

=>=>

=>=> =>=>......

Page 117: Εισαγωγή

117Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Δομικά Στοιχεία ή Παράθυρα (2/2)

=>=>... Μετά από κάποια ενδιάμεσα ... Μετά από κάποια ενδιάμεσα βήματαβήματα

=>=> =>=>

=>=>............

Page 118: Εισαγωγή

118Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Επίσημος Ορισμός Παραθύρων (1/4)

Χρησιμοποιείται επίσης αργότερα για επεξεργασία εικόνων γκρι και βίντεο.

Ένα παράθυρο είναι μια γεωμετρική συσχέτιση η οποία δημιουργεί μια σειρά από μικρογραφικές εικόνες καθώς περνά πάνω από την εικόνα διαδοχικά σειρά προς σειρά, στήλη προς στήλη (Ακολουθιακή Υλοποίηση).

Στην παράλληλη υλοποίηση, ένας μεγάλος αριθμός από παράθυρα θα καλύπτουν την εικόνα συγχρόνως.

Page 119: Εισαγωγή

119Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Επίσημος Ορισμός Παραθύρων (2/4)

Μερικά τυπικά Μονοδιάστατα Παράθυρα:

ROW(2M+1) και COL(2M+1). Αυτά λειτουργούν σε Σειρές και Στήλες Μόνο Ένα παράθυρο θα καλύπτει πάντα ένα περιττό αριθμό

στιγμάτων 2M+1, διαγώνια συμμετρικά στίγματα με το κεντρικό στίγμα

Οι λειτουργίες φίλτρου ορίζονται συμμετρικά με αυτό τον τρόπο.

ROW(3) ROW(5)

COL(5)COL(3)

Page 120: Εισαγωγή

120Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Επίσημος Ορισμός Παραθύρων (3/4)

Μερικά τυπικά Δυσδιάστατα Παράθυρα:

SQUARE(9) CROSS(5)

SQUARE(25) CROSS(9)CIRC(13)

Page 121: Εισαγωγή

121Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Επίσημος Ορισμός Παραθύρων (4/4)

Τυπικά Δυσδιάστατα Παράθυρα SQUARE(2M+1), CROSS(2M+1), CIRC(2M+1)Αυτά είναι τα πιο κοινά σχήματα παραθύρων .Και πάλι, 2M+1 δείχνει τον περιττό αριθμό

στιγμάτων που καλύπτονται από το παράθυρο.Μπορεί να γενικοποιηθεί σε παράθυρα

οποιουδήποτε-μεγέθους που να καλύπτει 2M+1 στίγματα.

Page 122: Εισαγωγή

122Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συμβολισμός Παραθύρων (1/3)

Ένα παράθυρο είναι: Ένας τρόπος συγκέντρωσης τοπικών

φωτεινοτήτων εικόνας.Ένα σύνολο από μετακινήσεις συντεταγμένων

Bi = (mi, ni) με κέντρο το (0,0):B = {B1, ..., B2M+1} = {(m1, n1),...,

(m2M+1,n2M+1)}

Page 123: Εισαγωγή

123Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συμβολισμός Παραθύρων (2/3)

Παραδείγματα Μονοδιάστατων Παραθύρων Β:B = ROW(2M+1) = {(0, -M), ..., (0, M)}

= {(0, n); n = -M ,..., M}

π.χ B = ROW(3)= {(0, -1), (0, 0), (0, 1)}

B = COL(2M+1) = {(-M, 0), ..., (M, 0)}

= {(m, 0); m = -M ,..., M}

π.χ B = COL(3) = {(-1, 0), (0, 0), (1, 0)}

Page 124: Εισαγωγή

124Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συμβολισμός Παραθύρων (3/3)

Παραδείγματα Δυσδιάστατων Παραθύρων Β:

B = SQUARE (9) = {(-1, -1) , (-1, 0), (-1, 1), (0, -1) , (0, 0), (0, 1),

(1, -1) , (1, 0), (1, 1)} B = CROSS(2M+1) = ROW(2M+1) και

COL(2M+1)

πχ B = CROSS(5) = { (-1, 0), (0, -1), (0, 0), (0, 1),

(1, 0) }

Page 125: Εισαγωγή

125Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σύνολο Παραθύρων (1/3)

Δεδομένης μιας εικόνας Ι και ενός παραθύρου Β ορίζουμε το σύνολο παραθύρων στις συντεταγμένες εικόνας (i, j) ως:

B.I( i, j ) = {I( I + m, j + n); όπου (m, n) Î B

και ( i, j ) Î [0,n-1] }

το οποίο είναι το σύνολο των στιγμάτων εικόνας που καλύπτεται από το παράθυρο όταν έχει κέντρο τις συντεταγμένες (i, j).

Page 126: Εισαγωγή

126Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σύνολο Παραθύρων (2/3)

Παραδείγματα 1D:

B = ROW(3):

B˚I( i, j ) = {I( i, j-1 ) , I( i, j ), I( i, j+1 )}

B = COL(3):

B˚I( i, j ) = {I( i-1, j ) , I( i, j ) , I( i+1, j )}

Page 127: Εισαγωγή

127Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σύνολο Παραθύρων (3/3)

Παραδείγματα 2D:

B = SQUARE (9):B.I( i, j ) = {I( i-1, j-1 ) , I( i-1, j ), I( i-1,

j+1 ), I( i, j-1 ) , I( i, j ), I( i, j+1 ),

I( i+1, j-1 ) , I( i+1, j ), I( i+1, j+1 )}

B = CROSS(5): B.I(i, j) = { I( i-1, j ),

I( i, j-1 ), I( i, j ), I( i, j+1 ), I( i+1, j ) }

Page 128: Εισαγωγή

128Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γενικά Δυαδικά Φίλτρα

Δείχνουμε τις δυαδικές λειτουργίες G στο σύνολο παραθύρου B.I( i, j ) ως εξής:

J( i, j ) = G {B.I( i, j )} =

G{I( I + m, j + n );

όπου (m, n) Î B

και ( i, j ) Î [0,n-1] } Εφαρμόζοντας αυτήν σε κάθε στίγμα της εικόνας,

δίνει μια φιλτραρισμένη εικόνα

J = G[I, B] = [J( i, j ); 0 ≤ i, j ≤ N-1]

Page 129: Εισαγωγή

129Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Επεξεργασία Στα Όρια Της Εικόνας

Το παράθυρο καλύπτει ‘κενό χώρο’

Συνήθως γεμίζουμε τους κενούς χώρους του παραθύρου με την τιμή του κοντινότερου στίγματος της εικόνας. Αυτό λέγεται Επανάληψη.

Page 130: Εισαγωγή

130Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διαστολή, Συστολή Και Μέση Τιμή

Διαστολή - Καλείται έτσι επειδή αυτή η λειτουργία μεγαλώνει το μέγεθος των ΜΑΥΡΩΝ αντικειμένων στην δυαδική εικόνα.

Συστολή - Καλείται έτσι επειδή αυτή η λειτουργία μειώνει το μέγεθος των ΜΑΥΡΩΝ αντικειμένων στην δυαδική εικόνα.

Μέση τιμή - Στην πραγματικότητα πλειοψηφία. Μια ειδική περίπτωση του γκρι-επιπέδου μεσαίου φίλτρου. Κατέχει ποιοτικές ιδιότητες και των δυο, της διαστολής και της συστολής, αλλά γενικά δεν αλλάζει το μέγεθος του αντικειμένου η του φόντου.

Page 131: Εισαγωγή

131Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διαστολή, Συστολή Και Μέση Τιμή

Διαστολή – Δίδεται ένα παράθυρο Β και μια δυαδική εικόνα Ι J1 = DILATE (I, B) αν

J1(i, j) = OR {B˚I(i, j)}

= OR {I(i-m, j-n); (m, n) B}

Συστολή – Δίδεται ένα παράθυρο Β και μια δυαδική εικόνα Ι J2 = ERODE (I, B) αν

J2(i, j) = AND {B˚I(i, j)}

= AND {I(i-m, j-n); (m, n) B}

Μέση τιμή – Δίδεται ένα παράθυρο Β και μια δυαδική εικόνα Ι J3 = MEDIAN (I, B) αν

J3(i, j) = MAJ {B˚I(i, j)}

= MAJ {I(i-m, j-n); (m, n) B}

Page 132: Εισαγωγή

132Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διαστολή

Παράδειγμα 1.

OR

I J

B =

Page 133: Εισαγωγή

133Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διαστολή

Παράδειγμα 2.

It is useful to think of the structuring element as rolling along all of the boundaries of all BLACK objects in the image.

The center point of thestructuring elementtraces out a set of paths.

That form the boundariesof the dilated image.

Page 134: Εισαγωγή

134Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συστολή

Παράδειγμα 1.

AND

I J

B =

Page 135: Εισαγωγή

135Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συστολή

Παράδειγμα 2.

It is useful to think of thestructuring element asrolling inside of theboundaries of all BLACKobjects in the image.

The center point of thestructuring elementtraces out a set of paths.

That form the boundariesof the eroded image.

Page 136: Εισαγωγή

136Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μέση Τιμή

Παράδειγμα 1.

MAJ

I JB =

A

B

C

Το φίλτρο μεσαίου αφαίρεσε το μικρό αντικείμενο Α και την μικρή οπή Β,αλλά δεν άλλαξε το όριο (μέγεθος) της μεγαλύτερης περιοχής C.

Page 137: Εισαγωγή

137Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ποιοτικές Ιδιότητες Διαστολής

1. Αφαιρεί τις πολύ-μικρού μεγέθους οπές του αντικειμένου

DILATE

2. Η διαστολή επίσης αφαιρεί πολύ-στενά κενά ή κόλπους

DILATE

Page 138: Εισαγωγή

138Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ποιοτικές Ιδιότητες Διαστολής

3. Η διαστολή του ΜΑΥΡΟΥ μέρους της εικόνας είναι το ίδιο με την συστολή του ΛΕΥΚΟΥ μέρους!

NOT

NOT

ERODEDILATE

Page 139: Εισαγωγή

139Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ποιοτικές Ιδιότητες Συστολής

1. Αφαιρεί αντικείμενα πολύ - μικρού μεγέθους

ERODE

2. Η συστολή αφαιρεί επίσης πολύ-στενά ‘ακρωτήρια’

ERODE

Page 140: Εισαγωγή

140Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ποιοτικές Ιδιότητες Συστολής

3. Η συστολή του ΜΑΥΡΟΥ μέρους της εικόνας είναι το ίδιο με την διαστολή του ΛΕΥΚΟΥ μέρους!

NOT

DILATE

NOT

ERODE

Page 141: Εισαγωγή

141Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συσχέτιση Συστολής Και Διαστολής

Η συστολή και η διαστολή είναι στην πραγματικότητα η ίδια λειτουργία – έχουν δυική (dual) λειτουργία αναφορικά με το συμπλήρωμα (complementation)

Η συστολή και η διαστολή είναι μόνο αντίστροφες κατά προσέγγιση η μια της άλλης

Η διαστολή μιας ήδη υπό συστολή εικόνας, πολύ σπάνια οδηγεί στην αρχική εικόνα. Κατ’ ακρίβεια η διαστολή δεν μπορεί να Ξαναδημιουργήσει τις χερσονήσους που αφαίρεσε η συστολή, Ξαναδημιουργεί μικρά αντικείμενα που αφαίρεσε η συστολή.

Page 142: Εισαγωγή

142Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συσχέτιση Συστολής και Διαστολής

Η συστολή μιας ήδη υπό διαστολή εικόνας πολύ σπάνια οδηγεί στην αρχική εικόνα. Κατ΄ ακρίβεια, η συστολή δεν μπορεί να Αδειάσει οπές που γέμισαν από την διαστολή, Ξαναδημιουργεί κενά η κόλπους που γέμισαν από την διαστολή.

Page 143: Εισαγωγή

143Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ποιοτικές Ιδιότητες Μέσης τιμής

1. Το φίλτρο μεσαίου αφαιρεί και αντικείμενα και οπές πολύ-μικρού μεγέθους

MEDIAN

2. Το φίλτρο μεσαίου αφαιρεί κενά (κόλπους) και χερσονήσους πολύ-στενές

MEDIAN

Page 144: Εισαγωγή

144Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ποιοτικές Ιδιότητες Μέσης τιμής

3. Το φίλτρο μεσαίου γενικά δεν αλλάζει το μέγεθος των αντικειμένων (παρόλο του ότι αλλάζει αυτά)

4. Το φίλτρο μεσαίου είναι η δυική λειτουργία του εαυτού του, αφού

MEDIAN [ NOT(I) ] = NOT [ MEDIAN(I) ]

5. Έτσι, το φίλτρο μεσαίου απαλύνει το σχήμα.

Μπορούμε επίσης να ορίσουμε και άλλους μηχανισμούς απάλυνσης σχήματος.

Page 145: Εισαγωγή

145Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Άνοιγμα-Κλείσιμο και Κλείσιμο-Άνοιγμα

Πολύ αποτελεσματικοί μηχανισμοί που απαλύνουν εικόνες μπορούν να δημιουργηθούν με την επαναλαμβανόμενη χρησιμοποιήσει των λειτουργιών του Ανοίγματος και του Κλεισίματος.

Για μια εικόνα Ι και ένα δομικό στοιχείο Β, ορίζουμε  OPEN-CLOS(I, B) = OPEN [CLOSE (I, B), B]  CLOS-OPEN(I, B) = CLOSE [OPEN (I, B), B] Αυτές οι λειτουργίες είναι σχετικά όμοιες, όχι όμως

μαθηματικά ταυτόσημες.

Page 146: Εισαγωγή

146Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Open-Close and Close-Open

Και οι δυο αφαιρούν πολύ μικρά στοιχεία χωρίς να επηρεάζουν πολύ το μέγεθος

Και οι δυο είναι παρόμοιες με το φίλτρου μεσαίου όρου, με εξαίρεση το γεγονός απαλύνουν περισσότερο την εικόνα, (για ένα δεδομένο δομικό στοιχείο Β).

Page 147: Εισαγωγή

147Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Open-Close and Close-Open

Αξιοσημείωτες διαφορές μεταξύ Ανοίγματος-Κλεισίματος και Κλεισίματος-Ανοίγματος Το OPEN-CLOS τείνει να ενώσει γειτονικά

αντικείμενα μεταξύ τους Το CLOS-OPEN τείνει να ενώσει γειτονικές οπές

μεταξύ τους

Page 148: Εισαγωγή

148Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Open-Close and Close-Open

Παράδειγμα 1.

O P E N -C L O S

C L O S -O P E N

Page 149: Εισαγωγή

149Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Open-Close and Close-Open

O P E N -C L O S

C L O S -O P E N

Παράδειγμα 2.

Page 150: Εισαγωγή

150Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σκελετοποίηση (1/10)

Η Σκελετοποίηση αποτελεί ένα τρόπος για να πάρουμε τον μεσαίο άξονα η σκελετό μιας εικόνας.

Δεδομένης μίας εικόνας I0 και παραθύρου B, ο σκελετός είναι SKEL(Io, B).

Ορίζουμε In = ERODE [· · · ERODE [ERODE(Io, B), B], · · · B ], n

διαδοχικές εφαρμογές του ERODE στην I0 με δομικό στοιχείο το B.

N = max { n: In ≠ } = empty set Ο μεγαλύτερος αριθμός συστολών πριν την εξαφάνιση της In

Sn = In NOT[OPEN(In, B)]

Page 151: Εισαγωγή

151Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σκελετοποίηση (2/10)

Τότε SKEL(I0, B) = S1 S2 … SN

Το αποτέλεσμα είναι ο σκελετός, ή ο μετασχηματισμός μεσαίου άξονα, ή η συνάρτηση «φωτιά λιβαδιού» (prairie – fire transform).

Page 152: Εισαγωγή

152Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σκελετοποίηση (3/10)

Παράδειγμα 1.

Εικόνα Ι0: Δομικό Στοιχείο Β :

Page 153: Εισαγωγή

153Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σκελετοποίηση (4/10)

SKEL( I0, B):

Page 154: Εισαγωγή

154Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σκελετοποίηση (5/10)

Τα βήματα της εκτέλεσης:Βήμα 1ο

Ι0 NOT[OPEN(I0, B)] S0

Page 155: Εισαγωγή

155Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σκελετοποίηση (6/10)

Βήμα 2ο

Ι1 NOT[OPEN(I1, B)] S1

Page 156: Εισαγωγή

156Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σκελετοποίηση (7/10)

Βήμα 3ο

NOT[OPEN(I2, B)]Ι2 S2

Page 157: Εισαγωγή

157Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σκελετοποίηση (8/10)

NOT[OPEN(I3, B)]Ι3 S3

Βήμα 4ο

Page 158: Εισαγωγή

158Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σκελετοποίηση (9/10)

Βήμα 5ο

SKEL(I0)=S1S2S3S4

Page 159: Εισαγωγή

159Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σκελετοποίηση (10/10)

Παράδειγμα 2.

δυαδική εικόνα σκελετός (του φόντου)

Page 160: Εισαγωγή

160Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα εφαρμογής: Μέτρηση εμβαδού κυττάρων (1/3)

Απλά βήματα επεξεργασίας Εύρεση γενικών περιοχών κυττάρων από απλή

κατωφλίωση – Εφαρμογή τεχνικών διόρθωσης περιοχής

Χρωματισμός μερών

– Αφαίρεση ασήμαντων περιοχών – Κλείσιμο-Άνοιγμα

Απεικόνιση των ορίων του κυττάρου για επαλήθευση λειτουργίας

Page 161: Εισαγωγή

161Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα εφαρμογής:Μέτρηση εμβαδού κυττάρων (2/3)

Απλά βήματα επεξεργασίας Υπολογισμός του εμβαδού των κυττάρων στην

εικόνα με την μέτρηση των στιγμάτων.Υπολογισμός του πραγματικού εμβαδού

χρησιμοποιώντας προβολή Η προηγούμενη χειρονακτική τεχνική μέτρησης

χρειάζεται > 1 ώρα για την ανάλυση κάθε κύτταρου της εικόνας

Page 162: Εισαγωγή

162Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα εφαρμογής:Μέτρηση εμβαδού κυττάρων (3/3)

Ο αλγόριθμος τρέχει σε λιγότερο από ένα δευτερόλεπτο. Χρησιμοποιήθηκε σε > 50,000 εικόνες κύτταρων τα προηγούμενα χρόνια.

Δημοσιεύτηκε στο CRC Press’s Image Analysis in Biology ως η τυποποιημένη μέθοδος για την αυτόματη μέτρηση εμβαδού (Automated Area Measurement).

Page 163: Εισαγωγή

163Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Μήκους διαδρομών (1/7)

Ο αριθμός των bits που χρειάζονται για την αποθήκευση μιας NN δυαδικής εικόνα είναι N2. Σε πολλές περιπτώσεις, αυτό μπορεί να μειωθεί σημαντικά.

Η κωδικοποίηση μήκους διαδρομών είναι γενικά αποδοτική όταν οι ΛΕΥΚΕΣ και ΜΑΥΡΕΣ περιοχές δεν είναι μικρές.

Page 164: Εισαγωγή

164Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Μήκους διαδρομών (2/7)

Πως δουλεύει η κωδικοποίηση μήκους διαδρομών (Run – Length Coding):Οι δυαδικές εικόνες αποθηκεύονται (η

μεταφέρονται) γραμμή-προς-γραμμή (σειρά-προς-σειρά).

Page 165: Εισαγωγή

165Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Μήκους διαδρομών (3/7)

Πώς δουλεύει η κωδικοποίηση μήκους διαδρομών (Συνέχεια) Για κάθε γραμμή της εικόνας, που αριθμείται με m:

– Αποθηκεύουμε την τιμή του πρώτου στίγματος ('0' η '1') στην σειρά m για αναφορά

– Θέτουμε τον μετρητή c = 1 – Για κάθε στίγμα στην εικόνα:

Εξετάζουμε το επόμενο στίγμα στα δεξιά Αν είναι το ίδιο με το τρέχον στίγμα, θέτουμε c = c + 1 Αν είναι διαφορετικό με το τρέχον στίγμα, αποθηκεύουμε το c και

θέτουμε c = 1 Συνεχίζουμε μέχρι να φτάσουμε το τέλος της γραμμής

Page 166: Εισαγωγή

166Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Μήκους διαδρομών (4/7)

Κάθε μήκος-διαδρομών αποθηκεύεται χρησιμοποιώντας b bits. Παράδειγμα 1.

‘1’ 7 5 8 3 1

Page 167: Εισαγωγή

167Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Μήκους διαδρομών (5/7)

Σχόλια για την κωδικοποίηση μήκους διαδρομών Σε μερικές εικόνες μπορεί να δώσει εξαιρετική

συμπίεση χωρίς απώλειες πληροφοριών. Αυτό θα συμβεί αν η εικόνα περιέχει πολλές

διαδρομές του 1's και 0's.

Page 168: Εισαγωγή

168Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Μήκους διαδρομών (6/7)

Αν η εικόνα περιέχει μόνο πολύ μικρές διαδρομές, τότε ο κώδικας μήκους-διαδρομών μπορεί να μεγαλώσει τον χώρο αποθήκευσης. Παράδειγμα 2.

‘1’ 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 11 1 1 1 1 1 1 1

Page 169: Εισαγωγή

169Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Μήκους διαδρομών (7/7)

Σε αυτή την χειρότερη περίπτωση η αποθήκευση πολλαπλασιάζεται με τον αριθμό b.

Κανόνας: Ο μέσος όρος μήκους διαδρόμων L πρέπει να ικανοποιεί την σχέση: L > b.

Page 170: Εισαγωγή

170Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αντιπροσώπευση Περιγράμματος Και Κώδικας Αλυσίδας (1/3)

Μπορούμε να διαχωρίσουμε δυο γενικούς τύπους διάδικων εικόνων: εικόνες περιοχών εικόνες περιγραμμάτων

Εικόνα Περιοχών Εικόνα Περιγραμμάτων

Page 171: Εισαγωγή

171Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αντιπροσώπευση Περιγράμματος Και Κώδικας Αλυσίδας (2/3)

Για τις εικόνες περιγραμμάτων απαιτούμε ειδικότερα:Κάθε ΜΑΥΡΟ στίγμα στην εικόνα περιγράμματος

πρέπει να έχει το πολύ δυο ΜΑΥΡΑ από τα 8 – γειτονικά στίγματα

Ένα ΜΑΥΡΟ στίγμα και 8 - γείτονες

Page 172: Εισαγωγή

172Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αντιπροσώπευση Περιγράμματος Και Κώδικας Αλυσίδας (3/3)

Μία εικόνα περιγράμματος περιέχει μόνο ευθείες και καμπύλες που έχουν πλάτος ένα στίγμα ή και απλά σημεία ενός στίγματος.

Page 173: Εισαγωγή

173Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κώδικας Αλυσίδας (1/7)

Ο κώδικας αλυσίδας είναι μια μέθοδος κωδικοποίησης περιγράμματος υψηλής απόδοσης.

Παρατηρείστε ότι αν οι αρχικές συντεταγμένες (i, j) ενός 8-συνδεδεμένου περιγράμματος είναι γνωστές, τότε τα υπόλοιπα στοιχεία του περιγράμματος μπορούν να κωδικοποιηθούν δίνοντας τις κατευθύνσεις στην οποία το περίγραμμα διαδίδεται.

Page 174: Εισαγωγή

174Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κώδικας Αλυσίδας (2/7)

Παράδειγμα 1.

Περίγραμμα Αρχικό σημείο και Κατευθύνσεις

Page 175: Εισαγωγή

175Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κώδικας Αλυσίδας (3/7)

Για το σκοπό αυτό, χρησιμοποιούμε την ακόλουθη κωδικοποίηση 8-κατευθύνσεων.

0

123

4

5 67

Page 176: Εισαγωγή

176Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κώδικας Αλυσίδας (4/7)

Δεδομένου ότι οι αριθμοί , 1, 2, 3, 4, 5, 6, 7 μπορούν να κωδικοποιηθούν με τα δυαδικά ισοδύναμα τους των 3-bit : 000, 001, 010, 011, 100, 101, 110, 111, η τοποθεσία κάθε σημείου σε ένα περίγραμμα μετά το αρχικό σημείο μπορεί να κωδικοποιηθεί με 3 bits.

Page 177: Εισαγωγή

177Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κώδικας Αλυσίδας (5/7)

i0

j0

= initial point

Παράδειγμα 1.

Page 178: Εισαγωγή

178Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κώδικας Αλυσίδας (6/7)

Ο κώδικας αλυσίδας για το παράδειγμα (μετά την καταγραφή των αρχικών συντεταγμένων (i0, j0): Στο δεκαδικό: 1, 0, 1, 1, 1, 1, 3, 3, 3, 4, 4, 5, 4 Στο δυαδικό: 001, 000, 001, 001, 001, 001, 011, 011, 011,

100, 100, 101, 100

Η συμπίεση που έχουμε είναι σημαντική: κωδικοποίηση του περιγράμματος από M-bit συντεταγμένες (M = 9 για 512 x 512 εικόνες) χρειάζεται 6 φορές την αρχική μνήμη.

Page 179: Εισαγωγή

179Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κώδικας Αλυσίδας (7/7)

Για κλειστά περιγράμματα, οι αρχικές συντεταγμένες μπορούν να επιλεχθούν τυχαία. Αν το περίγραμμα είναι ανοικτό, τότε συνήθως είναι ένα τελικό σημείο (ενός γείτονα στο σύστημα 8 – κατευθύνσεων.

Η τεχνική αυτή είναι αποτελεσματική σε πολλές εφαρμογές μηχανικής όρασης και ανάγνωσης προτύπων π.χ. ανάγνωση χαρακτήρων.

Page 180: Εισαγωγή

180

Κεφάλαιο 3

Ιστόγραμμα Εικόνας και Λειτουργίες Σημείου

ΕΠΛ 445 – Ψηφιακή Επεξεργασία Εικόνας

Page 181: Εισαγωγή

181Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λειτουργίες Διανυσμάτων Και Πινάκων (1/4)

Το διάνυσμα είναι ένας μονοδιάστατος πίνακας. Τα διανύσματα θα θεωρούνται ότι είναι στήλες

διανυσμάτων (N x 1). Για παράδειγμα, το μοναδιαίο διάνυσμα είναι:

e =

1

1

·

·

·

1

(N x 1)

Page 182: Εισαγωγή

182Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λειτουργίες Διανυσμάτων Και Πινάκων (2/4)

Η ανάστροφος (transpose) είναι μια σειρά διανυσμάτων (1 x N), και δεικνύετε :

Μια δυαδική εικόνα είναι ένας πίνακας η μήτρα από ακέραιους αριθμούς

= 1 1 · · · 1

Δεικνύουμε ένα (τετραγωνικό) πίνακα εικόνας

I = [I(i, j); 0 ≤ i, j ≤ N-1]

Te

Page 183: Εισαγωγή

183Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λειτουργίες Διανυσμάτων Και Πινάκων (3/4)

I =

I(0, 0) I(0, 1)

I(1, 0) I(1, 1)···

···

I(N-1, 0)

· · ·

· · ·

· · ·

)

)···

I(N-1, N-1)

I(0, N-1

I(1, N-1

I(N-1, 1)

IT =

I( )

I( )

I( )

)

I( )

I( )

) · · ·

I( ) · · ····

···

· · · I( )0,N-1

I(

I(

···

0,0

0,1

1,N-1

1,0

1,1

N-1,N-1

N-1,0

N-1,1

Ο ανάστροφος (transpose) του πίνακα δεικνύετε

Page 184: Εισαγωγή

184Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λειτουργίες Διανυσμάτων Και Πινάκων (4/4)

Οι σειρές της IT είναι οι στήλες της I και οι στήλες της IT είναι οι στήλες της I. Σημειώστε ότι [IT]T = I.

Ένας συμμετρικός πίνακας ικανοποιεί την σχέση

IT = I.

Page 185: Εισαγωγή

185Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βασική Άλγεβρα Πινάκων (1/9)

Θεωρούμαι μόνο διανύσματα και τετράγωνους πίνακες (N x N), αλλά όλα τα υπόλοιπα μπορούν να προεκταθούν σε μη-τετράγωνους πίνακες (N x M)

Το εσωτερικό γινόμενο (N x 1) δυο διανυσμάτων a και b είναι

K = =

N-1i=0

a(i)b(i)

Το οποίο είναι μονόμετρος (αριθμός) (όχι διάνυσμα)

baT

Page 186: Εισαγωγή

186Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βασική Άλγεβρα Πινάκων (2/9)

Το γινόμενο δυο πινάκων (N x N) :

I =

I(0, 0) I(0, 1)

I(1, 0) I(1, 1)···

···

I(N-1, 0)

· · ·

· · ·

· · ·

)

)···

I(N-1, N-1)

I(0, N-1

I(1, N-1

I(N-1, 1)

J =

J(0, 0) (0, 1)

(1, 0) (1, 1)···

···

(N-1, 0)

· · ·

· · ·

· · ·

)

)···

(N-1, N-1)

(0, N-1

(1, N-1

(N-1, 1) J

J

JJ

JJ

JJ

είναι:

K = IJ

Page 187: Εισαγωγή

187Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βασική Άλγεβρα Πινάκων (3/9)

Τα στοιχεία του γινομένου των πινάκων K είναι:

K(i, j) =

Nn=1

I(i, n)J(n, j).

Αυτό είναι απλά το εσωτερικό γινόμενο της ith στήλης του διανύσματος ii της IT και της στήλης διανύσματος jj της J: K(i, j) = iiTjj.

Page 188: Εισαγωγή

188Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βασική Άλγεβρα Πινάκων (4/9)

Σημαντικές Σημειώσεις Δυο τετραγωνικοί πίνακες πρέπει να έχουν το ίδιο

μέγεθος για να πάρουμε το γινόμενο τους.

Στο γινόμενο των πινάκων δεν επιτρέπεται η αντιμετάθεση (commute). Δηλαδή δεν είναι γενικά αληθές ότι :

IJ = JI.

Page 189: Εισαγωγή

189Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βασική Άλγεβρα Πινάκων (5/9)

Πίνακας Ταυτότητας Ο (N x N) πίνακας ταυτότητας είναι

1 = ···

00

1

···

00

0

· · ·

· ·

· · ·

···

10

0

···

01

0

·

Καλείται έτσι επειδή το γινόμενο της 1 με κάθε N x N

πίνακα J1J = J1 = J

Page 190: Εισαγωγή

190Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βασική Άλγεβρα Πινάκων (6/9)

Αντιστροφή Πίνακα

Σημειώστε ότι I-1 αντιμετατίθεται με το I.

Η αντιστροφή ενός N x N πίνακα I είναι ένας άλλος

N x N πίνακας που δεικνύετε I-1

II-1 = I-1I = 1

Καλείται Αντίστροφος πίνακας επειδή:

Page 191: Εισαγωγή

191Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βασική Άλγεβρα Πινάκων (7/9)

Αντιστροφή Πίνακα (συνέχεια) Πότε υπάρχει ο αντίστροφος πίνακας;

Πότε είναι σταθερός;

Ο αντίστροφος του αντίστροφου δίνει πίσω τον

αρχικό πίνακα:

[I-1]-1 = I

Page 192: Εισαγωγή

192Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βασική Άλγεβρα Πινάκων (8/9)

Αντιστροφή Πίνακα Παράδειγμα:

I =

1 3 50 4 09 6 3

I-1 =

1168

-12 -21 200 42 0

36 -21 -4

Ο υπολογισμός του αντίστροφου ενός πίνακα με το

χέρι είναι μια σκληρή αλγεβρική διαδικασία, ειδικά

για μεγάλους πίνακες.

Page 193: Εισαγωγή

193Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βασική Άλγεβρα Πινάκων (9/9)

Αντιστροφή Πίνακα Δεν θα δώσουμε τις λεπτομέρειες εδώ. Οι πιο πολλές

βιβλιοθήκες σε μαθηματικά προγράμματα υπολογιστών

έχουν την εντολή αντιστροφής πινάκων διαθέσιμη

(π.χ., Matlab, Labview, IDL, IMSL).

Page 194: Εισαγωγή

194Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Aπλές Λειτουργίες Ιστογράμματος (1/6)

Θυμηθείτε: το ιστόγραμμα πεδίων φωτεινότητας HI μιας εικόνας I είναι μια γραφική παράσταση της συχνότητας ύπαρξης κάθε πεδίου φωτεινότητας στην I

HI είναι μια μονοδιάστατη συνάρτηση με πεδίο ορισμού 0, ... , K-1 :

HI(k) = n αν το πεδίο φωτεινότητας k υπάρχει (ακριβώς) n φορές στην I,

Για κάθε k = 0, ... K-1.

Page 195: Εισαγωγή

195Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Απλές Λειτουργίες Ιστογράμματος (2/6)

Το ιστόγραμμα HI δεν περιέχει πληροφορίες του χώρου της I – μόνο πληροφορίες για την σχετική συχνότητα φωτεινότητας.

H I (k)

0 K-1gray level k

Page 196: Εισαγωγή

196Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Απλές Λειτουργίες Ιστογράμματος (3/6)

Ωστόσο: Χρήσιμες πληροφορίες μπορούν να παρθούν από το

ιστόγραμμα. Η ποιότητα της εικόνας επηρεάζεται (βελτίωση ποιότητας,

τροποποίηση) με την αλλαγή του ιστογράμματος.

Page 197: Εισαγωγή

197Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Απλές Λειτουργίες Ιστογράμματος (4/6)

Μέση Τιμή Οπτικής Πυκνότητας

- Average Optical Density

Η μέτρηση μέσης τιμής φωτεινότητας μιας εικόνας I:

AOD(I) = 1

N2

=

1

N2

N-1j=0

N-1i=0

I(i,j)N-1i=0

N-1j=0

I(i, j)

Page 198: Εισαγωγή

198Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Απλές Λειτουργίες Ιστογράμματος (5/6)

Μπορεί να υπολογιστεί και από το ιστόγραμμα επίσης

K-1k=0

kHI(k)

όπου ο kος όρος = (επίπεδο φωτεινότητας k) x (# ύπαρξης του k)

Μέση Τιμή Οπτικής Πυκνότητας

1

N2

Page 199: Εισαγωγή

199Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Απλές Λειτουργίες Ιστογράμματος (6/6)

Παρατηρώντας το ιστόγραμμα μπορεί να αποκαλυφθούν πιθανά λάθη στην επεξεργασία εικόνας:

Μέση Τιμή Οπτικής Πυκνότητας

overexposedunderexposed

Low AOD High AOD

Τρόποι διόρθωσης τέτοιων λαθών χρησιμοποιούν το ιστόγραμμα.

Page 200: Εισαγωγή

200Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμικές Λειτουργίες Απλού Σημείου (1/8)

Η λειτουργία απλού σημείου σε μία εικόνα Ι είναι μια συνάρτηση f η οποία χαρτογραφεί ή προσδιορίζει την εικόνα Ι σε μια άλλη εικόνα J με τη λειτουργία της στο κάθε στίγμα της I:

J(i, j) = f[I(i, j)] , 0 ≤ i, j ≤ N-1

Η ίδια συνάρτηση f εφαρμόζεται σε όλες τις συντεταγμένες της εικόνας.

Αυτό είναι διαφορετικό από τις τοπικές λειτουργίες όπως ΑΝΟΙΚΤΌ, ΚΛΕΙΣΤΟ, κ.λπ., δεδομένου ότι αυτές είναι συναρτήσεις και του Ι (ι, j) και των γειτόνων του.

Page 201: Εισαγωγή

201Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμικές Λειτουργίες Απλού Σημείου (2/8)

Οι λειτουργίες απλού στίγματος δεν αλλάζουν τις σχέσεις χώρου μεταξύ των στιγμάτων. Αλλάζουν το ιστόγραμμα της εικόνας, και έτσι την ολική εμφάνιση της εικόνας.

Οι γραμμικές λειτουργίες απλού σημείου είναι η απλούστερη τάξη λειτουργιών απλού σημείου. Μετατοπίζουν και κλιμακώνουν τα πεδία φωτεινότητας της εικόνας.

Page 202: Εισαγωγή

202Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμικές Λειτουργίες Απλού Σημείου (3/8)

Θεωρούμαι ότι το L πέφτει στο πεδίο -(K-1) ≤ L ≤ K-1 (± την κανονικοποιημένη κλίμακα γκρί)

Μετατόπιση Εικόνας - Image Offset

J(i, j) = I(i, j) + L , for 0 ≤ i, j ≤ N-1

Έτσι, η ίδια σταθερά L προστίθεται στην τιμή κάθεστίγματος εικόνας.

Page 203: Εισαγωγή

203Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμικές Λειτουργίες Απλού Σημείου (4/8)

Μετατόπιση Εικόνας Αν L > 0, J θα είναι η εικόνα I φωτεινότερη. Αλλιώς

η εμφάνιση της θα είναι ουσιαστικά η ίδια. Αν L < 0, J θα είναι η σκοτεινότερη εκδοχή της

εικόνας I. Η πρόσθεση του L μετατοπίζει το ιστόγραμμα με την

τιμή L στα αριστερά η δεξιά

Page 204: Εισαγωγή

204Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμικές Λειτουργίες Απλού Σημείου (5/8)

Μετατόπιση Εικόνας

L>0 L<0

Histograms of additive image offsets

Η είσοδος και έξοδος του ιστογράμματος συσχετίζονται με:

HJ(k) = HI(k-L)

Page 205: Εισαγωγή

205Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμικές Λειτουργίες Απλού Σημείου (6/8)

Παράδειγμα: Θεωρούμαι ότι είναι επιθυμητό να συγκρίνουμε

πολλαπλές εικόνες I1, I2 ,..., In της ίδιας σκηνής. Ωστόσο, οι εικόνες πάρθηκαν από διαφορετικές συνθήκες φωτεινότητας.

Μια λύση: ισοστάθμιση των AOD's των εικόνων. Αν η κλίμακα πεδίων φωτεινότητας της εικόνας είναι

0 ,..., K-1, ένα λογικό AOD είναι K/2.

Page 206: Εισαγωγή

206Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμικές Λειτουργίες Απλού Σημείου (7/8)

Παράδειγμα (συνέχεια): Θέτουμε Lm = AOD(Im), για m = 1 ,..., n. Τότε

ορίζουμε την ‘ισοστάθμιση- AOD’ εικόνων J1, J2 ,..., Jn σύμφωνα με

Jm(i, j) = Im(i, j) - Lm + K/2 , for 0 ≤ i, j ≤ N-1

Page 207: Εισαγωγή

207Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμικές Λειτουργίες Απλού Σημείου (8/8)

Παράδειγμα (συνέχεια): Το αποτέλεσμα:

0 K-1K/2

HI (k)1

0 K-1K/2

0 K-1K/2

HI (k)2

0 K-1K/2..

etc.

Page 208: Εισαγωγή

208Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κλιμάκωση Εικόνας (1/5)

Θεωρούμαι P > 0 (όχι απαραίτητα ακέραιος). Η κλιμάκωση εικόνας ορίζεται από την συνάρτηση

J(i, j) = P· I(i, j) , for 0 ≤ i, j ≤ N-1

Έτσι, Ρ πολλαπλασιάζει κάθε τιμή στίγματος της εικόνας. Στην πράξη:

J(i, j) = INT[ P· I(i, j) + 0.5 ] , for 0 ≤ i, j ≤ N-1 όπου INT[ R ] = ο πλησιέστερος ακέραιος που είναι ≤ R.

Page 209: Εισαγωγή

209Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κλιμάκωση Εικόνας (2/5)

Αν P > 1, J θα έχει πιο πλατύ πεδίο φωτεινότητας από την εικόνα Ι.

Αν P < 1, J θα έχει πιο στενό πεδίο φωτεινότητας από την εικόνα I.

Page 210: Εισαγωγή

210Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κλιμάκωση Εικόνας (3/5)

Πολλαπλασιάζοντας την σταθερά Ρ επεκτείνει ή στενεύει το ‘πλάτος’ του ιστογράμματος της εικόνας με κάποιο συντελεστή Ρ:

Page 211: Εισαγωγή

211Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κλιμάκωση Εικόνας (4/5)

Σχόλια :

Μια εικόνα η οποία έχει συμπιεσμένη κλίμακα πεδίων φωτεινότητας γενικά έχει χαμηλή οπτική αντίθεση.

Μια τέτοια εικόνα μπορεί να έχει «ξεθωριασμένη» εμφάνιση.

Page 212: Εισαγωγή

212Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κλιμάκωση Εικόνας (5/5)

Μια εικόνα με φαρδύ πεδίο φωτεινότητας γενικά έχει υψηλή οπτική αντίθεση.

Μια τέτοια εικόνα μπορεί να έχει πιο κτυπητή, ορατή εμφάνιση.

Page 213: Εισαγωγή

213Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αποκοπή (1/2)

Γενικά, η διαθέσιμη κλίμακα φωτεινότητας της μετασχηματισμένης εικόνας J είναι η ίδια όπως αυτή της αρχικής εικόνας I: {0 ,..., K-1}.

Όταν κάνουμε τον μετασχηματισμό

J(i, j) = P· I(i, j) + L, for 0 ≤ i, j ≤ N-1 πρέπει να φροντίζουμε η μέγιστη και ελάχιστη τιμή

Jmax and Jmin να ικανοποιεί :

Jmax ≤ K-1 και Jmin ≥ 0.

Page 214: Εισαγωγή

214Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αποκοπή (2/2)

Στην καλύτερη περίπτωση, οι τιμές έξω απ’ αυτή την κλίμακα θα “ψαλιδιστούν”.

Στην χειρότερη περίπτωση, καταστάσεις υπερχείλισης (overflow) ή λανθασμένου πρόσημου (sign-error) συνθήκες μπορεί να εμφανιστούν. Σε αυτή την περίπτωση, η τιμή της κλίμακας φωτεινότητας που δίνεται σε ένα λανθασμένο στίγμα θα είναι πολύ απροσδιόριστη.

Page 215: Εισαγωγή

215Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Επέκταση Αντίθεσης κλίμακας (1/4)

Είναι πιο κοινή γραμμική λειτουργία στίγματος. Θεωρούμαι ότι η Ι έχει ένα συμπιεσμένο ιστόγραμμα:

Page 216: Εισαγωγή

216Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Επέκταση Αντίθεσης κλίμακας (2/4)

Ορίζουμε το Α και Β να είναι το min και max επίπεδο φωτεινότητας στην ΙΙ. Ορίζουμε :

J(i, j) = P·I(i, j) + LJ(i, j) = P·I(i, j) + L

έτσι ώστε :

P·A+L = 0P·A+L = 0 και P·B + L = (K-1)P·B + L = (K-1)..

Page 217: Εισαγωγή

217Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Επέκταση Αντίθεσης κλίμακας (3/4)

Το αποτέλεσμα της λύσης του συστήματος 2 εξισώσεων με 2 άγνωστους (P, L) είναι μια εικόνα J η οποία έχει ιστόγραμμα που οι τιμές του ανήκουν σε όλη την κλίμακα φωτεινοτήτων:

Page 218: Εισαγωγή

218Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Επέκταση Αντίθεσης κλίμακας (4/4)

Η λύση στις πιο πάνω εξισώσεις είναι :

και

ή

J (i,j) = [ I ( i ,j) – A ]

AB

K 1 A

AB

K

1

AB

K 1

Page 219: Εισαγωγή

219Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μη Γραμμικές Λειτουργίες Στίγματος

Μια μη-γραμμική λειτουργία στίγματος στην εικόνα Ι είναι μια σημειακή συνάρτηση f που σχετίζει την I με την J:

J(i, j) = f [I (i, j) ] for 0 ≤ i, j ≤ N-1

Όπου f είναι μια μη-γραμμική συνάρτηση.

Page 220: Εισαγωγή

220Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μη Γραμμικές Λειτουργίες Στίγματος

Αυτή είναι μια πολύ μεγάλη τάξη συναρτήσεων.

Ωστόσο, μόνο μερικές χρησιμοποιούνται συχνά: J(i, j) = |I(i, j)| (absolute value or magnitude) J(i, j) = [I(i, j)]2 (square-law) J(i, j) = sqrt [ I (i, j) ] (square root) J(i, j) = log[1+I (i, j) ] (logarithm) J(i, j) = exp[I (i, j)] = (i, j) (exponential)

Ie

Page 221: Εισαγωγή

221Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λογαριθμική Συμπίεση Πεδίου ( Range ) (1/5)

Κίνητρο: Μια εικόνα μπορεί να περιέχει πλούσιες πληροφορίες, απαλή εναλλαγή χαμηλών φωτεινοτήτων – και πολύ μικρές φωτεινές περιοχές.

Τα φωτεινά στίγματα θα κυριαρχήσουν την ορατή αντίληψη που έχουμε για την εικόνα.

Page 222: Εισαγωγή

222Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λογαριθμική Συμπίεση Πεδίου ( Range ) (2/5)

Ένα τυπικό Ιστόγραμμα.

Page 223: Εισαγωγή

223Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λογαριθμική Συμπίεση Πεδίου ( Range ) (3/5)

Ο λογαριθμικός μετασχηματισμός : J(i, j) = log[1+I(i, j)] συμπιέζει μη-γραμμικά και ισοσταθμίζει τα επίπεδα φωτεινότητας.

Οι φωτεινές εντάσεις συμπιέζονται πολύ περισσότερο – έτσι οι ασθενές λεπτομέρειες αναδύονται.

Page 224: Εισαγωγή

224Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λογαριθμική Συμπίεση Πεδίου ( Range ) (4/5)

Το τέντωμα αντίθεσης πλήρους κλίμακας χρησιμοποιεί μετά όλο το πεδίο φωτεινοτήτων.

Λογαριθμικός μετασχηματισμός τέντωσε τις αντιθέσεις.

Page 225: Εισαγωγή

225Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λογαριθμική Συμπίεση Πεδίου ( Range ) (5/5)

Χρήσιμο για εύρεση ασθενών κοσμικών αντικειμένων:

Χρήσιμο για να δείχνουμε εικόνες μετασχηματισμού Fourier.

Page 226: Εισαγωγή

226Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αλλαγή Μορφής Και Ταύτιση Ιστογράμματος

Θα εξετάσουμε τώρα μεθόδους για αλλαγή μορφής ιστογράμματος.

Επιτυγχάνεται με λειτουργίες απλού στίγματος:

η μορφή αντικειμένων και η τοποθεσία δεν αλλάζουν.

Page 227: Εισαγωγή

227Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ισοστάθμιση Ιστογράμματος

Μια εικόνα με ισοσταθμισμένο ιστόγραμμα κάνει πλούσια χρήση των διαθέσιμων πεδίων φωτεινότητας.

Αυτή μπορεί να είναι μια εικόνα με :

1. Απαλές διαβαθμίσεις στην κλίμακα φωτεινότητας που να καλύπτουν πολλαπλά επίπεδα φωτεινότητας γκρι.

2. Πολλαπλή υφή που να καλύπτει πολλαπλά επίπεδα φωτεινότητας.

Page 228: Εισαγωγή

228Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ιστόγραμμα Κανονικότητας (1/3)

Ορισμός: κ=0,1,…., K-1

Αθροίζοντας:

όπου είναι η πιθανότητα του επιπέδου φωτεινότητας κ να υπάρχει (σε οποιοδήποτε δεδομένο στίγμα)

)(1

=)( 2 kk Hp INI

)(kpI

1

0

( ) 1K

Ii

p i

Page 229: Εισαγωγή

229Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ιστόγραμμα Κανονικότητας (2/3)

Το συσσωρευτικό ιστόγραμμα είναι:

για r=0,1,2,…., K-1

όπου μια αύξουσα συνάρτηση με ( )IP k ( 1) 1IP K

r

kII kprP

0

)()(

Page 230: Εισαγωγή

230Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ιστόγραμμα Κανονικότητας (3/3)

Άρα, για όλα τα σημεία (i, j):(i, j):

Επίσης…

για r=0,…, K-1

( ) Pr{ ( , ) }I

r I i j rP

I( ) P ( ) - P ( -1)I Ip r r r

Page 231: Εισαγωγή

231Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συνεχές Ιστόγραμμα

Έστω οτι τα pp(x)(x) και PP(x)(x) είναι συνεχή: (μπορεί να θεωρηθούν σαν συναρτήσεις πυκνότητας πιθανότητας (pdf) και

συσσωρευτική διανομή (cdf)).

Τότε:

pp(x) = d(x) = dPP(x)/dx(x)/dx

Σημείωση:

υπάρχει η μπορεί να οριστεί κατά σύμβαση.)(1 xP

Page 232: Εισαγωγή

232Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συνεχής Ισοστάθμιση Και Αλλαγή Μορφής (1/5)

Μετασχηματίζουμε τα (συνεχή): ΙΙ, , pp(x), (x), PP(x)(x) σε J, qq(x), (x), QQ(x).(x).

Η ακόλουθη εικόνα θα έχει ένα ισοσταθμισμένο ιστόγραμμα:

JJ = = PP((II) (J(i, j) = ) (J(i, j) = PP[I(i, j)] [I(i, j)] για κάθε για κάθε (i, j)) (i, j))

Page 233: Εισαγωγή

233Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συνεχής Ισοστάθμιση Και Αλλαγή Μορφής (2/5)

Το συσσωρευτικό ιστόγραμμα QQ της JJ:

xxQ

xPPxQ

xPIxQ

xIPxQ

xJxQ

)(

)]([)(

)}(Pr{)(

})(Pr{)(

}Pr{)(

1

1

Page 234: Εισαγωγή

234Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συνεχής Ισοστάθμιση Και Αλλαγή Μορφής (3/5)

έτσι:

Q(x) = dQ(x) = dQQ(x)/dx = 1 for 0 (x)/dx = 1 for 0 << x x << 1 1

Τι παρατηρούμε? Χρειάζεται τέντωμα αντίθεσης

Page 235: Εισαγωγή

235Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συνεχής Ισοστάθμιση Και Αλλαγή Μορφής (4/5)

Έστω ότι παίρνουμε κάποια τυχαία qq(x),(x),QQ(x).(x).

Τότε ορίζουμε:

για όλα τα (i,j)

)]([1 IPQJ 1( , ) { [ ( , )]}J i j Q P I i j

Page 236: Εισαγωγή

236Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συνεχής Ισοστάθμιση Και Αλλαγή Μορφής (5/5)

Το συσσωρευμένό ιστόγραμμα της J είναι:

Σημείωση: Τα πιο πάνω μπορούν να προσεγγιστούν μόνο με διακριτάιστογράμματα

)(}Pr{

)]}([{}Pr{

)]}([Pr{}Pr{

)}()(Pr{}Pr{

})([Pr{}Pr{

1

1

1

xQxJ

xQPPxJ

xQPIxJ

xQIPxJ

xIPQxJ

Page 237: Εισαγωγή

237Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ισοστάθμιση Ιστογράμματος (1/3)

Έστω η εικόνα ΙΙ:

Ορίζουμε το συσσωρευτικό ιστόγραμμα εικόνας JJ11 = = PP((II))

όπου 1

10

( , ) [ ( , )] ( )K

I Ik

J i j p I i j p k

Page 238: Εισαγωγή

238Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ισοστάθμιση Ιστογράμματος (2/3)

Παρατηρήσεις:Σε κάθε στίγμα, αυτό είναι το συσσωρευτικό

ιστόγραμμα που υπολογίζεται στα επίπεδα φωτεινότητας του στίγματος.

Τα στοιχεία της συσσωρευτικής πιθανότητας της εικόνας JJ11 θα κατανεμηθούν γραμμικά κατά προσέγγιση μεταξύ 0 και 1.

Page 239: Εισαγωγή

239Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ισοστάθμιση Ιστογράμματος (3/3)

Κλιμακώνουμε το JJ11 για να καλύψει την κλίμακα 0, ..., κ-10, ..., κ-1, δημιουργώντας εικόνα ισοσταθμισμένου ιστογράμματος JJ:

J(i, j) = int [ (K-1)·JJ(i, j) = int [ (K-1)·J11(i, j) + 0.5 ](i, j) + 0.5 ]

Page 240: Εισαγωγή

240Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα Ισοστάθμισης Ιστογράμματος (1/7)

Δίνεται μια 4 x 44 x 4 εικόνα ΙΙ με επίπεδα φωτεινότητας

{0, ..., 15} (K-1 = 15):{0, ..., 15} (K-1 = 15):

I =

1 1 3 4

2 5 3 2

8 1 8 2

4 5 3 11

Page 241: Εισαγωγή

241Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα Ισοστάθμισης Ιστογράμματος (2/7)

Το ιστόγραμμα της είναι:

k 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

H(k) 0 3 3 3 2 2 0 0 2 0 0 1 0 0 0 0

Page 242: Εισαγωγή

242Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα Ισοστάθμισης Ιστογράμματος (3/7)

Κανονικοποίηση Ιστογράμματος:

k 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

p(k) 0 0 0 0 0 0 0 0 0316

316

316

216

216

216

116

Page 243: Εισαγωγή

243Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα Ισοστάθμισης Ιστογράμματος (4/7)

Υπολογισμός ενδιάμεσης εικόνας JJ11:

JJ11=

3/16 3/16 9/16 11/16

6/16 13/16 9/16 6/16

15/16 3/16 15/16 6/16

11/16 13/16 9/16 16/16

Page 244: Εισαγωγή

244Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα Ισοστάθμισης Ιστογράμματος (5/7)

Υπολογισμός ‘ισοσταθμισμένης’ εικόνας JJ:

JJ =

3 3 8 10

6 12 8 6

14 3 14 6

10 12 8 15

Page 245: Εισαγωγή

245Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα Ισοστάθμισης Ιστογράμματος (6/7)

Το νέο, ισοσταθμισμένο ιστόγραμμα μοιάζει με το

ακόλουθο:

k 0 1 2 4 5 6 7 8 9 10 11 12 13 14 153

H(k) 0 0 0 0 0 3 0 3 0 2 0 2 0 2 13

Page 246: Εισαγωγή

246Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα Ισοστάθμισης Ιστογράμματος (7/7)

Δημιουργία Ιστογράμματος:

Page 247: Εισαγωγή

247Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ισοστάθμισης Ιστογράμματος (συνέχεια…)

Τα ύψη H(k) δεν μπορούν να μειωθούν, απλώςμετακινούνται έτσι:

Η ισοστάθμιση ψηφιακού ιστογράμματος δεν ‘ισοσταθμίζει’ στην πραγματικά το ιστόγραμμα , απλώς το κάνει πιο ‘κολακευτικό’ με την εξάπλωση του ιστογράμματος.

Ο χώρος που δημιουργείται είναι πολύ χαρακτηριστικός του ‘ισοσταθμισμένου’ ιστογράμματος , ειδικά όταν το αρχικό ιστόγραμμα είναι πολύ συμπιεσμένο.

Page 248: Εισαγωγή

248Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα Ισοστάθμισης Ιστογράμματος στο ΜatLab

I = imread(‘exampleim.tif’);I = imread(‘exampleim.tif’);

J = histeq(I);J = histeq(I);

figure,subplot(2,1,1),imshow(I);figure,subplot(2,1,1),imshow(I);

subplot(2,1,2), imhist(Jsubplot(2,1,2), imhist(J);

Page 249: Εισαγωγή

249Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αλλαγή Μορφής Ιστογράμματος (1/3)

Δημιουργεί μια αλλαγμένη εικόνα JJ με μια κατάπροσέγγιση προσδιορισμένη μορφήιστογράμματος, όπως τρίγωνο ή καμπύλη μορφήςκαμπάνας.

Ορίζουμε το να είναι η επιθυμητή μορφήιστογράμματος με τις αντίστοιχες κανονικές τιμές(πιθανότητες) .

)(kH J

)(kpJ

Page 250: Εισαγωγή

250Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αλλαγή Μορφής Ιστογράμματος (2/3)

1. Ορίζουμε το συσσωρευτικό ιστόγραμμα εικόνας όπως πριν:

2. Επίσης ορίζουμε τις συσσωρευτικές πιθανότητες:

),(

01 )()],([),(

jiI

kII kpjiIPjiJ

n

kJJ kpnP

0

)()(

Page 251: Εισαγωγή

251Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αλλαγή Μορφής Ιστογράμματος - Αλγόριθμος (3/3)

Ορίζουμε n(i, j)n(i, j) να δεικνύει την μικρότερη τιμή τουn ώστε:

Τότε παίρνουμε: J(i, j) = n(i, j)J(i, j) = n(i, j)

Αυτό είναι μια τυπικότητα για:

),(1)( jiJnpJ

)],(1[),( 1 jiJPjin J

Page 252: Εισαγωγή

252Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα Αλλαγή Μορφής Ιστογράμματος (1/7)

Υποθέστε ότι έχουμε την ίδια εικόνα με το προηγούμενο παράδειγμα

ΙΙ =

1 1 3 4

2 5 3 2

8 1 8 2

4 5 3 11

Page 253: Εισαγωγή

253Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα Αλλαγή Μορφής Ιστογράμματος (2/7)

Υπολογισμός ενδιάμεσης εικόνας JJ11:

JJ11 =

3/16 3/16 9/16 11/16

6/16 13/16 9/16 6/16

15/16 3/16 15/16 6/16

11/16 13/16 9/16 16/16

Page 254: Εισαγωγή

254Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα Αλλαγή Μορφής Ιστογράμματος (3/7)

Το εφαρμόζουμε στο ακόλουθο (τριγωνικό) ιστόγραμμα:

k 0 1 2 4 5 6 7 8 9 10 11 12 13 14 153

0 0 1 2 0 3 0 4 0 3 0 2 0 1 003160 0 0 0 0 0 0 00 3

16416

216

216

116

116

H (k)

p (k)J

J

Page 255: Εισαγωγή

255Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα Αλλαγή Μορφής Ιστογράμματος (4/7)

Δημιουργία Ιστογράμματος:

Page 256: Εισαγωγή

256Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα Αλλαγή Μορφής Ιστογράμματος (5/7)

Πιο κάτω είναι οι συσσωρευμένες (αθροιστικές) πιθανότητες που συνδέονται μαζί του:

J 0 0

n 0 1 2 4 5 6 7 8 9 10111213141531616

1516

1316

1016

116

616

316

116

316

616

1016

1316

1516

1616

P (n)

Page 257: Εισαγωγή

257Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα Αλλαγή Μορφής Ιστογράμματος (6/7)

Προσεκτική ορατή παρατήρηση της JJ11 μας οδηγεί

στο φτιάξιμο της νέας εικόνας:

JJ =

4 4 8 10

6 10 8 6

12 4 12 6

10 10 8 14

Page 258: Εισαγωγή

258Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα Αλλαγή Μορφής Ιστογράμματος (7/7)

Το νέο Ιστόγραμμα είναι:

H (k)J

k 0 1 2 4 5 6 7 8 9 10 11 12 13 14 153

0 0 0 3 0 3 0 3 0 4 0 2 0 1 00

Page 259: Εισαγωγή

259Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ταύτιση Ιστογράμματος (1/2)

Μια ειδική περίπτωση της αλλαγής μορφής ιστογράμματος.

Διαφορά: το ιστόγραμμα της αρχικής εικόνας ΙΙ ταυτίζεται με το ιστόγραμμα μιας άλλης εικόνας II´́

Αλλιώς η διαδικασία είναι η ίδια, όταν οι συσσωρευμένες πιθανότητες υπολογιστούν για την μοντελοποιημένη εικόνα II´́

Page 260: Εισαγωγή

260Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ταύτιση Ιστογράμματος (2/2)

Χρήσιμη εφαρμογή:

Σύγκριση όμοιων εικόνων της ίδιας σκηνής που

πάρθηκε κάτω από διαφορετικές συνθήκες (π.χ.

φωτός, ώρα της ημέρας, κλπ).

Προεκτείνεται η έννοια της ισοστάθμισης AODAOD

που περιγράψαμε πιο πριν.

Page 261: Εισαγωγή

261Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βασικές Αλγεβρικές Λειτουργίες Εικόνας (1/3)

Οι αλγεβρικές λειτουργίες εικόνας (μεταξύ εικόνων) είναι κάπως απλές.

Θεωρούμε ότι έχουμε δυο N x NN x N εικόνες II11 και II22. Οι τέσσερις βασικές αλγεβρικές λειτουργίες (όπως αυτές της υπολογιστικής σας) είναι:

Page 262: Εισαγωγή

262Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βασικές Αλγεβρικές Λειτουργίες Εικόνας (2/3)

Σημειακή Πρόσθεση ΠινάκωνΣημειακή Πρόσθεση Πινάκων

JJ = = II11 + + II22

if J(i, j) = if J(i, j) = II11(i, j) + (i, j) + II22(i, j) (i, j)

for 0 ≤ i, j ≤ N-1for 0 ≤ i, j ≤ N-1

Σημειακή Αφαίρεση πινάκωνΣημειακή Αφαίρεση πινάκων

JJ = = II11 – – II22

if J(i, j) = if J(i, j) = II11(i, j) – (i, j) – II22(i, j) (i, j)

for 0 ≤ i, j ≤ N-1for 0 ≤ i, j ≤ N-1

Page 263: Εισαγωγή

263Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βασικές Αλγεβρικές Λειτουργίες Εικόνας (3/3)

Σημειακός Πολλαπλασιασμός ΠινάκωνΣημειακός Πολλαπλασιασμός Πινάκων J = IJ = I11 Ä Ä II22

if J(i, j) = Iif J(i, j) = I11(i, j) x I(i, j) x I22(i, j) for 0 ≤ i, j ≤ N-1(i, j) for 0 ≤ i, j ≤ N-1

Σημειακή Διαίρεση ΠινάκωνΣημειακή Διαίρεση Πινάκων J = IJ = I11 D D II22

if J(i, j) = Iif J(i, j) = I11(i, j) / I(i, j) / I22(i, j) for 0 ≤ i, j ≤ N-1(i, j) for 0 ≤ i, j ≤ N-1

* Ειδική σήμανση για σημείο προς σημείο (σημειακό) πολλαπλασιασμό και διαίρεση πινάκων αφού υπάρχει και άλλος ορισμός για πολλαπλασιασμό πινάκων.

* Οι λειτουργίες Ä και D είναι πολύ χρήσιμες όταν επεξεργαζόμαστε πίνακες μετασχηματισμών Fourier.

Page 264: Εισαγωγή

264Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εφαρμογές Των Αλγεβρικών Λειτουργιών

Παρ’οτι απλές, οι αλγεβρικές λειτουργίες αποτελούν την σπονδυλική στήλη για την ψηφιακή επεξεργασία εικόνων.

Θα εξετάσουμε δυο απλές αλλά σημαντικές εφαρμογές αλγεβρικών λειτουργιών σε εικόνες:

Μέσος όρος πλαισίου για μείωση θορύβου Εντοπισμός κίνησης

Page 265: Εισαγωγή

265Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μέσος Όρος Πλαισίου για Μείωση Θορύβου (1/3)

Μια εικόνα JJ συχνά είναι ‘μολυσμένη’ με αθροιστικό

θόρυβο:

Διασκόρπιση επιφάνειας ακτινοβολίας Θόρυβος στην κάμερα Θερμικός θόρυβος στα υπολογιστικά κυκλώματα Θόρυβος καναλιών επικοινωνίας

Page 266: Εισαγωγή

266Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μέσος Όρος Πλαισίου για Μείωση Θορύβου (2/3)

Μπορούμε να κάνουμε μοντέλα για τέτοιες εικόνες με θόρυβο σαν το άθροισμα μιας πρωτότυπης, ‘αμόλυντης’ εικόνας ΙΙ και μιας εικόνας θορύβου ΝΝ

J = I + NJ = I + N

όπου τα στοιχεία N(i, j) N(i, j) του NN είναι τυχαίες μεταβλητές.

Δεν θα εξετάσουμε τους μαθηματικούς ορισμούς των τυχαίων μεταβλητών (ακόμα).

Page 267: Εισαγωγή

267Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μέσος Όρος Πλαισίου για Μείωση Θορύβου (3/3)

Απλώς θα θεωρήσουμε ότι ο θόρυβος έχει μηδενικήμεσαία τιμή (εργοδική), που σημαίνει ότι το δείγμαμεσαίου ΜΜ πινάκων θορύβου τείνει προς το μηδέν όταν τοΜΜ μεγαλώνει

[ N1 + · · · + NM ] ≈ 0 (matrix of zeros) 

Υπολογίζοντας τον μέσο όρο πολλών δειγμάτωνμηδενικού-μέσου όρου δίνει μια τιμή κοντά στο μηδέν.Θα ορίσουμε το μηδενικό μέσο όρο πιο προσεκτικάαργότερα.

MN

M

M

ii

11

1

Page 268: Εισαγωγή

268Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Υπολογισμός του Μέσου Όρου Πλαισίου για Μείωση Θορύβου (1/3)

Θεωρούμε ότι παίρνουμε ΜΜ εικόνες JJ11, ..., , ..., JJMM της ίδιαςσκηνής: Σε μια γρήγορη ακολουθία, χωρίς να υπάρχει κίνησημεταξύ πλαισίων Ή να μην υπάρχει καθόλου κίνηση.

Ωστόσο, τα πλαίσια είναι θορυβώδη:  for i = 1 ,..., M.  iii NIJ

Page 269: Εισαγωγή

269Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Υπολογισμός του Μέσου Όρου Πλαισίου για Μείωση Θορύβου (2/3)

Θεωρούμε ότι παίρνουμε τον μέσο όρο των πλαισίων: 

 

Ωστόσο αφού II11 = = II22 = · · · = = · · · = IIMM = = II, τότε

και από πριν

Έτσι περιμένουμε ότι J ≈ I + 0 ≈ I(αν από αρκετά πλαίσια (MM) παρθεί ο μέσος όρος)

M

ii

M

iii

M

ii

M

ii N

MI

MNI

MJ

MJ

1111

11][

11

IIMM

I]...I[IM

IM

M

ii

111

1

01

1

M

iiN

M

Page 270: Εισαγωγή

270Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Υπολογισμός του Μέσου Όρου Πλαισίου για Μείωση Θορύβου (3/3)

Η επεξεργασία εικόνας ενδιαφέρεται κυρίως για την διόρθωση η καλυτέρευση των εικόνων του προγραμματικού κόσμου.  

Τα γραφικά υπολογιστών ενδιαφέρονται κυρίως για την δημιουργία εικόνων κάποιου μη-πραγματικού κόσμου.

Page 271: Εισαγωγή

271Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εντοπισμός Κίνησης (1/2)

Συχνά είναι ενδιαφέρον να εντοπίσουμε κίνηση

αντικειμένων μεταξύ πλαισίων.

Εφαρμογές: Συμπίεση βίντεο Αναγνώριση στόχου και παρακολούθησης Κάμερες ασφάλειας Επίβλεψη Αυτόματος έλεγχος κλπ.

Page 272: Εισαγωγή

272Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εντοπισμός Κίνησης (2/2)

Πιο κάτω δίδεται μια απλή προσέγγιση:

Ορίζουμε II11, II22 ως δυο διαδοχικά πλαίσια που πάρθηκαν

σε πολύ σύντομο χρόνο, π.χ. από μια βίντεο κάμερα.

Από την εικόνα απόλυτης διαφοράς JJ = | = |II11 – – II22||

εεφαρμόζουμε τέντωμα αντίθεσης πλήρους κλίμακας

στην JJ το οποίο έχει ως αποτέλεσμα ένα πιο δραματικό

οπτικό αποτέλεσμα.

Page 273: Εισαγωγή

273Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γεωμετρικές Λειτουργίες Εικόνας

Οι γεωμετρικές λειτουργίες εικόνας είναι κάπως πιο περίπλοκες από τις αλγεβρικές λειτουργίες, και χρησιμοποιούνται λιγότερο (στην επεξεργασία εικόνων).

Πολλές από τις ιδέες επίσης συμπίπτουν πολύ με σημαντικά στοιχεία των γραφικών υπολογιστών. Έτσι θα ξοδέψουμε λίγο χρόνο σε αυτά.

Page 274: Εισαγωγή

274Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βασικές Γεωμετρικές Λειτουργίες Εικόνας

Οι γεωμετρικές λειτουργίες εικόνας είναι αντίθετες των λειτουργιών απλού στίγματος: αλλάζουν την τοποθεσία των στιγμάτων αλλά όχι την τιμή τους.

Μια γεωμετρική λειτουργία γενικά χρειάζεται δυο βήματα:

Page 275: Εισαγωγή

275Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βασικές Γεωμετρικές Λειτουργίες Εικόνας

Μια ταύτιση χώρου των συντεταγμένων της εικόνας μας δίνει μια νέα συνάρτηση εικόνας J:

J(i, j) = I(i´ , j´ ) = I[a(i, j), b(i, j)J(i, j) = I(i´ , j´ ) = I[a(i, j), b(i, j)

Οι συντεταγμένες a(i, j) and b(i, j) δεν είναι γενικά ήΟι συντεταγμένες a(i, j) and b(i, j) δεν είναι γενικά ή συνήθως ακέραιοισυνήθως ακέραιοι!! ΓΓια παράδειγμαια παράδειγμα: : a(i, j) = i/3.5, b(i, j) = j/4.5a(i, j) = i/3.5, b(i, j) = j/4.5

Τότε J(i, j) = I(i/3.5, j/4.5),J(i, j) = I(i/3.5, j/4.5), το οποίο έχει απροσδιόριστες συντεταγμένες !

Έτσι συνεπάγεται η ανάγκη δεύτερης λειτουργίας:

Page 276: Εισαγωγή

276Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βασικές Γεωμετρικές Λειτουργίες Εικόνας

Πλαστογραφούμε τις μη-ακραίες συντεταγμένες a(i, j)a(i, j) και b(i, b(i, j)j) σε ακέραιες τιμές, έτσι ώστε το JJ να μπορεί να παραστεί σε μορφή σειρών-στηλών (πίνακα)

Page 277: Εισαγωγή

277Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παρεμβολή Πλησιέστερου Γείτονα

 Με απλή σκέψη: Οι γεωμετρικά μετασχηματισμένες συντεταγμένες ταυτίζονται στις πλησιέστερες ακέραιες συντεταγμένες:

J(i, j) = IJ(i, j) = I{{INT[a(i, j)+0.5], INT[b(i, j)+0.5]INT[a(i, j)+0.5], INT[b(i, j)+0.5]} }

Σοβαρό μειονέκτημα: Ξαφνικές αλλαγές της φωτεινότητας έχουν σαναποτέλεσμα τις σπασμένές ακμές.

Page 278: Εισαγωγή

278Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Προειδοποίηση

Για κάποια συντεταγμένη (i, j) είτε  INT[a(i, j)+0.5] < 0INT[a(i, j)+0.5] < 0 ή INT[b(i, j)+0.5] < 0INT[b(i, j)+0.5] < 0

είτε  INT[a(i, j)+0.5] > N-1INT[a(i, j)+0.5] > N-1 ή INT[b(i, j)+0.5] > N-1INT[b(i, j)+0.5] > N-1 τότε J(i, j) = I{INT[a(i, j)+0.5], INT[b(i, j)+0.5]}J(i, j) = I{INT[a(i, j)+0.5], INT[b(i, j)+0.5]} δεν μπορεί να προσδιοριστεί.

Συνήθως θέτουμε το J(i, j) = 0J(i, j) = 0 για αυτές τις τιμές.

Page 279: Εισαγωγή

279Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διγραμμική Παρεμβολή

Δημιουργία μιας πιο ομαλής παρεμβολής από την προσέγγιση του πλησιέστερου γείτονα.

Δίδονται τέσσερις συντεταγμένες I(iI(i00, j, j00), I(i), I(i11, j, j11), I(i), I(i22, , jj22),), και I(iI(i33, j, j33),), η νέα εικόνα J(i, j)J(i, j) υπολογίζεται ως ακολούθως:

J(i, j) = AJ(i, j) = A00 + A + A11· i + A· i + A22·j + A·j + A33· i·j· i·j

όπου τα διγραμμικά βάρη A0, A1, A2A0, A1, A2, και A3A3 είναι το αποτέλεσμα της λύσης της πιο κάτω εξίσωσης:

Page 280: Εισαγωγή

280Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ένας γραμμικός συνδυασμός των τεσσάρων

πλησιέστερων τιμών. Το πιο καλό ταίριασμα

επιπέδου στις τέσσερις πλησιέστερες τιμές.

A0

A1

A2

A3

=

11

1

1

i

i

i

i

j 0

j 1

j 2

j 3

i 0

i 1

i 2

i 3

j 0

j 1

j 2

j 3

0

1

2

3

-1

I(i , j )0 0

I(i , j )

I(i , j )

I(i , j )1 1

2 2

33

Διγραμμική Παρεμβολή

Page 281: Εισαγωγή

281Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Οι Βασικοί Γεωμετρικοί Μετασχηματισμοί

 Οι πιο βασικοί γεωμετρικοί μετασχηματισμοί

είναι:

- Translation (Μετατόπιση)

- Rotation (Περιστροφή)

- Zooming (Μεγέθυνση)

Page 282: Εισαγωγή

282Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μετατόπιση

Η μετατόπιση είναι η πιο απλή γεωμετρική λειτουργία

και δεν χρειάζεται παρεμβολή. Ορίζουμε

a(i, j) = i - i0, b(i, j) = j - j0a(i, j) = i - i0, b(i, j) = j - j0

όπου (i0, j0)(i0, j0) είναι σταθερές.

Σε αυτή την περίπτωση J(i, j) = I(i - i0, j - j0)J(i, j) = I(i - i0, j - j0)

μια μετακίνηση ή μετατόπιση της εικόνας με μέγεθος i0 στην κατακόρυφη (σειρά) διεύθυνση και μεγέθους j0 στην οριζόντια διεύθυνση.

Page 283: Εισαγωγή

283Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Περιστροφή

Η περιστροφή της εικόνας με την γωνία q σε σχέση με τον αξονα-x επιτυγχάνετε από τον ακόλουθο μετασχηματισμό:

a(i, j) = i cos( q ) - j sin( q )

b(i, j) = i sin( q ) + j cos( q )

Page 284: Εισαγωγή

284Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Απλές περιπτώσεις:

q = 90° : [a(i, j), b(i, j)] = (-j, i)q = 90° : [a(i, j), b(i, j)] = (-j, i)

q = 180° : [a(i, j), b(i, j)] = (-i, -j)q = 180° : [a(i, j), b(i, j)] = (-i, -j)

q = -90° : [a(i, j), b(i, j)] = (j, -i)q = -90° : [a(i, j), b(i, j)] = (j, -i)

Οι περιστρεφόμενες εικόνες συνήθως χρειάζονται μετατόπιση μετέπειτα για να πάρουν τιμές συντεταγμένων στο επιθυμητό πεδίο.

Περιστροφή

Page 285: Εισαγωγή

285Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μεγέθυνση

Η μεγέθυνση μεγαλώνει μια εικόνα με την συνάρτηση ταύτισης

a(i, j) = i / ca(i, j) = i / c και b(i, j) = j / db(i, j) = j / d

όπου c ≥ 1c ≥ 1 και d ≥ 1d ≥ 1.

Page 286: Εισαγωγή

286Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Για μεγάλη μεγέθυνση, η μεγεθυσμένη εικόνα θα φαίνεται ‘θολή’ αν χρησιμοποιηθεί απλή παρεμβολή πλησιέστερου γείτονα. Η διγραμμική παρεμβολή δουλεύει καλύτερα.

originaloriginal

Αυτοί είναι πολύ απλοί μετασχηματισμοί.Ένα παράδειγμα πιο έξυπνου γεωμετρικού μετασχηματισμού !

2x zoomed2x zoomed

Μεγέθυνση

Page 287: Εισαγωγή

287

Κεφάλαιο 4

ΔΙΑΚΡΙΤΟΣ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ FOURIER

ΕΠΛ 445 - Ψηφιακή Επεξεργασία Εικόνας

Page 288: Εισαγωγή

288Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Περιεχόμενα

o Ημιτονικές εικόνεςo Διακριτός Μετασχηματισμός Fouriero Σημασία των Συχνοτήτων Εικόνας o Θεώρημα Δειγματοληψίας

Page 289: Εισαγωγή

289Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ημιτονικές Εικόνες (1/5)

Θα κάνουμε συχνή αναφορά σε αυτό το κεφάλαιο για το περιεχόμενο συχνοτήτων μιας εικόνας.

Πρώτα θα εξετάσουμε τις εικόνες οι οποίες έχουν το απλούστερο περιεχόμενο συχνοτήτων.

Μια ψηφιακή ημιτονική εικόνα Ι1 είναι μια εικόνα η οποία έχει στοιχεία

Μια ψηφιακή συνημιτονική εικόνα Ι2 είναι μια εικόνα η οποία έχει στοιχεία

10 για 2

sin),(1 N-i,jvj))(uiΝ

π(jiI

1N-i,j0vj))(uiΝ

π2(cos)j,i(2I ≤≤για +=

Page 290: Εισαγωγή

290Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Τα u και v αποτελούν τις ακέραιες συχνότητες στην i και j κατεύθυνση και μετρώνται σε κύκλους ανά εικόνα (cycles per image).

Η ακτινωτή συχνότητα Ω μιας εικόνας (το πόσο γρήγορα η εικόνα ταλαντεύεται στην κατεύθυνση της διάδοσης) ορίζεται ως:

Η γωνία θ του κύματος (ως προς τον άξονα i) ορίζεται ως:

Ημιτονικές Εικόνες (2/5)

22 vuΩ

)u

v(θ 1tan

Page 291: Εισαγωγή

291Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ημιτονικές Εικόνες (3/5)

Παράδειγμα: Έστω ότι Ν=16 και v=0 (κύκλοι ανά εικόνα) για μια συνημιτονική εικόνα Ι. Επομένως ισχύει ότι

Αυτό είναι ένα κύμα συνημίτονου το οποίο διαδίδεται μόνο στην κατεύθυνση i (Όλες οι γραμμές είναι οι ίδιες) με συχνότητα u. Στην επόμενη διαφάνεια δείχνουμε τις τιμές της συνάρτησης Ι(i) για κάποια συγκεκριμένα u. Το i-οστό εικονοστοιχείο κάθε γραμμής της εικόνας μας θα έχει τιμή Ι(i).

)16

2cos()( uiiI

Page 292: Εισαγωγή

292Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ημιτονικές Εικόνες (4/5)

1614121086420-1

0

1

i

u=1 or u=15

1614121086420-1

0

1

i

u=2 or u=14

1614121086420-1

0

1

i

u=4 or u=12

1614121086420-1

0

1

i

u=8

Η συνάρτηση για διάφορες τιμές του u:)16

2cos()( uiiI

Page 293: Εισαγωγή

293Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ημιτονικές Εικόνες (5/5)

Παρατηρήστε ότι

Αυτό σημαίνει ότι το κύμα με την μεγαλύτερη συχνότητα λαμβάνει χώρα όταν

και το N είναι άρτιος στην συγκεκριμένη περίπτωση. Αυτό θα είναι σημαντικό αργότερα.

2

Nu

])16(16

2cos[)

16

2cos()( iuuiiI

Page 294: Εισαγωγή

294Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μιγαδικές εκθετικές εικόνες

Θα χρησιμοποιήσουμε μιγαδικές εκθετικές συναρτήσεις για να ορίσουμε αργότερα τον μετασχηματισμό Fourier μιας ψηφιακής εικόνας.

Ως εκ τούτου ορίζουμε την δυσδιάστατη μιγαδική εκθετική συνάρτηση ως ακολούθως:

Το είναι ο γνήσιος φανταστικός αριθμός όπου

Η μιγαδική εκθετική συνάρτηση δίνει την δυνατότητα μιας εύκολης και βολικής αναπαράστασης και χειρισμού των συχνοτήτων, όπως θα δούμε παρακάτω.

10 για)(

21

Ni,j evjui

111

2

Page 295: Εισαγωγή

295Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μιγαδικοί Αριθμοί (1/3)

Ένας μιγαδικός αριθμός Χ έχει την μορφή:

όπου το Α αποτελεί το πραγματικό μέρος και το αποτελεί το φανταστικό μέρος του αριθμού.

Ένας μιγαδικός αριθμός Χ χαρακτηρίζεται από το μέγεθος ( ) και την φάση του ( ) όπου

1 BAX

1B

)(tan και 122

A

BΧBAX

ΧX

Page 296: Εισαγωγή

296Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μιγαδικοί Αριθμοί (2/3)

Ένας μιγαδικός αριθμός Χ μπορεί να αναπαρασταθεί συναρτήσει του μεγέθους και της φάσης του ως ακολούθως:

Ο μιγαδικός συζυγής ή απλά συζυγής του Χ ορίζεται ως ακολούθως:

1 ΧeXX

1* BAX

Page 297: Εισαγωγή

297Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μιγαδικοί Αριθμοί (3/3)

Ισχύει η εξής ιδιότητα μεταξύ ενός μιγαδικού αριθμού Χ και του συζυγούς του Χ* :

)1()1(* BABAXX22 )1( BA

222 1 BA

)1(22 BA22 BA

2X

Page 298: Εισαγωγή

298Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ιδιότητες Της Μιγαδικής Εκθετικής Εικόνας (1/3)

Θα χρησιμοποιήσουμε τον συμβολισμό

για την μιγαδική εκθετική εικόνα, όπου το Ν αποτελεί το μέγεθος της εικόνας .

Άρα βάσει του συμβολισμού μας έπεται ότι

2

1eWN

)(2

1)( vjuivjuiN eW

Page 299: Εισαγωγή

299Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ιδιότητες Της Μιγαδικής Εκθετικής Εικόνας (2/3)

H ταυτότητα Euler έχει ως ακολούθως:

Επομένως αφού

έπεται ότι

)sin(1)cos(1 aae a

)(2

1)(

21

και vjui

vjuiN eWeW

)](2

sin[1)](2

cos[)( vjuivjuiW vjuiN

και )2

sin(1)2

cos(

NW

Page 300: Εισαγωγή

300Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ιδιότητες Της Μιγαδικής Εκθετικής Εικόνας (3/3)

Επιπρόσθετα ισχύουν οι ακόλουθες ισότητες:

][2

1)](

2cos[ α) )()( vjui

Nvjui

N WWvjui

][12

1)](

2sin[ β) )()( vjui

Nvjui

N WWvjui

Page 301: Εισαγωγή

301Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μέγεθος & Φάση Της Μιγαδικής Εκθετικής Εικόνας

Το μέγεθος και η φάση της μιγαδικής εκθετικής εικόνας αντίστοιχα είναι τα ακόλουθα:)( vjui

NW

1 )](2

[sin )](2

[cos 22)(

vjuivjuiW vjuiN

)(Ν

2π)

)](2

cos[

)](2

sin[(tan 1)( vjui

vjui

vjuiW vjui

N

Page 302: Εισαγωγή

302Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μιγαδικές Εκθετικές Εικόνες - Σχόλια

Η ανάπτυξη του μετασχηματισμού Fourier (πεδίο συχνοτήτων) χωρίς την βοήθεια των μιγαδικών αριθμών είναι δυνατή. Όμως τα μαθηματικά τα οποία θα χρησιμοποιηθούν θα είναι περισσότερα.

Η χρήση του για αναπαράσταση μιας συνιστώσας συχνότητας η οποία ταλαντώνεται σε u κύκλους ανά μήκους εικόνας και σε v κύκλους ανά μήκους εικόνα στις κατευθύνσεις i και j αντίστοιχα, απλοποιεί σε ένα ικανοποιητικό βαθμό τα πράγματα.

Επομένως είναι πολύ βοηθητικό να θεωρούμε τοως αναπαράσταση της κατεύθυνσης και συχνότητας της ταλάντωσης.

)( vjuiNW

)( vjuiNW

Page 303: Εισαγωγή

303Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Τιμές Της Μιγαδικής Εκθετικής Συνάρτησης (1/4)

Η μιγαδική εκθετική συνάρτηση

αποτελεί μια αναπαράσταση της συχνότητας συναρτήσει του εκθέτη ui.

H ελάχιστη φυσική συχνότητα, λαμβάνει χώρα περιοδικά όταν u = kN όπου τα i, k είναι ακέραιοι αριθμοί. Συγκεκριμένα ισχύει ότι

)(2

1)( uiuiN eW

1)( kNiNW

Page 304: Εισαγωγή

304Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Τιμές Της Μιγαδικής Εκθετικής Συνάρτησης (2/4)

Απόδειξη της προαναφερθείσας πρότασης:)(

21)( kNikNi

N eW

)(21 kie kiπ))sin(21π)(cos(2

ki1

1

Page 305: Εισαγωγή

305Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Τιμές Της Μιγαδικής Εκθετικής Συνάρτησης (3/4)

H μέγιστη φυσική συχνότητα, λαμβάνει χώρα περιοδικά όταν u = kN + Ν/2 όπου τα i, k είναι ακέραιοι αριθμοί και το Ν είναι άρτιος . Συγκεκριμένα ισχύει ότι

Ακολουθεί τη απόδειξη της παραπάνω πρότασης.

)1()2

( iiN

kNNW

Page 306: Εισαγωγή

306Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Τιμές Της Μιγαδικής Εκθετικής Συνάρτησης (4/4)

Απόδειξη της προαναφερθείσας πρότασης:i

NkN

NW )2

( iN

NkNi

N WW 2.

iN

NW 21

ii

N

ee

1)

2(

21

ii )1())sin(1)(cos(

Page 307: Εισαγωγή

307Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διακριτός Μετασχηματισμός Fourier (1/4)

Για τον Διακριτό Μετασχηματισμό Fourier συνήθως χρησιμοποιούμε την συντομογραφία DFT από τον αντίστοιχο αγγλικό όρο Discrete Fourier Transform.

O Διακριτός Μετασχηματισμός Fourier μας προσφέρει την δυνατότητα μετάβασης από το πεδίο χώρου μιας εικόνας (spatial domain) στο αντίστοιχο πεδίο συχνοτήτων της (frequency domain).

Αυτή η δυνατότητα είναι πολύ σημαντική. Όπως θα δούμε στο κεφάλαιο αυτό αλλά και σε επόμενα κεφάλαια, η επέμβαση στο πεδίο συχνοτήτων μιας εικόνας είναι ένας από τους σημαντικότερους τρόπους τροποποίησης και επεξεργασίας της.

Page 308: Εισαγωγή

308Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διακριτός Μετασχηματισμός Fourier (2/4)

Ο μαθηματικός τύπος για τον DFT είναι ο ακόλουθος:

Προσοχή: Πρέπει να τονιστεί ότι τα (i, j) αποτελούν συντεταγμένες χώρου ενώ τα (u, v) αποτελούν συντεταγμένες συχνοτήτων οι οποίες εκφράζονται σε κύκλους ανά εικόνα.

∑∑1N

0i

1N

0j

)vjui(NW)j,i(I)v,u(I

~

= =

+=

Page 309: Εισαγωγή

309Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διακριτός Μετασχηματισμός Fourier (3/4)

Το αποτέλεσμα του DFT μιας εικόνας είναι ένας πίνακας διαστάσεων Ν x N (όπως η αρχική μας εικόνα). Επομένως

O Αντίστροφος Διακριτός Μετασχηματισμός Fourier (IDFT - Inverse DFT) μας βοηθά να ανακτήσουμε την αρχική μας εικόνα από το πεδίο συχνοτήτων της. Ο μαθηματικός του τύπος είναι ο ακόλουθος

]1,0|),(~

[~ NvuvuII

∑∑1N

0u

1N

0v

)vjui(N2 W)v,u(I

~N

1)j,i(I

= =

+=

Page 310: Εισαγωγή

310Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διακριτός Μετασχηματισμός Fourier (4/4)

Αν έχω ένα πεπερασμένο αριθμό εικόνων Ι1 ... ΙΜ

τότε ισχύει η ακόλουθη ιδιότητα:

Τα α1 ... αΜ είναι πραγματικοί αριθμοί και DFT(IΚ) = όπου 1 Κ Μ.

DFT[ α1Ι1 + ... + αΜΙΜ ] = α1DFT[ Ι1] + ... + αΜDFT[ ΙΜ]

KI~

Page 311: Εισαγωγή

311Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διακριτός Μετασχηματισμός Fourier - Σχόλια

Από τον τύπο του ΙDFT παρατηρούμε ότι μια εικόνα Ι δυνατόν να εκφραστεί ως ένα άθροισμα ενός πεπερασμένου αριθμού μιγαδικών εκθετικών εικόνων πολλαπλασιαζόμενων με κάποιο συντελεστή βάρους (weighted sum).

Για τον υπολογισμό του DFT μιας εικόνας, στις πλείστες περιπτώσεις, χρησιμοποιείται ο αλγόριθμος FFT (Fast Fourier Transform), ένας αποδοτικός αλγόριθμος και ένας από τους πλέον δημοφιλείς και χρησιμοποιούμενους αλγορίθμους ! ...

Page 312: Εισαγωγή

312Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διακριτός Μετασχηματισμός Fourier - Σχόλια

Το αποτέλεσμα του IDFT είναι μια μιγαδική εικόνα J όπου το φανταστικό μέρος του κάθε στοιχείου της εικόνας είναι της μορφής = 0. Επομένως θα πρέπει να απομονώσουμε το πραγματικό μέρος και μόνο αυτό να απεικονίσουμε.

10

Page 313: Εισαγωγή

313Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ιδιότητες του πίνακα DFT (1/3)

Μπορούμε να κατανοήσουμε τον πίνακα DFT καλύτερα μελετώντας μερικές ιδιότητες του.

Κάθε εικόνα Ι που μελετούμε, αποτελείται από πραγματικούς αριθμούς ή ακεραίους.

Ωστόσο, το DFT της είναι γενικά μιγαδικό.To DFT μιας εικόνας μπορεί να γραφτεί σαν

άθροισμα μιας πραγματικής και μιας φανταστικής εικόνας.

Page 314: Εισαγωγή

314Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ιδιότητες του πίνακα DFT (2/3)

Μπορεί να γραφτεί στην μορφή:

όπουimagreal III

~~~

1

)](2

cos[),(),(1

0

1

0

~

vjuijiIvuIN

i

N

j

real

)](2

sin[),(),(1

0

1

0

~

vjuijiIvuIN

i

N

j

imag

και

Page 315: Εισαγωγή

315Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ιδιότητες του πίνακα DFT (3/3)

δηλαδή,

Τα πιο πάνω υπολογίστηκαν απ΄ευθείας από την αρχική εξίσωση DFT.

Έτσι η έχει μέγεθος και φάση.

),(1),(),(~~~

vuIvuIvuI imagreal

~

I

Page 316: Εισαγωγή

316Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μέγεθος του DFT

Το μέγεθος του DFT είναι ένας πίνακας

με στοιχεία:

τα οποία είναι τα μεγέθη των μιγαδικών στοιχείων της

1,0|;),([|||~~

NvuvuII

),(~

),(~

|),(|22~

vuvuvuIII imagreal

~

I

Page 317: Εισαγωγή

317Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Φάση του DFT

Η φάση του DFT είναι ένας πίνακας

με στοιχεία:

τα οποία είναι η φάση των μιγαδικών στοιχείων της

]1,0);,([~~

NvuvuII

),(

),(tan),( ~

~

1~

vu

vuvuI

I

I

real

imag

~

I

Page 318: Εισαγωγή

318Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

DFT της εικόνας Ι

Έτσι…

Μέγεθος Φάση

)},(1exp{|),(|),(~~~

vuIvuIvuI

Page 319: Εισαγωγή

319Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συμμετρία (1/5)

Το DFT μιας εικόνας έχει συμμετρική συζυγία.

ΑπόδειξηΣτην απόδειξη θα χρησιμοποιηθούν οι πιο κάτω ισότητες:

1.

2.

1,0);,(*),(~~

NvuvuIvNuNI

11 )()(12)(

21

)(

jijiji

jiNN eeW

ji,*)()( ][ vjui

Nvjui

N WW

Page 320: Εισαγωγή

320Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συμμετρία (2/5)

Συνεχίζουμε με την απόδειξη…

),(*),(

),(*])[,(

),(

),(

),(

~~

~1

0

1

0

*][

1

0

1

0

)()]([

1

0

1

0

])()[(

~

vuIvNuNI

vuIWjiI

WWjiI

WjiI

vNuNI

N

i

N

j

vjuiN

N

i

N

j

vjuiN

jiNN

N

i

N

j

jvNiuNN

Page 321: Εισαγωγή

321Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συμμετρία (3/5)

Αποδεικνύοντας το πιο πάνω συμπεραίνουμε ότι ο πίνακας DFT περιέχει πλεονασμό, δηλαδή έχουμε τις ίδιες πληροφορίες περισσότερες από μία φορές (συμμετρία).

Τετριμμένα ισχύει: ),(),(

~~

vuIvNuNI realreal

),(),(~~

vuIvNuNI imagimag 1,0; Nvu

1,0; Nvu

Page 322: Εισαγωγή

322Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συμμετρία (4/5)

Απεικόνιση της συμμετρίας του DFT (μέγεθος).Συμμετρία και στις δύο κατευθύνσεις

(u-κατεύθυνση και v-κατεύθυνση). Οι μονάδες μέτρησης είναι cycles/image

(κύκλοι/εικόνα).v

u

(0, 0)

||~

I

Page 323: Εισαγωγή

323Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συμμετρία (5/5)

Οι ψηλότερες συχνότητες αναπαριστάνονται κοντά στο (u, v) = (N/2, N/2), δηλαδή στο κέντρο.

v

u

(0, 0)

low freqs

low freqs

low freqs

low freqs

high freqs

(0, N-1)

(N-1, 0) (N-1, N-1)

Page 324: Εισαγωγή

324Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Περιοδικότητα του DFT (1/4)

Ορίζουμε τον πίνακα DFT ώστε να έχει πεπερασμένη προέκταση με διαστάσεις N x N.

Ωστόσο, αν οι συντελεστές επιτραπούν να πάρουν τιμές έξω από την κλίμακα 0 ≤ u, v ≤ N-1, βρίσκουμε ότι το DFT είναι περιοδικό και στην u- και στην v-κατεύθυνση, με περίοδο Ν

]1,0);,([~~

NvuvuII

Page 325: Εισαγωγή

325Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Περιοδικότητα του DFT (2/4)

Απόδειξη

Στην απόδειξη θα χρησιμοποιηθεί η πιο κάτω ισότητα:

1.Συνεχίζουμε με την απόδειξη…

11 )()(12)(

21

)(

mjnimjnimjni

mjniNN eeW

1

0

1

0

])()[(

~

),(

),(N

i

N

j

jmMvinNuNWjiI

mMvnNuI

Page 326: Εισαγωγή

326Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Περιοδικότητα του DFT (3/4)

Αυτό ονομάζεται περιοδική προέκταση του DFT. Ορίζεται για όλες τις ακέραιες συχνότητες u,v.

1

0

1

0

)()(),(N

i

N

j

vjuiN

mjniNN WWjiI

1

0

~1

0

)( ),(),(N

i

N

j

vjuiN vuIWjiI

),(),(~~

vuImMvnNuI nm,

Page 327: Εισαγωγή

327Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Περιοδικότητα του DFT (4/4)

Περιοδική προέκταση του DFT

.

.

. . . .

.

.

Page 328: Εισαγωγή

328Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Περιοδική Προέκταση Της Εικόνας (1/4)

Εφαρμόζοντας την IDFT εξίσωση

στο DFT μιας εικόνας Ι, θα πάρουμε την αρχική μας εικόνα Ι, έτσι και η I προεκτείνεται περιοδικά.

ΑπόδειξηΣτην απόδειξη θα χρησιμοποιηθεί η πιο κάτω ισότητα:

1.

1

0

1

0

)(~

2),(

1),(

N

u

N

v

vjuiNWvuI

NjiI

11 )()(12)(

21

)(

mvnumvnumvnu

mvnuNN eeW

Page 329: Εισαγωγή

329Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Περιοδική Προέκταση Της Εικόνας (2/4)

Συνεχίζουμε με την απόδειξη…

1

0

1

0

)]()([~

2),(

1

),(N

u

N

v

mMjvnNiuNWvuI

N

mMjnNiI

1

0

1

0

)()(~

2),(

1 N

u

N

v

mvnuNN

vjuiN WWvuI

N

Page 330: Εισαγωγή

330Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Περιοδική Προέκταση Της Εικόνας (3/4)

Κατά τη χρήση του DFT υπονοείται ότι η εικόνα Ι είναι ήδη περιοδική.

Αυτό θα είναι πολύ χρήσιμο όταν θα μελετήσουμε την συνέλιξη (κυκλική συνέλιξη).

),(),(~

jiImMjnNiI

1

0

1

0

)(~

2),(),(

1 N

u

N

v

vjuiN jiIWvuI

N

mn,

Page 331: Εισαγωγή

331Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Περιοδική Προέκταση Της Εικόνας (4/4)

Περιοδική προέκταση της εικόνας

.

.

.

.

. .. .

Εικόνα Ι

Page 332: Εισαγωγή

332Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παρουσίαση του DFT (1/6)

Συνήθως το DFT αναπαρίσταται με την κεντρική του συντεταγμένη (u, v) = (0, 0) στο κέντρο της εικόνας.

Με αυτό τον τρόπο, οι πληροφορίες που αφορούν χαμηλές συχνότητες (οι οποίες συνήθως είναι κυρίαρχες στην εικόνα) επικεντρώνονται στη μέση της οθόνης.

Page 333: Εισαγωγή

333Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παρουσίαση του DFT (2/6)

Αυτό μπορεί να επιτευχθεί στην πράξη με το να πάρουμε το DFT της εναλλασσόμενης εικόνας (για σκοπούς αναπαράστασης μόνο).

Παρατηρήστε ότι:

οπότε χρησιμοποιώντας τα πιο πάνω…

1,0);,()1( NjijiIji

2/)(2/)(

21

)(1j i(-1) jiNN

jiji Wee

Page 334: Εισαγωγή

334Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παρουσίαση του DFT (3/6)

)2

,2

(~ N

vN

uI

)(1

0

1

0

)1(),()()1( vjuiN

N

i

N

j

jiji WjiIjiIDFT

2/)()(1

0

1

0

),( jiNN

vjuiN

N

i

N

j

WWjiI

jNviNuN

N

i

N

j

WjiI )2/()2/(1

0

1

0

),(

Page 335: Εισαγωγή

335Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παρουσίαση του DFT (4/6)

Μια απλή μετατόπιση του DFT στο μισό μήκος του και στις δυο κατευθύνσεις παρουσιάζεται πιο κάτω:

v

u

high

high

high

high

(-N/2, N/2)

(N/2, N/2)

low

(N/2, -N/2)

(-N/2, -N/2)

Centered DFT

Page 336: Εισαγωγή

336Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παρουσίαση του DFT (5/6)

Επειδή το DFT είναι μιγαδικής μορφής, το μέγεθος

και η φάση μπορούν να αναπαρασταθούν σαν ξεχωριστή εικόνα.

Για να αναπαρασταθεί το μέγεθος , συνήθως είναι καλύτερα να το συμπιέσουμε λογαριθμικά με την εξής εφαρμογή:

πριν την αναπαράσταση, επειδή οπτικά οι χαμηλού μεγέθους συχνότητες θα είναι δυσδιάκριτες.

~

I||~

I

|),(~

|1log vuI

Page 337: Εισαγωγή

337Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παρουσίαση του DFT (6/6)

Μετά το λογάριθμο, είναι αναγκαίο να χρησιμοποιήσουμε γραμμική λειτουργία απλού στίγματος για να επεκτείνουμε την αντίθεση, επειδή οι τιμές του λογαρίθμου θα είναι πολύ μικρές.

ΠΑΡΑΔΕΙΓΜΑ DFT

Ι = imread(‘exampleim.tif’); F = fft2(I); F1 = log(1+abs(F)); imshow(I); figure, imshow(F1)

I

Page 338: Εισαγωγή

338Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Πίνακας Εκθετικών Μιγαδικών

Ορίζουμε ένα πίνακα των DFT εκθετικών μιγαδικών.

Αυτός είναι ένας συμμετρικός πίνακας.

2)1()1(21

12

...1

............1

...1

....111

NN

NN

NN

NNNN

N

WWW

WWWW

Page 339: Εισαγωγή

339Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Πίνακας Εκθετικών Μιγαδικών

Ο αντίστροφος πίνακας του είναι ο εξής συζυγής μιγαδικός:

*1 1NW

NW

N

NW

Page 340: Εισαγωγή

340Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Πίνακας Εκθετικών Μιγαδικών

Στην προηγούμενη εξίσωση, το στοιχείο καθορίζεται από τον εξής πίνακα:

όπου

*NW

)(1exp()2

1exp( 11 jiWN

2)1()1(21

121*

...1

............1

...1

....111

NN

NN

NN

NNNN

N

WWW

WWWW

Page 341: Εισαγωγή

341Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μορφή γινομένου πινάκων των λειτουργιών DFT

Μπορούμε τώρα να ξαναγράψουμε τις DFT και IDFT εξισώσεις σαν γινόμενο πινάκων:

DFT:

IDFT:

NN IWWI ~

**2

~1NN WIW

NI

Page 342: Εισαγωγή

342Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Απόδειξη εξισώσεων γινομένου πινάκων των λειτουργιών DFT

**2

**2

1~1NNNNNN WIWWW

NWIW

N

112

1 NNNN NWIWWNWN

11 NNNN WIWWW

I

I

11

Page 343: Εισαγωγή

343Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μορφή γινομένου πινάκων των λειτουργιών DFT

Δεν υπάρχει κανένα μυστήριο σχετικά με τη μορφή του πίνακα DFT – είναι απλά ένας εύκολος και βολικός τρόπος καταγραφής στοιχείων και αθροισμάτων υπό μορφή πολλαπλασιασμού πινάκων.

Θα μας είναι πολύ χρήσιμο αργότερα σαν συντόμευση όταν θα χρησιμοποιούμε το DFT εκτενώς.

Page 344: Εισαγωγή

344Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Υπολογισμός του DFT

Οι γρήγοροι αλγόριθμοι για το DFT αναφέρονται συλλογικά σαν αλγόριθμοι γρήγορων μετασχηματισμών Fourier (FFT – Fast Fourier Transform).

Δεν θα ερευνήσουμε τη σχεδίασή τους, αφού είναι διαθέσιμοι στα περισσότερα προγράμματα μαθηματικών βιβλιοθηκών.

Page 345: Εισαγωγή

345Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Υπολογισμός του DFT Συνήθως ένας αλγόριθμος αρκεί για τον υπολογισμό και του DFT και του IDFT, αφού η δομή των μετασχηματισμών είναι παρόμοια.

Στις εξισώσεις πινάκων του DFT – IDFT, θυμηθείτε ότι διαφέρουν μόνο στη χρήση του W αντί του .

Έτσι ένα πρόγραμμα χρειάζεται να γνωρίζει μόνο ένα ψηφίο ελέγχου (flag bit), το οποίο θα δεικνύει κατά πόσο οι μιγαδικές τιμές θα πρέπει να είναι συζυγείς ή όχι.

NW

Page 346: Εισαγωγή

346Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Το Νόημα Της Συχνότητας Εικόνας

Μερικές φορές είναι εύκολο να χάσουμε την έννοια του DFT και του περιεχομένου συχνότητας της εικόνας σε όλα αυτά τα μαθηματικά.

Το DFT είναι ακριβώς αυτό – μια περιγραφή της περιεχόμενης συχνότητας.

Κοιτάζοντας το DFT ή το φάσμα μιας εικόνας (ειδικά το μέγεθός της), μπορούμε να προσδιορίσουμε πολλά στοιχεία σχετικά με την εικόνα.

Page 347: Εισαγωγή

347Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ποιοτικές ιδιότητες του DFT

Μπορούμε να θεωρήσουμε το DFT σαν μια εικόνα περιεχομένου συχνότητας.

Οι φωτεινές περιοχές στην DFT “εικόνα” αντιστοιχούν στις συχνότητες οι οποίες έχουν

μεγάλο μέγεθος στην πραγματική εικόνα.

Είναι διαισθητικά λογικό να σκεφτούμε την περιεχόμενη συχνότητα της εικόνας σε συσχέτιση με την κοκκυκότητα (κατανομή της ακτινωτής συχνότητας) και τον προσανατολισμό της.

Page 348: Εισαγωγή

348Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Granularity

Μεγάλες τιμές κοντά στο κέντρο του DFT αντιστοιχούν σε μεγάλες ομαλές περιοχές της εικόνας ή σε δυνατό φόντο.

Από τη στιγμή που οι εικόνες είναι θετικές (υπονοώντας μια προσθετική μετατόπιση), κάθε εικόνα έχει μια μεγάλη κορυφή στο (u, v) = (0, 0).

Page 349: Εισαγωγή

349Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Χρήση μασκών στο DFT

Θεωρούμε ότι ορίζουμε διαφορετικές εικόνες με τιμές 0 και 1 (δυαδικές εικόνες).

Σημείωση: Οι μάσκες πρέπει να εφαρμόζονται πάνω σε shifted εικόνες.

Low pass Mid pass High pass

Page 350: Εισαγωγή

350Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Χρήση μασκών στο DFT

Η χρησιμοποίηση μασκών στο DFT παράγει IDFT εικόνες με μόνο χαμηλές, μέσες ή υψηλές εναπομείναντες συχνότητες.

Φυσικά η πρόσθεση των αποτελεσμάτων μας επαναφέρει στην αρχική εικόνα.

Προσανατολισμός (Directionality): Αν το DFT είναι φωτεινότερο κατά μήκος κάποιας κατεύθυνσης , η εικόνα περιλαμβάνει ψηλά στοιχεία προσανατολισμού προς αυτή την κατεύθυνση.

Page 351: Εισαγωγή

351Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Χρησιμοποιώντας μάσκες στο DFT

Ορίζουμε μερικές εικόνες προσανατολισμού μηδενός – ενός:

Page 352: Εισαγωγή

352Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Χρησιμοποιώντας μάσκες στο DFT

Η χρησιμοποίηση μασκών θα παράξει ΙDFT εικόνες μόνο με απομεινάρια υψηλών προσανατολισμένων συχνοτήτων( διαφάνειες).

Πάλι αν προσθέσουμε τα αποτελέσματα θα πάρουμε πίσω την αρχική εικόνα.

Page 353: Εισαγωγή

353Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εικόνες Στενού Φάσματος

Είναι επίσης πιθανόν να παράξουμε μια εικόνα η οποία είναι υψηλά προσανατολισμένη.

Αυτή η μάσκα δημιουργήθηκε με πολλαπλασιασμό( σημείου- προς – σημείο) της

Μάσκας συχνοτήτων με μια από τις μάσκες προσανατολισμού.

Page 354: Εισαγωγή

354Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Θεώρημα Δειγματοληψίας (1/3)

Είναι αξιοσημείωτη η εξέταση της συσχέτισης

μεταξύ του DFT (φάσμα ψηφιακού σήματος) και του μετασχηματισμού Fourier της αρχικής, χωρίς – δειγματοληψία εικόνας.

Page 355: Εισαγωγή

355Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Θεώρημα Δειγματοληψίας (2/3)

Η εικόνα Ιc(x,y) έχει Συνεχές Μετασχηματισμό Fourier (CFT) Ιc(wx, wy) όπου (x,y)δηλώνουν τις

συχνότητες πραγματικού χώρου και (ωx,ωy) δηλώνουν συνεχείς συχνότητες.

~ ∞ ∞ -2π √-1 (xωx+ yωy)

Ic(ωx, ωy) = ∫ ∫ Ic(x, y) ℮ dωx dωy

-∞ -∞ ∞ ∞ ~ 2 π √-1 (xωx+ yωy) Ic(x,y)= 1/ (2π)2 ∫ ∫ Ic(ωx,ωy) ℮ dωx dωy

-∞ -∞

Page 356: Εισαγωγή

356Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Θεώρημα Δειγματοληψίας (3/3)

Αυτό δεν πρέπει να είναι μεγάλη έκπληξη αφού

Τα ολοκληρώματα είναι όρια αθροισμάτων :

Ιc(x,y) μπορεί να εκφραστεί σαν όρια αθροισμάτων εκθετικών μιγαδικών.

Σημαντικό:

To CFT δεν είναι περιοδικό.Αυτή η ιδιότητα είναι παράξενη σε ψηφιακές εικόνες.Το CFT ορίζεται για όλες τις συχνότητες. Το CFT

Page 357: Εισαγωγή

357Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συσχέτιση του CFT με το DFT (1/5)

Ας θεωρήσουμε ότι Ιc(x,y) έχει περιορισμένο φάσμα ,που σημαίνει ότι το CFT της είναι μηδέν έξω από ένα πεδίο συχνοτήτων:

Ιc(ωx, ωy) = 0 for |ωx| ≥ Wx, |ωy| ≥ Wy

Η συνθήκη ικανοποιήτεαφού το υλικό (hardware)το εφαρμόζει με αναλογικόφιλτράρισμα (π.χ. οπτικά).

Πριν την δειγματοληψία.

Page 358: Εισαγωγή

358Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συσχέτιση του CFT και DFT (2/5)

Κάθε πραγματική εικόνα είναι σημαντικά περιορισμένη (π.χ., το CFT της γίνεται μηδενικό για μεγάλα ωx, ωy).

Άν Ι(i,j) είναι ένα δείγμα χώρου Χ και Υ στην x- και y-κατεύθυνση (έτσι η συχνότητα

δειγματοληψίας 1 και 1 ): Χ Υ Ι(i,j) = Ic(iX,jY) για 0 ≤ i, j ≤ N-1

Page 359: Εισαγωγή

359Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συσχέτιση του CFT και DFT (3/5)

Tότε το DFT και το CFT συσχετίζονται από: ~ 1 ∞ ∞ ~ n m

I(u,v)= ∑ ∑ Ic(ωx - ,ωy - ) | X Y n=- ∞ m=-∞ X Y u v

ωx = , ωy = N X N Y

Page 360: Εισαγωγή

360Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συσχέτιση του CFT και DFT (4/5)

1 ∞ ∞ ~ u n v m = ∑ ∑ Ic ( - , - ) X Y n=- ∞ n=- ∞ N X X NY Y

Αυτό είναι το άθροισμα μετατοπισμένης εκδοχήςτου CFT .Είναι περιοδικό στη u και v κατεύθυνση

με περίοδο 1/Χ και 1/Υ.

Page 361: Εισαγωγή

361Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συσχέτιση του CFT και DFT (5/5)

Αυτό φαίνεται στο πιο κάτω σχήμα:

12

12

y

x

Y

X

Page 362: Εισαγωγή

362Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σχόλια (1/2)

Υπάρχει ένας μαθηματικός λόγος γιατί οι εικόνες γιατί οι εικόνες πρέπει να δειγματοληπτούνται αρκετά πυκνά. Αν αυτός ο μαθηματικός όρος παραβιαστεί ,τότε η παραμόρφωση των εικόνων θα είναι ορατή.

Επίσης σημαντικό: αν το θεώρημα δειγματοληψίας ικανοποιηθεί ,μπορεί να θεωρηθεί ώς περιοδικό αντίγραφο του CFT.

Έτσι ο ΝxN DFT πίνακας Ι θα περιλαμβάνει στοιχεία που αποτελούνται από δείγματα του CFT

Page 363: Εισαγωγή

363Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σχόλια (2/2)

~ 1 ~ u vI(u,v) = Ic( , ) for 0≤ |u|,|v|≤N/2-1 ΧΥ ΝΧ ΝΥ

(Σημειώστε: αφού το CFT δεν είναι περιοδικό, ορίζουμε το DFT σαν δείγματα του CFT με την αρχή (0,0) στο κέντρο).

Δεν υπάρχει λόγος για να μην μπορούμε να θεωρήσουμε ότι Χ=Υ=1.

Page 364: Εισαγωγή

364Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σημαντικές 2-Δ Συναρτήσεις και τα DFT (1/2)

Αξίζει να εξετάσουμε τα DFT s μερικών προσδιορισμών εικόνων .Ωστόσο, αυτό είναι δύσκολο να το κάνουμε με το χέρι στις περισσότερες περιπτώσεις.Έτσι θα δώσουμε μερικά απλά παραδείγματα. Μετά θα δείξουμε μερικά άλλα ως CFT ζεύγη μετασχηματισμού.

Constant image : Θέτουμε Ι(i,j) = c for 0≤ i,j≤ N-1 ~

Τότε I(u,v)=N² . c.δ(u,v) δ(u,v)= { 1, u=v=0; else 0.

Page 365: Εισαγωγή

365Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σημαντικές 2-Δ Συναρτήσεις και τα DFT (2/2)

2-D Unit Pulse Image (2-Δ Unit Pulse εικόνα) Θέτουμε Ι( i,j) = c. δ(i,j) (I(0,0)=c, else I(i,j)=0). ~ N-1 N-1 (ui+ vj)Tότε Ι(u,v) = c. δ(i,j) WN

0 i=0 j=0 =c.W =c (constant DFT).

Cosine Wave Image (Εικόνα Συνημιτόνου) Θέτουμε Ι(i,j)=d. cos[2π/Ν (bi + cj)]

Page 366: Εισαγωγή

366Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Eικόνα Συνημιτόνου

Με βάση τα προηγούμενα υπολογίζουμε το DFT : N-1 N-1 (bi + cj) -(bi+cj) (ui+vj)

Ι(u,v)=(d/2) [WN + WN ] WN i=0 j=0

Προκύπτει : Ι(u,v)=(dN² )[ δ(u+b, v+c) +δ(u-b, v-c)]

Έτσι το DFT δεν έχει μηδενική τιμή μόνο στις συχνότητες του κύματος συνημιτόνου.Με το ίδιο σκεπτικό υπολογίζω το DFT του ημιτόνου.

DFT{d.sin[2π/Ν(bi+cj)]} = (dN²)-1[δ(u-b,v-c) - δ(u+b,v+c)].

Page 367: Εισαγωγή

367Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παραδείγματα ΣυνεχήΜετασχηματισμού Fourier (I / II)

Και τώρα μερικά CFT ζεύγη τα οποία είναι δύσκολο να εκφραστούν ή παίρνουν πολύ χρόνο για να γίνουν με το χέρι σαν ζεύγη DFT.

Συνάρτηση Ορθογωνίου

·     Θέτουμε   Ic(x, y) = c rect(x/Ax) rect(y/Ay)

Δηλαδή: Ic(x, y) = { c; |x| ≤ Ax/2 και |y| ≤ Ay/2 { 0 ; αλλούΑφού rect(x) = { 1 ; |x| ≤ ½ ~ { 0 ; αλλού

Τότε: Ιc (wx, wy) = c Ax Ay sinc(wx Ax) sinc(wy Ay)  όπου sinc(x)=sin(π x)/(π x)

Page 368: Εισαγωγή

368Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παραδείγματα ΣυνεχήΜετασχηματισμού Fourier (II / II)

Συνάρτηση Sinc

Ic(x, y) = c· sinc (ax) sinc (by) όπου a, b ≥ 0

Ic (wx, wy) = {c; |wx| ≤ a και |wy| ≤ b {0; αλλού.

Συνάρτηση Gaussian

Ic(x, y )= exp [ -(x² + y²)/s²]

Τότε Ιc(wx, wy)= exp [ -2π ²s²( ωx+ωy) ]

Το οποιο ειναι επισης Gaussian.

Page 369: Εισαγωγή

369Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Τέλος Κεφαλαίου 4

ΕΠΛ 445 – Ψηφιακή Επεξεργασία Εικόνας

Page 370: Εισαγωγή

370

ΚΕΦΑΛΑΙΟ 5

Γραμμικό Φιλτράρισμα Εικόνων

ΕΠΛ 445 – Ψηφιακή Επεξεργασία Εικόνας

Page 371: Εισαγωγή

371Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κυκλική Συνέλιξη (1/2)

Έχουμε παρατηρήσει ότι με την μετατόπιση του DFT μιας εικόνας αλλάζει η εμφάνιση της.

Για παράδειγμα, πολλαπλασιάζοντας το DFT με μια μάσκα μηδενός:

Μετατρέπει με σιγουριά την δομή των πεδίων φωτεινότητας στην

εικόνα.

Page 372: Εισαγωγή

372Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κυκλική Συνέλιξη (2/2)

Ποιο είναι το αποτέλεσμα αν δυο τυχαία DFTs πολλαπλασιαστούν μεταξύ τους (σημείο προς σημείο);

Ποια είναι η φύση της εικόνας που παράγεται από τις ακόλουθες λειτουργίες;

1 2

1 2

.*

. /

J I I

J I I

Page 373: Εισαγωγή

373Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Πολλαπλασιασμός/Διαίρεση DFTs (1/5)

Αποφέυγετε την διαίρεση με το μηδέν.

Page 374: Εισαγωγή

374Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Πολλαπλασιασμός DFTs (2/5)

Εφαρμόζουμε τον αντίστροφο μετασχηματισμό DFT στο γινόμενο των DFTs

1 1( )2

0 0

( , ) (1/ ) ( , )N N

ui vjN

u v

J i j N J u v W

1 1( )2

1 20 0

(1/ ) ( , ) ( , )N N

ui vjN

u v

N I u v I u v W

1 2( , ) ( , )I u v I u v

Page 375: Εισαγωγή

375Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Πολλαπλασιασμός DFTs (3/5)

1 1 1 1

2 ( )1

0 0 0 0

(1/ ) { ( , ) }.N N N N

um vnN

u v m n

N I m n W

1

0

1

0

)()(2 }.),({

N

p

N

q

vjuiN

vqupN WWqpI

1 1 1 12

1 20 0 0 0

(1/ )[ ( , ) ( , )].N N N N

m n p q

N I m n I p q

1

0

1

0

)]()([ ][N

u

N

v

jnqvimpuNW

Page 376: Εισαγωγή

376Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Πολλαπλασιασμός DFTs (4/5)

Ο εσωτερικός όρος είναι:

Αντικαθιστώντας παίρνουμε:

1

0

1

0

2)]()([ ),(N

u

N

v

jnqvimpuN inqimpNW

Page 377: Εισαγωγή

377Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Πολλαπλασιασμός DFTs (5/5)

1 1 1 1

1 20 0 0 0

( , ) ( , ) ( , ). ( , )N N N N

m n p q

J i j I m n I p q p m i q n j

1 1

1 20 0

( , ). [( ) , ( ) ])N N

N Nm n

I m n I i m j n

1 1

1 20 0

[( ) , ( ) ]. ( , )N N

N Np q

I i p j q I p q

Page 378: Εισαγωγή

378Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κυκλική Συνέλιξη (1/2)

Μελετούμε τώρα το άθροισμα

=Ι1 Ι2 =κυκλική συνέλιξη της Ι1 και Ι2Το είναι ένα άθροισμα βάρους των συντελεστών

της εικόνας Ι1 , όπου οι παράμετροι Ι2(i-m , j-n) είναι μετατοπισμένα στοιχεία της εικόνας Ι2.

])(,)[().,(),( 2

1

0

1

01 NN

N

m

N

n

njmiInmIjiJ

Page 379: Εισαγωγή

379Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κυκλική Συνέλιξη (2/2)

Το μέγεθος της μετατόπισης εξαρτάτε από (i, j). Για δεδομένα (i, j), η J(i, j) που αποτελεί την νέα

εικόνα, ορίζεται ως: τοποθέτηση της I2 πάνω στην I1 αντιστροφή της I2 : [I2(-m, -n)] μετατόπιση της I2 με μέγεθος (i, j) υπολογισμός I1(m, n)·I2[(i-m)N, (j-n)N]

for 0 ≤ m, n ≤ N-1προσθέτουμε τα αποτελέσματα.Τα σχήματα που δίδονται πιο κάτω είναι απαραίτητα για

να κατανοήσουμε πλήρως τις έννοιες αυτές.

Page 380: Εισαγωγή

380Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διαγράμματα Της Κυκλικής Συνέλιξης (1/6)

Όλες οι ακόλουθες διεργασίες είναι για να υπολογίσουμε την κυκλική συνέλιξη σε ένα απλό σημείο (i, j).

Θεωρούμαι τις δυο εικόνες Ι1 και Ι2 με την εικόνα I1 και το σκιασμένο περιεχόμενο σε κάθε φάση της επεξεργασίας που φαίνεται:

(0,0) (0,0)

Image I1

j

i

Image I2

Page 381: Εισαγωγή

381Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διαγράμματα Της Κυκλικής Συνέλιξης (2/6)

Τους δίνουμε το ίδιο σύστημα συντεταγμένων (δηλ. τοποθετούμε την μια πάνω στην άλλη).

Και το αποτέλεσμα που παίρνουμε είναι:

(0,0)

j

i

Superimposed

Page 382: Εισαγωγή

382Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διαγράμματα Της Κυκλικής Συνέλιξης (3/6)

Η εικόνα Ι2 αντιστρέφεται(ανακλάτε), κατά μήκος και των δύο αξόνων.

Έτσι είναι ορισμένη και για αρνητικές συντεταγμένες, π.χ χρησιμοποιείτε η περιοδική επέκταση.

(0,0)

j

i

reversedI2

Page 383: Εισαγωγή

383Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διαγράμματα Της Κυκλικής Συνέλιξης (4/6)

Η αντιστραμμένη ερμηνεία της Ι2 τότε μετατοπίζεται με το μέγεθος (i , j) κατά μήκος των δυο αξόνων:

(0,0)j

ishiftedI2

Page 384: Εισαγωγή

384Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διαγράμματα Της Κυκλικής Συνέλιξης (5/6)

Το άθροισμα προεκτείνεται πάνω στο 0<=m,n<=Ν-1 έτσι μερικοί από τους συντελεστές της Ι2(i-m , j-n) πέφτουν έξω από το διάστημα 0,...,Ν-1.

Αυτό που υπολογίζεται είναι το άθροισμα του α)γινομένου της: [ Ι1(m,n) ; 0 <= m,n <= N-1 ] β)της περιοδικής επέκτασης [ Ι2(i-m , j-n) ]

Page 385: Εισαγωγή

385Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διαγράμματα Της Κυκλικής Συνέλιξης (6/6)

Όπως φαίνεται:

I2Overlay of periodic extension of shiftedSummation occurs for 0 < I, j < N-1 (inside )

(0,0)j

i

Page 386: Εισαγωγή

386Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Υπολογισμός Της Κυκλικής Συνέλιξης (1/3)

Ευθύς Υπολογισμός:

Είναι κάπως απλός αλλά χρονοβόρος.

])(,)[().,(),(1

0

1

021 NN

N

m

N

n

njmiInmIjiJ

Page 387: Εισαγωγή

387Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Υπολογισμός Της Κυκλικής Συνέλιξης (2/3)

Ψευδοκώδικας:

int I1 [N ] [N], I2 [N ] [N], J[N][N];

while (0 ≤ i, j ≤ N-1) { J (i, j) = 0;

while (0 ≤ m, n ≤ N-1) J (i, j) = J (i, j) + I1(m, n) * I2[(i-m) mod N, (j-n) mod N];

}

Matlab: J = conv2(I1, I2);

Page 388: Εισαγωγή

388Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Υπολογισμός της Κυκλικής Συνέλιξης (3/3)

Ο αλγόριθμος είναι απλά ένα σύνολο με do-loops το ένα μέσα στο άλλο.

Αν το Ν είναι μεγάλο(ας πούμε 512 * 512) τότε:

-Για κάθε N2 συντεταγμένες: N2 αθροίσματα και

N2 πολλαπλασιασμοί .

-΄Η N4 αθροίσματα και N4 πολλαπλασιασμοί

σύνολο.

-Για N = 512, αυτό κάνει 236 = 6.9 x 1010

λειτουργίες.

Page 389: Εισαγωγή

389Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Υπολογισμός με DFT της Κυκλικής Συνέλιξης

Λόγο του FFT, ο υπολογισμός της κυκλικής συνέλιξης στον χώρο του DFT είναι πολύ πιο γρήγορος, νοούμενου ότι Ν =δυνάμεις του 2.

Απλά:

Όπου δείχνει ένα Ν*Ν σημείων

αλγόριθμο FFT.

Matlab: J = real (ifft2(fft2(I1) .* fft2(I2)));

real(.), παρόλον ότι το φανταστικό μέρος είναι μικρό.

1 2 1 2[ [ ] [ ]]N N NJ I I IFFT FFT I FFT I

NFFT

Page 390: Εισαγωγή

390Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Υπολογισμός με DFT της Κυκλικής Συνέλιξης

Ο υπολογισμός του FFT μιας Ν*Ν εικόνας είναι της τάξεως του όπως επίσης και ο

υπολογισμός της κυκλικής συνέλιξης.

Μετά από όλη αυτή την δουλειά θα ανακαλύψουμε τώρα ότι η κυκλική συνέλιξη πρέπει να τροποποιηθεί για να γίνει χρήσιμη.

)log(. 22 NN

Page 391: Εισαγωγή

391Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Συνέλιξης (1/7)

Η κυκλική συνέλιξη είναι συναίτια του περιοδικού DFT Για συνεχείς εικόνες και , κάνουμε

πολλαπλασιασμό των CFTs (π.χ., με οπτικά μέσα)

Έχει ως αποτέλεσμα την χρήσιμη γραμμική συνέλιξη:

),(1 yxI c ),(2 yxI c

1 2'( , ) ( , ) ( , )x y c x y c x yJ I I

),(*),(),( 21 yxIyxIyxJ cc

Page 392: Εισαγωγή

392Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Συνέλιξης (2/7)

Η γραμμική συνέλιξη είναι φαινόμενο της φύσης. Η κυκλική συνέλιξη είναι τεχνητό αποτέλεσμα της ψηφιακής επεξεργασίας.

Πολλή ύλη από την θεωρία κυκλωμάτων, την οπτική, και την θεωρία συνεχών φίλτρων είναι βασισμένες πάνω στην γραμμική συνέλιξη.

Συνεπάγεται ότι, (γραμμική) η θεωρία των ψηφιακών κυκλωμάτων επίσης χρειάζονται την αντίληψη της ψηφιακής γραμμικής συνέλιξης.

Ευτυχώς, η κυκλική συνέλιξη μπορεί να χρησιμοποιηθεί για τον υπολογισμό της γραμμικής συνέλιξης.

Page 393: Εισαγωγή

393Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Συνέλιξης (3/7)

Παράδειγμα(γιατί η κυκλική συνέλιξη είναι μη επιθυμητή):

Ένα από τους απλούστερους τύπους γραμμικών συνελίξεων είναι η λειτουργία τοπικού μέσου όρου (η φίλτρο μέσου όρου).

Πιο κατανοητά, κάθε στίγμα εικόνας αντικαθίσταται από τον μέσο όρο των γειτόνων του μέσα σε ένα τετράγωνο ‘παράθυρο’.

Άρα:

Page 394: Εισαγωγή

394Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Συνέλιξης (4/7)

(0,0)

Input image

j

i

(0,0)

Output image

j

i

average of values within square window

Page 395: Εισαγωγή

395Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Συνέλιξης (5/7)

Αυτό μπορεί να εκφραστεί, στα πιο πολλά σημεία (χωρίς να το αποδείξουμε εδώ) σαν την κυκλική συνέλιξη της εικόνα με μια άλλη εικόνα του τετράγωνου με φωτεινότητα 1/M, όπου M = # στιγμάτων στο τετράγωνο:

Input image Image of square

0

1/M

Page 396: Εισαγωγή

396Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Συνέλιξης (6/7)

Κοντά στα άκρα της εικόνας, ωστόσο, έχουμε κυκλικές παρεμβολές:

Συνήθως είναι επιθυμητό να παίρνουμε μέσους όρους γειτονικών στοιχείων...

Opposite sidesof the imageare being averagedtogether !

Page 397: Εισαγωγή

397Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Συνέλιξης (7/7)

… και γενικά, ο σκοπός της συνέλιξης είναι για να θέσουν υπεράνω και να ζυγίσουν τις εικόνες σύμφωνα με τη σωστή σειρά τους στον χώρο, αντί την περιοδική σειρά που είναι αποτέλεσμα του DFT

Το αποτέλεσμα είναι ακόμα χειρότερο αν και οι δυο εικόνες δεν είναι μηδενικές κοντά στις άκρες τους.

Αν το φίλτρο είναι μεγάλο, το κυκλικό λάθος είναι γενικά απαράδεκτο

Αν το φίλτρο είναι μικρό, το κυκλικό αποτέλεσμα μπορούμε να το δεχτούμε αν αναγνωριστεί κοντά στις άκρες τις εικόνας. Αλλά χρησιμοποιώντας μικρά φίλτρα μπορεί να γίνει και χωρίς DFTs (αργότερα)

Page 398: Εισαγωγή

398Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Συνέλιξη Με Προσθήκη Μηδενικών (1/4)

Η εκτέλεση της γραμμικής συνέλιξης από κυκλική συνέλιξη είναι γενικώς απλό θέμα

Επιτυγχάνεται με την προσθήκη στους δυο πίνακες εικόνων με μηδενικές τιμές

Γενικά, και οι δυο πίνακες εικόνας πρέπει να διπλασιαστούν στο μέγεθος:

Page 399: Εισαγωγή

399Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Συνέλιξη Με Προσθήκη Μηδενικών (2/4)

Στις άκρες της εικόνας, δεν θα σημειωθεί κυκλικό φαινόμενο, αφού η ‘κινητή’ εικόνα θα ζυγιστούν με μηδενικές τιμές μόνο έξω από το πεδίο ορισμού

Αυτό μπορεί να το δούμε παρατηρώντας τις επικαλύψεις όταν υπολογίζουμε την συνέλιξη στα σημεία (i, j):

0

Image I1

(zero padded)

0

Image I2

(zero padded)

Page 400: Εισαγωγή

400Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Συνέλιξη Με Προσθήκη Μηδενικών (3/4)

Στις άκρες της εικόνας, δεν θα σημειωθεί κυκλικό φαινόμενο, αφού η ‘κινητή’ εικόνα θα ζυγιστεί με μηδενικές τιμές μόνο έξω από το πεδίο ορισμού. Θα το δούμε στο παράδειγμα παρατηρώντας τις επικαλύψεις όταν υπολογίζουμε την συνέλιξη στα σημεία (i, j).

Στο παράδειγμα που θα δούμε τα αθροίσματα υπάρχουν μόνο μέσα στο μπλε σκιασμένο τετράγωνο.

Αντί να αθροίζουμε στην περιοδική επέκταση της ‘κινητής εικόνας’, οι μηδενικές τιμές προσθέτονται στις ζυγισμένες εσωτερικές τιμές

Page 401: Εισαγωγή

401Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Συνέλιξη Με Προσθήκη Μηδενικών (4/4)

Γραμμική συνέλιξη με προσθήκη μηδενικών

Παράδειγμα

Page 402: Εισαγωγή

402Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Υπολογισμός DFT της Γραμμικής Συνέλιξης

Ας θεωρήσουμε ότι I1´ , I2´ , και J´ είναι εκδοχές εικόνων με προσθήκη μηδενικών 2N x 2N δυο εικόνων οι οποίες θα εφαρμοστεί η γραμμική συνέλιξη (I1 και I2). Τότε αν

J´ = I1´ I2´ = IFFT2N [FFT2N[I1´] FFT2N[I2´]]

όπου FFT2N δείχνει ένα (2N x 2N)-σημείο του αλγόριθμου FFT, τότε η N x N εικόνα με στοιχεία

 J(i, j) = J´ (i, j) ; d+0 ≤ i, j ≤ d+ N-1

όπου (d, d) είναι το ‘κέντρο’ του φίλτρου θα περιλαμβάνει το αποτελεσμα γραμμικής συνέλιξης.

  Με άλλες λέξεις:J = IJ = I11 * I * I22

Page 403: Εισαγωγή

403Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σημειώσεις

Στην πραγματικότητα, το αποτέλεσμα της γραμμικής συνέλιξης είναι μεγαλύτερο από N x N, αλλά το σημαντικό μέρος του αποτελέσματος περιέχεται στην J

Μερικές φορές είναι επιθυμητό να συνελέξουμε μια εικόνα με ένα μικρότερο template φίλτρου (ας πούμε MxM), όπου M < N. Αυτό επιτυγχάνεται εύκολα με την προσθήκη μηδενική στο υποστήριγμα με μηδενικά μεγέθους NxN.

Στην πράξη, αν M << N, ίσως είναι γρηγορότερο να εκτελέσουμε την γραμμική συνέλιξη στο πεδίο χώρου

Page 404: Εισαγωγή

404Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ευθείς Υπολογισμός της Γραμμικής Συνέλιξης

Ο ευθείς υπολογισμός της γραμμικής συνέλιξης είναι απλός με χωρίς περισσότερο υπολογισμό από της κυκλικής συνέλιξης (αλλά ακόμα συνήθως πολύ περισσότερος από της προσέγγιση FFT).

Αν αντί να θεωρήσουμε ότι I1 και I2 είναι περιοδικά επεκτεινόμενα (όχι απαραίτητος όταν δεν χρησιμοποιούμε το DFT), μπορούμε να υποθέσουμε ότι

I1(i, j) = I2(i, j) = 0 οποιουδήποτε i < 0 ή j < 0 ή i > N-1 ή j > N-1.

Σε αυτή την περίπτωση η εξίσωση :

Δίνει:

J = I1 * I2

1-N

0m

1-N

0n21 n)-j m,-(in)·I (m,Ij)J(i,

Page 405: Εισαγωγή

405Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ψευδό-Κώδικας για Γραμμική Συνέλιξη

{int I1 [N ] [N], I2 [N ] [N]; do{

J(i, j) = 0;do{

if (0 ≤ i-m ≤ N-1 and 0 ≤ j-n ≤ N-1){

J(i, j) = J(i, j) + I1(m, n) * I2(i-m, j-n);}

} while (0 ≤ m, n ≤ N-1); } while (0 ≤ i, j ≤ N-1);}

Εδώ η υποθετική εντολή (if) εμποδίζει την λειτουργία αθροίσματος από το να συμβεί έξω από την εικόνα.

Page 406: Εισαγωγή

406

ΓΡΑΜΜΙΚΑ ΣΥΣΤΗΜΑΤΑ ΚΑΙ ΓΡΑΜΜΙΚΟ ΦΙΛΤΡΑΡΙΣΜΑ ΕΙΚΟΝΩΝ

Μια επεξεργασία η οποία δέχεται ένα σήμα ή εικόνα Ι σαν είσοδο και την μετασχηματίζει με μια πράξη της γραμμικής συνέλιξης, είναι ένας τύπος γραμμικού συστήματος

ΕΠΛ 445 – Ψηφιακή Επεξεργασία Εικόνας

Page 407: Εισαγωγή

407Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παραδείγματα

MTF = modulation transfer function:

IR = impulse response:

Αυτό που μας ενδιαφέρει:

 

series of

lenses with MTF

optical image

I H

transformed image

J = I H *

electrical current

I H

output current

lumped electrical

circuit with IR J = I*H

J = I H*

digital image

output image

I

digital image filter

H

Page 408: Εισαγωγή

408Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Στόχος του Φιλτραρίσματος Εικόνων

Επεξεργαζόμαστε, δειγματολημμένες, κβαντισμένες εικόνες για να μετασχηματίσουμε σε:

εικόνες καλύτερης ποιότητας (με κάποια κριτήρια) εικόνες με ορισμένα χαρακτηριστικά υπερτιμημένα εικόνες με ορισμένα χαρακτηριστικά με μειωμένη έμφαση

digitized image

computer program

or

dedicated hardware processor

transformed image

Page 409: Εισαγωγή

409Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Στόχος

Εξομάλυνση – αφαίρεση θορύβου από λάθη στα bits, μετάδοση, κλπ.

Αφαίρεση θαμπότητας – μεγαλώνει την όξυνση θαμπωμένων εικόνων

  Όξυνση – δίνει έμφαση σε σημαντικά χαρακτηριστικά, όπως

ακμές  Συνδυασμός αυτών

Page 410: Εισαγωγή

410Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Χαρακτηρισμός Γραμμικών Φίλτρων (1/3)

Κάθε γραμμικό ψηφιακό φίλτρο εικόνας μπορεί να χαρακτηριστεί

με ένα από τους δυο ισοδύναμους τρόπους:

* Από την ανταπόκριση (απόκριση) του φίλτρου στον χώρο

(impulse response)

* Από την ανταπόκριση (απόκριση) Fourier του φίλτρου

(Fourier response) , ,u v H u v H

, [ ( , )]i j H i jH

Page 411: Εισαγωγή

411Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Χαρακτηρισμός Γραμμικών Φίλτρων (2/3)

Η ανταπόκριση του φίλτρου στο χώρο και η ανταπόκριση στο πεδίο Fourier είναι ένα DFT ζεύγος:

= DFT[ H ] 

H = IDFT[ ] 

·        Η ανταπόκριση στο πεδίο Fourier επεξηγεί ακριβώς πως το σύστημα επηρεάζει κάθε συχνότητα της εικόνας η οποία περνάτε διαμέσου του συστήματος

 ·        Επειδή:  

Μια συχνότητα εικόνας στο (u, v) = (u0, v0) ενισχύεται ή ελαττώνεται μεμέγεθος και μετατοπίζεται από το μέγεθος

H

H

Page 412: Εισαγωγή

412Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα (1/3)

Τώρα θεωρούμε ότι η είσοδος στο σύστημα είναι ημιτονική εικόνα με συχνότητα (b, c):

2/]W cj)(bi-W cj)(bi[ cj)]bi(N

2πcos[j)J(i, NN

Page 413: Εισαγωγή

413Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα (2/3)

Τότε η έξοδος είναι:

1-N

0m

1-N

0n

cn)(bm-cj)(bi

1-N

0m

1-N

0n

cn)(bmcj)(bi-

1-N

0m

1-N

0n

n)]-c(jm)-[b(i-n)]-c(jm)-[b(i

1-N

0m

1-N

0n

Wn).H(m,W).2

1(

Wn).H(m,W).2

1(j)J(i,

]WWn).[H(m,)2

1(j)J(i,

n)-jm,-n).I(iH(m,j)I(i,*j)H(i,j)J(i,

NN

NN

NN

Page 414: Εισαγωγή

414Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα (3/3)

c)](b,~Hcj)bi(

Νπ2[ cos|c)(b,

~H|j)J(i,

][|c)(b,~H|).

2

1(j)J(i,

]WW[|c)(b,~H|).

2

1(j)J(i,

](-b,-c)~HWc)(b,

~HW).[

2

1(j)J(i,

c)](b,~Hcj)bi(

Ν

π2[1-c)](b,

~Hcj)bi(

Ν

π2[1-

c)(b,~H1-cj)(bic)(b,

~H1-cj)(bi-

cj)(bicj)(bi-

ee

ee NN

NN

Page 415: Εισαγωγή

415Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Χαρακτηρισμός Γραμμικών Φίλτρων (3/3)

Η κρουστική απόκριση είναι ακριβώς αυτό – η απόκρισης του συστήματος στην κρουστική απόκριση

Η κρουστική απόκριση είναι ένας αποτελεσματικός τρόπος για να σχεδιάσουμε την απόκριση του συστήματος σε μια εικόνα αφού κάθε εικόνα είναι ένα ζυγισμένο άθροισμα από παλμούς.

0ji ; 1αλλού ; 0

j)δ(i,

Page 416: Εισαγωγή

416Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα

Υποθέτουμε ότι η είσοδος σε ένα γραμμικό σύστημα Η είναι μια κρουστική απόκριση, που έχει αποτέλεσμα μια εικόνα εξόδου με στοιχεία:

 

Τότε 

1-N j i, 0 ; j) d(i, * j) H(i, j) J(i,

1-N ji, 0 j);H(i,j)J(i,

n)j-m,-i(n).δH(m,j)J(i,1

0

1

0

N

m

N

n

Page 417: Εισαγωγή

417Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σχεδιασμός Φίλτρων με Βάση το DFT (1/2)

Συχνά ένα φίλτρο θα σχεδιαστεί σύμφωνα με τους προσδιορισμούς του πεδίου συχνοτήτων.

Αυτό μπορεί να δημιουργηθεί, π.χ. από ένα μοντέλο από γραμμική παραμόρφωση που συνέβη στο συνεχές πεδίο το οποίο θα διορθωθεί ψηφιακός.

  Δοθέντος ενός εναλλασσόμενου προσδιορισμού ή προσδιορισμού-χώρου

μπορούμε να ορίσουμε την κατά προσέγγιση δειγματοληψία ή

ψηφιακή ερμηνεία σαν:

),(~H yxC

 

CC

1-N/2 |v||,u| 0

)N

v ,N

u(~H

N

vyω ,

N

uxω

|)yω ,x(ω~H v)(u,

~H

Page 418: Εισαγωγή

418Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σχεδιασμός Φίλτρων με Βάση το DFT (2/2)

Το φίλτρο παίρνει τιμές στο διάστημα 0 ≤ |u|, |v| ≤ N/2 - 1, αφού το CFT είναι κεντραρισμένο και μη-περιοδικό

·   Όταν το φίλτρο σχεδιαστεί η κρουστική απόκριση μπορεί να παρθεί από:

v)](u,~HIDFT[ j) H(i,

Page 419: Εισαγωγή

419Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κατωδιαβατά, Ζωνοδιαβατά, και Ανωδιαβατά Φίλτρα

Οι όροι κατωδιαβατό, ζωνοδιαβατό , και ανωδιαβατό είναι μόνο ατελής ποιοτική επεξηγήσει της απόκρισης συχνότητας του συστήματος

‘Κατωδιαβατό – μειώνει όλες εκτός από τις ‘χαμηλές’ συχνότητες

‘Ζωνοδιαβατό – μειώνει όλες εκτός από ένα ενδιάμεσο διάστημα ή ‘μέση’ συχνότητα

‘Ανωδιαβατό – μειώνει όλες εκτός από τις ‘υψηλές’ συχνότητες

Έχουμε ήδη δει παραδείγματα από αυτές: το μηδέν-ένα αποτέλεσμα μάσκας εικόνας

Page 420: Εισαγωγή

420Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γενικές Χρήσεις των Διάφορων Τύπων Φίλτρων

Τα Κατωδιαβατά φίλτρα χρησιμοποιούνται τυπικά για

-  εξομάλυνση θορύβου

- Θόλωμα λεπτομερειών εικόνας για έμφαση

Τα Ανωδιαβατά φίλτρα χρησιμοποιούνται τυπικά για  

-  υπερτίμηση λεπτομερειών της εικόνας και αντιθέσεις

-  αφαίρεση θαμπώματος εικόνας

  Τα Ζωνοδιαβατά φίλτρα είναι συνήθως για ειδικές χρήσεις

Page 421: Εισαγωγή

421Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κατωδιαβατό Φίλτρο (1/2)

Το gaussian φίλτρο με απόκριση συχνότητας

1-N/2 |v| |,u| 0 ];2N/)2 v2u(2σ2π2exp[)v,u(H

:έτσι

)]2yω 2

xω(2σ2π2exp[)yω ,xω(H

~C

Παράδειγμα

Page 422: Εισαγωγή

422Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κατωδιάβατο Φίλτρο (2/2)

Πέφτει γρήγορα χαμηλά για μεγαλύτερες συχνότητες:

N = 32, s = 1 N = 32, s = 1.5

Σχεδιαγράμματα για μια γραμμή τού πίνακα (ν = 0)

Το gaussian είναι ένα σημαντικό κατωδιαβατο φίλτρο

  2-Δ Gaussians και τα DFTs τους φαίνονται στο κεφαλαίο 4

15129630-3-6-9-12-150.0

0.2

0.4

0.6

0.8

1.0

u u15129630-3-6-9-12-15

0.0

0.2

0.4

0.6

0.8

1.0

Page 423: Εισαγωγή

423Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ζωνοδιαβατό Φίλτρο

Επιτυγχάνεται με τη διαφορά δύο κατωδιαβατών όμοιων φίλτρων εκτός από τον συντελεστή συχνότητας

Γραφική παράσταση της διαφοράς-των-gaussians (DOG) από προηγούμενο παράδειγμα:

u15129630-3-6-9-12-15

0.0

0.2

0.4

0.6

0.8

1.0

2 2 2 2 2 2( , ) exp[ 2( ) ( )] exp[ 2( ) ( )]C x y x y x yH K

2 2 2 2 2 2 2 2( , ) exp[ 2( ) ( ) / ] exp[ 2( ) ( ) / ]H u v u v N K u v N

όπου Ν = 32 και Κ = 1.5

12

,0 N

vu

Page 424: Εισαγωγή

424Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ανωδιαβατό Φίλτρο

Το κατά προσέγγιση DFT του μετασχηματισμού Fourier του συνεχούς Laplacian:

)(),( 22yxyxC A 2

22

),(

)(

N

vuAvu

1

2,0

Nvu

2

2

2

22

yx

Γραφική Παράσταση (Α = 4.5 και Ν = 32)

15129630-3-6-9-12-150.0

0.2

0.4

0.6

0.8

1.0

u

Page 425: Εισαγωγή

425

Γραμμική βελτίωση της ποιότητας εικόνας

ΕισαγωγήΜοντέλο Αθροιστικού Λευκού ΘορύβουΦάσμα του Λευκού ΘορύβουΨηφιακός Λευκός ΘόρυβοςΕξομάλυνση Θορύβου – Φίλτρο Μέσου ΌρουΕξομάλυνση Θορύβου – Ιδανικό Κατωδιαβατό ΦίλτροΕξομάλυνση Θορύβου – Φίλτρο GaussianΕφαρμογή Φίλτρων με χρήση Matlab

ΕΠΛ 445 – Ψηφιακή Επεξεργασία Εικόνας

Page 426: Εισαγωγή

426Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εισαγωγή

Η βελτίωση της ποιότητας εικόνας σημαίνει μια επεξεργασία όπου η οπτική ποιότητα της εικόνας καλυτερεύει.

Μελετήσαμε κάποιες λειτουργίες απλού στίγματος και γεωμετρικές λειτουργίες οι οποίες μπορούν να χρησιμοποιηθούν σαν ‘βελτίωση’.

Η γραμμική βελτίωση της ποιότητας εικόνας ειδικά, σημαίνει μια επεξεργασία εξομάλυνσης ανωμαλιών ή θορύβου που έχουν διαφθείρει κάπως την εικόνα, χωρίς να καταστρέφει την πληροφορία της.

Ο θόρυβος συνήθως σχεδιάζεται σαν αθροιστικός θόρυβος ή σαν θόρυβος πολλαπλασιασμού.

Ο θόρυβος πολλαπλασιασμού χειρίζεται καλύτερα από μια μη-γραμμική τεχνική φιλτραρίσματος γνωστή ως ομοιομορφικό φιλτράρισμα.

Page 427: Εισαγωγή

427Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μοντέλο Αθροιστικού Λευκού Θορύβου (1/2)

Σχεδιάζεται σαν αθροιστική εικόνα Ν της οποίας οι τιμές είναι υψηλά χαοτικές ή απροσδιόριστες.

Μπορεί να συμβεί σαν θερμικός θόρυβος στο κύκλωμα, θόρυβος μετάδοσης όταν η εικόνα σταλεί μέσα από κάποιο κανάλι, κλπ.

Μπορεί να συμβεί πριν την δειγματοληψία της εικόνας, π.χ., η συνεχής εικόνα JC(x, y) που λαμβάνεται είναι της μορφής:

),(),(),( yxNyxIyxJ CCC

όπου NC(x, y) είναι λευκός θόρυβος

Page 428: Εισαγωγή

428Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μοντέλο Αθροιστικού Λευκού Θορύβου (2/2)

Θεωρείται να έχει μηδενικό-μεσαίο: αν πάρουμε το μέσο όρο από Μ οποιαδήποτε δείγματα NC(xi, yi) ; i = 1 ,..., M:

τότε το meanM[NC] 0 όταν M ∞ . Κατά μέσο όρο, ο θόρυβος

πέφτει γύρο από την τιμή μηδέν (ακριβώς μιλώντας, ο θόρυβος

είναι επίσης ‘mean-ergodic’).

),(1

][1

iiC

M

CM yxNM

Nmean

Page 429: Εισαγωγή

429Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Φάσμα Του Λευκού Θορύβου (1/3)

Το ενεργειακό φάσμα του NC(x, y) είναι ο μετασχηματισμός Fourier:

Tο τετραγωνικό μέγεθος του μέσου όρου (πάνω σε Μ εικόνες θορύβου) είναι σταθερή για όλες τις συχνότητες (επίπεδο φάσμα, έτσι λευκό):

Fourier transform of NC(x, y) N ),( yxC

Κατά μέσο όρο, ο λευκός θόρυβος περιλαμβάνει όλες τις συχνότητες σε ίσα μεγέθη (επίπεδο φάσμα, έτσι λευκό)

η = ισχύς του θορύβου

meanM[| C(ωx, ωy)|2] η ως M ∞ για κάθε (ωx, ωy).N

Page 430: Εισαγωγή

430Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Φάσμα Του Λευκού Θορύβου (2/3)

Ο λευκός θόρυβος είναι ένα κατά προσέγγιση μοντέλο της κατάστασης όπου το φάσμα της εικόνας C(ωx, ωy) προσθέτεται στο σήμα φαρδιού φάσματος θορύβου:

J ),( yxC ),( yxC ),( yxC I N

x x

+

(x) C (x) C I N

+

x ( ) I x ( ) N

x x

Page 431: Εισαγωγή

431Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Φάσμα Του Λευκού Θορύβου (3/3)

x

x( )H

Σκοπός της γραμμικής βελτίωσης ποιότητας της εικόνας είναι η αφαίρεση όσο το δυνατό περισσότερο, των υψηλών συχνοτήτων του φάσματος θορύβου και παράλληλα να διατηρήσει όσο το δυνατό περισσότερο το φάσμα της εικόνας. Αυτό επιτυγχάνεται από ένα κατωδιάβατο φίλτρο με κάποιο ευρύ φάσμα (αφού οι εικόνες έχουν οι ίδιες ευρύ φάσμα).

Page 432: Εισαγωγή

432Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ψηφιακός Λευκός Θόρυβος

Μοντέλο ψηφιακού αθροιστικού θορύβου: J = I + N όπου Ν είναι μια εικόνα με ψηφιακό

γραμμικό θόρυβο. Κατά μέσο όρο τα στοιχεία του Ν θα είναι μηδέν. Το DFT της εικόνας θορύβου θα είναι ένα άθροισμα του DFT

της αρχικής εικόνας και το DFT της εικόνας θορύβου:

Κατά μέσο όρο το DFT θορύβου θα περιλαμβάνει ένα ευρύ φάσμα από συχνότητες.

J I N= +

Page 433: Εισαγωγή

433Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εξομάλυνση Θορύβου – Φίλτρο Μέσου Όρου (1/3)

Αν αντικαταστήσουμε κάθε στίγμα στην εικόνα που περιέχει θόρυβο, με το μέσο όρο των τοπικών γειτόνων μέσα σε ένα M x M παράθυρο τότε η εικόνα θα εξομαλυνθεί:

Ο μέσος όρος στοιχείων θα περιορίσει το μεσαίο θόρυβο προς το μηδέν.

Το φίλτρο μέσου όρου τετράγωνου είναι ένα γραμμικό ψηφιακό φίλτρο με κρουστική απόκριση:

3 Χ 3

21

),(

MjiH ,1,0 Mji όπου Μ << Ν

Page 434: Εισαγωγή

434Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εξομάλυνση Θορύβου – Φίλτρο Μέσου Όρου (2/3)

Η φιλτραρισμένη (γραμμικά συνελιγμένη) εικόνα K = H*J = H*I + H*N

J I NK

θα έχει την εικόνα και το φάσμα θορύβου επηρεασμένα με τον ίδιο τρόπο.

u

(u)H1

Παίρνοντας τον μέσο όρο περισσότερων στοιχείων (μεγαλύτερο Μ) δημιουργεί στενότερο φάσμα.

u

(u)H1

= = +

Page 435: Εισαγωγή

435Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εξομάλυνση Θορύβου – Φίλτρο Μέσου Όρου (3/3)

Το μέγεθος του φίλτρου μέσου όρου συνήθως παίρνεται σα μια ενδιάμεση τιμή για να ισοσταθμίσει τη διάφορα μεταξύ της εξομάλυνσης θορύβου και εξομάλυνσης εικόνας.

Τυπικά μεγέθη φίλτρων μέσου όρου είναι M x M = 3 x 3, 5 x 5, ..., 15 x 15 (πολύ εξομάλυνση) για μια 512 x 512 εικόνα.

Παράδειγμα φίλτρου μέσου όρου στο Matlab

I = imread(‘examleim.tif’);J = imnoise(I, ‘gaussian’, 0.02);K = filter2(fspecial(‘average’,3),J)/255;imshow(J);figure, imshow(K);

Άσκηση:Δείξτε ότι:

(0,0) = 1

Page 436: Εισαγωγή

436Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εξομάλυνση Θορύβου – Ιδανικό Κατωδιαβατό Φίλτρο

Είναι επίσης πιθανόν να χρησιμοποιούμε ένα φίλτρο μηδενός-ενός ή ένα ιδανικό κατωδιάβατο φίλτρο με σχεδίαση στο πεδίο του DFT:

Χρήσιμο αν είναι πιθανό με κάποιο τρόπο να υπολογίσουμε την πιο μεγάλη σημαντική ακτινωτή συχνότητα.

u

v

(0, 0)

U cutoff(N-1, N-1)

centered DFT

12

22 N

Uvu cutoff= 1 για

= 0 διαφορετικά

(u,v)

Page 437: Εισαγωγή

437Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εξομάλυνση Θορύβου – Φίλτρο Gaussian

Αποτελεί ένα αποτελεσματικό φίλτρο εξομάλυνσης:

Πλεονέκτημα ότι δίνει περισσότερο βάρος στους κοντινότερους γείτονες.

Ο σχεδιασμός του DFT συνήθως περιλαμβάνει τοποθέτηση του εύρους πλάτους μέσης-κορυφής στο Ucutoff με την επιλογή του σ (στις περισσότερες περιπτώσεις ο χρήστης θα πειραματιστεί με διαφορετικές τιμές του σ), π.χ:

cutoffUvu 22Θέτουμε και λύνουμε για το σ:

2

1]

2exp[

2

222

N

U cutoff

cutoffcutoff U

N

U

N19.02log

(u,v) = ])(2

exp[)(2

222222

N

vuvu

12

,0 N

vu

Page 438: Εισαγωγή

438Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας (1...28)

Συχνά μια εικόνα η οποία πάρθηκε ψηφιακά έχει ήδη διευρυνθεί από κάποια γραμμική επεξεργασία.

Αυτό μπορεί να γίνει λόγο του θαμπώματος από κίνηση, ή θάμπωμα λόγο της μη-εστίασης της κάμερας.

Μπορούμε να σχεδιάσουμε μια τέτοια παρατηρημένη εικόνα σαν το αποτέλεσμα γραμμικά συνέλιξης:

JC(x, y) = GC(x, y)*IC(x, y) όπου το GC(x, y) είναι μια γραμμική παραμόρφωση

Page 439: Εισαγωγή

439Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας

Επίσης, J°° C(wx, wy) = G° C(wx, wy).ĨC(wx, wy) Η εικόνα δειγματοληψίας τότε θα είναι της μορφής (θεωρώντας τη συχνότητα δειγματοληψίας

ικανοποιητικά ψηλή – Θεώρημα δειγματοληψίας) J=G*I με DFT J°° = G° Ĩ (με άπειρα στίγματα έτσι που να μπορούμε να προσεγγίσουμε την γραμμική συνέλιξη με κυκλική). Το παραμορφωμένο G είναι επίσης πάντα κατωδιάβατο (θάμπωμα).

Page 440: Εισαγωγή

440Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας

Φίλτρο Αντιστροφής Συχνά είναι πιθανό να κάνουμε ένα υπολογισμό της

παραμόρφωσης G. Αυτό μπορεί να είναι πιθανό μελετώντας της φυσική

της κατάστασης. Το θάμπωμα από κίνηση (κίνηση της κάμερας) είναι

συνήθως κατά μήκος μιας διάστασης ή κατεύθυνσης. Αν αυτή η κατεύθυνση μπορεί να υπολογιστεί, τότε ένα προσεγγιστικό φίλτρο μπορεί να σχεδιαστεί.

Page 441: Εισαγωγή

441Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας

Αντιστρέφοντας την διαδικασία της γραμμικής παραμόρφωσης G λέγετε Deconvolution. Γίνεται χρησιμοποιώντας το φίλτρο αντίστροφης Ginverse της παραμόρφωσης.

Στο πεδίο του DFT, το φίλτρο αντίστροφης ορίζεται από

Ginverse(u,v)=1/ G° (u,v) ; 0 ≤ u, v ≤ N-1 Δεδομένου ότι G° (u, v) ≠ 0 για 0 ≤ u, v ≤ N-1

Page 442: Εισαγωγή

442Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας

Τότε έχουμε για το DFT της φιλτραρισμένης (αποκατεστημένης) εικόνας:

Κ° = Ginverse G° Ĩ = Ĩ Ο σκοπός μας είναι να χρησιμοποιήσουμε ψηφιακούς

τρόπους για το θάμπωμα της εικόνας. Όπως θα δούμε, αυτό θα είναι κάπως δύσκολο.

Μερικές φορές είναι απίθανο, η μπορεί να γίνει μόνο με οπτική διόρθωση.

Συνήθως παίρνεται μόνο ένας υπολογισμός της θαμπότητας G.

Page 443: Εισαγωγή

443Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας

Η αντιστροφή της κατωδιάβατης παραμόρφωσης είναι πάντα ανωδιάβατο.

u u Gaussian distortion Inverse filter

Page 444: Εισαγωγή

444Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας

Σημείωση: το φίλτρο αντιστροφής παίρνει τιμή 1.0 στο (u, v) = (0, 0).

Στις υψηλές συχνότητες ο σχεδιαστής πρέπει να είναι προσεκτικός.

 

Page 445: Εισαγωγή

445Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας

Ελλιπής Συχνότητες Δυστυχώς, τα πράγματα δεν είναι πάντα τόσο ‘ιδανικά’ στην

πραγματικότητα. Μερικές φορές η απόκριση συχνότητας της παραμόρφωσης παίρνει τιμή μηδέν σε μερικές συχνότητες.

Θεωρούμαι ότι για κάποια (u0, v0) ισχύει ότι

G(u0, v0) = 0. Ο σύνηθες ορισμός για το φίλτρο αντιστροφής θα δώσει

Ginverse (u0, v0) = ∞ που δεν έχει οποιαδήποτε σημασία.

Page 446: Εισαγωγή

446Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας

Στην πραγματικότητα κάθε συχνότητα η οποία μηδενίζεται από μια γραμμική παραμόρφωση είναι αναντικατάστατες στην πράξη – χάνονται για πάντα!

Το καλύτερο που μπορεί να γίνει είναι να αντιστρέψουμε την παραμόρφωση στις μη-μηδενικές τιμές.

Page 447: Εισαγωγή

447Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας (10...28)

Μερικές φορές αυτό μπορεί να είναι πάνω σε πολλά επίπεδα συχνοτήτων. Μερικά οπτικά συστήματα αφαιρούν ένα μεγάλο γωνιακό κομμάτι συχνοτήτων:

Page 448: Εισαγωγή

448Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας

Φίλτρο Ψευδό-Αντιστροφής Το φίλτρο ψευδό-αντίστροφης G° p-inverse ορίζεται

G° p-inverse(u, v) = 1 / G° (u, v) ; if G° (u, v) ≠ 0

= 0 ; if G° (u, v) = 0

for 0 ≤ u, v ≤ N-1.

Έτσι, καμία προσπάθεια δεν γίνεται για επανάκτηση μηδενικών συχνοτήτων.

Page 449: Εισαγωγή

449Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας

Η συντηρητική προσέγγιση είναι να μηδενίσουμε το φίλτρο ψευδό-αντίστροφης στο γνωστό κομμάτι ελλιπών συχνοτήτων.

Με αυτό τον τρόπο κάθε νοθές (θορυβώδεις) συχνότητες θα εκλείπονταν.

Page 450: Εισαγωγή

450Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας

Deconvolution στην παρουσία θορύβου Η χειρότερη περίπτωση συμβαίνει όταν η εικόνα

παραμορφώνεται και από γραμμικές παραμορφώσεις G και περιλαμβάνει επίσης αθροιστικό θόρυβο.

Αυτό μπορεί να συμβεί όταν, για παράδειγμα , μια εικόνα η οποία είναι γραμμικά παραμορφωμένη (G) και τότε στέλνεται μέσα από ένα θορυβώδες κανάλι.

Page 451: Εισαγωγή

451Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας

Το γενικό μοντέλο είναι: J = G*I + N όπου G είναι η γραμμική παραμόρφωση και Ν είναι η

εικόνα ψηφιακού λευκού θορύβου. Το DFT της παραμορφωμένης εικόνας θα είναι ένα

άθροισμα του DFT της γραμμικής παραμόρφωσης της αρχικής εικόνας και του DFT της εικόνας θορύβου

J°° = G° Ĩ + Ν°°

Page 452: Εισαγωγή

452Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας

Το φιλτράρισμα με το γραμμικό φίλτρο Η θα πετάξει το αποτέλεσμα

K = H*J = H*G*I + H*N ή

K°° = H°° J°° = H°° G° Ĩ + H°° Ν°° Το πρόβλημα είναι ότι ούτε το κατωδιάβατο φίλτρο (για να

εξομαλύνει το θόρυβο, αλλά να μην διόρθωση το θάμπωμα), ούτε το ανωδιάβατο φίλτρο (π.χ., το φίλτρο αντίστροφης, το οποίο θα ενίσχυση το θόρυβο) θα δουλεύει.

Page 453: Εισαγωγή

453Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας

Είναι γεγονός ότι αν το φίλτρο αντιστροφής χρησιμοποιηθεί, θα πάρουμε

K = Ginverse*J = Ginverse*G*I + Ginverse * N ή

K°° = G°°inverse G°° Ĩ + G°°inverse Ν°° K°° = Ĩ + G°°inverse Ν

Σε αυτή την περίπτωση το θάμπωμα διορθώνεται, αλλά η αποκατεστημένη εικόνα έχει τρομερά ενισχυμένο υψηλής-συχνότητας θόρυβο προσθεμένο σε αυτή.

Page 454: Εισαγωγή

454Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας

Φίλτρο Wiener Το φίλτρο Wiener (από τον Norbert Wiener) είναι μια

λύση σε αυτό το πρόβλημα. Το DFT του φίλτρου Wiener για τα μοντέλα

θαμπώματος G και του λευκού θορύβου Ν που χρησιμοποιούμε δίνεται από

G° *(u,v) G° Wiener(u,v) = για 0 ≤ u, v ≤ N-1. | G° (u,v) |² + n

Page 455: Εισαγωγή

455Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας

Συχνά η ισχύς του θορύβου η είναι άγνωστη ή ανεπίτευκτη. Ο σχεδίασης μπορεί τότε να πειραματισθεί με τυχαίες τιμές του η.

Θα εξετάσουμε τώρα το κίνητρο πίσω από αυτό το φίλτρο.

Page 456: Εισαγωγή

456Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας

Παρατηρήσεις για το φίλτρο Wiener Αν η ισχύς θορύβου είναι μηδέν (καθόλου θόρυβο: η=0), το

φίλτρο Wiener συρρικνώνεται στο φίλτρο αντιστροφής:

G° *(u,v) 1

G° Wiener(u,v) = = = G ̃inverse(u,v) | G° (u,v) |² + n G° (u,v)

για 0 ≤ u, v ≤ N-1 το οποίο είναι πολύ επιθυμητό.

Page 457: Εισαγωγή

457Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας (20...28)

Αν δεν υπάρχει καθόλου θάμπωμα (G° (u, v) = 1 για κάθε u,v), το φίλτρο Wiener συρρικνώνεται στο:

G° Wiener(u,v) = 1/(1+n) για 0 ≤ u, v ≤ N-1 To οποίο είναι φίλτρο που δεν κάνει τίποτα. Έτσι, το

φίλτρο Wiener δεν είναι πολύ χρήσιμο αν δεν υπάρχει θάμπωμα. Ενδιαφέρον, ωστόσο, ο MSE είναι λιγότερο σχετικός στην αρχική εικόνα από τον MSE της εικόνας με θόρυβο.

Page 458: Εισαγωγή

458Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας

Φυσικά, αν υπάρχουν συχνότητες μηδενισμένες από γραμμική παραμόρφωση G τότε είναι καλύτερα να ορίσουμε το φίλτρο ψευδό-Wiener:

G° *(u,v)

G̃p-Wiener(u,v) = Αν G(u,v) = 0 | G° (u,v) |² + n Αν G(u,v) = 0 τότε θα έχουμε αποτέλεσμα 0. Ο θόρυβος στο ‘ελλιπές κομμάτι’ συχνοτήτων θα

αφαιρεθεί.

Page 459: Εισαγωγή

459Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας

Οπτική Διαδοχική ΔιατομήΤα οπτικά συστήματα συχνά θαμπώνουν τις

εικόνες που δημιουργούν

Μια πιθανή λύση:

Page 460: Εισαγωγή

460Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας

Μικροσκοπία οπτικής διατομής

Μια εικόνα παίρνεται σε κάθε εστιακό επίπεδο, δίνει μια σειρά από 2-Δ εικόνες, ή μια 3-Δ εικόνα οπτικής πυκνότητας

Page 461: Εισαγωγή

461Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας

(Ideal) 3-D image of optical density

Magnitude of (ideal) 3-D DFT

Page 462: Εισαγωγή

462Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνα

Μπορέσαμε να δείξουμε ότι σε αυτό το σύστημα τρία διαφορετικά αποτελέσματα συμβαίνουν:

- Μια γραμμική κατωδιαβάτη παραμόρφωση G. - Κατά προσέγγιση λευκός αθροιστικός θόρυβος. - Μια μεγάλη δυκωνική περιοχή συχνοτήτων

ευθυγραμμισμένη στην κατεύθυνση του οπτικού άξονα, μηδενίζεται.

Page 463: Εισαγωγή

463Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας (26...28)

Region of 3-D frequencies zeroed by the

optical sectioning microscope

Παρατηρήστε ότι η συχνότητα (u, v, w) = (0, 0, 0) μηδενίζεται επίσης. Αυτό σημαίνει ότι η χαμηλότερη (πεδίο φόντου) συχνότητα χάθηκε.

Page 464: Εισαγωγή

464Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας (27...28)

Δεν υπάρχει τρόπος για να επανακτήσουμε αυτή τη δυκωνική περιοχή συχνοτήτων.

Έτσι οι 3-Δ εικόνες που πάρθηκαν έχουν θαμπωθεί, είχαν μια μεγάλη 3-Δ περιοχή συχνοτήτων αφαιρεμένη και είχαν κάποιο θόρυβο προσθεμένο.

Στο επεξεργασμένο αποτέλεσμα μας, επιδεικνύουμε την ικανότητα του

-  ψευδο-αντιστρόφου φίλτρου -  ψευδο-Wiener φίλτρου.

Page 465: Εισαγωγή

465Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Γραμμική Αποκατάσταση Εικόνας (28...28)

Και επίσης επιδεικνύουμε δύο 3-Δ εικόνες διατομής από:

  - a pollen grain (κόκκου γύρης)

- a pancreas Iset of Langerhans

(μεγάλη συλλογή κυττάρων)

Page 466: Εισαγωγή

466

Κεφάλαιο 7

ΕΠΛ 445 – Ψηφιακή Επεξεργασία Εικόνας

Page 467: Εισαγωγή

467

Περιεχόμενα

Σκοποί της ΣυμπίεσηςΚώδικες χωρίς απώλεια πληροφοριώνΚώδικες με απώλεια πληροφοριώνJPEG Πρότυπο Συμπίεσης ΕικόναςWavelet ή Sub band Κωδικοποίηση εικόνας

Page 468: Εισαγωγή

468Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σκοπός Της Συμπίεσης Εικόνας

Για να δημιουργήσουμε μια αναπαράσταση συμπιεσμένης εικόνας που ‘φαίνεται η ίδια’ (όταν αποσυμπιεστεί) αλλά και που μπορεί να αποθηκευτεί σε μικρότερο χώρο από ότι η αρχική εικόνα.

Αυτό μπορεί να είναι είτε - Μια αναπαράσταση χωρίς απώλειες, από την οποία η εικόνα

μπορεί ακριβώς να αποκωδικοποιηθεί (όπως ήταν πριν την συμπίεση).

- Μια αναπαράσταση με απώλειες από την οποία οι οπτικές πλεονάζουσες πληροφορίες έχουν αφαιρεθεί. Η συμπιεσμένη εικόνα ‘φαίνεται’ χωρίς αλλαγή, αλλά μαθηματικώς έχει χάσει πληροφορίες.

Page 469: Εισαγωγή

469Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Η συμπίεση εικόνας είναι σημαντική:

Μείωση του χώρου αποθήκευσης της εικόνας Μείωση του bandwidth μετάδοσης της εικόνας

(Σημείωση:)

- Μια μη-συμπιεσμένη εικόνα δεν έχει συμπιεσθεί

- Μια αποσυμπιεσμένη εικόνα είναι μία συμπιεσμένη εικόνα η οποία έχει αποκωδικοποιηθεί για επίδειξη

Page 470: Εισαγωγή

470Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σημαντική Για Την Αρχειοθέτηση Εικόνας

Αρχική Εικόνα

Τελική Εικόνα

Page 471: Εισαγωγή

471Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σημαντική Για Την Μετάδοση Εικόνας

Οι συμπιεσμένες εικόνες μπορούν να σταλούν με πιο γρήγορο ρυθμό:

Περισσότερες εικόνες το δευτερόλεπτο!

Page 472: Εισαγωγή

472Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

1

0

1

0),(

12

i jji

Μετρήσεις Συμπιέσεως (1/2)

Bits για κάθε στίγμα (ΒΒΡ) είναι ο μέσος αριθμός των bits που χρειάζονται την αποθήκευση των επιπέδων φωτεινότητας για κάθε στίγμα της εικόνας

Σε μια μη-συμπιεσμένη εικόνα BPP = log2(K) = B, όπου K = ο αριθμός των επιτρεπόμενων επιπέδων φωτεινότητας. Συνήθως B = log2(256) = 8. Ο αριθμός των bits που χρησιμοποιούνται για την κωδικοποίηση των

στιγμάτων μπορεί να διαφέρει κατά μήκος της κωδικοποιημένης εικόνας.

Ας ορίσουμε το B(i, j) = ο αριθμός των στιγμάτων που χρησιμοποιούνται για την κωδικοποίηση του στίγματος I(i, j).

Τότε BPP =

Page 473: Εισαγωγή

473Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αν ο ολικός αριθμός των bits που περιλαμβάνεται στον κώδικα [I] είναι Btotal,

τότε BPP = B total

Η Αναλογία Συμπίεσης (CR) είναι η αναλογία CR = > 1

Και τα δύο, το BPP και το CR χρησιμοποιούνται συχνά

2

1

Μετρήσεις Συμπιέσεως (2/2)

Page 474: Εισαγωγή

474Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συμπίεση Χωρίς Απώλειες (1/2)

Οι τεχνικές συμπίεσης χωρίς απώλειες επιτυγχάνουν συμπίεση των πληροφοριών της εικόνας χωρίς να χάσουμε καμία πληροφορία.

Η αληθινή εικόνα μπορεί να ανασκευαστεί ακριβώς από την κωδικοποιημένη εικόνα.

Συνήθως, ο κώδικας χωρίς απώλειες δεν επιτυγχάνει μεγάλη συμπίεση (αφού τίποτε δεν χάνεται), αλλά έχει ορισμένες εφαρμογές όπως:

- Επεξεργασία ιατρικής εικόνας - Επεξεργασία εικόνας με σκοπό την ανίχνευση διαφόρων

χαρακτηριστικών.

Page 475: Εισαγωγή

475Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Συμπίεση Χωρίς Απώλειες (2/2)

Ο λόγος συμπίεσης που παίρνουμε το σχήμα κωδικοποίησης χωρίς απώλειες βρίσκονται συνήθως στο διάστημα

  2:1 ≤ CR ≤ 3:1

αν και γενικά αλλάζει από εικόνα σε εικόνα

Page 476: Εισαγωγή

476Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Πλεονασμός Εικόνων (1/2)

Η συμπίεση εικόνας επιδιώκει να εκμεταλλευτεί τον πλεονασμό ή την συσχέτιση μεταξύ των στιγμάτων (ή των αναπαραστάσεων τους).

  Οι περισσότερες εικόνες έχουν ψηλό πλεονασμό. Τα γειτονικά

επίπεδα φωτεινότητας συνήθως είναι παρόμοια ή έχουν κάποια σχέση.

Οι εξομαλυσμένες περιοχές έχουν πολύ παρόμοια επίπεδα φωτεινότητας.

Page 477: Εισαγωγή

477Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Πλεονασμός Εικόνων (2/2)

Τα στίγματα κατά μήκος των ακμών έχουν παρόμοιες σχέσεις.

Τα πρότυπα έχουν πλεονασμό εκ φύσεως λόγο της περιοδικής συμμετρίας, κλπ.

Page 478: Εισαγωγή

478Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Η ιδέα πίσω από την κωδικοποίηση χωρίς απώλειες

Χρησιμοποίηση μεταβλητών μήκων λέξεως για κωδικοποίηση των επιπέδων φωτεινότητας.

Εξισώνουμε μικρά μήκη λέξεων στα πεδία φωτεινότητας τα οποία εμφανίζονται συχνά (πλεονάζον πεδία φωτεινότητας).

  Εξισώνουμε μεγάλα μήκη λέξεων στα πεδία φωτεινότητας τα

οποία δεν εμφανίζονται συχνά.  Κατά μέσο όρο, το BPP θα μειωθεί.

Page 479: Εισαγωγή

479Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Tο ιστόγραμμα της εικόνας HI (1/2)

HI(k) = n αν το επίπεδο φωτεινότητας k εμφανίζεται (ακριβώς) n φορές στην I,

για κάθε k = 0, ... K-1.

Page 480: Εισαγωγή

480Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ιστόγραμμα Εικόνας (2/2)

- Ας ορίσουμε το B(k) = # των bits που χρησιμοποιούνται για την κωδικοποίηση του επιπέδου φωτεινότητας k.

Τότε BPP =

Αυτή είναι η συνηθισμένη μέτρηση του BPP για τεχνικές χωρίς απώλειες (με μεταβλητό μήκος λέξεων)

1

0

)()( kHIk

1

2

Page 481: Εισαγωγή

481Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εντροπία Εικόνας

Θυμηθείτε τις τιμές κανονικού ιστογράμματος:

pI(k) = HI(k) ; k = 0,..., K-1όπου

pI(k) = η "πιθανότητα" να υπάρξει το επίπεδο φωτεινότητας k   - Η εντροπία μιας εικόνας I ορίζεται:  E [I] = - pI(k) log2 pI(k)

2

1

1

0

Page 482: Εισαγωγή

482Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ιδιότητες Εντροπίας (1/2)

- Η εντροπία είναι απλά μια μέτρηση η οποία έχει καλές ιδιότητες για υπολογισμό της ποιότητας της στρατηγικής κωδικοποίησης.

- Η εντροπία μιας εικόνας Ι είναι μια μέτρηση της πολυπλοκότητας – του μεγέθους της πληροφορίας που περιλαμβάνει.

- Μπορεί να αποδεικτεί ότι η εντροπία έχει μέγιστη τιμή όταν pI(k) = p = (σταθερά για 0 ≤ k ≤ K-1) το οποίο αντιπροσωπεύει ένα επίπεδο ιστόγραμμα. Σε αυτή την περίπτωση (K = 2B)

E [I] = - log2 = B

Η εντροπία της I μεγαλώνει όταν το ιστόγραμμα ανοίγει.

1

1

1

1

0

Page 483: Εισαγωγή

483Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ιδιότητες Εντροπίας (2/2)

- Η εντροπία έχει ελάχιστη τιμή όταν

  pI(ki) = 1 for some 0 ≤ ki ≤ K-1

  Έτσι pI(kj) = 0 για j ≠ i.

Αυτή είναι σταθερή εικόνα και E [I] = 0.

 - Είναι γεγονός ότι:

0 ≤ E [I] ≤ B

Page 484: Εισαγωγή

484Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σημαντικότητα της Εντροπίας (1/3)

Ένα σημαντικό θεώρημα της θεωρίας κωδικοποίησης περιορίζει το πόσο καλά μπορούμε να κωδικοποιήσουμε μια εικόνα χωρίς απώλειες με το να εξισώσουμε μεταβλητά μήκη λέξεων 

BPP ≥ E [I]

Ο κώδικας μεταβλητών μήκων λέξεων θεωρεί ότι οι πιθανότητες pI(k) είναι γνωστές και στον διαβιβαστεί και στον παραλήπτη

  Με τη λέξη κώδικας, εννοούμε μοναδικά αποκωδικοποιημένο κώδικα.   

Page 485: Εισαγωγή

485Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σημαντικότητα της Εντροπίας (2/3)

- Αυτός είναι ο καλύτερος λόγος για την χρησιμοποίηση της εντροπίας σαν μέτρο κωδικοποίησης.

  Μας λεει ότι μια εικόνα με τέλειο επίπεδο ιστόγραμμα  E [I] = B  Δεν μπορεί να συμπιεστεί χρησιμοποιώντας ένα κώδικα

μεταβλητών μήκων λέξεων. Ευτυχώς, συχνά μπορούμε να διορθώσουμε αυτή την κατάσταση.

     

Page 486: Εισαγωγή

486Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σημαντικότητα της Εντροπίας (3/3)

Μας λεει επίσης ότι μια εικόνα σταθερής φωτεινότητας δεν χρειάζεται καν να σταλεί!

  E [I] = 0  Θα εξετάσουμε σύντομα τεχνικές κωδικοποίησης μεταβλητών

μήκων λέξεων.   Πρώτα, θα κοιτάξουμε το πρόβλημα της μείωσης εντροπίας

εικόνας. Αυτό θα κάνει πιθανή την κωδικοποίηση με χαμηλότερο ΒΡΡ (τουλάχιστον χαμηλότερο όριο για τις προσπάθειες μας)

Page 487: Εισαγωγή

487Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

DPCM για Μείωση Εντροπίας Εικόνας (1/2)

Προσέγγιση: Υπολογίζουμε μια νέα εικόνα D με πιο συμπιεσμένο ιστόγραμμα από

την εικόνα Ι αλλά χωρίς απώλεια πληροφοριών

Πρέπει να είμαστε ικανοί να πάρουμε την I ακριβώς από την D – χωρίς απώλεια πληροφοριών

Page 488: Εισαγωγή

488Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

DPCM (2/2)

Η συμπίεση του ιστογράμματος (Κεφαλαίο 3) δε θα δουλέψει, αφού χάνεται πληροφορία όταν δυο επίπεδα φωτεινότητας k1 και k2 μαζευτούν πάνω στο ίδιο επίπεδο φωτεινότητας k

Η διαφορική παλμική διαμόρφωση (DPCM) είναι μια αποτελεσματική τεχνική για μέση εντροπίας χωρίς απώλειες. Θα εξετάσουμε την απλούστερη μορφή του DPCM

Page 489: Εισαγωγή

489Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μείωση εντροπίας από Διαφόρηση (απλό DPCM) (1/3)

Έχουμε παρατηρήσει ότι τα γειτονικά στίγματα συχνά έχουν παρόμοιες τιμές σε μια εικόνα, ειδικά κατά μήκος εξομαλυσμένων περιοχών

  Ορίζουμε μια διαφορική εικόνα D χρησιμοποιώντας είτε 1-Δ ή 2-Δ

διαφόρηση 

(1) D(i, j) = I(i, j) - I(i, j-1) for 0 ≤ i ≤ N-1 and 1 ≤ j ≤ N-1 

(2) D(i, j) = I(i, j) - I(i-1, j) - I(i, j-1) + I(i-1, j-1) for 1 ≤ i, j ≤ N-1

 

Page 490: Εισαγωγή

490Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μείωση εντροπίας από Διαφόρηση (2/3)

Το νέο ιστόγραμμα HD συνήθως θα είναι πιο συμπιεσμένο από το HI.

Έτσι  E [D] < E [I].

 

Aυτός είναι ένας γενικός κανόνας για εικόνες, όχι μαθηματικό αποτέλεσμα.

Page 491: Εισαγωγή

491Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μείωση εντροπίας από Διαφόρηση (3/3)

Σημειώστε ότι η διαφορική εικόνα D θα είναι ικανή να πάρει

  -2K-1 τιμές (1-K) ,..., (K-1) αν η (1) χρησιμοποιηθεί

-4K-1 τιμές 2(1-K) ,..., 2(K-1) αν η (2) χρησιμοποιηθεί

Page 492: Εισαγωγή

492Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αποκωδικοποίηση της I από τη D (1/3)

• Αν χρησιμοποιηθεί η (1) τότε:• I(i, j) = D(i, j) + I(i, j-1)

• for 0 ≤ i ≤ N-1 and 1 ≤ j ≤ N-1 •Η πρώτη στήλη της I πρέπει επίσης να σταλεί μαζί με την κωδικοποιημένη εικόνα. Μπορεί να σταλεί πρώτη, πριν την εικόνα.

Page 493: Εισαγωγή

493Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αποκωδικοποίηση της I από τη D (2/3)

• Αν χρησιμοποιηθεί η (2), τότε

I(i, j) = D(i, j) + I(i-1, j) + I(i, j-1) - I(i-1, j-1)for 1 ≤ i, j ≤ N-1

• Σε αυτή την περίπτωση, στέλλεται η πρώτη σειρά και η πρώτη στήλη της Ι μαζί με την κωδικοποιημένη εικόνα.

• Στην συζήτηση της κωδικοποίησης, θα αγνοήσουμε την κωδικοποίηση της πρώτης σειράς και στήλης γιατί το overhead είναι μικρό.

Page 494: Εισαγωγή

494Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αποκωδικοποίηση της I από τη D (3/3)

• Αυτό είναι χωρίς απώλειες DPCM. Υπάρχουν επίσης DPCM’s με απώλειες, και υπάρχουν επίσης στατιστικά DPCM’s τα οποία έχουν ως βάρη τα στίγματα διαφοράς για να βρει την καταλληλότερη τιμή κάποιου στατιστικού κριτηρίου.

• Απο’δω και πέρα θεωρούμαι ότι τα ‘επίπεδα φωτεινότητας’ της D έχουν τιμές:

0,…,K´ -1 με πιθανότητες:

p D(k); 0 ≤ k ≤ K´ -1

Page 495: Εισαγωγή

495Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εύρεση Βέλτιστου Κώδικα (1/3)

Θυμηθείτε ότι το θεώρημα χαμηλότερου ορίου για την κωδικοποίηση του BPP είναι:

BPP ≥ E [D] = - Σ pD(k) log2 pD(k)

χρησιμοποιώντας κώδικα μεταβλητού μήκους λέξεων

K´ -1

k=0

Page 496: Εισαγωγή

496Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εύρεση Βέλτιστου Κώδικα (2/3)

• Η κωδικοποίηση κάθε τιμής επιπέδου φωτεινότητας k χρησιμοποιώντας μήκος λέξεως L(k) bits δίνει ένα μέσο όρο μήκος λέξης ή BPP

BPP = Σ pD(k) L(k) • Συγκρίνοντας με την πιο πάνω εξίσωση. Αν

L(k) = - log2 pD (k) τότε έχουμε επιτύχει το χαμηλότερο όριο!

K´ -1

k=0

Page 497: Εισαγωγή

497Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εύρεση Βέλτιστου Κώδικα (3/3)

• Αυτό συμβαίνει, ΑΝ μπορούμε να βρούμε τέτοιο κώδικα.

• Δεν μπορούμε αν [- log2 pD(k)] ≠ κάποιο ακέραιο για κάθε k.

• Ορίζουμε τον κώδικα εύρεσης καταλληλότερου C για την D σαν κάποιο κώδικα που ικανοποιεί: - BPP of C(D) ≤ BPP of any other code C´(D)

- BPP of C(D) = E [D] if [- log2 pD(k)] = integers

όπου C(D) είναι η κωδικοποιημένη ερμηνεία του D

Page 498: Εισαγωγή

498Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αλγόριθμος Huffman (1/3)

• Τα προηγούμενα σχόλια δε λένε πως βρίσκουμε κάποιο κατάλληλο κώδικα. Ο αλγόριθμος Huffman πάντα δίνει τον κατάλληλο κώδικα.

• Για ένα σύνολο επιπέδων φωτεινότητας

{0 ,.., K´ -1} δίνει ένα σύνολο από κώδικες λέξεις

kk=code(k) 0 ≤ k ≤ K´ -1 όπου BPP = Σ pD(k) L(kk) είναι όσο πιο μικρό γίνεται.

^

K´ -1

k=0

^

Page 499: Εισαγωγή

499Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αλγόριθμος Huffman (2/3)

Αλγόριθμος Huffman: Από ένα δυαδικό δέντρο με κλαδιά που έχουν επιγραφή το επίπεδο φωτεινότητας ki και τις πιθανότητες pD(ki)

(0) Μας περιορίζει από την μελέτη κάθε ki όπου pD(ki) = 0

(1)Βρίσκει τις 2 μικρότερες πιθανότητες pi=pD(ki) και pj= pD(kj)

(2) Αντικαθιστά με pij = pi + pj (βάση σημάδι, μειώνει την λίστα κατά ένα)

Page 500: Εισαγωγή

500Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αλγόριθμος Huffman (3/3)

(3) Δίνει τιμές στα κλαδιά: για το ki '1' και για το kj '0'

(4) Μέχρι που η λίστα να έχει μόνο 1 στοιχείο (φτάσαμε στην ρίζα) επιστρέφουμε στο (1)

* Στο τρίτο βήμα, οι τιμές ‘1’ και ‘0’ δίνονται σε ζεύγη στοιχείων (ki, kj), τριών στοιχείων κλπ., όπως η διαδικασία προχωρεί.

Page 501: Εισαγωγή

501Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα εφαρμογής Huffman

• Υπάρχουν K´ = 8 τιμές {0 ,.., 7} που θα πάρουν λέξεις

κώδικες:

pD(0) = 1/2 pD(4) = 1/16

pD(1) = 1/8 pD(5) = 1/32

pD(2) = 1/8 pD(6) = 1/32

pD(3) = 1/8 pD(7) = 0

Page 502: Εισαγωγή

502Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα 1

Η διαδικασία δημιουργεί ένα δέντρο, με τιμές ‘1’ και ‘0’ τοποθετημένα στα δεξιά και αριστερά κλαδιά σε κάθε βήμα:

k 0 1 2 3 4 5 6 pD(k) 1/2 1/8 1/8 1/8 1/16 1/32 1/32

kk 1 011 010 001 0001 00001 00000 L(kk) 1 3 3 3 4 5 5

11/2

1/4

1/8

1/161/4

1 01 0

1 0

1 0

1 0

1 0

^^

μέγιστη τιμή επιπέδου φωτεινότητας = 6 < 23

Άρα, χρειάζονται Β=3bits για την κωδικοποίηση κάθε pixel!!!

Παράδειγμα εφαρμογής Huffman

Page 503: Εισαγωγή

503Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα εφαρμογής Huffman

BPP= Σ pD(k)L(kk)

= pD(0)L(k0) + pD(1)L(k1) + pD(2)L(k2) + pD(3)L(k3)

+ pD(4)L(k4) + pD(5)L(k5) + pD(6)L(k6) + pD(7)L(k7)

= 1/2*1 + 1/8*3 + 1/8* 3 +1/8*3 + 1/16*4 + 1/32*5 +

1/32*5 + 0

= 2.1875

E[D] = - Σ pD(k) log2 pD(k)=2.1875 CR= = =1.38:1

k=0

K´ -1^

^ ^ ^ ^^^^^

K´ -1

k=0

Το επίπεδο φωτεινότητας 7 δεν υπάρχει στην εικόνα, άρα δεν κωδικοποιείται!!

BPP

B 3

2.18

Page 504: Εισαγωγή

504Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα εφαρμογής Huffman

• Υπάρχουν K´ = 8 τιμές {0 ,.., 7} που θα πάρουν λέξεις

κώδικες:

pD(0) = 0.4 pD(4) = 0.12

pD(1) = 0.08 pD(5) = 0.08

pD(2) = 0.08 pD(6) = 0.04

pD(3) = 0.2 pD(7) = 0.0

Παράδειγμα 2

Page 505: Εισαγωγή

505Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα εφαρμογής Huffman

k 0 1 2 3 4 5 6 pD(k) 0.4 0.08 0.08 0.2 0.12 0.08 0.04

kk 1 0111 0110 010 001 0001 0000L(kk) 1 4 4 3 3 4 4

1

0.60.24

0.120.16

1 0

1 0

1 0

1 0

1 0

^^

μέγιστη τιμή επιπέδου φωτεινότητας = 6 < 23

Άρα, χρειάζονται Β=3bits για την κωδικοποίηση κάθε pixel!!!

0.36

BPP=2.48 bits Entropy=2.42 bits CR=1.2:1

Page 506: Εισαγωγή

506Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αποκωδικοποίηση Huffman

• Ο κώδικας Huffman έχει μόνο ένα τρόπο αποκωδικοποίησης. Υπάρχει μόνο μια ερμηνεία για μια σειρά από λέξεις κώδικες (σειρά από bits).

• Η αποκωδικοποίηση προχωρεί με τη σάρωση του δέντρου.

Page 507: Εισαγωγή

507Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα

• Στο δεύτερο παράδειγμα, παραλαμβάνεται αυτή η σειρά τιμών των bits :

00010110101110000010000100010110111010• Η σειρά των bits εξετάζεται μέχρι να αναγνωριστεί μια

λέξη κώδικα. Αυτή η διαδικασία συνεχίζεται μέχρι να αναγνωριστούν όλα τα bits:

0001,0110,1,0111,0000,010,0001,0001,0110,1,1,1,010• Η αποκωδικοποιημένη σειρά (σε επίπεδα φωτεινότητας

k) είναι: 5 2 0 1 6 3 5 5 2 0 0 0 3

Page 508: Εισαγωγή

508Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σχόλια (1/2)

• Ο συντελεστής συμπίεσης που επιτυγχάνεται με τον κώδικα Huffman είναι συνήθως γύρω στο

2:1 ≤ CR ≤ 3:1• Ο κώδικας Huffman μπορεί να προσβληθεί από

θόρυβο στην μετάδοση (πολύ περισσότερο από την μετάδοση της αρχικής εικόνας)

• Υπάρχουν κώδικες διόρθωσης λαθών οι οποίοι είναι πολύ λιγότερο ευαίσθητοι στο θόρυβο. Μεγαλώνουν κάπως το συντελεστή κωδικοποίησης.

• Μερικά σύγχρονα σχήματα κωδικοποίησης εικόνας με απώλειες μπορούν να πετύχουν CR > 30:1

Page 509: Εισαγωγή

509Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σχόλια (2/2)

Έτσι, γιατί εξετάζουμε σχήματα χωρίς απώλειες;Επειδή:

(1) Τα σχήματα με απώλειες μπορούν να συνδυαστούν με τον κώδικα Huffman, κωδικοποιώντας τις λέξεις κώδικα με απώλειες, με τον κώδικα Huffman.

(2) Ο κώδικας συμπίεσης με απώλειες μπορεί τότε να πολλαπλασιαστεί με το μέγεθος του συμπιεστή Huffman.

Page 510: Εισαγωγή

510Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Εικόνας Με Απώλειες (1/2)

• Για τη συμπίεση με απώλειες έχουν προταθεί πολλές προσεγγίσεις. Θα κάνουμε ανασκόπηση μερικών δημοφιλών προσεγγίσεων:

(1) Κωδικοποίηση Αποκομμένων Μπλοκ (BCT) – απλός και γρήγορος (2) Κωδικοποίηση Αποκομμένων Διανυσμάτων (VQC) - δαπανηρός

αλλά με ποιότητα (3) Κωδικοποίηση Οπτικού Υποδείγματος (VPIC) – χρησιμοποιεί

οπτικά μοντέλα (4) Κωδικοποίηση Διακριτού Μετασχηματισμού Συνημιτόνου (DCT)

και JPEG (5) Κωδικοποίηση Εικόνας με βάση τα Wavelets

Page 511: Εισαγωγή

511Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Εικόνας Με Απώλειες (2/2)

Οι συντελεστές συμπίεσης που πάρθηκαν κατά τα πρώτα 25 χρόνια έρευνας:

CR

0 10 20

5

10

years

025

Τα πράγματα όμως αλλάζουν!!!

Page 512: Εισαγωγή

512Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Εικόνας χρησιμοποιώντας Μπλοκ

Η μέθοδος με την μεγαλύτερη απώλεια χωρίζει την εικόνα σε μικρότερα μπλοκ τα οποία κωδικοποιούνται ξεχωριστά (oι μέθοδοι των Wavelets αποτελούν εξαίρεση).

Ο λόγος; Γενικά οι εικόνες είναι υψηλά ασταθείς, διαφορετικά κομμάτια μιας εικόνας μπορούν να έχουν διαφορετικές ιδιότητες

M x M M x M M x M

M x M M x M M x M

M x M M x M M x M

όπως περισσότερες υψηλές ή χαμηλές συχνότητες, περισσότερη ή λιγότερη λεπτομέρεια κλπ.

Έτσι, η τοπική κωδικοποίηση είναι πολύ πιο αποδοτική.

Τυπικά μεγέθη των μπλοκ είναι 4x4 ή 8x8 ή 16x16

Page 513: Εισαγωγή

513Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Αποκομμένου Μπλοκ ( BTC ) 1..7

Γρήγορος αλλά δίνει περιορισμένη συμπίεση. Χρησιμοποιεί 4 Χ 4 μπλοκ { Ι(1) , Ι(2),…,Ι(16) } που περιέχουν : 16 . 8 = 128bits.

Βήματα κωδικοποίησης της εικόνας :

1.Χωρίζουμε την εικόνα σε μπλοκ μεγέθους 4 Χ 4 , όπου : i. Σύνολο στιγμάτων στο μπλοκ = { Ι(1),Ι(2),…,Ι(16) } ii. Συνολικός αριθμός bits στο μπλοκ πριν την κωδικοποίησή του = 16 . 8 = 128 bits.

Page 514: Εισαγωγή

514Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Αποκομμένου Μπλοκ ( BTC ) 2..7

Βήματα κωδικοποίησης της εικόνας ( συνέχεια ):

2.Για κάθε μπλοκ υπολογίζουμε και μεταδίδουμε :

i. Την μέση φωτεινότητα του μπλοκ : ,

χρησιμοποιώντας Β1 bits .

ii. Την τυπική απόκλιση ( standard deviation ) : ,

χρησιμοποιώντας Β2 bits.

iii. Ένα 16-bit δυαδικό μπλοκ b το οποίο υπολογίζουμε με τον εξής τρόπο :

_

Για i = 1,2,…,16 b ( i ) = 1 αν Ι ( i ) ≥ I

και _

b ( i ) = 0 αν Ι ( i ) < Ι

16

1i

1

16

_

Ι(i)Ι

16

1

2__

)(16

1

i

I IiI

Page 515: Εισαγωγή

515Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Αποκομμένου Μπλοκ ( BTC ) 3..7

Βήματα κωδικοποίησης της εικόνας ( συνέχεια ):

Παράδειγμα 1 : _ Ι = 98.75Ι =

Αναλογία Συμπίεσης : CR = B / ( B1 + B2 + 16 )1.Αν Β1 = Β2 = 8 CR = 128/32 = 4:12.Έχουμε καλή ποιότητα αν : Β1 = 6 , Β2 = 4 CR = 128/26 ≈ 5:1

121 114 56 47

37 200 247 255

16 0 12 169

43 5 7 251

1 1 0 0

0 1 1 1

0 0 0 1

0 0 0 1

Page 516: Εισαγωγή

516Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Αποκομμένου Μπλοκ ( BTC ) 4..7

Βήματα κωδικοποίησης της εικόνας ( συνέχεια ):

Σχόλια : Χρησιμοποιώντας Β1 > Β2 είναι εντάξει : το ανθρώπινο μάτι είναι πολύ

ευαίσθητο στην ύπαρξη διαφοράς , αλλά όχι στο μέγεθος ( magnitude )

της διαφοράς :

Mach Band Illusion

_ _ Συνδυασμένος με τον κώδικα εντροπίας για Ι , σ , μπορεί να δώσει CR≈10:1.

Page 517: Εισαγωγή

517Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Αποκομμένου Μπλοκ ( BTC ) 5..7

Αποκωδικοποίηση του BTC Μπλοκ ( BTC Block Decoding )

Για να δημιουργήσουμε τα “αποκωδικοποιημένα” στίγματα ( pixels ) J(1),J(2),…,J(16) πρέπει να ακολουθήσουμε τα πιο κάτω βήματα : 1. Έστω Q = αριθμός των 1 που λήφθηκαν. Ρ = αριθμός των 0 που λήφθηκαν. 2. Θέτουμε : , αν b( i ) = 1

, αν b( i ) = 0 όπου και b το κωδικοποιημένο μπλοκ που στάλθηκε.

A/IJ(i)_

.AσIJ(i)

_

PQA

Page 518: Εισαγωγή

518Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Αποκομμένου Μπλοκ ( BTC ) 6..7

Αποκωδικοποίηση του BTC Μπλοκ ( BTC Block Decoding ) _ _ _ _ Το Α επιλέγεται έτσι ώστε J≈I και σJ ≈ σI (λάθος κβαντοποίησης). Παράδειγμα 2 : Χρησιμοποίηση των δεδομένων του παραδείγματος 1. 1. Q = 7 , P = 9 A = 0.8819 2. _ I = ΙΝΤ [ 98.75 + 0.5 ] = 99. _ σ I = INT [ 92.95 + 0.5 ] = 93. J( i ) = 99 + INT [ 93 / 0.8819 + 0.5 ] = 99+105 = 104 , αν b(i)=1. J( i ) = 99 – INT [ 93 . 0.8819 + 0.5 ] = 99–82 = 17 , αν b(i)=0.

Page 519: Εισαγωγή

519Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Αποκομμένου Μπλοκ ( BTC ) 7..7

Αποκωδικοποίηση του BTC Μπλοκ ( BTC Block Decoding )

Παράδειγμα 2 ( συνέχεια ):

_ _

J = και J = 98.8 , σ = 77.3

204 204 17 17

17 204 204 204

17 17 17 204

17 17 17 204

Page 520: Εισαγωγή

520Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Αποκομμένου Διανύσματος ( VQ ) 1..7

Αυτή η τεχνική είναι πολύ ευαίσθητη υπολογιστικά.

Βήματα κωδικοποίησης μιας εικόνας :

1. Διαιρούμε την εικόνα σε 4 Χ 4 μπλοκ.

2. Υπολογίζουμε ένα βιβλίο με κώδικες ( codebook ) των Μ “τυπικών” 4 X 4 μπλοκ Τj , j = 1,2,…,M. Αυτό γίνεται χρησιμοποιώντας αλγορίθμους ομαδοποίησης . Συνήθως : 256 ≤ Μ ≤ 1024

Page 521: Εισαγωγή

521Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Αποκομμένου Διανύσματος ( VQ ) 2..7

Βήματα κωδικοποίησης μιας εικόνας ( συνέχεια )

Παράδειγμα : Αν χρησιμοποιηθεί 2 Χ 1 μπλοκ ,ο χώρος με τις ομάδες των μπλοκ μπορεί να έμοιαζε με τον ακόλουθο.

όπου μπλοκ κέντρο ομάδας Gray-level 2 (τυπικό μπλοκ)

Gray – level 1

Page 522: Εισαγωγή

522Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Αποκομμένου Διανύσματος ( VQ ) 3..7

Βήματα κωδικοποίησης μιας εικόνας ( συνέχεια )

Σχόλια για βήμα 2: Συνήθως οι ομάδες βρίσκονται χρησιμοποιώντας ομαδοποίηση μικρότερης

τετραγωνικής απόστασης. Το κέντρο κάθε ομάδας γίνεται ο τυπικός κώδικάς της. Στη VQ συμπίεση ο χώρος έχει 16 διαστάσεις αντί 2 διαστάσεις, και αυτό

λόγω του ότι χρησιμοποιείται 4 Χ 4 μπλοκ. Ο υπολογισμός του βιβλίου με τους κώδικες ( codebook ) είναι πολύ

χρονοβόρα διαδικασία.

i. Μπορεί να υπολογιστεί ευθέως από την εικόνα .

ii. Σε εφαρμογές πολλών παρόμοιων εικόνων μπορεί να χρησιμοποιηθεί ένα παγκόσμιο βιβλίο με κώδικες.

Page 523: Εισαγωγή

523Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Αποκομμένου Διανύσματος ( VQ ) 4..7

Βήματα κωδικοποίησης μιας εικόνας ( συνέχεια )

3.Χρησιμοποιούμε ένα αλγόριθμο αναζήτησης για να αποφασίσουμε ποιο

από τα M “τυπικά” μπλοκ είναι πιο κοντά στο κάθε 4 Χ 4 μπλοκ της

εικόνας.

Αυτό ονομάζεται κβαντοποίηση διανύσματος.

Το κοντινότερο “τυπικό” μπλοκ το αποφασίζουμε χρησιμοποιώντας την

έννοια του μέσου-τετραγώνου ως ακολούθως :

Κοντινότερο τυπικό μπλοκ =

16

1i

2

jTj(i)I(i)

16

1min

Page 524: Εισαγωγή

524Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Αποκομμένου Διανύσματος ( VQ ) 5..7

Βήματα κωδικοποίησης μιας εικόνας ( συνέχεια )

Σχόλια για βήμα 3: Αν το βιβλίο με τους κώδικες κατασκευαστεί από την εικόνα τότε η

αναζήτηση για το κοντινότερο τυπικό μπλοκ δεν παίρνει καθόλου χρόνο,αφού οι μέσες τετραγωνικές αποστάσεις είναι γνωστές από την ομαδοποίηση στο βήμα 2.

Αν ένα παγκόσμιο βιβλίο με κώδικες χρησιμοποιηθεί τότε η αναζήτηση είναι πολύ χρονοβόρα.

Page 525: Εισαγωγή

525Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Αποκομμένου Διανύσματος ( VQ ) 6..7

Βήματα κωδικοποίησης μιας εικόνας ( συνέχεια )

4.Όταν το καλύτερο ( κοντινότερο ) “τυπικό” μπλοκ Τj βρεθεί , μόνο ο δείκτης j στέλνεται .

i. Για Μ = 1024 χρειάζονται 10 bits για αποστολή του δείκτη j

CR = ( 8 . 16 ) / 10 = 12.8 : 1 .

ii. Για Μ = 256 χρειάζονται 8 bits για αποστολή του δείκτη j

CR = ( 8 . 16 ) / 8 = 16 : 1

Page 526: Εισαγωγή

526Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Αποκομμένου Διανύσματος ( VQ ) 7..7

Γενικά σχόλια : Η κατασκευή του βιβλίου με τους κώδικες(codebook) και η αναζήτηση

των διανυσμάτων είναι πολύ χρονοβόρες διαδικασίες. Η αποκωδικοποίηση είναι πολύ γρήγορη .Απλά γίνεται έλεγχος στο βιβλίο

με τους κώδικες για εύρεση του δείκτη που έχει σταλεί. Το VQ χρησιμοποιείται σε εφαρμογές όπου ο χρόνος κωδικοποίησης δεν

είναι σημαντικός , αλλά ο χρόνος αποκωδικοποίησης είναι πολύ σημαντικός.

Παράδειγμα : Βιβλιοθήκες εικόνων. Αποδεκτές εικόνες στο διάστημα CR = 15 : 1 – 20 : 1 είναι τυπικές.

Page 527: Εισαγωγή

527Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Οπτικού Υποδείγματος ( VPIC ) 1..11

Χρησιμοποιεί 4 Χ 4 μπλοκ εικόνας .

Χρησιμοποιεί ένα μικρό παγκόσμιο βιβλίο με κώδικες με πέντε “τυπικά” μπλοκ :

1. Μπλοκ Ακμών ( Edge Blocks ) :

1. 2. 3.

Page 528: Εισαγωγή

528Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Οπτικού Υποδείγματος ( VPIC ) 2..11

Πέντε “τυπικά” μπλοκ ( συνέχεια ):

1. Μπλοκ Ακμών (συνέχεια) : 2. Σταθερό μπλοκ ( Constant Block ) :

4. 5.

Page 529: Εισαγωγή

529Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Οπτικού Υποδείγματος ( VPIC ) 3..11

Τα μπλοκ σχεδιάζονται χρησιμοποιώντας αρχές από την ανθρώπινη όραση : 1.Το μάτι είναι ευαίσθητο στις ακμές και στα εξομαλυσμένα τοπία (regions). Έτσι τα μπλοκ ακμών και τα σταθερά μπλοκ αντιπροσωπεύουν την εικόνα. 2.Ο νόμος του Weber : Σε ένα μικρό τοπίο της εικόνας , υπάρχει η ελάχιστη αντιληπτή αλλαγή φωτεινότητας.Έτσι τα μπλοκ με μικρή αλλαγή φωτεινότητας πρέπει να κωδικοποιούνται σαν σταθερά μπλοκ. 3.Το ανθρώπινο μάτι αφαιρεί τις χαμηλές συχνότητες / το dc από τις εικόνες και τις επεξεργάζεται ξεχωριστά. 4.Το ( μη – dc ) σύστημα της ανθρώπινης όρασης έχει μια ζωνοδιάβατη αντίδραση στο διάστημα 3 – 6 cy / deg ( deg = degrees ). 5.Εικόνες ( π.χ. στην οθόνη ) ,πάντα παρατηρούνται από μια απόσταση.

Page 530: Εισαγωγή

530Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Οπτικού Υποδείγματος ( VPIC ) 4..11

Ένα μοντέλο για τη Γεωμετρική Παρατήρηση

Θεωρούμε : Η εικόνα είναι Ν Χ Ν , τα μπλοκ κώδικες είναι Μ Χ Μ. Η εικόνα παρουσιάζεται πάνω σε μια L X L (cm²) οθόνη. D είναι η απόσταση παρατήρησης ( cm ).

ΜΧΜ μπλοκ-εικόνας.

Σημείο Παρατήρησης ΝΧΝ εικόνα

παρουσιαζόμενη πάνω σε LXL οθόνη.

Da

N

M

Page 531: Εισαγωγή

531Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Οπτικού Υποδείγματος ( VPIC ) 5..11

Ένα μοντέλο για τη Γεωμετρική Παρατήρηση ( συνέχεια )

Αν D >> L , η γωνία παρατήρησης a που αντιστοιχεί σε ένα μπλοκ είναι :

degrees.

Για μια 40 in ( διαγώνιο ) οθόνη , L ≈ 72cm . Έτσι , για πιθανές τιμές

N = 512 , M = 4 και D = 200cm , η γωνία παρατήρησης είναι a ≈ 0.16º.

π.N.D

180.L.M

N.D

L.M.tan

π

180a 1

Page 532: Εισαγωγή

532Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Οπτικού Υποδείγματος ( VPIC ) 6..11

Σχετίζοντας τη Γεωμετρία Παρατήρησης

με την Αντίδραση της Ορατότητας

Θυμηθείτε : Το ορατό ζωνοδιαβατό διάστημα είναι 3 – 6 cy / deg. Έτσι για ένα μπλοκ εικόνας : 0.48 – 0.96 cy / ( 0.16º γωνία παρατήρησης ).

Μπορούμε να πούμε ότι πρέπει να υπάρχει το μέγιστο ένας κύκλος μεταξύ μιας 0.16º γωνίας ή στο 4 Χ 4 μπλοκ εικόνας.

Έτσι το μέγιστο μια αποδεκτή αλλαγή φωτεινότητας ( φωτεινό προς σκοτεινό ή αντίθετα ) αντιπροσωπεύεται σε κάθε μπλοκ ακμών.

Page 533: Εισαγωγή

533Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Οπτικού Υποδείγματος ( VPIC ) 7..11

Υπολογισμός του Μπλοκ

Για κάθε 4 Χ 4 μπλοκ b = { b(i,j) ; 0 ≤ i,j ≤ 3 } , βρες τη διαφορά των μέσων στα μισά μπλοκ ως ακολούθως :

1. Στην κατεύθυνση του x ( γραμμή ) : Δxb = ave { bi,j ; 0 ≤ i ≤ 3 ; j = 0,1 } – ave { bi,j ; 0 ≤ i ≤ 3 ; j = 2,3 } 2. Στην κατεύθυνση του y ( στήλη ) : Δyb = ave { bi,j ; i = 0,1 , 0 ≤ j ≤ 3 } - ave { bi,j ; i = 2,3 , 0 ≤ j ≤ 3 }

Το μέγεθος μιας ακμής( στο τετράγωνο ) και η κατεύθυνσή της είναι : | b |² = ( Δxb )² + ( Δyb )² και < b = tanˉ¹ [ Δxb / Δyb ]

Αυτά έχουν συνεχές πεδίο τιμών τ το οποίο πρέπει να κβαντοποιηθεί.

Page 534: Εισαγωγή

534Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Οπτικού Υποδείγματος ( VPIC ) 8..11

Αλγόριθμος κωδικοποίησης εικόνας Για κάθε 4 Χ 4 μπλοκ εικόνας :

_

1. Υπολογίστε τον μέσο b , το μέγεθος ακμής | b |² και την κατεύθυνση

ακμής < b .

2. Αν | b |² ≤ min κωδικοποιείστε το b σαν σταθερό μπλοκ

( Νόμος του Weber ) .Μεταδώστε αυτή την απόφαση χρησιμοποιώντας

1 bit .

3. Αν | b |² > min κωδικοποιείστε το b σαν μπλοκ ακμής .

i.Μεταδώστε την < b χρησιμοποιώντας Βο = 2bits ( 4 κατευθύνσεις

ακμής ).

ii.Μεταδώστε το | b |² χρησιμοποιώντας Βg bits ( 0≤Βg ≤2,το μάτι δεν

είναι πολύ ευαίσθητο στο μέγεθος της ακμής ).

iii.Μεταδώστε την πολικότητα της ακμής με 1bit.

Page 535: Εισαγωγή

535Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Οπτικού Υποδείγματος ( VPIC ) 9..11

Αλγόριθμος κωδικοποίησης εικόνας ( συνέχεια ) Για κάθε 4 Χ 4 μπλοκ εικόνας ( συνέχεια ): _ 4.Κβαντοποιείστε και μεταδώστε το b χρησιμοποιώντας Bm bits : i.Μπλοκ ακμής ( Edge block ) Bm = Bme ii.Σταθερό μπλοκ ( Constant block ) Bm = Bmc _ όπου Bme < Bmc. Το μάτι είναι πιο ευαίσθητο στο b στα εξομαλισμένα σημεία.

Συνολικός αριθμός bits που θα μεταδοθούν : i.Μπλοκ ακμής ( Edge block ) : Be = Bme + Bg + Bo + 2 = Bme + Bg + 4. ii.Σταθερό μπλοκ ( Constant block ) : Bc = Bmc + 1. Πάντα Be > Bc.

Page 536: Εισαγωγή

536Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Οπτικού Υποδείγματος ( VPIC ) 10..11

VPIC Ανάλυση Συμπίεσης

Σε μια εικόνα κωδικοποιημένη με Nc σταθερό μπλοκ και Ne μπλοκ ακμής η ακριβής συμπίεση που επιτυγχάνεται είναι :

Τυπικές τιμές είναι : Bc = 6 και Be = 7 οι οποίες δίνουν :

18.3 : 1 ≤ CVPIC ≤ 21.3 : 1

1:

Ne.BeNc.Bc

NeNc128.1:

Ne.BeNc.Bc

NeNc8.16.CR VPIC

1:Bc

128CR1:

Be

128VPIC

Page 537: Εισαγωγή

537Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κωδικοποίηση Οπτικού Υποδείγματος ( VPIC ) 11..11

Αποκωδικοποίηση VPIC

Αντιπροσώπευση των σταθερών μπλοκ με τον μέσο της φωτεινότητας μόνο.

Για ένα μπλοκ ακμής αποκωδικοποιείστε ως ακολούθως : 1.Αντιπροσωπεύστε τα πρότυπα ακμών με ± 1. 2.Πολλαπλασιάστε το πρότυπο με το μέγεθος της κλίσης. 3.Αποφασίστε την πολικότητα. 4.Προσθέστε τον μέσο της φωτεινότητας.

Ανάλυση πολυπλοκότητας

Πολυπλοκότητα : 2.0 προσθέσεις , 0.1 πολλαπλασιασμοί για κάθε στίγμα ( γρήγορος ).

Page 538: Εισαγωγή

538Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διακριτός Μετασχηματισμός Συνημίτονου (DCT) Κωδικοποίηση & JPEG (1/6)

Υπολογισμός του διακριτού μετασχηματισμού και του αντίστροφου διακριτού μετασχηματισμού συνημίτονου μιας εικόνας :

1. Διακριτός Μετασχηματισμός Συνημίτονου ( DCT )

2.Αντίστροφος Διακριτός Μετασχηματισμός Συνημίτονου ( IDCT )

όπου C( u ) = 1 / √2 ; u = 0 C( u ) = 1 ; u = 1,…,N-1

2N

1)vπ(2jcos

2N

1)uπ(2ij)cosI(i,

N

4C(u)C(v)v)(u,I

1N

0i

1N

0j2~

1)vπ(2jcos

1)uπ(2iv)cos(u,IC(u)C(v)j)I(i,

1N

0u

1N

0v~

Page 539: Εισαγωγή

539Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διακριτός Μετασχηματισμός Συνημίτονου (DCT) Κωδικοποίηση & JPEG (2/6)

Γιατί να χρησιμοποιούμε DCT αντί για DFT ?

Υπάρχουν O(N²logN²) αλγόριθμοι για τον DCT – και κάπως γρηγορότεροι από τον DFT : λόγω του ότι έχουμε να κάνουμε υπολογισμούς μόνο με πραγματικούς αριθμούς με γρήγορη αριθμητική ακεραίων μόνο.

Η χρησιμοποίηση του DCT δίνει καλύτερης ποιότητας συμπιεσμένη εικόνα από τη χρησιμοποίηση του DFT , η οποία υποφέρει από block-artifacts.Το DFT δείχνει ότι η εικόνα είναι N-περιοδική ,ωστόσο το DCT δείχνει ότι η αντικατοπτρισμένη εικόνα είναι 2Ν-περιοδική.

Page 540: Εισαγωγή

540Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διακριτός Μετασχηματισμός Συνημίτονου (DCT) Κωδικοποίηση & JPEG (3/6)

Περιοδικότητα που συνεπάγεται από το DFT σε αντίθεση με το DCT

Ένα σήμα μήκους – Ν

Ν

Page 541: Εισαγωγή

541Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διακριτός Μετασχηματισμός Συνημίτονου (DCT) Κωδικοποίηση & JPEG (4/6)

Περιοδικότητα που συνεπάγεται από το DFT σε αντίθεση με το DCT

Η περιοδική επέκταση που συνεπάγεται από το DFT :

Η περιοδική επέκταση του αντικατοπτρισμένου σήματος που συνεπάγεται από το DCT :

N

2N

Page 542: Εισαγωγή

542Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διακριτός Μετασχηματισμός Συνημίτονου (DCT) Κωδικοποίηση & JPEG (5/6)

Περιοδικότητα που συνεπάγεται από το DFT σε αντίθεση με το DCT

Το DFT μήκους – 2Ν αντικατοπτρισμένου σήματος οδηγεί (δύο περιόδους) στο DCT του μήκους – Ν σήματος.

Βασική Διαφορά : Η περιοδική επέκταση του DFT δημιουργεί υψηλές συχνότητες - ανακοπές μεταξύ των μπλοκ.Αυτές οι υψηλές συχνότητες μπορεί να αναπαρασταθούν στο κώδικα ( δεν καταστρέφονται ) , αλλιώς έχουμε κακής ποιότητας ανακατασκευασμένη εικόνα.

To DCT δεν έχει αυτό το πρόβλημα , έτσι έχουμε λιγότερα να κωδικοποιήσουμε και έτσι έχουμε υψηλότερη απόδοση.

Page 543: Εισαγωγή

543Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διακριτός Μετασχηματισμός Συνημίτονου (DCT) Κωδικοποίηση & JPEG (6/6)

ΒΑΣΙΚΗ ΔΙΑΦΟΡΑ: Η περιοδική επέκταση του DFT δημιουργεί ψηλές συχνότητες – οι ασυνέχειες μεταξύ των μπλοκ. Αυτές οι ψηλές συχνότητες πρέπει να αναπαρασταθούν στον κώδικα (δεν καταστρέφονται), αλλιώς η ανακατασκευασμένη εικόνα θα είναι κακής ποιότητας με blocking effects.

Το DCT δεν έχει αυτό το πρόβλημα – λιγότερη κωδικοποίηση και ψηλότερη απόδοση.

Page 544: Εισαγωγή

544Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Επανάληψη του JPEG

Το πρότυπο εμπορικής βιομηχανίας – Joint Photographic Experts Group (JPEG).

Χρησιμοποιεί το DCT σαν το κεντρικό μετασχηματισμό.

Γενικά ο αλγόριθμος JPEG είναι περίπλοκος.Τρία μέρη:

Βασικό σύστημα JPEG (βασικός κώδικας με απώλειες).

Εκτενή χαρακτηριστικά JPEG (12-bit, προοδευτική, αριθμητική).

Κωδικοποιητής JPEG χωρίς απώλειες.

Page 545: Εισαγωγή

545Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βήματα Βασικού Συστήματος JPEG (1/3)

i. Διαχωρίζουμε την εικόνα σε 8 x 8 μπλοκ, και μετασχηματίζουμε κάθε μπλοκ με DCT. Δηλώνουμε αυτά τα μπλοκ με

~kI (u, v)

Page 546: Εισαγωγή

546Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βήματα Βασικού Συστήματος JPEG (2/3)

ii. Διαιρούμε σημείο με σημείο κάθε μπλοκ με ένα 8 x 8 πίνακα κανονικοποίησης Q(u, v), τον οποίο ορίζει ο χρήστης. Αυτός ο πίνακας μεταδίδεται σαν μέρος του κώδικα για την ολική εικόνα. Ο πίνακας συνήθως σχεδιάζεται χρησιμοποιώντας ιδιότητες ευαισθησίας του συστήματος ανθρώπινης όρασης.

Page 547: Εισαγωγή

547Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βήματα Βασικού Συστήματος JPEG (3/3)

iii. Ομοιόμορφα κβαντικοποιούμε τα αποτελέσματα.

Q ~k~k

I (u, v)I (u, v) = int + 0.5

Q(u, v)

Δίνει ένα πίνακα ακέραιων που περιέχει πολλά

μηδενικά.

Page 548: Εισαγωγή

548Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα (1/3)

8 x 8 μπλοκ

~k

1260 1 12 5 2 2 3 123 17 6 3 3 0 0 111 9 2 2 0 1 1 07 2 0 1 1 0 0 0I = 1 1 1 2 0 1 1 1

2 0 2 0 1 1 1 11 0 0 1 0 2 1 13 2 4 2 2 1 1 0

Page 549: Εισαγωγή

549Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα (2/3)

Ένας τυπικός JPEG πίνακας κανονικοποίησης

16 11 10 16 24 40 51 6112 12 14 19 26 58 60 5514 13 16 24 40 57 69 5614 17 22 29 51 87 80 62Q = 18 22 37 56 68 109 103 7724 35 55 64 81 104 113 9249 64 78 87 103 121 120 10172 92 95 98 112 100 103 99

Page 550: Εισαγωγή

550Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα (3/3)

Αποτέλεσμα

Q~k

79 0 -1 0 0 0 0 0-2 -1 0 0 0 0 0 0-1 -1 0 0 0 0 0 00 0 0 0 0 0 0 0I = 0 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 0

Παρατηρήστε όλα τα μηδενικά.

Page 551: Εισαγωγή

551Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βήματα Βασικού Συστήματος JPEG (1/7)

iv. Εφαρμόζουμε απλό DPCM στις διακριτές συνημιτονικές (DC) τιμές Q

~kI (0, 0)

μεταξύ γειτονικών μπλοκ για να μειώσουμε την εντροπία.Υπολογίζουμε τη διαφορά μεταξύ της τρέχουσας DC τιμής και του αριστερού διπλανού μπλοκ.

Q Q~ ~k k-

e(k) = I (0, 0) - I (0, 0)

Page 552: Εισαγωγή

552Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βήματα Βασικού Συστήματος JPEG (2/7)

iv. Η σειρά e(k) που είναι το αποτέλεσμα των διαφορών συμπιέζεται δίχως απώλειες χρησιμοποιώντας ένα χωρίς απώλειες JPEG κωδικοποιητή Huffman (έχει ένα προκαθορισμένο πίνακα Huffman).Όπως και πριν, κρατώντας την πρώτη σειρά/στήλη των DC τιμών, καθώς επίσης και την e(k), επιτρέπεται η ανακατασκευή των DC τιμών.

Page 553: Εισαγωγή

553Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βήματα Βασικού Συστήματος JPEG (3/7)

v. Επανατακτοποιούμε τις AC τιμές.

Q~kI (u, v)

Q~kI (u, v) ; (u, v) (0, 0)

Ο κβαντικοποιημένος πίνακαςπεριλαμβάνει πολλά μηδενικά στοιχεία, ειδικά στις υψηλές συχνότητες. Έτσι, τακτοποιούμε τα στοιχεία σε ένα 1-Δ διάνυσμα χρησιμοποιώντας τη ζιγκ-ζαγκ διάταξη

Page 554: Εισαγωγή

554Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βήματα Βασικού Συστήματος JPEG (4/7)

0 1 5 6 14 15 27 282 4 7 13 16 26 29 423 8 12 17 25 39 41 439 11 18 24 31 40 44 53

10 19 23 32 39 45 52 5420 22 33 38 46 51 55 6021 34 37 47 50 56 59 6135 36 48 49 57 58 62 63

Από το προηγούμενο παράδειγμα το διατεταγμένο κβαντικοποιημένο μπλοκ είναι 79 0 2 1 1 1 0 0 1 EOB

Page 555: Εισαγωγή

555Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βήματα Βασικού Συστήματος JPEG (5/7)

vi. Κωδικοποιούμε τις AC τιμές χρησιμοποιώντας ακόμα ένα χωρίς απώλειες JPEG κωδικοποιητή Huffman.

Κωδικοποιούμε τα μηδενικά – υπάρχουν πολλά – με τη μέθοδο ‘μήκος διαδρομής’. Αυτό είναι πιθανόν η μεγαλύτερη πηγή συμπίεσης.

Page 556: Εισαγωγή

556Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βήματα Βασικού Συστήματος JPEG (6/7)

vii. Η αποκωδικοποίηση επιτυγχάνεται με αντίστροφη της κωδικοποίησης Huffman και της DPCM για επαναδημιουργία ~k

IΠολλαπλασιάζουμε με τον πίνακα κανονικοποίησης για τη δημιουργία του κωδικοποιημένου DCT

Q

k~k

^

~I Q I

Page 557: Εισαγωγή

557Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Βήματα Βασικού Συστήματος JPEG (7/7)

viii. Η κωδικοποιημένη εικόνα είναι η IDCT του αποτελέσματος ^ ^

k ~kI = IDCT[I ]

Οι συμπιέσεις που μπορούν να επιτευχθούν

κυμαίνονται:

8 : 1 (πολύ καλή ποιότητα)

16 : 1 (καλή ποιότητα)

32 : 1 (κακή ποιότητα για τις περισσότερες εφαρμογές)

Page 558: Εισαγωγή

558Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Wavelet ή Subband Κωδικοποίηση Εικόνας 1..11

Ολική σειρά από προσεγγίσεις κωδικοποίησης εικόνας που έχει ένα κοινό θέμα – αποσύνθεση πολλαπλής ανάλυσης.

Δεν χρησιμοποιούνται τα μπλοκ εικόνων – δεν έχουμε ανακατασκευασμένη εικόνα κακής ποιότητας.

Μερικοί αλγόριθμοι φτάνουν σε συμπίεση 40:1.

Page 559: Εισαγωγή

559Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Wavelet ή Subband Κωδικοποίηση Εικόνας

ΒΑΣΙΚΗ ΙΔΕΑ: Η εικόνα Ι περνά διαμέσου ενός συνόλου από ζωνοδιάβατα φίλτρα.

Τα φίλτρα σχηματίζουν μια ορθοκανονική βάση, που σημαίνει ότι η εικόνα Ι μπορεί να επανακτηθεί ακριβώς, περνώντας τα φιλτραρισμένα σήματα διάμεσου μιας τράπεζας από φίλτρα αποκωδικοποίησης.

Page 560: Εισαγωγή

560Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Wavelet ή Subband Κωδικοποίηση Εικόνας 3..11

H 0

H 1

HN -1

coefficient quantization

Bandpass filter bank

ImageI

G 0

G 1

N G -1

Reconstruction filter bank

Code( )I

Page 561: Εισαγωγή

561Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Wavelet ή Subband Κωδικοποίηση Εικόνας

Τα Subband φίλτρα διαχωρίζουν ή αποσυνθέτουν την εικόνα σε ψηλές συχνότητες και χαμηλές συχνότητες που ονομάζονται subbands.

Κάθε ζώνη συχνότητας μπορεί να κωδικοποιηθεί ξεχωριστά. Αυτά λέγονται φίλτρα τετραγωνισμού. Αν αυτό γίνει επαναληπτικά στις ζώνες των χαμηλότερων συχνοτήτων, το αποτέλεσμα είναι ένας μετασχηματισμός wavelet.

Page 562: Εισαγωγή

562Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Wavelet ή Subband Κωδικοποίηση Εικόνας 5..11

(0, 0)

High, High

High, Low

Low, High

Low, Low

HH

HL

LH

LLHHLLLH

LLHL

(0, 0)

"Pyramid" Wavelet Transform

(0, 0)

"Tree-Structured" Wavelet Transform

Page 563: Εισαγωγή

563Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Wavelet ή Subband Κωδικοποίηση Εικόνας

Απεικόνιση της ιεραρχίας του φίλτρου (1-Δ μόνο)

H 0 H 1

H 0 H 1

H 0 H 1

IImage

HighLow

HighLow

HighLow

Page 564: Εισαγωγή

564Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Wavelet ή Subband Κωδικοποίηση Εικόνας 7..11

Οι έξοδοι των φίλτρων είναι οι συντελεστές του wavelet.

Μέσω μιας διαδικασίας υποδειγματοληψίας σε κάθε πεδίο φιλτραρίσματος, υπάρχουν ακριβώς N2 μη πλεονάζον συντελεστές wavelet. Η εικόνα μπορεί να επανακατασκευαστεί ακριβώς από αυτά.

Η υποδειγματοληψία είναι βαρύτερη (περισσότερη) στις χαμηλότερες συχνότητες.

Οι συντελεστές του wavelet κβαντικοποιούνται, όπως και στο JPEG, με τις ψηλότερες συχνότητες να κβαντικοποιούνται πιο αυστηρά.

Page 565: Εισαγωγή

565Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Wavelet ή Subband Κωδικοποίηση Εικόνας

Η συμπίεση είναι μια περιοχή με ενεργητική έρευνα. Μερικές τεχνικές:Κωδικοποίηση εντροπίας παρόμοια του

Huffman.Κώδικας μήκους διαδρόμων στα μηδενικά. ‘Κωδικοποίηση Μηδενικού δέντρου’.

ΒΑΣΙΚΗ ΙΔΕΑ: Όμοια με το JPEG, σαρώνει από τις χαμηλότερες στις ψηλότερες συχνότητες και κωδικοποιούν τα μήκη διαδρόμων για τους μηδενικούς συντελεστές.

Page 566: Εισαγωγή

566Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Wavelet ή Subband Κωδικοποίηση Εικόνας 9..11

HH

HL

LH

LLHHLLLH

LLHL

(0, 0)

Zig-zag scanning to findzeroed coefficients

Page 567: Εισαγωγή

567Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Wavelet ή Subband Κωδικοποίηση Εικόνας - Αποκωδικοποίηση

Ολική αποκωδικοποίηση χρειάζεται:Αποσυμπίεση συντελεστών του wavelet.Επανακανονικοποίηση κβαντικοποιημένων

συντελεστών.Επανακατασκευή εικόνας από τους

αποκωδικοποιημένους συντελεστές

Page 568: Εισαγωγή

568Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Wavelet ή Subband Κωδικοποίηση Εικόνας – Αποκωδικοποίηση 11..11

G 1G 0

G 1G 0

G 1G 0

Reconstruction from Code ( )I

Αυτό είναι μετριασμένη έκθεση (watered-down exposition) της κωδικοποίησης wavelet.

Page 569: Εισαγωγή

569

ΚΕΦΑΛΑΙΟ 8

Ταύτιση Προτύπου (Template Matching)Ανίχνευση Ακμών

Ανιχνευτής Ακμών ΚλήσηςΑνιχνευτής Ακμών LaplacianΑνισοτροπική Διάχυση

ΕΠΛ 445 – Ψηφιακή Επεξεργασία Εικόνας

Page 570: Εισαγωγή

570Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Περιεχόμενα 1..4

Tι είναι η Ψηφιακή Ανάλυση Εικόνας;Ταύτιση Προτύπου (Template)Μετρήσεις Μη ΤαίριαξηςΔιασταυρωμένη ΣυσχέτισηΚατωφλίωσηΠεριορισμοί Ταύτισης ΠρωτύπωνΑρχές Ανίχνευσης Ακμών

Page 571: Εισαγωγή

571Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κλίμακα μίας Ακμής ΕικόναςΣύνοψη Μεθόδων Ανίχνευσης ΑκμώνΑνιχνευτής Ακμών με Βάση την ΚλίσηΟρισμός Ανιχνευτών Ακμών με Βάση την

ΚλίσηΨηφιακή ΔιάκρισηΛειτουργία Απλού ΣτίγματοςΛειτουργία Κατωφλίωσης

Περιεχόμενα 2..4

Page 572: Εισαγωγή

572Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ανιχνευτής Ακμών Τύπου LAPLACIANΨηφιακό LAPLACIANΕξομαλυσμένοι Ανιχνευτές Ακμών

LAPLACIANΕξομαλυμένο Προ-Φίλτρο GAUSSIANΑνιχνευτής Ακμών LAPLACIAN-OF-

GAUSSIANΑνιχνευτής ZC

Περιεχόμενα 3..4

Page 573: Εισαγωγή

573Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κατωφλίωση των ZCsΔιπλή Κατωφλίωση Κατωφλίωση Συνδεδεμένης ΔιαδρομήςΑνιχνευτής Ακμών CANNYΑσκήσεις

Περιεχόμενα 4..4

Page 574: Εισαγωγή

574Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Tι είναι η Ψηφιακή Ανάλυση Εικόνας; (1/3)

Αφαίρεση «κοσμικών» πληροφοριών από τις

εικόνες μέσο ψηφιακής επεξεργασίας.Συνήθως η ανάλυση έχει κάποιο σκοπό. Για

παράδειγμα: Η μέτρηση απλών ιδιοτήτων αντικειμένων όπως το σχήμα, η

επιφάνεια, η απόσταση, η αντανάκλαση, η σύσταση επιφάνειας.

Εύρεση λαθών ή διαφορών από μη αναμενόμενη “ονομαστική” εικόνα: εύρεση λάθους, αυτόματος

έλεγχος.

Page 575: Εισαγωγή

575Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Tι είναι η Ψηφιακή Ανάλυση Εικόνας; (2/3)

Αναγνώριση κινητού στόχου από το σχήμα και τις ιδιότητες κίνησης

Ταξινόμηση εικόνων από σκηνές αέρος χρησιμοποιώντας μια στατιστική προσέγγιση ταξινόμησης προτύπων

Πλοήγηση ενός vision-guided robot διαμέσου ενός εχθρικού περιβάλλοντος με τη δημιουργία ενός 3-D χάρτη του άμεσου περιβάλλοντος

Δεν υπάρχουν γενικές αναλύσεις εικόνων ή συστήματα τεχνητής όρασης διαθέσιμα, αλλά το καθένα πρέπει να σχεδιαστεί για να ταιριάξει με το θέμα που έχουμε, το υπολογιστικό

Page 576: Εισαγωγή

576Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Tι είναι η Ψηφιακή Ανάλυση Εικόνας; (3/3)

περιβάλλον κλπ.Ωστόσο, υπάρχει μια ¨βιβλιοθήκη¨ από

υπαρκτούς αλγόριθμους οι οποίοι εκτελούν υποκαθήκοντα καθορισμένα για τα περισσότερα ή τα πιο πολλά θέματα όρασης

Page 577: Εισαγωγή

577Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Tαύτιση Προτύπου (Template) (1/4)

Συχνά μας ενδιαφέρει να βρούμε πόσες φορές ένα κομμάτι εικόνας υπάρχει σε μια εικόνα. Αυτό μπορεί να σημαίνει να βρούμε κάποιο συγκεκριμένο αντικείμενο, χαρακτήρα κλπ.

Είναι δυνατό να ορίσουμε μια τεχνική η οποία χρησιμοποιεί απλή παραθυροποίηση της εικόνας για να επιτύχει αυτό το σκοπό.

Ένα παράθυρο ορίζεται έτσι ώστε όχι μόνο να ορίζει γεωμετρική σχέση μεταξύ συντεταγμένων εικόνων, αλλά έχει επίσης ένα σύνολο

Page 578: Εισαγωγή

578Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Tαύτιση Προτύπου (Template) (2/4)

από επίπεδα φωτεινότητας που σχετίζονται με αυτό. Είναι ένα κομμάτι εικόνας.

Αυτός ο τύπος παραθύρου ονομάζεται πρότυπο (template)

Πρότυπο του χαρακτήρα “P”

Στην πραγματικότητα η διαδικασία που θα ορίσουμε είναι εξ’ ολοκλήρου ανάλογη στην ψηφιακή ταύτιση προτύπου που ορίσαμε στο κεφάλαιο 2.

Page 579: Εισαγωγή

579Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Tαύτιση Προτύπου (Template) (3/4)

Εδώ δημιουργούμε μετρήσεις ταιριασματος επιπέδων φωτεινότητας

Δεδομένης μιας εικόνας Ι και ενός template Τ, το σύνολο του παραθύρου στις συντεταγμένες των εικόνων (i, j) είναι (όπως και πριν):

T.I(i, j) = {I(i+m, j+n); (m, n) ЄT}

το σύνολο των στιγμάτων που καλύπτονται από το Τ

στις συντεταγμένες (i, j) Μπορούμε να ορίσουμε διάφορες μετρήσεις

ταίριαξης μεταξύ των gray-levels στο template Τ

Page 580: Εισαγωγή

580Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Tαύτιση Προτύπου (Template) (4/4)

και των στιγμάτων εικόνας T˚I(i, j) που

καλύπτονται από αυτό. Το αποτέλεσμα είναι μια εικόνα ταίριαξης J η οποία

παίρνει μεγάλες τιμές στις συντεταγμένες (i, j) όπου T και T˚I(i, j) είναι πολύ παρόμοιες.

Θα αρχίσουμε με διάφορες αταίριαστες μετρήσεις και θα παράξουμε μία μέτρηση ταίριαξης από μια από αυτές.

Ακολουθεί η συνέχεια

Page 581: Εισαγωγή

581Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αταίριαστες Μετρήσεις 1..2

MISMATCH {T˚I(i, j), T}

(1) = max m,n Є T{|I(i+m, j+n) - T(m, n)|}

(maximum absolute error)

(2) = 1/(Ν Μ) Σ Σ m,n Є T |I(i+m, j+n) - T(m, n)|

(mean absolute error)

(3) = 1/(Ν Μ) Σ Σ m,n Є T [I(i+m, j+n) - T(m, n)]2

(mean-square error)

για εικόνες προτύπου μεγέθους ΝxM.

Page 582: Εισαγωγή

582Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Αταίριαστες Μετρήσεις 2..2

Οποιοδήποτε από αυτά είναι λογικό κριτήριο για να καθορίσει το αταίριαστο μεταξύ T˚I(i, j) και T.

Ωστόσο, μόνο το (3), το MSE οδηγεί σε καλή μέτρηση ταίριαξης

Page 583: Εισαγωγή

583Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ανάλυση MSE 1..2

Σπάζουμε το MSE σε τρεις όρους:

MSE {T˚I(i, j), T} = 1/(N M) Σ Σ m,n Є T [I(i+m, j+n) - T(m, n)]2

= 1/(N M) Σ Σ m,n Є T [I2(i+m, j+n) - 2I(i+m, j+n)T(m, n) + T2(m, n)]

= 1/(N M) Σ Σ m,n Є T I2(i+m, j+n)

– 2/(N M) Σ Σ m,n Є T I(i+m, j+n)T(m, n) + 1/(N M) Σ Σ m,n Є T T2(m,n)

Ας εξετάσουμε κάθε όρο:

Σ Σ m,n Є T T2(m, n) = ολική ‘ενέργεια’ προτύπου ET

= μια σταθερά με βάση το (i, j)

Page 584: Εισαγωγή

584Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ανάλυση MSE 2..2

Σ Σ m,n Є T I2(i+m, j+n) = τοπική ‘ενέργεια’ εικόνας στο (i, j)

= ET˚ I(i, j)

ανεξάρτητο από τις τιμές του T παρόλο που υπολογίζεται πάνω σε επιφάνεια σχήματος T.

Σ Σ m,n Є T I(i+m, j+n)T(m, n) = διασταυρωμένη-συσχέτιση των I και T.

= CI,T(i, j)

Page 585: Εισαγωγή

585Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διασταυρωμένη Συσχέτιση 1..2

Έτσι, (N M) MSE {T˚I(i, j), T} = ET + ET ˚ I(i, j) - 2·CI,T(i, j).

Αφού το MSE είναι μικρό όταν υπάρχει καλή ταίριαξη, και αφού ET και ET˚I(i, j) δεν έχουν καμία σχέση με το πόσο καλά το T˚I(i, j) και T ταιριάζουν, τότε το CI,T(i, j)πρέπει να αυξάνεται όταν υπάρχει καλή ταίριαξη στο (i, j).

Είναι γεγονός ότι η ανισότητα Schwarz λεει ότι για κάθε άθροισμα γινόμενου ισχύει το ακόλουθο:

Σ Σ m,n A(m, n)B(m, n)

≤ SQRT m,n[Σ Σ m,n A2(m, n)·Σ Σ m,n B2(m, n)]

Page 586: Εισαγωγή

586Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διασταυρωμένη Συσχέτιση 2..2

με την ισότητα "=" να αντικαθιστά "≤" Τότε και μόνον τότε

A(m, n) = K·B(m, n) for all (m, n)

όπου Κ οποιαδήποτε σταθερά Μπορούμε να το εφαρμόσουμε αυτό στη διασταυρωμένη-

συσχέτιση

Page 587: Εισαγωγή

587Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ανώτατο Όριο Διασταυρωμένης Συσχέτισης

Από την ανισότητα Schwarz, το ανώτατο όριο της διασταυρωμένης-συσχέτισης είναι:

CI,T(i, j) = Σ Σ m,n Є T I(i+m, j+n)T(m, n)

≤ SQRT [Σ Σ m,n Є T I2(i+m, j+n) ·

Σ Σ m,n Є T T2(m, n)]

= SQRT [ET˚ I(i, j)·ET]

με ισότητα αν και μόνο αν

I(i+m, j+n) = K·T(m, n) for all (m, n) Є T.

Page 588: Εισαγωγή

588Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Σχόλια

Η διασταυρωμένη-συσχέτιση δίνει καλή μέτρηση ταίριαξης

Για να ορίσουμε πόσο καλή είναι η ταίριαξη, πρέπει να την συγκρίνουμε με το θεωρητικό ανώτερο όριο

SQRT [ET ˚I(i, j)·ET]

΄Η αν κανονικοποιήσουμε την διασταυρωμένη-συσχέτιση

Page 589: Εισαγωγή

589Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κανονικοποιημένη Διασταυρωμένη Συσχέτιση 1..2

ΟρίζουμεCI ,T(i, j)

SQRT[ET°I (i, j)·ET]I,T(i, j)

=

Έτσι έχουμε:

0 ≤ I,T(i, j) ≤ 1 για κάθε (i, j)

Αυτό σημαίνει ότι όλοι οι τρεις όροι CI,T(i, j),

ET και ET˚I(i, j) του MSE πρέπει να υπολογιστούν.

Page 590: Εισαγωγή

590Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κανονικοποιημένη Διασταυρωμένη Συσχέτιση 2..2

Έτσι μπορούμε να ορίσουμε την ολική λειτουργία της διασταυρωμένης-συσχέτισης με κανονικότητα

J = CORR[I, T]

Αν

J(i, j) = I,T(i, j) for 0 ≤ i, j ≤ N-1.I,T(i, j)

Page 591: Εισαγωγή

591Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Υπολογισμός

Η κανονικοποιημένη διασταυρωμένη-συσχέτιση με κανονικότητα είναι σχετικά απλά υπολογίσιμη Το ET είναι γνωστό από πριν και χρειάζεται να υπολογιστεί μόνο μια

φορά Το ET˚I(i, j) εξαρτάται από τις τιμές της εικόνας μόνο

Το CI,T(i, j) ορίζεται σαν μια γραμμική συνέλιξης

CI,T(i, j) = Σ Σ m,n Є T I(i+m, j+n) T(m, n) = I(i, j)*T(-i, -j)

Εκτός από το temlate δεν ‘αντιστρέφεται’ στο άθροισμα

Ισχύει: DFT[CI,T] = DFT[T]·DFT[I]*

Page 592: Εισαγωγή

592Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα Συσχέτισης Στο Matlab

I = imread(‘exampleim.tir’)’

T = imread(‘template.tif’);

J = xcorr2(I, T);

imshow(I);

Figure, imshow(J);

Page 593: Εισαγωγή

593Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κατωφλίωση 1..2

Ένας καλός τρόπος για να υπολογίσουμε την καλύτερη ταίριαξη είναι να βρούμε την μεγαλύτερη τιμή στην εικόνα ταίριαξης

J = CORR[I, T] Αλλά αυτό θεωρεί ότι υπάρχει ταίριαξη, ή μόνο μια

ταίριαξη. Διαφορετικά, κάποιος μπορεί να κατωφλιώσει την εικόνα ταίριαξης: Ας ορίσουμε

K(i, j) = 1 if J(i, j) ≥ t

το οποίο ταυτίζει όλα τα σημεία που έχουν

ικανοποιητικά καλή ταίριαξη

Page 594: Εισαγωγή

594Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κατωφλίωση 2..2

Αν τ=1, τότε μόνο τέλειες ταιριάξεις θα βρεθούν. Αυτή είναι σπάνια περίπτωση ακόμα και αν το αντικείμενο είναι παρόν, λόγο θορύβου.

Συνήθως χρησιμοποιείται η τιμή τ η οποία είναι κοντά μα μικρότερη από 1

Ο καθορισμός αυτής της τιμής είναι συνήθως μια εμπειρική (trial-and-error) άσκηση

Page 595: Εισαγωγή

595Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Template Matching 1..8

Περιορισμοί της ταύτισης του Template Θόρυβος,

περιστροφή, τέντωμα, κλιμάκωση, κλπ.

Έχω το template που παρουσιάζεται στα δεξιά.

template

Page 596: Εισαγωγή

596Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Template Matching 2..8

Περιορισμοί της ταύτισης του Template (συνέχεια)

Το template θα ταιριάξει καλά στην εικόνα δεξιά

Αλλά όχι σε μια από τις ακόλουθες

Page 597: Εισαγωγή

597Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Template Matching 3..8

To template δεν ταιριάζει γιατί παρουσιάζεται περιστρεμμένο.

Page 598: Εισαγωγή

598Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Template Matching 4..8

To template δεν ταιριάζει γιατί παρουσιάζεται σε μεγένθυνση.

Page 599: Εισαγωγή

599Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Template Matching 5..8

To template δεν ταιριάζει γιατί υπάρχει θόρυβος.

Page 600: Εισαγωγή

600Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Template Matching 6..8

To template δεν ταιριάζει γιατί υπάρχει άλλο αντικείμενο μπροστά του.

Page 601: Εισαγωγή

601Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Template Matching 7..8

Γενικοποιημένη Ταύτιση Template Η λειτουργία ταύτισης Template είναι πολύ δύσκολο

να γενικοποιηθεί σε αυθαίρετες υπάρξεις κάποιου αντικειμένου, όπως στις περιπτώσεις προβλήματος που έχουμε δείξει προηγουμένως.

Ερευνητές έχουν επεκτείνει την τεχνική (με σημαντικό προσκολλημένο υπολογισμό) για να λύσουν ένα ή δυο από τα προβλήματα.

Ωστόσο, η τεχνική παραμένει κάπως περιορισμένη.

Page 602: Εισαγωγή

602Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Template Matching 8..8

Γενικοποιημένη Ταύτιση TemplateΑργότερα θα εξετάσουμε τον μετασχηματισμό

Hough ο οποίος είναι πολύ πιο γενικευμένος, αλλά εφαρμόζεται μόνο σε ταύτιση και εύρεση καμπυλών.

Το επόμενο θέμα, ανίχνευση Άκμων, είναι ένας ειδικός τύπος ταύτισης template (τα templates σε αυτή την περίπτωση είναι πολύ απλά).

Page 603: Εισαγωγή

603Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Έννοιες Ανίχνευσης Ακμών 1..14

Πιθανόν κανένα θέμα στον χώρο ανάλυσης εικόνας, δεν έχει μελετηθεί τόσο εξαντλητικά όσο η ανίχνευση ακμών.

Οι ακμές είναι ξαφνικές, επικροτημένες αλλαγές στην μέση φωτεινότητα της εικόνας η οποία επεκτείνεται κατά μήκος μιας διαδρομής.

Page 604: Εισαγωγή

604Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Έννοιες Ανίχνευσης Ακμών

Η ανίχνευση ακμών χρησιμοποιείται σαν προεφαρμογή στα περισσότερα πρακτικά θέματα ανάλυσης εικόνας. Οι περισσότεροι αλγόριθμοι τεχνητής όρασης χρησιμοποιούν ακμές που έχουν ανιχνευτεί σαν τη βασικές πρώτες ύλες για επεξεργασία.

Οι λόγοι γι’ αυτό υποστηρίζονται εύκολα: Στις ακμές μιας εικόνας υπάρχουν πολλές πληροφορίες. Μια

εικόνα μπορεί σε μεγάλο βαθμό να αναγνωριστεί μόνο από τις ακμές της.

Μια απεικόνιση των ακμών της εικόνας χρειάζεται πολύ λιγότερο χώρο αποθήκευσης παρά την εικόνα την ίδια (είναι μια δυαδική γραφική παράσταση διαδρόμων).

Page 605: Εισαγωγή

605Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Έννοιες Ανίχνευσης Ακμών 3..14

Τι είναι μια ακμή; Που βρίσκονται οι ακμές σε

κάθε μια από τις εικόνες στα δεξιά;

Υπάρχουν πολλές αλλαγές φωτεινότητας. Μερικές είναι πιο επικρατέστερες από τις άλλες. Μερικές είναι πιο απότομες από τις άλλες.

Ποιες είναι οι ακμές; Ποιος είναι ο ‘χάρτης ακμών

για κάθε εικόνα;

(1) (2)

(3) (4)

Page 606: Εισαγωγή

606Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Έννοιες Ανίχνευσης Ακμών

Scale of an image edge Κλίμακα Ακμής Εικόνας. Η αντίληψη της κλίμακας μιας ακμής είναι βασική. Η

κλίμακα μιας ακμής σχετίζεται με την διάρκεια χώρου της και την αιχμηρότητα της.

Χαλαρά, αναφερόμαστε σε ακμή μεγάλης-κλίμακας με σημαντική διάρκεια και στις δυο περιπτώσεις. Διαμήκης της διαδρομής της ακμής (μήκος) Κάθετα στην ακμή (πχ η μέση φωτεινότητα)

– Περιοχές σε κάθε πλευρά της ακμής έχουν επικρατέστερη επιφάνεια.

Page 607: Εισαγωγή

607Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Έννοιες Ανίχνευσης Ακμών 5..14

Μια ακμή μικρής κλίμακας, έχει είτε: Διαδρομή μικρής διάρκειας. Ή χωρίζει (μέσες) περιοχές φωτεινότητας μικρών

επιφανειών. Ένας τρόπος να το εξετάσουμε είναι το μέγεθος του

μεγαλύτερου κύκλου ο οποίος μπορεί να περιλαμβάνει την ακμή χωρίς να προσκρούει σε άλλες ακμές της ίδιας κλίμακας

Για παράδειγμα, έχουμε αυτούς τους τρεις κύκλους (κλίμακες):

Page 608: Εισαγωγή

608Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Έννοιες Ανίχνευσης Ακμών Με αυτόν τον ορισμό θα

ισχυριζόμασταν ότι: Η ακμή στη (1), βρίσκεται και στις 3

κλίμακες. Υπάρχει μια ακμή μεγάλης - κλίμακας

στο κέντρο της (2) και ένας μεγάλος αριθμός από ακμές μικρής-κλίμακας στο δεξιό μισό της (2).

Η εξομαλυσμένη ακμή στην (3) είναι μεγάλης κλίμακας μόνο.

Οι ακμές στην (4) είναι μικρής κλίμακας μόνο.

Έτσι μπορούμε να φανταστούμε το αποτέλεσμα εφαρμογής ενός ‘μεγάλης κλίμακας’ ανιχνευτή ακμών.

(1) (2)

(3) (4)

Page 609: Εισαγωγή

609Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Έννοιες Ανίχνευσης Ακμών 7..14

Οι τοποθεσίες ανιχνευμένων ακμών ενδείκνυνται από λεπτές διαδρομές.

Η ακριβής τοποθεσία της ακμής στην (3) δεν είναι φανερή. Μπορούμε να ισχυριστούμε ότι είναι στο κέντρο της αλλαγής – αλλά αυτό είναι ανακριβής

Συνήθως, πρέπει να είμαστε ικανοποιημένοι με τον καθορισμό της τοποθεσίας μιας ακμής οπουδήποτε την τοποθετήσει ο ανιχνευτής ακμών! Αυτός είναι ο λόγος που πρέπει να σχεδιάσουμε τον ανιχνευτή ακμών προσεκτικά

(1) (2)

(3) (4)

None

Υποθετικό Αποτέλεσμα Ανιχνευτή Ακμών Μεγάλης Κλίμακας.

Page 610: Εισαγωγή

610Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Έννοιες Ανίχνευσης Ακμών

Και πάλι η (3) δεν είναι φανερή – πόσο αιχμηρή μια ακμή πρέπει να είναι πριν να θεωρηθεί σαν υπαρκτή σε μικρή κλίμακα;

Τα σημεία αυτής της επίδειξης είναι: Οι ακμές συμβαίνουν σε μια ακτίνα

από κλίμακες. μερικές ακμές συμβαίνουν σε

πολλαπλές κλίμακες Έτσι, ο τύπος, η εμφάνιση, και η

ανίχνευση μιας ακμής καθορίζονται σε μεγάλο βαθμό από τις κλίμακες στις οποίες συμβαίνει.

Ας εφαρμόσουμε τώρα μερικές πιο επίσημες έννοιες

Υποθετικό Αποτέλεσμα Ανιχνευτή Ακμών Μικρής Κλίμακας.

(1) (2)

(3) (4)

None

Page 611: Εισαγωγή

611Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Έννοιες Ανίχνευσης Ακμών 9..14

Γενική Ιδέα Μεθόδων Ανίχνευσης Ακμών. Οι μέθοδοι για την ανίχνευση ακμών έχουν μελετηθεί από τα μέσα του 1960 Έχει εύκολα γίνει το πιο μελετημένο πρόβλημα στον τομέα της ανάλυσης

εικόνας, και η καλύτερη προσέγγιση είναι εκπληκτικά απατηλή Υπήρξαν εκατοντάδες από διαφορετικές προσεγγίσεις τεχνάσματα – με βάση

περίπου σε κάθε μαθηματική τεχνική που μπορούμε να φανταστούμε για να αποφασίσουμε πότε ένα σύνολο αριθμών είναι μεγαλύτερο από κάποιο άλλο

Το πρόβλημα έγινε (επιτέλους) κάπως καλά κατανοητό στην δεκαετία του 1980

Αυτό είναι τυπικό για την ανάλυση εικόνας – τα προβλήματα, ακόμα και τα πιο εύκολα, είναι πολύ πιο δύσκολα από αυτά της κανονικής επεξεργασίας εικόνας (φιλτράρισμα, αποκατάσταση, κλπ.)

Page 612: Εισαγωγή

612Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Έννοιες Ανίχνευσης Ακμών

Γενική Ιδέα Μεθόδων Ανίχνευσης Ακμών.Θα μελετήσουμε τρεις βασικές προσεγγίσεις:

Ανιχνευτής ακμών με βάση την κλίμακα (gradient based)

Ανιχνευτής ακμών με βάση την τοπική εκτίμηση (local estimator based)

Ανιχνευτής ακμών Laplacian (πολλαπλής-κλίμακας)

Page 613: Εισαγωγή

613Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Έννοιες Ανίχνευσης Ακμών 11..14

Ανιχνευτής Ακμών Με Βάση Την Κλίση Παλαιότερη (Roberts 1965) αλλά ακόμα σημαντική τάξη ανιχνευτών

ακμών Ανιχνευτής ακμών με βάση την κλίμακα (gradient based) Για μια συνεχής 2-Δ συνάρτηση f(x, y), η κλίση ορίζεται σαν

διάνυσμα δυο-στοιχείων:

f(x, y) = [fx(x, y), fy(x, y)]T

όπου fx(x, y) = f(x, y) και fy(x, y) = f(x, y) είναι η

προσανατολισμένη παραγωγός (κλίση, ταχύτητα αλλαγής) της f(x, y)

στην x- και y-κατεύθυνση:

x

y

x

y

Page 614: Εισαγωγή

614Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Έννοιες Ανίχνευσης Ακμών 12..14

Μετρήσεις Κλίμακας Γεγονός: η κατεύθυνση της γρηγορότερης ταχύτητας αλλαγής

του f(x, y) στο σημείο (x, y) είναι ο προσανατολισμός της κλίσης

f(x, y) = tan-1

και αυτή η ταχύτητα αλλαγής είναι το μέγεθος τηςκλίσης Mf(x, y) =

Η κλίση κάνει έκκληση για τον ορισμό ενός ανιχνευτήακμών, αφού σίγουρα περιμένουμε μια ακμή να (τοπικά) αντιπροσωπεύει τη μεγαλύτερη ταχύτητα αλλαγής στην φωτεινότητα της εικόνας

fx2(x, y) + fy

2(x, y)

Page 615: Εισαγωγή

615Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Έννοιες Ανίχνευσης Ακμών 13..14

Μετρήσεις Κλίμακας Γεγονός: οι προσανατολισμένες παραγωγοί

σε κάθε δυο κάθετες κατευθύνσεις, ας πούμε x´ και y´, και Mf(x, y) μένουν χωρίς αλλαγή:

Έτσι: Mf(x, y) είναι συμμετρικά περιστρεφόμενη ή ισοτροπική λειτουργία

Μια ισοτροπική λειτουργία είναι επιθυμητή για την ανίχνευση ακμών, αφού οι ακμές συμβαίνουν σε όλες τις κατευθύνσεις, και πρέπει να αντιμετωπίζονται με τον ίδιο τρόπο ανεξάρτητα από την κατεύθυνση

x ́y ́

Ακμές σε διάφορες κατευθύνσεις

Page 616: Εισαγωγή

616Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Έννοιες Ανίχνευσης Ακμών 14..14

Ορισμός Ανιχνευτή Ακμών με Βάση Την Κλίμακα ΕεξηείLτεόLτόκόLλόυόίL ρμμρόηL ς

ψηφίκηL ρώιση (digital differentiation):ρόείLζείψηφίκL τό Ι και το Ι

λειτουργία απλού στίγματος (point operation): συνδυάζουμε τις προσανατολισμένες παραγωγούς σε ένα υπολογισμό του μεγέθους κλίσης MI

κατωφλίωση (threshold): ορίζουμε τις τοποθεσίες των μεγάλων τιμών του MI σαν ισχυρές τοποθεσίες ακμών

image

I

discrete differentiation

point operation

threshold E

edge map

edge enhancement detection

x

y

Page 617: Εισαγωγή

617Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

(i) = I(i) + N(i) =

Η παραγώγιση πάντα δίνει έμφαση στις υψηλές συχνότητες (όπως ο θόρυβος):

|J(i) - J(i-1)| =

Ο θόρυβος είναι ένα μεγάλο πρόβλημα για αυτό τον τύπο ανιχνευτών ακμών

151296300

10

20

151296300

2

4

6

8

Ψηφιακή Παραγώγιση

Page 618: Εισαγωγή

618Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Τύποι Των Ανιχνευτών Ακμών Με Βάση Την Κλίση 1..5

Ορίζουμε το πρότυπο ακμών Δx και Δy οι οποίοι συντελώνται με την εικόνα Ι, για να δημιουργήσουν ψηφιακούς υπολογισμούς του και .

Οι απλοί τύποι:

x

y

x = y = adjacent-1 1

-1

1

Page 619: Εισαγωγή

619Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

x = y = centered

Τύποι Των Ανιχνευτών Ακμών Με Βάση Την Κλίση 2..5

-1 0 1

-1

0

1

x = y = Roberts'-1 0

0 1

0 -1

1 0

Η εκτέλεση αυτών των τριών ανιχνευτών ακμών είναι παρόμοια.

Page 620: Εισαγωγή

620Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Τύποι Των Ανιχνευτών Ακμών Με Βάση Την Κλίση 3..5

Οι τύποι μείωσης θορύβου:

x = /3 y = Prewitt/3-1 0 1

-1 0 1

-1 0 1

-1 -1 -1

0 0 0

1 1 1

x = /4 y = Sobel/4

-1 0 1

-2 0 2

-1 0 1

-1 -2 -1

0 0 0

1 2 1

Page 621: Εισαγωγή

621Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Η ιδέα πίσω από τους Prewitt και Sobel ανιχνευτές ακμών είναι να πάρουν τους μέσους όρους των υπολογισμών του και κατά μήκος τριών σειρών και στηλών αντιστοίχως.

Το Sobel είναι λίγο διαφορετικό από το Prewitt: επιπρόσθετο βάρος δίνετε στις τιμές κοντά στο κέντρο του παραθύρου

x

y

Τύποι Των Ανιχνευτών Ακμών Με Βάση Την Κλίση 4..5

Page 622: Εισαγωγή

622Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ωστόσο, η εκτέλεση αυτών των δυο ανιχνευτών ακμών είναι παρόμοια.

Καλυτερεύουν την ευαισθησία στον θόρυβο από τους ‘απλούς’ τύπους. Αλλά είναι ακόμα πολύ ευαίσθητοι στο θόρυβο.

Τύποι Των Ανιχνευτών Ακμών Με Βάση Την Κλίση 5..5

Page 623: Εισαγωγή

623Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λειτουργία Απλού Στίγματος 1..3

Η λειτουργία απλού στίγματος συνδυάζει τους υπολογισμούς των προσανατολισμένων παραγώγων Δx και Δy σε ένα απλό υπολογισμό του μεγέθους της κλίσης

Οι συνήθεις υπολογισμοί είναι:

(A) M(i, j) = x

2

(i, j) + y

2

(i, j)

Page 624: Εισαγωγή

624Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λειτουργία Απλού Στίγματος 2..3

(B) M(i, j) = |Δx(i, j)| + |Δy(i, j)|

(C) M(i, j) = max{|Δx(i, j)| , |Δy(i, j)|}

Οι ακόλουθες σχέσεις ισχύουν πάντα:

C ≤ A ≤ B

Page 625: Εισαγωγή

625Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λειτουργία Απλού Στίγματος 3..3

Ενώ το (Α) είναι η σωστή αντιπροσώπευση του μεγέθους τηςκλίσης, το (Β) και (C) είναι πιο ικανά υπολογιστικά – χωρίςλειτουργίες ή τετραγωνικές ρίζες.

Από αυτά, το (Β) συχνά υπερτιμά το μέγεθος μιας ακμής, ενώ το (C) συχνά υποτιμά το μέγεθος της.

Κάπως καλύτερο από το (Β) ή το (C) είναι το

(D) M(i, j) = max{|x| , |y|} + · min{|x| , |y|}

Ακόμα, οι διαφορές μεταξύ αυτών είναι ελάχιστες.

14

Page 626: Εισαγωγή

626Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λειτουργία Κατωφλίωσης

Όταν ένας υπολογισμός του μεγέθους της κλίσης M(i, j) έχει παρθεί, έχει κατωφλιωθεί για να οριστούν οι πιθανές τοποθεσίες ακμών

Αυτό δημιουργεί ένα δυάδικο χάρτη Ε με στοιχεία

E(i, j) = for 0 ≤ i, j ≤ N-1 1

0

; if M(i, j) > τ; if M(i, j) < τ

Page 627: Εισαγωγή

627Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Λειτουργία Κατωφλίωσης

Έτσι: η τιμή '1' δείχνει την παρουσία μιας ακμής στο (i, j)

η τιμή '0' δείχνει την απουσία μιας ακμής στο (i, j)

Το κατώφλι τ περιέχει την αιχμηρότητα και το μέγεθος

των ακμών οι οποίες έχουν ανιχνευτεί.

Page 628: Εισαγωγή

628Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Πλεονεκτήματα του Ανιχνευτή Ακμών με Βάση την Κλίση

Απλός, υπολογιστικά ικανοποιητικός

Φυσικός ορισμός

Δουλεύει καλά σε ‘καθαρές’ εικόνες

Page 629: Εισαγωγή

629Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μειονεκτήματα του Ανιχνευτή Ακμών με Βάση την Κλίση 1..2

Υπερβολικά ευαίσθητος στον θόρυβο.

Χρειάζεται κατωφλίωση η οποία είναι δύσκολο να επιλεχθεί. Η τιμή της μπορεί να εξαρτάται από την ολική αντίθεση της εικόνας, για παράδειγμα. Συνήθως χρειάζεται αλληλεπιδρόμενη επιλογή για καλύτερα αποτελέσματα.

Page 630: Εισαγωγή

630Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μειονεκτήματα του Ανιχνευτή Ακμών με Βάση την Κλίση 2..2

Ο υπολογισμός του μεγέθους της κλίσης συχνά θα πέφτει πάνω από το κατώφλι σε απόσταση μερικών στιγμάτων από την αληθινή ακμή. Έτσι, η ανιχνευμένη ακμή είναι συνήθως πάχους μερικών στιγμάτων.

Αυτό συνήθως χρειάζεται κάποιο είδος λειτουργίας «λέπτυνσης ακμών» – συνήθως αόριστη.

Οι διαδρομές ακμών είναι συνήθως κομμένες – εμφανίζονται κενά. Αυτό χρειάζεται κάποιο είδος λειτουργίας «ένωσης ακμών» – συνήθως αόριστη.

Page 631: Εισαγωγή

631Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Παράδειγμα Εύρεσης Ακμών στο Matlab

I = imread(‘exampleim.tif’);J = edge(i, ‘roberts’);imshow(i);Figure, imshow(j);

Page 632: Εισαγωγή

632Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ανιχνευτής Ακμών Τύπου Laplacian 1..2

Οι ανιχνευτές ακμών είναι βασισμένη στην δεύτερη παραγωγό

Για μια συνεχή 2-Δ συνάρτηση f(x, y), το Laplacian ορίζετε ως:

f(x, y) = f(x, y) + f(x, y) = (x, y) + (x, y)

Είναι απλός αριθμός και όχι διάνυσμα

fxx fyy

2

x2

2

2

y2

Page 633: Εισαγωγή

633Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ανιχνευτής Ακμών Τύπου Laplacian 2..2

Γεγονός: Αν οι προσανατολισμένοι παραγωγοί σε κάποιες άλλες δυο κάθετες κατευθύνσεις (ας πούμε x´, y´) η τιμή του Laplacian f(x, y) παραμένει χωρίς αλλαγή:

2

Page 634: Εισαγωγή

634Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ορίζουμε τον Ανιχνευτή Ακμών Laplacian 1..2

Ο Ανιχνευτής Ακμών Laplacian υλοποιείται από το ακόλουθο διάγραμμα ροής:

image

I

discrete differentiation

zero-crossing detection E

edge map

edge enhancement detection

Page 635: Εισαγωγή

635Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ορίζουμε τον Ανιχνευτή Ακμών Laplacian 2..2

Ψηφιακή Παραγώγιση:

ψηφιακή προσέγγιση I και I (ή απλός I)

Ανίχνευση διασταύρωσης-μηδενικών:

Ανακαλύπτουμε σε πιο μέρος το Laplacian

διασταυρώνει το μηδέν

2

x2

2

y 2

2

Page 636: Εισαγωγή

636Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μονοδιάστατη Επεξήγηση 1..2

Θυμηθείτε ότι η παραγωγός είναι η κλίση: 1-Δ Κατατομή Ακμής:

Πρώτη Παραγώγιση:

Page 637: Εισαγωγή

637Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Μονοδιάστατη Επεξήγηση 2..2

Δεύτερη Παραγώγιση:

Μια διασταύρωση του μηδέν ή ZC συμβαίνει κοντά στο κέντρο των ακμών όπου η κλίση της κλίσης αλλάζει πρόσημο

Page 638: Εισαγωγή

638Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Το Ψηφιακό Laplacian 1..6

Για μια 1-Δ συνάρτηση f(x) η οποία έχει δειγματοληφθεί, για να παράξει την f(i), χρησιμοποιούμε:

και τότε (αλλαγή με άλλο τρόπο)

με template συνέλιξης:

ddx f(x) ≈ f(i) - f(i-1) = y(i)

d

2

d x 2 f(x) ≈ y(i+1) - y(i) = f(i+1) - 2f(i) + f(i-1)

1 1-2

Page 639: Εισαγωγή

639Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Το Ψηφιακό Laplacian 2..6

Στις δύο-διαστάσεις:

με template συνέλιξης:

Ας χρησιμοποιήσουμε το προηγούμενο 1-Δ παράδειγμα μας:

I(x, y) ≈ [I(i+1, j) - 2I(i, j) + I(i-1, j)] + [I(i, j+1) - 2I(i, j) + I(i, j-1)]

2

1 1-21

1-2+ =

0

01

1

1-4

0

01

Page 640: Εισαγωγή

640Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Το Ψηφιακό Laplacian 3..6

Παράδειγμα – Διπλή- Παραγώγιση μιας 1-Δ

Εικόνας:Μια απλή γραμμή μιας εικόνας:

I(i) =

151296300

10

20

Page 641: Εισαγωγή

641Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Το Ψηφιακό Laplacian 4..6

Η δεύτερη-παραγωγός:

Αποκαλύπτει φανερά μια αιχμηρή τοποθεσία ακμής: μια απλή μεγάλη-κλίση ZC και μερικές «μικρότερες»

διασταυρώσεις ακμών.

I(i+1) - 2I(i) + I(i-1) =

15129630-20

-10

0

10

20

Page 642: Εισαγωγή

642Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Το Ψηφιακό Laplacian 5..6

Παράδειγμα: - Διπλή – Παραγώγηση μιας 1-Δ Εικόνας με Θόρυβο

Μια απλή γραμμή μιας εικόνας με θόρυβο:

J(i) = I(i) + N(i) =

151296300

10

20

Page 643: Εισαγωγή

643Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Το Ψηφιακό Laplacian 6..6

Η δευτερη παραγωγος της:

Πολλά ψεύτικα ZCs.Ο θόρυβος είναι ένα ακόμα μεγαλύτερο πρόβλημα

για αυτό τον τύπο των ανιχνευτών Άκμων. Η διπλη παραγώγιση δημιουργεί υψηλά ενισχυμένο θόρυβο.

J(i+1) - 2J(i) + J(i-1) =

15129630-10

0

10

Page 644: Εισαγωγή

644Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κατωφλίωση;

Ίσως η Κατωφλίωση μερικών τύπων μπορεί να καλυτερεύσει την εκτέλεση του Laplacian;

Ας είναι J(i, j) = I(i, j).

Συγκρίνοντας | J(i, j)| σε ένα κατώφλι όπου J(i, j) = 0.

2

Page 645: Εισαγωγή

645Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εξωμαλυμένοι Και Πολλών-Κλιμάκων Ανιχνευτές Ακμών Laplacian

Η διαφορική λειτουργία Laplacian είναι πολύ

ευαίσθητη στο θόρυβο για να είναι πρακτική για την

ανίχνευση ακμών – υπάρχει πάντα θόρυβος

Αλλά με τροποποίησή της με απλό τρόπο μπορεί να

γίνει πολύ δυνατή

Page 646: Εισαγωγή

646Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Εξωμαλυμένοι Και Πολλών-Κλιμάκων Ανιχνευτές Ακμών Laplacian

Η βασική ιδέα περιλαμβάνεται:

Η διάφορα: μια γραμμική θάμπωση (κατωδιάβατο φίλτρο) εφαρμόζεται πριν από την εφαρμογή του Laplacian

image detect zero crossings I

edge map

E

Laplacian

2

Low-pass filter

G

- smooth noise

- determine edge scale

Page 647: Εισαγωγή

647Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κατωδιαβατό Προ-Φιλτράρισμα

Ο κύριος σκοπός του κατωδιαβατού προ-φιλτραρίσματος του Laplacian είναι να μειώσουμε (εξομαλύνουμε) τον υψηλής-συχνότητας θόρυβο, ενόσω διατηρούμε την σημαντική δομή της εικόνας

Ο δευτερεύων σκοπός του φίλτρου εξομάλυνσης είναι να περιορίσει την κλίμακα στην οποία οι ακμές ανιχνεύονται.

Σημείωση: μια ανωδιαβατή λειτουργία (όπως είναι το Laplacian) που ακολουθείται (ή προηγείται) από ένα κατωδιαβατό φίλτρο θα οδηγήσει σε ένα ζωνοδιαβατό φίλτρο, αν οι ζώνες που περνούν από το φίλτρο ταυτίζονται.

Page 648: Εισαγωγή

648Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Προ-Φιλτράρισμα Εξομάλυνσης Gaussian

Πολλή έρευνα έχει γίνει στο πως το φίλτρο G πρέπει να επιλεχθεί

Έχει βρεθεί ότι το καταλληλότερο φίλτρο εξομάλυνσης στις ακόλουθες δύο ταυτόχρονες αισθήσεις: καλύτερη ακρίβεια τοποθεσίας ακμών μέγιστη αναλογία σήματος-προς-θόρυβο (SNR)

είναι ένα φίλτρο Gaussian: (Κ είναι μια άσχετη σταθερά)

G(i, j) = K· exp [ -(i2 + j2)/2s2 ] ; 0 ≤ i, j ≤ N - 1(u, v) = exp [ -2π 2s2(u2 + v2) / N2 ] ; 0 ≤ |u|, |v| ≤ N/2 -1

Page 649: Εισαγωγή

649Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ανιχνευτής Ακμών Laplacian of Gaussian

Ορίζουμε την λειτουργία Laplacian of a Gaussian ή LoG στην I:

J(i, j) = Ñ2 [G(i, j)*I(i, j)] = G(i, j)*Ñ2I(i, j) = Ñ2G(i, j)*I(i, j)

Οι πιο πάνω 3 μορφές είναι ισοδύναμες αφού οι γραμμικές λειτουργίες (όπως παραγώγιση και συνέλιξη) μπορούν να ανταλλακτούν

Page 650: Εισαγωγή

650Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ανιχνευτής Ακμών Laplacian of Gaussian

Η καλύτερη προσέγγιση είναι να προ-υπολογίσουμε το LoG:

με DFT

τότε περνούμε την συνέλιξη της Ι με το συνδυασμένο φίλτρο (Σημείωση: όλοι οι σταθεροί πολλαπλασιαστές έχουν αφεθεί έξω αφού όλα όσα μας ενδιαφέρουν είναι τα ZCs)

Page 651: Εισαγωγή

651Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ανίχνευση ZC

Μετά το φιλτράρισμα, η τελευταία φάση της ανίχνευσης ακμών (στις περισσότερες περιπτώσεις) ανίχνευσης διασταύρωσης μηδενικών

Ας ορίσουμε J = [J(i, j)] να είναι το αποτέλεσμα του φιλτραρίσματος LoG Ένα ZC είναι μια διασταύρωση του μηδενικού επιπέδου: αυτό σημαίνει ότι ο

αλγόριθμος πρέπει να ψάξει να βρει στίγματα της μορφής:

Συνήθως (με την εθιμοτυπικό) ένα πρόσημο ή το άλλο σημαδεύεται σαν την τοποθεσία της ακμής αν δεν υπάρχει ανάγκη για μεγαλύτερη (υπό-στίγματος) ακρίβεια

Page 652: Εισαγωγή

652Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Έννοια της Κλίμακας

Όσο μεγαλύτερη είναι η τιμή των σ που χρησιμοποιούνται, τόσο μεγαλύτερος και ο βαθμός της εξομαλύνσεις από το κατωδιάβατο προ-φίλτρο G

Αν το σ είναι μεγάλο, τότε κάποιος θόρυβος θα εξομαλυνθεί σημαντικά – αλλά έτσι θα μειώσει σημαντικές ακμές

Η ευαισθησία του θορύβου μεγαλώνει με την μείωση του σ – αλλά ο ανιχνευτής Άκμων LoG τότε ανιχνεύει περισσότερη λεπτομέρεια

Page 653: Εισαγωγή

653Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ψηφιακή Κατασκευή του Ανιχνευτή Ακμών LoG

Χρησιμοποιούμε το υπό δειγματοληψία LoG:

Υπάρχουν ειδικοί κανόνες οι οποίοι πρέπει να ακολουθηθούν:Αρκετά 2G(i, j) πρέπει να δειγματολειφθούν.

Το LoG δεν θα δουλέψει καλά δεν περιέχει και τις δυο κύριες και ασήμαντες περιοχές. Στην πράξη, η ακτίνα R του LoG (στο χώρο) πρέπει να ικανοποιεί R ≥ 4s (in pixels)

Page 654: Εισαγωγή

654Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ψηφιακή Κατασκευή του Ανιχνευτή Ακμών LoG

Όταν το του LoG υπολογιστεί, οι συντελεστές του πρέπει να ρυθμιστούν ελαφρός έτσι ώστε να έχουν άθροισμα μηδέν (Γιατί;)

Αυτό γίνεται με την αφαίρεση του (μέσου) ολικού αθροίσματος συντελεστών από το καθένα

Το LoG δεν θα δουλεύει καλά αν το σ δεν είναι ≥ 1 (στίγμα)!

Page 655: Εισαγωγή

655Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κατωφλίωση των ZCs

Η κατωφλίωση δεν είναι συνήθως αναγκαία αν ένας αρκετά μεγάλος χειριστής λειτουργίας χρησιμοποιηθεί

Ωστόσο, μερικές φορές είναι επιθυμητό να ανιχνεύσουμε λεπτομέρειες και να μην ανιχνεύσουμε θόρυβο

Αυτό μπορεί να επιτευχθεί με αποτελεσματικότητα από την κατωφλίωση

Page 656: Εισαγωγή

656Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κατωφλίωση των ZCs

Ας ορίσουμε το J(i, j) να είναι η LoG φιλτραρισμένη εικόνα και E(i, j) να είναι ο χάρτης ακμών

Τότε, βρίσκουμε το μέγεθος της κλίσης |J(i, j)| (η μορφή Roberts θα είναι ικανοποιητική αφού η J έχει εξομαλυνθεί)

If J(i, j)| > t = threshold

και E(i, j) = 1 (ένα ZC υπάρχει στο (i, j))

τότε αφήνουμε τα ZC. Αλλιώς τα αφαιρούμε

Page 657: Εισαγωγή

657Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διπλή Κατωφλίωση

Πρόβλημα: Η απλή κατωφλίωση μπορεί να δημιουργήσει σπασμένες ZC διαδρομές

Προσέγγιση: Ορίζουμε δυο κατώφλια tlo και thi όπουtlo < thi

Συχνά παίρνοντας thi = 2tlo είναι αποτελεσματικό Σε κάθε τοποθεσία ZC (όπου E(i, j) = 1) κάνουμε τα ακόλουθα (α) ΑνJ(i, j)| < tlo απόρριψε το ZC (απορρίπτουμε το ZC) (β) ΑνJ(i, j)| > thi δέκτου το ZC (αποδεχόμαστε το ZC) (γ) Αν tlo ≤ J(i, j)| ≤ thi (τότε αποφασίζουμε σύμφωνα με

τα γειτονικά ZCs)

Page 658: Εισαγωγή

658Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Διπλή Κατωφλίωση

Η τελευταία στρατηγική (γ) μπορεί να πάρει πολλές μορφές. Για παράδειγμα, μπορούμε να αποφασίσουμε να δεχτούμε το τρέχων ZC ικανοποιώντας το (γ) αν κάποια από τα γειτονικά ZCs ικανοποιούν το (β)

Ή, αν ένα από τα γειτονικά ZCs είτε ικανοποιεί το (β), ή ικανοποιεί το (γ) και έχει γείτονα που ικανοποιεί το (β)

Αυτή η προσέγγιση προωθεί την σύνδεση

Page 659: Εισαγωγή

659Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Κατωφλίωση Διαδρομών

Προσέγγιση: Συγκρίνουμε όλα τα στίγματα ZC σε μια ZC διαδρομή με ένα κατώφλι. Αν αρκετά ZC είναι πάνω από την κατωφλίωση, αποδεχόμαστε την διαδρομή, διαφορετικά την απορρίπτουμε

Υποθέτουμε ότι (i1, j1), (i2, j2), (i3, j3) ,..., (iL, jL) είναι σημεία σε μια 8-συνδεδεμένη διαδρομή ZC

Υπολογίζουμε το J(in, jn)| για n = 1 ,..., L. Ας ορίσουμε το Q = # σημείων όπου το J(in, jn)| > t. If Q/L > PERCENT (τότε αποδεχόμαστε ολόκληρη την ZC

διαδρομή)Q/L ≤ PERCENT (τότε απορρίπτουμε ολόκληρη την ZC διαδρομή)Τυπικά PERCENT > 0.75

Page 660: Εισαγωγή

660Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

DOG και Προσέγγιση Διαφοράς των Κιβωτίων

Πίσω στο Κεφάλαιο 5 είχε παρατηρηθεί ότι η διαφορά των Gaussians ή DOG είναι χρήσιμη:

(u, v) = exp [-2π 2s(u2 + v2) / N2 ] - exp [-2π 2s(u2 + v2) / N2 ]; 0 ≤ |u|, |v| ≤ N/2 -

1 Είναι γεγονός ότι το DOG ζωνοδιάβατο φίλτρο είναι σχεδόν ακριβώς το ίδιο με

το LoG αν s1 ≈ 1.5s2 Για αυτό τον λόγο το DOG χρησιμοποιείτε για τον υπολογισμό του LoG (π.χ.,

αν ένα Gaussian σχεδιαστεί σαν μέρος του συστήματος) Άλλες διάφορες των κατωδιάβατων φίλτρων μπορούν να χρησιμοποιηθούν

επίσης: ένα παροδικό παράδειγμα είναι η διαφορά των κιβωτίων, το οποίο στο πεδίο ορισμού του χώρου δίνετε από

J = AVE[I, B1] - AVE[I, B2]όπου B1 και B2 είναι παράθυρα του ίδιου σχήματος αλλά διαφορετικών μεγεθών

Αυτό έχει το πλεονέκτημα της απλοποίησης του υπολογισμού αλλά τείνει να οδηγήσει σε λίγο πιο πολλές λανθασμένες ακμές

Page 661: Εισαγωγή

661Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Πλεονεκτήματα του LoG

Συνήθως δεν χρειάζεται κατωφλίωση Οδηγεί πάντα σε ακμές πάχους ενός στίγματος (δεν χρειάζεται

λέπτυνση!) Οδηγεί σε συνδεδεμένες ακμές (δεν χρειάζεται σύνδεση

ακμών!) Μπορεί να αποδειχθεί να είναι η καταλληλότερη (κάτω από

κάποιο κριτήριο) Φαίνεται να είναι παρόμοιο με το τι γίνεται στην βιολογική

όραση Μειονεκτήματα του LoG

Υπολογιστικά δαπανηρό – μεγάλου-μεγέθους DFT

Page 662: Εισαγωγή

662Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ανιχνευτής Ακμών Canny

Επιχειρεί να καλυτερεύσει το LoG Θεωρούμαι μια ιδανική εικόνα

ιστό-ακμή: Επίσης το Laplacian 2 είναι

ισοτροπικό, είναι ισοδύναμο με να πάρουμε: Μια διπλή-παράγωγο σε

κατεύθυνση κάθετη με την ακμή . Αυτή μεταφέρει την πληροφορία ακμής

Μια διπλή-παραγωγός σε κατεύθυνση παράλληλη με την ακμή. Αυτή δεν μεταφέρει πληροφορία ακμής!

Page 663: Εισαγωγή

663Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ανιχνευτής Ακμών Canny

Είναι γεγονός αν υπάρχει θόρυβος στην εικόνα, η παράλληλη διπλή παράγωγος θα δώσει μόνο άχρηστες πληροφορίες!

Ο αλγόριθμος του Canny προσπαθεί να αφαιρέσει αυτό το ελάττωμα χρησιμοποιώντας μόνο τις πληροφορίες παραγωγού στην κατεύθυνση της ακμής

Page 664: Εισαγωγή

664Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ο Αλγόριθμος Canny

Σχηματίζει την Gaussian-εξομαλυσμένη εικόνα:

K(i, j) = G(i, j)*I(i, j) Υπολογίστε το μέγεθος της κλίσης και του

προσανατολισμού:

| K(i, j)| and K(i, j) Χρησιμοποιώντας ψηφιακή (διάφορης) προσέγγιση

Page 665: Εισαγωγή

665Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Ο Αλγόριθμος Canny

Ας ορίσουμε το n να είναι ένα διάνυσμα μονάδας στην κατεύθυνση direction K(i, j). Υπολογίστε την δεύτερη-παραγωγό του K(i, j) στην κατεύθυνση του n:

Βρέστε τα ZCs στην εικόνα. Αυτά είναι ακριβώς οι διασταυρώσεις-μηδενικών: K ×

( K × K), οι οποίες είναι πιο εύκολο να σχεδιαστούν.

Μειονεκτήματα: μη-γραμμικό, έτσι οι συνδεδεμένες ακμές δεν είναι εγγυημένες. Ωστόσο, η διπλή-κατωφλίωση συνήθως δουλεύει κάπως καλά.

Page 666: Εισαγωγή

666Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής

Τέλος Θεωρίας

Ψηφιακή Επεξεργασία Εικόνας

ΕΠΛ 445