Digital Image Processing

82
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ ∆ρ.Χ.Στρουθόπουλος

description

Digital Image Processing

Transcript of Digital Image Processing

Τµήµα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ∆ρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:

• Η ψηφιοποίηση και κωδικοποίηση εικόνων µε σκοπό τηναποθήκευση, µετάδοση και εκτύπωσή τους.

•Η βελτίωση και η αποκατάσταση των εικόνων µε σκοπό τηνκαλύτερη απεικόνισή τους.

•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται µε τους παρακάτω επιστηµονικούς κλάδους:

• Ψηφιακή Επεξεργασία Σηµάτων (ΨΕΣ)

• Ροµποτική όραση

• Τεχνητή Νοηµοσύνη

• Αναγνώριση Προτύπων

• Νευρωνικά ∆ίκτυα

• Ασαφής Λογική

• Κωδικοποίηση

• Γραφικά Η/Υ

Η µετατροπή µιας εικόνας σε ψηφιακή

µορφή ουσιαστικά είναι η µετατροπή ενός

δισδιάστατου αναλογικού σήµατος σε ψηφιακό

και απαιτεί τις διαδικασίες της δειγµατοληψίας

και του κβαντισµού.

Εικονοστοιχείο(picture element, pixel, pel)

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ

Η τιµή I(j,k)µε k=0,1,2….K-1και j=0,1,2….J-1είναι ο κωδικός τουχρώµατος τουεικονοστοιχείουστην θέση (k,j) τηςψηφιακής εικόνας

J πλήθος γραµµών

Κ πλήθος στηλών JxK πλήθος εικονοστοιχείων

Τρόποι δηµιουργίας ψηφιακών εικόνων

• Με χρήση λογισµικού σχεδίασης(π.χ. Corel Draw, PaintBrush, Autocad, 3D studio …

• Ψηφιοποίηση(π.χ. ψηφιακές φωτογραφικές µηχανές, σαρωτές (scanners)…)

Circle (x,y,r)222 ryx =+Vectors

Raster

Χρωµατικοί χώροι

• Red, Green, Blue (RGB)

• Luminance, Hue, Saturation (YIQ, NTSC)

• Luminance, Component Blue, Component Red (YCbCr)

• Hue, Saturation, Value (HSV)

• Cyan, Magenta, Yellow (CMY, CMYK)

• Hue, Saturation, Intensity

• Red, Green, Blue (RGB)

Luminance, Hue, Saturation (YIQ, NTSC)

Το τηλεοπτικό σύστηµα µετάδοσης στην Αµερική NTSC χρησιµοποιείΤον χτωµατικό χώρο YIQ

Hue, Saturation, Value (HSV)

HueΑπόχρωση σύµφωνα µε τοµήκος κύµατος τηςφωτεινής ακτινοβολίας

SaturationΚαθαρότητα σε προσµιξηλευκού

ValueΤιµή πρόσµιξης µε τοµαύρο

Hue, Saturation, Ι (HSΙ)

HueΑπόχρωση σύµφωνα µε τοµήκος κύµατος τηςφωτεινής ακτινοβολίας

SaturationΚαθαρότητα σε προσµιξηλευκού

IntensityΈνταση του φωτός, Φωτεινή ισχύς

[ ]

⎪⎭

⎪⎬

⎪⎩

⎪⎨

−−+−

−+−=

++−=

++=

)RG)(BR()GR(

)BR()GR(21

cosH

)]B,G,R[min(BGR

31S

)BGR(31I

2

1

Hue, Saturation, Ι (HSΙ)

Cyan, Magenta, Yellow (CMY, CMYK)

Η εκτύπωση σε λευκή επιφάνειαΙσοδυναµεί µε αφαίρεση τουσυµπληρωµατικού χρώµατος

⎥⎥⎥

⎢⎢⎢

⎡−

⎥⎥⎥

⎢⎢⎢

⎡=

⎥⎥⎥

⎢⎢⎢

BGR

111

MYC

ΕΙ∆Η ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ∆υαδικές εικόνες (binary images) I(k,j)∈0,1

Εικόνες αποχρώσεων του γκρι (gray level images)I(k,j)=0,1,...255

Eγχρωµες εικόνες (color images):κάθε εικονοστοιχείο χρωµατίζεταιµε χρώµατα που προέρχονται απότην ανάµειξη των αποχρώσεων τουκόκκινου, πράσινου και µπλε (RGB).I(k.j)=(IR(k,j), IG(k,j), IB(k,j))IR(k,j), IG(k,j), IB(k,j)∈0,1,2,...,255

Συνήθεις τύποι αρχείων αποθήκευσης ψηφιακών εικόνων

Το σύνολο των χρωµάτων που µπορούν να χρησιµοποιηθούν για τον χρωµατισµότων εικονοστοιχείων της εικόνας λέγεται χρωµατική παλέτα. Εάν C είναι το πλήθος των χρωµάτων, τότε για την κωδικοποίησή τους απαιτούνταιΒ bits και ισχύουν οι σχέσεις: C=2B ⇔ B=log2C

Το Β ονοµάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχειΚ στήλες και J γραµµές τότε για την απεικόνισή της απαιτούνταιJ×K×B bits.

Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιµές των παραπάνω µεγεθών.

Είδος εικόνας J K B bits bytes

∆υαδική 100 100 1 10000 1250Αποχρώσεων του γκρι 100 100 8 80000 10000Έγχρωµη RGB 100 100 24 240000 30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

AKJE ×

=

J

K

JΜΟΝΑ∆ΕΣpixels/mm2

dpi ( dots per inch : κουκίδες ανά ίντσα)

Φαινόµενο της σκακιέρας K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ∆ΥΑ∆ΙΚΕΣ ΕΙΚΟΝΕΣΚέντρο Βάρους

∑∑−

=

=

=1J

0j

1K

0kjkIN

N

Ijj

,N

Ikk

1J

0j

1K

0kjk

1J

0j

1K

0kjk

∑∑

∑∑

=

=

=

=

⋅=

⋅=

Προβολές στους άξονες αναφοράς

Προσανατολισµός αντικειµένου

Ποιος ο προσατολισµός ενός κύκλου;

Άξονας µέγιστης προβολής, µετασχηµατισµός Randon

Κωδικοποίηση κατά µήκος διαδροµής (Run Length encoding, RLE)

Συστοιχία1 1 1 0 0 0 0 1 1 0 0

0 0 0 0 0 1 1 0 0 1 1

1 1 1 1 1 0 0 1 1 1 0

(0,3),(7,2)(5,2),(9,2)(0,5),(7,3)

(0,2),(8,9)(5,6),(9,10)(0,4),(7,9)

3,4,2,20,5,2,2,25,2,3,1

Συνεκτικά και µη συνεκτικά συστατικά (χωρία), (connected components)

Συνδεδεµένο χωρίο(connected component)

Μη συνδεδεµένο χωρίο(not connected component)

Κωδικοποίηση αλυσίδας (chain coding)

0

765

4

3 21

Εκκίνηση από (2,2)0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΑΦΑΙΡΕΣΗ ΘΟΡΥΒΟΥ

• Linear (Φίλτρο µέσης τιµής ή Gaussian)

• Median (Φίλτρο ενδιάµεσης τιµής)

• Adaptive (Φίλτρο Wiener)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

Ιστόγραµµα

g H(g) h(g)10 3 0.12550 4 0.167

100 6 0.250250 11 0.458

1.000

250 250 100 100

250 50 100 10

250 50 100 10

250 100 250 100

250 250 250 250

10 250 50 50

1h(g)

Η(g)

)g(H)g(h

1)g(H

255

0g

255

0g

g)j,k(I

=

=

=

=

=

=∀

0

2

4

6

8

10

12

0 50 100 150 200 250 300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

Ιστόγραµµα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

Βελτίωση εικόνας µε εξισορρόπηση του ιστογράµµατος

∑=

=g

iihgP

0)()(

I΄(k,j) = [(G-1)P(I(k,j)]

P(g) = P(g-1)+ h(g).

10 10 14 14 14

14 14 25 25 25

25 26 27 27 27

g H(g) h(g) P(g) g΄

10 2 2/15 2/15 255*2/15 = 34

14 5 5/15 7/15 255*7/15 = 119

25 4 4/15 11/15 255*11/15 = 187

26 1 1/15 12/15 255*12/15 = 204

27 3 3/15 15/15 255*15/15 = 255

0

1

2

3

4

5

6

1 18 35 52 69 86 103

120

137

154

171

188

205

222

239

0

1

2

3

4

5

6

1 17 33 49 65 81 97 113

129

145

161

177

193

209

225

241

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

Βελτίωση εικόνας µε εξισορρόπηση του ιστογράµµατος

Παράδειγµα 1ο

Βελτίωση εικόνας µε εξισορρόπηση του ιστογράµµατος

Παράδειγµα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά τα εικονοστοιχεία ενός αντικειµένου µιας εικόνας παίρνουν

τιµές σε ένα µικρό διάστηµα αποχρώσεων. Αυτό οδηγεί συνήθως στη

δηµιουργία ενός τοπικού µέγιστου στην περιοχή του ιστογράµµατος

της εικόνας. Η εύρεση τέτοιων τοπικών µεγίστων διευκολύνει τον

εντοπισµό των αντικειµένων της εικόνας και την απόδοσή της µε

λιγότερες κύριες αποχρώσεις. Παρακάτω θα περιγράψουµε διάφορες

τεχνικές για τον καθορισµό τιµών του πεδίου των αποχρώσεων

µεταξύ των οποίων εµφανίζονται τοπικά µέγιστα του ιστογράµµατος.

Οι τιµές αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι µε δυαδική κατωφλίωση

⎩⎨⎧

≤<

∈gT αν C

Tg αν Cg

2

1

ΤC1 C2g

⎪⎩

⎪⎨⎧

≥∈

<∈=′ T)jkI ( 2CjkI αν 1

T)jkI ( 1CjkI αν 0

jkI

Κατωφλίωση - Μέθοδος της διασποράς (Otsu)

1)(1

0

=∑−

=

G

g

gh ∑−

=

=1

01 )(

T

gghp

1

1

01

)(

p

gghT

g∑−

==µ

∑−

=

=1

2 )(G

Tg

ghp

2

1

2

)(

p

gghG

Tg∑−

==µ

p1+p2=1.

∑−

=

=1

0)(

G

ggghµ

µ2µ1∑−

=

−=1

0

22 )()(G

g

ghg µσµ=p1µ1+p2µ2

)()(1)()(1

0

21

11

1

0

21

21 ghg

ppghg

gg∑∑−Τ

=

−Τ

=

−=−= µµσ

∑−

=

−=1

22

2

22 )()(1 G

Tgghg

pµσ 2

222

112 σσσ ppw +=

22121

222

211

2 )()()( µµµµµµσ −=−+−= ppppb

2

2

w

b

σσ

λ =2

2

222

22

2

11

σσ

λλ

σσσ

σσσ

λλ

b

bw

bw

b

=+

⎪⎪⎭

⎪⎪⎬

+=

+=

+

1

2112

1)(

pp

b −−

=µµσ ))((max 2 Tt bT

σ=t=107

Παράδειγµα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

∑−

=

=ΡΡ

=1T

0g1

1

h(g),h(g)

ρ(g)

log(h(g)) h(g)1)log( )h(g)log( Ρ

h(g))(E1-T

0g11

1

1T

0g 11 ∑∑

=

= Ρ−Ρ=

Ρ−=T

log(h(g)) h(g)1

1)1log(

1 , h(g)log Ρ

h(g)Ε

255

Tg11

122

255

Tg 22

=

=

Ρ−−Ρ−=

Ρ−=ΡΡ

−=

))((max TEtT

=

t=111

Παράδειγµα

Πολυκατωφλίωση

1 17 33 49 65 81 97 113 129 145 161 177 193 209 225 241

l

h(l )

I x y

G f x y TG T f x y T

G J T J f x y

( , )

( ) ( , ) ( )( ) ( ) ( , ) ( )

( ) ( ) ( , )

=

≤< ≤

− − <

⎨⎪⎪

⎩⎪⎪

0 11 1 2

1 1

αν αν

. .

αν

Πολυκατωφλίωση – Ν∆ Kohonen

Γειτονιά του j νευ-ρώνα για d(t)=2

w0

wj

wJ-1

I(x,y)

I wj-2

w1

wj+2

wj-1

wj+1

x

)(),()( twyxIto jj −=

oc(t) = minoj(t)

⎪⎩

⎪⎨

∈−⋅=

c

c

j

N j αν 0

Ν j αν ))(),((Iα(t)∆w

twyx j

wj(t+1)=wj(t)+∆wj(t)

a t a tT

( ) ( ) ( )= ⋅ −0 1

d t d tT

( ) ( ) ( )= ⋅ −0 1

Πολυκατωφλίωση – Ν∆ Kohonen

ΠολυκατωφλίωσηΣυγκριτικά αποτελέσµατα

Μ έ θ ο δ ο ς

Πλήθοςκατωφλίων Ν∆

KohonenReddi Kapur Παπαµάρκου

1 T0 164 164 42 114

2T0T1

151227

112191

42210

167226

3T0T1T2

106179229

97149205

42139210

117184227

4

T0T1T2T3

106178224237

95142192230

42118164210

117184227

-

Εύρεση ακµών

Σε µια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχέςεικονοστοιχείων µε απότοµη αύξηση της φωτεινότητας. Οιπεριοχές αυτές βρίσκονται στα όρια των τµηµάτων της εικόνας πουέχουν σηµαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίωναυτών λέγεται προσδιορισµός των ακµών της εικόνας (edge detection). Η ανίχνευση ακµών είναι εξαιρετικά χρήσιµη εργασίαστην ανάλυση των εικόνων διότι µέσω αυτής προσδιορίζονται ταπεριγράµµατα των αντικειµένων της εικόνας. Υπάρχει πληθώρααλγορίθµων που αφορούν την επίλυση του προβλήµατος, όµως όλοιβασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότηταςΙ(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Τοαποτέλεσµα της όλης εργασίας είναι µια νέα δυαδική εικόνα, ιδίωνδιαστάσεων µε την αρχική, όπου τα εικονοστοιχεία τουαντικειµένου είναι οι ακµές της αρχικής εικόνας, Στο ακόλουθοσχήµα φαίνονται σε µία διάσταση, τύποι ακµών που διαφέρουν ωςπρος την κλίση τους.

Εύρεση ακµών

⎟⎟⎟⎟

⎜⎜⎜⎜

∂∂

∂∂

τοξεφ=φ

xf

yf

22

yf

xf)y,x(f ⎟⎟

⎞⎜⎜⎝

⎛∂∂

+⎟⎠⎞

⎜⎝⎛∂∂

=∇⎟⎟⎠

⎞⎜⎜⎝

⎛∂∂

∂∂

=∇yf,

xf)y,x(f

Άλλες µάσκες

)1j,k(I)j,k(I)j,k(I)j,1k(I)j,k(I)j,k(I

))j,k(I),j,k(I()j,k(I

J1

K1

J1K11

−−=∇−−=∇

∇∇=∇

)1,()1,(),(),1(),1(),()),(),,((),(

2

2

222

−−+=∇−−+=∇

∇∇=∇

jkIjkIjkIjkIjkIjkIjkIjkIjkI

J

K

JK

Εύρεση ακµών µε τον τελεστή Laplace

Εύρεση ακµών µε τον τελεστή Laplace

2

2

x)y,x(f

∂∂

∇1K(k+1,j)- ∇1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)

2

2

y)y,x(f

∂∂

∇1J(k,j+1)- ∇1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

2

2

2

22

y)y,x(f

x)y,x(f)y,x(f

∂∂

+∂

∂=∇

1

∇2=

1 -4 1

1

Η τεχνική του Canny

Η πλέον ισχυρή µέθοδος εντοπισµού των ακµών είναι ίσως αυτή του

Canny. Η µέθοδος διαφέρει από τις άλλες σχετικές µεθόδους διότι

βασίζεται σε δύο κατώφλια από τα οποία το ένα οδηγεί στο εντοπισµό

των έντονων ακµών και το άλλο των ασθενών. Οι ασθενείς ακµές

επιβιώνουν όταν οδηγούν σε συνένωση µε έντονες ακµές. Ένα βήµα προ-

επεξεργασίας είναι η αφαίρεση του θορύβου.

ΠαράδειγµαΕντοπισµός ακµών µε τη χρήση των µασκών του Sobel.

Οι ακµές στοεσωτερικό τωναιµοσφαιρίων δενεντοπίζονται.

Επικαλυπτόµενααιµοσφαίριασυνενώνονται

ΠαράδειγµαΕντοπισµός ακµών µε τη χρήση του τελεστή Laplace

µετά από εξοµάλυνση µε φίλτρο Gause.

Ακµές στοεσωτερικό τωναιµοσφαιρίων

Επικαλυπτόµενααιµοσφαίρια

ΠαράδειγµαΕντοπισµός ακµών µε την εφαρµογή του αλγορίθµου του Canny.

Ακµές στοεσωτερικό τωναιµοσφαιρίων.

Επικαλυπτόµενααιµοσφαίρια

Συµπίεση ψηφιακών εικόνων

Κωδικοποίηση HUFFMAN 100 100 100 100 100

200 10 20 150 100

200 50 50 150 100

200 200 200 150 150

80 80 80 80 80

∑ ∑−

=

=

==1

0

1

0

)()()()(G

g

G

g

glghglgpl

1)()( +≤≤ GHlGH

)(log)()(log)()(1

02

1

02 ∑∑

=

=

−=−=G

g

G

g

ghghgpgpGH

g H(g) h(g)

10 1 0.04

20 1 0.04

50 2 0.08

80 4 0.16

100 7 0.28

150 5 0.2

200 5 0.2

25 1

0

1

0

00

11

0

1

00.32

0.080.16

1

1

0.6

0.4

\

g 10 20 50 80 100 150 200

h(g) 00000 00001 0001 001 01 10 11

•Ευκρινής•Μονοσήµαντος•Στιγµιαία αποκωδικοποιήσιµος

Για την εικόνα του παραδείγµατος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού µήκους τριών bits (3=[log27]+1)

( ) ))12(6

cos(32

1 += nng π

( ) ))12(3

cos(32

2 += nng π

Έστω οι ακολουθίες τιµών για n=0,1,2

( )3

10 =ng

Μετασχηµατισµός συνηµιτόνου

1 3 2

0

)(0 ng3

13

13

1

)(1 ng2

12

1−

)(2 ng 61

32

−61

)(nfn: 0 1 2

)6

1,32,

61(g ),

21,0,

21(g

)3

1,3

1,3

1(g ),2,3,1(f

21

0

−=−=

==

rr

rr

202T020

121T212

101T010

210

gg0gg

gg0gg

gg0gg

,1ggg

rrrr

rrrr

rrrr

rrr

⊥⇔=⋅=⋅

⊥⇔=⋅=⋅

⊥⇔=⋅=⋅

===

gg

gg

gg⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢

−=⎥⎥⎥

⎢⎢⎢

⎡=

⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢

=⎥⎥⎥

⎢⎢⎢

⎡=

⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢

=⎥⎥⎥

⎢⎢⎢

⎡=

⎥⎥⎥

⎢⎢⎢

⎡=⎥⎥⎥

⎢⎢⎢

⎡=

61

32

61

)2(g)1(g)0(g

,

21

02

1

)2(g)1(g)0(g

,

31

31

31

)2(g)1(g)0(g

231

fff

2

2

2

2

1

1

1

1

0

0

0

0

2

1

0

ggg

f

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

( ) ( ) ( ) ))1n2(3

cos(32ng )),1n2(

6cos(

32ng ,

31ng 210 +

π=+

π==

n=0

n=2

n=1

g0

g1

g2

f

F0

F1

F2

Επειδή η βάση είναι ορθοκανονική

[ ]

FFF

f)n(gf)2(gf)1(gf)0(gfgF

f)n(gf)2(gf)1(gf)0(gfgF

f)n(gf)2(gf)1(gf)0(gfgF

1T

TT

T 210

T2

T1

T0

2

1

0

T2

2

0nn222120222

T1

2

0nn121110111

T0

2

0nn020100000

=

=

=

=

⋅=⇔⋅⋅=⋅⇔⋅=

⇔⋅=⋅⎥⎥⎥

⎢⎢⎢

=⎥⎥⎥

⎢⎢⎢

⎡=

⋅=⋅=⋅+⋅+⋅=⋅=

⋅=⋅=⋅+⋅+⋅=⋅=

⋅=⋅=⋅+⋅+⋅=⋅=

GGFGffGGFGfGF

fgggfggg

F

fg

fg

fg

rr

rr

rr

(επειδή η βάση είναι ορθοκανονική)

2,1,0k

F)n(gf f)n(gF2

0kkknn

2

0nkk

=

⋅=⇔⋅= ∑∑==

( ) ( ) ( )

( ) ( ) ))1n2(kN2

cos(2ng ,N1ng

))1n2(3

cos(32ng )),1n2(

6cos(

32ng ,

31ng

k0

210

3ΝΓΙΑ ΑΚΟΛΟΥΘΩΝ ΤΩΝ ΠΕΡΙΠΤΩΣΗ ΕΙ∆ΙΚΗ ΕΙΝΑΙ ΠΑΡΑΠΑΝΩΤΑ

Ν==

=+π

==

=

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

( ) ( )

⎩⎨⎧

≠=

>=<

=><

=

==

∑=

mkmk

nmN

nkN

nkN

ngN

ng k

01

g,g

))12(2

cos(2))12(2

cos(2 g,g

1-N0,..., k n, αριθµός, φυσικός N όπου

))12(2

cos(2 ,1

mk

1-N

0nmk

0

ππ

π

Σε µία ψηφιακή εικόνα µε Ν1 στήλες και Ν2 γραµµές η τιµή απόχρωσηςείναι µία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.Η ορθοκανονική βάση του διδιάστατου µετασχηµατισµού συνηµιτόνου είναι:

)N2

)1n2(πkcos(N2)

N2)1n2(πkcos(

N2)n,n(g

),N2

)1n2(πkcos(N2

N1)n,n(g

,NN

1)n,n(g

π.χ.

)n(g)n(g)n,n(g

2

22

21

11

121kk

2

22

21210k

212100

2k1k21kk

21

2

2121

+⋅⋅

+⋅=

+⋅=

=

⋅=

Συµπίεση εικόνας µε τη χρήση του ΜΣΟ µονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

#include<stdio.h>#include<stdlib.h>#include<conio.h>#include<math.h>#include<alloc.h>/*-------------------------------------------------------------------------*/float dct1d(int k, float *x, int N) int n; float c=0.0;

if( k == 0 )for( n = 0; n < N; n++) c += x[n];return c/sqrt((float)N);

for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));return c/sqrt((float)N/2);

/*-------------------------------------------------------------------------*/float idct1d(int n, float *c, int N)int k; float x=0;for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));return c[0]/sqrt((float)N) + x/sqrt((float)N/2);

/*-------------------------------------------------------------------------*/float dct2d(int k1, int k2, float *x, int N1, int N2)int n1; float *c, cc; char buf[20];c = (float*)malloc(N1*sizeof(float));for(n1 = 0; n1<N1; n1++) c[n1]= dct1d(k2,&x[n1*N2],N2);cc = dct1d(k1,c,N1);free(c);return cc;

/*-------------------------------------------------------------------------*/float idct2d( int n1, int n2, float *c, int N1, int N2)

float *x, xx; int k1;x = (float*)malloc(N1*sizeof(float));for(k1 = 0; k1<N1; k1++)x[k1]= idct1d(n2,&c[k1*N2],N2);xx = idct1d(n1,x,N1);free(x);return xx;

Ανακατασκευή µε 8 συντελεστές

Ο µετασχηµατισµός του Hough

ρ = x συνθ + y ηµθ

ρ

A

Ο(β)

(ε)

θ

y

ρ

(α)Σχήµα 8.

ρν = xκ συνθν + yκ ηµθν

)2

(y

y)

2(

)2

(y

)2

(yyxxy

φ−π

+θηµηµφ

⇔ηµθ+συνθφ−

πσυν

φ−π

ηµ=ρ

⇔φ−π

εφ=σφφ=⇔=εφφ

κ

κκ

κκκκ

κ

20 π

≤φ≤

22π

+φ≤θ≤π

−φ 22max yx κκ +=ρ

Ο µετασχηµατισµός του Hough

x

y

τοξεφ(2))

(ε) (1,0.

5)

(0,1)

(2,0)O(0,0)

222θ∆

−θ∆ν+π

−=θ∆

+θ=θ ν

22ρ∆

−ρ∆µ=ρ∆

+ρ=ρ µ

Νπ

=θ∆23

MJ22 +Κ

=ρ∆

)( , 22 P

P

xyτοξεφφπφθπφ ν =+≤≤−

Μορφολογία• Η επιστήµη της ψηφιακής µορφολογίας είναι σχετικά πρόσφατη,

από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκανανεφικτή µια τέτοια προσπάθεια. Από την άλλη τα µαθηµατικάπου απαιτούνται είναι µόνο η θεωρία συνόλων που είναι µίαγνωστή επιστηµονική περιοχή. Η βασική ιδέα που «κρύβεται»κάτω από τη ψηφιακή µορφολογία είναι ότι οι εικόνεςαποτελούνται από εικονοστοιχεία(pixels,picture-elements) ταοποία έχουν µία δυσδιάσταση απεικόνιση. Συγκεκριµένεςµαθηµατικές εφαρµογές πάνω σε οµάδες εικονοστοιχείωνµπορούν να οδηγήσουν στην αναγνώριση και στην καταµέτρησητων ολόκληρων σχηµάτων στα οποία ανήκουν. Βασικέςεφαρµογές είναι η erosion(διάβρωση) και η dilation(διαστολή). Στη διάβρωση τα pixels ενός µικρού προτύπου-pattern πουταιριάζουν µε ένα δεύτερο µεγαλύτερο πρότυπο διαγράφονταιαπό το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεταισε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος τηςεικόνας για το πως θα εφαρµοστούν οι παραπάνω διεργασίες -αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο µαύρο), ή γκρι αποχρώσεων ή πολύχρωµες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-∆ΥΑ∆ΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η µεταφορά (translation) ενός συνόλου Α κατά ένασηµείο x σα σύνολο γράφεται ως εξής:

• (Α)x = c|c = α + x, a A 2.1• Για παράδειγµα εάν το x ήταν το (1,2) τότε, το νέο, πάνω

αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5). ∆ηλαδή όλα τα εικονοστοιχεία του A θα µετακινηθούνκατά µία γραµµή πιο κάτω και κατά δύο στήλες δεξιότερασ’αυτήν την περίπτωση. Αυτή η µετακίνηση γίνεται µε τονίδιο τρόπο και στον τοµέα της γραφικής µε υπολογιστές(computer graphics) – µία αλλαγή της θέσης κατά µίασυγκεκριµένη ποσότητα (στην περίπτωση µας η ποσότηταήταν η 1,2).