Digital Image Processing
-
Upload
marub-asub -
Category
Documents
-
view
32 -
download
0
description
Transcript of Digital Image Processing
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων µε σκοπό τηναποθήκευση, µετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων µε σκοπό τηνκαλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται µε τους παρακάτω επιστηµονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σηµάτων (ΨΕΣ)
• Ροµποτική όραση
• Τεχνητή Νοηµοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά ∆ίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η µετατροπή µιας εικόνας σε ψηφιακή
µορφή ουσιαστικά είναι η µετατροπή ενός
δισδιάστατου αναλογικού σήµατος σε ψηφιακό
και απαιτεί τις διαδικασίες της δειγµατοληψίας
και του κβαντισµού.
Εικονοστοιχείο(picture element, pixel, pel)
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Η τιµή I(j,k)µε k=0,1,2….K-1και j=0,1,2….J-1είναι ο κωδικός τουχρώµατος τουεικονοστοιχείουστην θέση (k,j) τηςψηφιακής εικόνας
J πλήθος γραµµών
Κ πλήθος στηλών JxK πλήθος εικονοστοιχείων
Τρόποι δηµιουργίας ψηφιακών εικόνων
• Με χρήση λογισµικού σχεδίασης(π.χ. Corel Draw, PaintBrush, Autocad, 3D studio …
• Ψηφιοποίηση(π.χ. ψηφιακές φωτογραφικές µηχανές, σαρωτές (scanners)…)
Circle (x,y,r)222 ryx =+Vectors
Raster
Χρωµατικοί χώροι
• Red, Green, Blue (RGB)
• Luminance, Hue, Saturation (YIQ, NTSC)
• Luminance, Component Blue, Component Red (YCbCr)
• Hue, Saturation, Value (HSV)
• Cyan, Magenta, Yellow (CMY, CMYK)
• Hue, Saturation, Intensity
Luminance, Hue, Saturation (YIQ, NTSC)
Το τηλεοπτικό σύστηµα µετάδοσης στην Αµερική NTSC χρησιµοποιείΤον χτωµατικό χώρο YIQ
Hue, Saturation, Value (HSV)
HueΑπόχρωση σύµφωνα µε τοµήκος κύµατος τηςφωτεινής ακτινοβολίας
SaturationΚαθαρότητα σε προσµιξηλευκού
ValueΤιµή πρόσµιξης µε τοµαύρο
Hue, Saturation, Ι (HSΙ)
HueΑπόχρωση σύµφωνα µε τοµήκος κύµατος τηςφωτεινής ακτινοβολίας
SaturationΚαθαρότητα σε προσµιξηλευκού
IntensityΈνταση του φωτός, Φωτεινή ισχύς
[ ]
⎪⎭
⎪⎬
⎫
⎪⎩
⎪⎨
⎧
−−+−
−+−=
++−=
++=
−
)RG)(BR()GR(
)BR()GR(21
cosH
)]B,G,R[min(BGR
31S
)BGR(31I
2
1
Cyan, Magenta, Yellow (CMY, CMYK)
Η εκτύπωση σε λευκή επιφάνειαΙσοδυναµεί µε αφαίρεση τουσυµπληρωµατικού χρώµατος
⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡−
⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡=
⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡
BGR
111
MYC
ΕΙ∆Η ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ∆υαδικές εικόνες (binary images) I(k,j)∈0,1
Εικόνες αποχρώσεων του γκρι (gray level images)I(k,j)=0,1,...255
Eγχρωµες εικόνες (color images):κάθε εικονοστοιχείο χρωµατίζεταιµε χρώµατα που προέρχονται απότην ανάµειξη των αποχρώσεων τουκόκκινου, πράσινου και µπλε (RGB).I(k.j)=(IR(k,j), IG(k,j), IB(k,j))IR(k,j), IG(k,j), IB(k,j)∈0,1,2,...,255
Το σύνολο των χρωµάτων που µπορούν να χρησιµοποιηθούν για τον χρωµατισµότων εικονοστοιχείων της εικόνας λέγεται χρωµατική παλέτα. Εάν C είναι το πλήθος των χρωµάτων, τότε για την κωδικοποίησή τους απαιτούνταιΒ bits και ισχύουν οι σχέσεις: C=2B ⇔ B=log2C
Το Β ονοµάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχειΚ στήλες και J γραµµές τότε για την απεικόνισή της απαιτούνταιJ×K×B bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιµές των παραπάνω µεγεθών.
Είδος εικόνας J K B bits bytes
∆υαδική 100 100 1 10000 1250Αποχρώσεων του γκρι 100 100 8 80000 10000Έγχρωµη RGB 100 100 24 240000 30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
AKJE ×
=
J
K
JΜΟΝΑ∆ΕΣpixels/mm2
dpi ( dots per inch : κουκίδες ανά ίντσα)
Φαινόµενο της σκακιέρας K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ∆ΥΑ∆ΙΚΕΣ ΕΙΚΟΝΕΣΚέντρο Βάρους
∑∑−
=
−
=
=1J
0j
1K
0kjkIN
N
Ijj
,N
Ikk
1J
0j
1K
0kjk
1J
0j
1K
0kjk
∑∑
∑∑
−
=
−
=
−
=
−
=
⋅=
⋅=
Κωδικοποίηση κατά µήκος διαδροµής (Run Length encoding, RLE)
Συστοιχία1 1 1 0 0 0 0 1 1 0 0
0 0 0 0 0 1 1 0 0 1 1
1 1 1 1 1 0 0 1 1 1 0
(0,3),(7,2)(5,2),(9,2)(0,5),(7,3)
(0,2),(8,9)(5,6),(9,10)(0,4),(7,9)
3,4,2,20,5,2,2,25,2,3,1
Συνεκτικά και µη συνεκτικά συστατικά (χωρία), (connected components)
Συνδεδεµένο χωρίο(connected component)
Μη συνδεδεµένο χωρίο(not connected component)
Κωδικοποίηση αλυσίδας (chain coding)
0
765
4
3 21
Εκκίνηση από (2,2)0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΑΦΑΙΡΕΣΗ ΘΟΡΥΒΟΥ
• Linear (Φίλτρο µέσης τιµής ή Gaussian)
• Median (Φίλτρο ενδιάµεσης τιµής)
• Adaptive (Φίλτρο Wiener)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραµµα
g H(g) h(g)10 3 0.12550 4 0.167
100 6 0.250250 11 0.458
1.000
250 250 100 100
250 50 100 10
250 50 100 10
250 100 250 100
250 250 250 250
10 250 50 50
1h(g)
Η(g)
)g(H)g(h
1)g(H
255
0g
255
0g
g)j,k(I
=
=
=
∑
∑
∑
=
=
=∀
0
2
4
6
8
10
12
0 50 100 150 200 250 300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας µε εξισορρόπηση του ιστογράµµατος
∑=
=g
iihgP
0)()(
I΄(k,j) = [(G-1)P(I(k,j)]
P(g) = P(g-1)+ h(g).
10 10 14 14 14
14 14 25 25 25
25 26 27 27 27
g H(g) h(g) P(g) g΄
10 2 2/15 2/15 255*2/15 = 34
14 5 5/15 7/15 255*7/15 = 119
25 4 4/15 11/15 255*11/15 = 187
26 1 1/15 12/15 255*12/15 = 204
27 3 3/15 15/15 255*15/15 = 255
0
1
2
3
4
5
6
1 18 35 52 69 86 103
120
137
154
171
188
205
222
239
0
1
2
3
4
5
6
1 17 33 49 65 81 97 113
129
145
161
177
193
209
225
241
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας µε εξισορρόπηση του ιστογράµµατος
Παράδειγµα 1ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά τα εικονοστοιχεία ενός αντικειµένου µιας εικόνας παίρνουν
τιµές σε ένα µικρό διάστηµα αποχρώσεων. Αυτό οδηγεί συνήθως στη
δηµιουργία ενός τοπικού µέγιστου στην περιοχή του ιστογράµµατος
της εικόνας. Η εύρεση τέτοιων τοπικών µεγίστων διευκολύνει τον
εντοπισµό των αντικειµένων της εικόνας και την απόδοσή της µε
λιγότερες κύριες αποχρώσεις. Παρακάτω θα περιγράψουµε διάφορες
τεχνικές για τον καθορισµό τιµών του πεδίου των αποχρώσεων
µεταξύ των οποίων εµφανίζονται τοπικά µέγιστα του ιστογράµµατος.
Οι τιµές αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι µε δυαδική κατωφλίωση
⎩⎨⎧
≤<
∈gT αν C
Tg αν Cg
2
1
ΤC1 C2g
⎪⎩
⎪⎨⎧
≥∈
<∈=′ T)jkI ( 2CjkI αν 1
T)jkI ( 1CjkI αν 0
jkI
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
1)(1
0
=∑−
=
G
g
gh ∑−
=
=1
01 )(
T
gghp
1
1
01
)(
p
gghT
g∑−
==µ
∑−
=
=1
2 )(G
Tg
ghp
2
1
2
)(
p
gghG
Tg∑−
==µ
p1+p2=1.
∑−
=
=1
0)(
G
ggghµ
µ2µ1∑−
=
−=1
0
22 )()(G
g
ghg µσµ=p1µ1+p2µ2
)()(1)()(1
0
21
11
1
0
21
21 ghg
ppghg
gg∑∑−Τ
=
−Τ
=
−=−= µµσ
∑−
=
−=1
22
2
22 )()(1 G
Tgghg
pµσ 2
222
112 σσσ ppw +=
22121
222
211
2 )()()( µµµµµµσ −=−+−= ppppb
2
2
w
b
σσ
λ =2
2
222
22
2
11
σσ
λλ
σσσ
σσσ
λλ
b
bw
bw
b
=+
⇒
⎪⎪⎭
⎪⎪⎬
⎫
+=
+=
+
1
2112
1)(
pp
b −−
=µµσ ))((max 2 Tt bT
σ=t=107
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
∑−
=
=ΡΡ
=1T
0g1
1
h(g),h(g)
ρ(g)
log(h(g)) h(g)1)log( )h(g)log( Ρ
h(g))(E1-T
0g11
1
1T
0g 11 ∑∑
=
−
= Ρ−Ρ=
Ρ−=T
log(h(g)) h(g)1
1)1log(
1 , h(g)log Ρ
h(g)Ε
255
Tg11
122
255
Tg 22
∑
∑
=
=
Ρ−−Ρ−=
Ρ−=ΡΡ
−=
))((max TEtT
=
t=111
Πολυκατωφλίωση
1 17 33 49 65 81 97 113 129 145 161 177 193 209 225 241
l
h(l )
I x y
G f x y TG T f x y T
G J T J f x y
( , )
( ) ( , ) ( )( ) ( ) ( , ) ( )
( ) ( ) ( , )
=
≤< ≤
− − <
⎧
⎨⎪⎪
⎩⎪⎪
0 11 1 2
1 1
αν αν
. .
αν
Πολυκατωφλίωση – Ν∆ Kohonen
Γειτονιά του j νευ-ρώνα για d(t)=2
w0
wj
wJ-1
I(x,y)
I wj-2
w1
wj+2
wj-1
wj+1
x
)(),()( twyxIto jj −=
oc(t) = minoj(t)
⎪⎩
⎪⎨
⎧
∉
∈−⋅=
c
c
j
N j αν 0
Ν j αν ))(),((Iα(t)∆w
twyx j
wj(t+1)=wj(t)+∆wj(t)
a t a tT
( ) ( ) ( )= ⋅ −0 1
d t d tT
( ) ( ) ( )= ⋅ −0 1
ΠολυκατωφλίωσηΣυγκριτικά αποτελέσµατα
Μ έ θ ο δ ο ς
Πλήθοςκατωφλίων Ν∆
KohonenReddi Kapur Παπαµάρκου
1 T0 164 164 42 114
2T0T1
151227
112191
42210
167226
3T0T1T2
106179229
97149205
42139210
117184227
4
T0T1T2T3
106178224237
95142192230
42118164210
117184227
-
Εύρεση ακµών
Σε µια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχέςεικονοστοιχείων µε απότοµη αύξηση της φωτεινότητας. Οιπεριοχές αυτές βρίσκονται στα όρια των τµηµάτων της εικόνας πουέχουν σηµαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίωναυτών λέγεται προσδιορισµός των ακµών της εικόνας (edge detection). Η ανίχνευση ακµών είναι εξαιρετικά χρήσιµη εργασίαστην ανάλυση των εικόνων διότι µέσω αυτής προσδιορίζονται ταπεριγράµµατα των αντικειµένων της εικόνας. Υπάρχει πληθώρααλγορίθµων που αφορούν την επίλυση του προβλήµατος, όµως όλοιβασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότηταςΙ(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Τοαποτέλεσµα της όλης εργασίας είναι µια νέα δυαδική εικόνα, ιδίωνδιαστάσεων µε την αρχική, όπου τα εικονοστοιχεία τουαντικειµένου είναι οι ακµές της αρχικής εικόνας, Στο ακόλουθοσχήµα φαίνονται σε µία διάσταση, τύποι ακµών που διαφέρουν ωςπρος την κλίση τους.
Εύρεση ακµών
⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
∂∂
∂∂
τοξεφ=φ
xf
yf
22
yf
xf)y,x(f ⎟⎟
⎠
⎞⎜⎜⎝
⎛∂∂
+⎟⎠⎞
⎜⎝⎛∂∂
=∇⎟⎟⎠
⎞⎜⎜⎝
⎛∂∂
∂∂
=∇yf,
xf)y,x(f
)1j,k(I)j,k(I)j,k(I)j,1k(I)j,k(I)j,k(I
))j,k(I),j,k(I()j,k(I
J1
K1
J1K11
−−=∇−−=∇
∇∇=∇
)1,()1,(),(),1(),1(),()),(),,((),(
2
2
222
−−+=∇−−+=∇
∇∇=∇
jkIjkIjkIjkIjkIjkIjkIjkIjkI
J
K
JK
Εύρεση ακµών µε τον τελεστή Laplace
2
2
x)y,x(f
∂∂
∇1K(k+1,j)- ∇1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
2
2
y)y,x(f
∂∂
∇1J(k,j+1)- ∇1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2
2
2
22
y)y,x(f
x)y,x(f)y,x(f
∂∂
+∂
∂=∇
1
∇2=
1 -4 1
1
Η τεχνική του Canny
Η πλέον ισχυρή µέθοδος εντοπισµού των ακµών είναι ίσως αυτή του
Canny. Η µέθοδος διαφέρει από τις άλλες σχετικές µεθόδους διότι
βασίζεται σε δύο κατώφλια από τα οποία το ένα οδηγεί στο εντοπισµό
των έντονων ακµών και το άλλο των ασθενών. Οι ασθενείς ακµές
επιβιώνουν όταν οδηγούν σε συνένωση µε έντονες ακµές. Ένα βήµα προ-
επεξεργασίας είναι η αφαίρεση του θορύβου.
ΠαράδειγµαΕντοπισµός ακµών µε τη χρήση των µασκών του Sobel.
Οι ακµές στοεσωτερικό τωναιµοσφαιρίων δενεντοπίζονται.
Επικαλυπτόµενααιµοσφαίριασυνενώνονται
ΠαράδειγµαΕντοπισµός ακµών µε τη χρήση του τελεστή Laplace
µετά από εξοµάλυνση µε φίλτρο Gause.
Ακµές στοεσωτερικό τωναιµοσφαιρίων
Επικαλυπτόµενααιµοσφαίρια
ΠαράδειγµαΕντοπισµός ακµών µε την εφαρµογή του αλγορίθµου του Canny.
Ακµές στοεσωτερικό τωναιµοσφαιρίων.
Επικαλυπτόµενααιµοσφαίρια
Συµπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN 100 100 100 100 100
200 10 20 150 100
200 50 50 150 100
200 200 200 150 150
80 80 80 80 80
∑ ∑−
=
−
=
==1
0
1
0
)()()()(G
g
G
g
glghglgpl
1)()( +≤≤ GHlGH
)(log)()(log)()(1
02
1
02 ∑∑
−
=
−
=
−=−=G
g
G
g
ghghgpgpGH
g H(g) h(g)
10 1 0.04
20 1 0.04
50 2 0.08
80 4 0.16
100 7 0.28
150 5 0.2
200 5 0.2
25 1
0
1
0
00
11
0
1
00.32
0.080.16
1
1
0.6
0.4
\
g 10 20 50 80 100 150 200
h(g) 00000 00001 0001 001 01 10 11
•Ευκρινής•Μονοσήµαντος•Στιγµιαία αποκωδικοποιήσιµος
Για την εικόνα του παραδείγµατος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού µήκους τριών bits (3=[log27]+1)
( ) ))12(6
cos(32
1 += nng π
( ) ))12(3
cos(32
2 += nng π
Έστω οι ακολουθίες τιµών για n=0,1,2
( )3
10 =ng
Μετασχηµατισµός συνηµιτόνου
1 3 2
0
)(0 ng3
13
13
1
)(1 ng2
12
1−
)(2 ng 61
32
−61
)(nfn: 0 1 2
)6
1,32,
61(g ),
21,0,
21(g
)3
1,3
1,3
1(g ),2,3,1(f
21
0
−=−=
==
rr
rr
202T020
121T212
101T010
210
gg0gg
gg0gg
gg0gg
,1ggg
rrrr
rrrr
rrrr
rrr
⊥⇔=⋅=⋅
⊥⇔=⋅=⋅
⊥⇔=⋅=⋅
===
gg
gg
gg⎥⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢⎢
⎣
⎡
−=⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡=
⎥⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢⎢
⎣
⎡
−
=⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡=
⎥⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢⎢
⎣
⎡
=⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡=
⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡=⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡=
61
32
61
)2(g)1(g)0(g
,
21
02
1
)2(g)1(g)0(g
,
31
31
31
)2(g)1(g)0(g
231
fff
2
2
2
2
1
1
1
1
0
0
0
0
2
1
0
ggg
f
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
( ) ( ) ( ) ))1n2(3
cos(32ng )),1n2(
6cos(
32ng ,
31ng 210 +
π=+
π==
Επειδή η βάση είναι ορθοκανονική
[ ]
FFF
f)n(gf)2(gf)1(gf)0(gfgF
f)n(gf)2(gf)1(gf)0(gfgF
f)n(gf)2(gf)1(gf)0(gfgF
1T
TT
T 210
T2
T1
T0
2
1
0
T2
2
0nn222120222
T1
2
0nn121110111
T0
2
0nn020100000
−
=
=
=
=
⋅=⇔⋅⋅=⋅⇔⋅=
⇔⋅=⋅⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡
=⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡=
⋅=⋅=⋅+⋅+⋅=⋅=
⋅=⋅=⋅+⋅+⋅=⋅=
⋅=⋅=⋅+⋅+⋅=⋅=
∑
∑
∑
GGFGffGGFGfGF
fgggfggg
F
fg
fg
fg
rr
rr
rr
(επειδή η βάση είναι ορθοκανονική)
2,1,0k
F)n(gf f)n(gF2
0kkknn
2
0nkk
=
⋅=⇔⋅= ∑∑==
( ) ( ) ( )
( ) ( ) ))1n2(kN2
cos(2ng ,N1ng
))1n2(3
cos(32ng )),1n2(
6cos(
32ng ,
31ng
k0
210
3ΝΓΙΑ ΑΚΟΛΟΥΘΩΝ ΤΩΝ ΠΕΡΙΠΤΩΣΗ ΕΙ∆ΙΚΗ ΕΙΝΑΙ ΠΑΡΑΠΑΝΩΤΑ
+π
Ν==
+π
=+π
==
=
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
( ) ( )
⎩⎨⎧
≠=
>=<
+Ν
+Ν
=><
=
+Ν
==
∑=
mkmk
nmN
nkN
nkN
ngN
ng k
01
g,g
))12(2
cos(2))12(2
cos(2 g,g
1-N0,..., k n, αριθµός, φυσικός N όπου
))12(2
cos(2 ,1
mk
1-N
0nmk
0
ππ
π
Σε µία ψηφιακή εικόνα µε Ν1 στήλες και Ν2 γραµµές η τιµή απόχρωσηςείναι µία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.Η ορθοκανονική βάση του διδιάστατου µετασχηµατισµού συνηµιτόνου είναι:
)N2
)1n2(πkcos(N2)
N2)1n2(πkcos(
N2)n,n(g
),N2
)1n2(πkcos(N2
N1)n,n(g
,NN
1)n,n(g
π.χ.
)n(g)n(g)n,n(g
2
22
21
11
121kk
2
22
21210k
212100
2k1k21kk
21
2
2121
+⋅⋅
+⋅=
+⋅=
=
⋅=
Συµπίεση εικόνας µε τη χρήση του ΜΣΟ µονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
#include<stdio.h>#include<stdlib.h>#include<conio.h>#include<math.h>#include<alloc.h>/*-------------------------------------------------------------------------*/float dct1d(int k, float *x, int N) int n; float c=0.0;
if( k == 0 )for( n = 0; n < N; n++) c += x[n];return c/sqrt((float)N);
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));return c/sqrt((float)N/2);
/*-------------------------------------------------------------------------*/float idct1d(int n, float *c, int N)int k; float x=0;for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
/*-------------------------------------------------------------------------*/float dct2d(int k1, int k2, float *x, int N1, int N2)int n1; float *c, cc; char buf[20];c = (float*)malloc(N1*sizeof(float));for(n1 = 0; n1<N1; n1++) c[n1]= dct1d(k2,&x[n1*N2],N2);cc = dct1d(k1,c,N1);free(c);return cc;
/*-------------------------------------------------------------------------*/float idct2d( int n1, int n2, float *c, int N1, int N2)
float *x, xx; int k1;x = (float*)malloc(N1*sizeof(float));for(k1 = 0; k1<N1; k1++)x[k1]= idct1d(n2,&c[k1*N2],N2);xx = idct1d(n1,x,N1);free(x);return xx;
Ανακατασκευή µε 8 συντελεστές
Ο µετασχηµατισµός του Hough
ρ = x συνθ + y ηµθ
ρ
A
Ο(β)
(ε)
θ
y
ρ
xθ
(α)Σχήµα 8.
ρν = xκ συνθν + yκ ηµθν
)2
(y
y)
2(
)2
(y
)2
(yyxxy
φ−π
+θηµηµφ
=ρ
⇔ηµθ+συνθφ−
πσυν
φ−π
ηµ=ρ
⇔φ−π
εφ=σφφ=⇔=εφφ
κ
κκ
κκκκ
κ
20 π
≤φ≤
22π
+φ≤θ≤π
−φ 22max yx κκ +=ρ
Ο µετασχηµατισµός του Hough
x
y
τοξεφ(2))
(ε) (1,0.
5)
(0,1)
(2,0)O(0,0)
222θ∆
−θ∆ν+π
−=θ∆
+θ=θ ν
22ρ∆
−ρ∆µ=ρ∆
+ρ=ρ µ
Νπ
=θ∆23
MJ22 +Κ
=ρ∆
)( , 22 P
P
xyτοξεφφπφθπφ ν =+≤≤−
Μορφολογία• Η επιστήµη της ψηφιακής µορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκανανεφικτή µια τέτοια προσπάθεια. Από την άλλη τα µαθηµατικάπου απαιτούνται είναι µόνο η θεωρία συνόλων που είναι µίαγνωστή επιστηµονική περιοχή. Η βασική ιδέα που «κρύβεται»κάτω από τη ψηφιακή µορφολογία είναι ότι οι εικόνεςαποτελούνται από εικονοστοιχεία(pixels,picture-elements) ταοποία έχουν µία δυσδιάσταση απεικόνιση. Συγκεκριµένεςµαθηµατικές εφαρµογές πάνω σε οµάδες εικονοστοιχείωνµπορούν να οδηγήσουν στην αναγνώριση και στην καταµέτρησητων ολόκληρων σχηµάτων στα οποία ανήκουν. Βασικέςεφαρµογές είναι η erosion(διάβρωση) και η dilation(διαστολή). Στη διάβρωση τα pixels ενός µικρού προτύπου-pattern πουταιριάζουν µε ένα δεύτερο µεγαλύτερο πρότυπο διαγράφονταιαπό το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεταισε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος τηςεικόνας για το πως θα εφαρµοστούν οι παραπάνω διεργασίες -αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο µαύρο), ή γκρι αποχρώσεων ή πολύχρωµες
• Η µεταφορά (translation) ενός συνόλου Α κατά ένασηµείο x σα σύνολο γράφεται ως εξής:
• (Α)x = c|c = α + x, a A 2.1• Για παράδειγµα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5). ∆ηλαδή όλα τα εικονοστοιχεία του A θα µετακινηθούνκατά µία γραµµή πιο κάτω και κατά δύο στήλες δεξιότερασ’αυτήν την περίπτωση. Αυτή η µετακίνηση γίνεται µε τονίδιο τρόπο και στον τοµέα της γραφικής µε υπολογιστές(computer graphics) – µία αλλαγή της θέσης κατά µίασυγκεκριµένη ποσότητα (στην περίπτωση µας η ποσότηταήταν η 1,2).
∈