Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... ·...

77
Βάσεις Δεδομένων ΙΙ Ενότητα 10: Βάσεις Δεδομένων Πολυμέσων Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσων Το περιεχόμενο του μαθήματος διατίθεται με άδεια Creative Commons εκτός και αν αναφέρεται διαφορετικά Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους.

Transcript of Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... ·...

Page 1: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Βάσεις Δεδομένων ΙΙ

Ενότητα 10 Βάσεις Δεδομένων Πολυμέσων

Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσων

Το περιεχόμενο του μαθήματος

διατίθεται με άδεια Creative

Commons εκτός και αν αναφέρεται

διαφορετικά

Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού

Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και

συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό

Κοινωνικό Ταμείο) και από εθνικούς πόρους

Βάσεις Δεδομένων ΙΙ

Δεικτοδότηση Πολυμέσων

Πρόβλημα Δοθείσας μίας μεγάλης συλλογής (πολυμεσικών) εγγραφών (πχ μετοχές) Επιτρέπει γρήγορα ερωτήματα ομοιότητας

Εφαρμογές time series χρηματοιοκονομικά marketing (click-streams) ECGs ήχος εικόνες ιατρική ψηφιακές βιβλιοθήκες εκπαίδευση τέχνη higher-d σήματα επιστημονικές ΒΔ (πχ αστροφυσική) ιατρική (MRI ακτινογραφίες) ψυχαγωγία (video)

Παραδείγματα Ερωτημάτων Βρες ιατρικές υποθέσεις παρόμοιες και του κ Παπαδόπουλου Βρες ζεύγη μετοχών που κινούνται με συγχρονισμό Βρες ζεύγη εγγράφων που είναι παρόμοια (λογοκλοπία) Βρες πρόσωπα παρόμοια με του lsquoTiger Woodsrsquo

Λεπτομ ορισμός προβλήματος Πρόβλημα δοθείσας μιας συλλογής πολυμεσικών αντικειμένων βρες αυτά που είναι παρόμοια με ένα επιθυμητό αντικείμενο-ερώτημα

για παράδειγμα

τιμή

τιμή

1 365 μέρα

τιμή

1 365 μέρα

1 365 μέρα

συνάρτηση απόστασης από ειδικό

(πχ Ευκλείδεια απόσταση)

Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα

Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)

Πολυμέσα- λεπτομερώς

Πολυμέσα Motivation ορισμός προβλήματος

Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap

Κεντρική ιδέα

Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια

απόσταση τιμή

τιμή

1 τιμή

1

365 μέρα

1

365 μέρα

365 μέρα

Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα

Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και

πρόχειροrsquo έλεγχο

lsquoGEMINIrsquo - Παραστατικά

πχ std S1

F(S1)

1

365 μέρα

F(Sn)

Sn

πχ avg

1 365 μέρα

GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms

GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να

εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις

GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo

Time sequences Q what features

Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)

Time sequences

white noise

brown noise

Fourier spectrum

in log-log

Time sequences Eg

Time sequences conclusion colored noises are well approximated by their first few Fourier

coefficients colored noises appear in nature

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 2: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Βάσεις Δεδομένων ΙΙ

Δεικτοδότηση Πολυμέσων

Πρόβλημα Δοθείσας μίας μεγάλης συλλογής (πολυμεσικών) εγγραφών (πχ μετοχές) Επιτρέπει γρήγορα ερωτήματα ομοιότητας

Εφαρμογές time series χρηματοιοκονομικά marketing (click-streams) ECGs ήχος εικόνες ιατρική ψηφιακές βιβλιοθήκες εκπαίδευση τέχνη higher-d σήματα επιστημονικές ΒΔ (πχ αστροφυσική) ιατρική (MRI ακτινογραφίες) ψυχαγωγία (video)

Παραδείγματα Ερωτημάτων Βρες ιατρικές υποθέσεις παρόμοιες και του κ Παπαδόπουλου Βρες ζεύγη μετοχών που κινούνται με συγχρονισμό Βρες ζεύγη εγγράφων που είναι παρόμοια (λογοκλοπία) Βρες πρόσωπα παρόμοια με του lsquoTiger Woodsrsquo

Λεπτομ ορισμός προβλήματος Πρόβλημα δοθείσας μιας συλλογής πολυμεσικών αντικειμένων βρες αυτά που είναι παρόμοια με ένα επιθυμητό αντικείμενο-ερώτημα

για παράδειγμα

τιμή

τιμή

1 365 μέρα

τιμή

1 365 μέρα

1 365 μέρα

συνάρτηση απόστασης από ειδικό

(πχ Ευκλείδεια απόσταση)

Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα

Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)

Πολυμέσα- λεπτομερώς

Πολυμέσα Motivation ορισμός προβλήματος

Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap

Κεντρική ιδέα

Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια

απόσταση τιμή

τιμή

1 τιμή

1

365 μέρα

1

365 μέρα

365 μέρα

Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα

Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και

πρόχειροrsquo έλεγχο

lsquoGEMINIrsquo - Παραστατικά

πχ std S1

F(S1)

1

365 μέρα

F(Sn)

Sn

πχ avg

1 365 μέρα

GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms

GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να

εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις

GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo

Time sequences Q what features

Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)

Time sequences

white noise

brown noise

Fourier spectrum

in log-log

Time sequences Eg

Time sequences conclusion colored noises are well approximated by their first few Fourier

coefficients colored noises appear in nature

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 3: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Πρόβλημα Δοθείσας μίας μεγάλης συλλογής (πολυμεσικών) εγγραφών (πχ μετοχές) Επιτρέπει γρήγορα ερωτήματα ομοιότητας

Εφαρμογές time series χρηματοιοκονομικά marketing (click-streams) ECGs ήχος εικόνες ιατρική ψηφιακές βιβλιοθήκες εκπαίδευση τέχνη higher-d σήματα επιστημονικές ΒΔ (πχ αστροφυσική) ιατρική (MRI ακτινογραφίες) ψυχαγωγία (video)

Παραδείγματα Ερωτημάτων Βρες ιατρικές υποθέσεις παρόμοιες και του κ Παπαδόπουλου Βρες ζεύγη μετοχών που κινούνται με συγχρονισμό Βρες ζεύγη εγγράφων που είναι παρόμοια (λογοκλοπία) Βρες πρόσωπα παρόμοια με του lsquoTiger Woodsrsquo

Λεπτομ ορισμός προβλήματος Πρόβλημα δοθείσας μιας συλλογής πολυμεσικών αντικειμένων βρες αυτά που είναι παρόμοια με ένα επιθυμητό αντικείμενο-ερώτημα

για παράδειγμα

τιμή

τιμή

1 365 μέρα

τιμή

1 365 μέρα

1 365 μέρα

συνάρτηση απόστασης από ειδικό

(πχ Ευκλείδεια απόσταση)

Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα

Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)

Πολυμέσα- λεπτομερώς

Πολυμέσα Motivation ορισμός προβλήματος

Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap

Κεντρική ιδέα

Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια

απόσταση τιμή

τιμή

1 τιμή

1

365 μέρα

1

365 μέρα

365 μέρα

Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα

Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και

πρόχειροrsquo έλεγχο

lsquoGEMINIrsquo - Παραστατικά

πχ std S1

F(S1)

1

365 μέρα

F(Sn)

Sn

πχ avg

1 365 μέρα

GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms

GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να

εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις

GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo

Time sequences Q what features

Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)

Time sequences

white noise

brown noise

Fourier spectrum

in log-log

Time sequences Eg

Time sequences conclusion colored noises are well approximated by their first few Fourier

coefficients colored noises appear in nature

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 4: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Εφαρμογές time series χρηματοιοκονομικά marketing (click-streams) ECGs ήχος εικόνες ιατρική ψηφιακές βιβλιοθήκες εκπαίδευση τέχνη higher-d σήματα επιστημονικές ΒΔ (πχ αστροφυσική) ιατρική (MRI ακτινογραφίες) ψυχαγωγία (video)

Παραδείγματα Ερωτημάτων Βρες ιατρικές υποθέσεις παρόμοιες και του κ Παπαδόπουλου Βρες ζεύγη μετοχών που κινούνται με συγχρονισμό Βρες ζεύγη εγγράφων που είναι παρόμοια (λογοκλοπία) Βρες πρόσωπα παρόμοια με του lsquoTiger Woodsrsquo

Λεπτομ ορισμός προβλήματος Πρόβλημα δοθείσας μιας συλλογής πολυμεσικών αντικειμένων βρες αυτά που είναι παρόμοια με ένα επιθυμητό αντικείμενο-ερώτημα

για παράδειγμα

τιμή

τιμή

1 365 μέρα

τιμή

1 365 μέρα

1 365 μέρα

συνάρτηση απόστασης από ειδικό

(πχ Ευκλείδεια απόσταση)

Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα

Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)

Πολυμέσα- λεπτομερώς

Πολυμέσα Motivation ορισμός προβλήματος

Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap

Κεντρική ιδέα

Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια

απόσταση τιμή

τιμή

1 τιμή

1

365 μέρα

1

365 μέρα

365 μέρα

Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα

Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και

πρόχειροrsquo έλεγχο

lsquoGEMINIrsquo - Παραστατικά

πχ std S1

F(S1)

1

365 μέρα

F(Sn)

Sn

πχ avg

1 365 μέρα

GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms

GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να

εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις

GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo

Time sequences Q what features

Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)

Time sequences

white noise

brown noise

Fourier spectrum

in log-log

Time sequences Eg

Time sequences conclusion colored noises are well approximated by their first few Fourier

coefficients colored noises appear in nature

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 5: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Παραδείγματα Ερωτημάτων Βρες ιατρικές υποθέσεις παρόμοιες και του κ Παπαδόπουλου Βρες ζεύγη μετοχών που κινούνται με συγχρονισμό Βρες ζεύγη εγγράφων που είναι παρόμοια (λογοκλοπία) Βρες πρόσωπα παρόμοια με του lsquoTiger Woodsrsquo

Λεπτομ ορισμός προβλήματος Πρόβλημα δοθείσας μιας συλλογής πολυμεσικών αντικειμένων βρες αυτά που είναι παρόμοια με ένα επιθυμητό αντικείμενο-ερώτημα

για παράδειγμα

τιμή

τιμή

1 365 μέρα

τιμή

1 365 μέρα

1 365 μέρα

συνάρτηση απόστασης από ειδικό

(πχ Ευκλείδεια απόσταση)

Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα

Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)

Πολυμέσα- λεπτομερώς

Πολυμέσα Motivation ορισμός προβλήματος

Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap

Κεντρική ιδέα

Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια

απόσταση τιμή

τιμή

1 τιμή

1

365 μέρα

1

365 μέρα

365 μέρα

Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα

Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και

πρόχειροrsquo έλεγχο

lsquoGEMINIrsquo - Παραστατικά

πχ std S1

F(S1)

1

365 μέρα

F(Sn)

Sn

πχ avg

1 365 μέρα

GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms

GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να

εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις

GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo

Time sequences Q what features

Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)

Time sequences

white noise

brown noise

Fourier spectrum

in log-log

Time sequences Eg

Time sequences conclusion colored noises are well approximated by their first few Fourier

coefficients colored noises appear in nature

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 6: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Λεπτομ ορισμός προβλήματος Πρόβλημα δοθείσας μιας συλλογής πολυμεσικών αντικειμένων βρες αυτά που είναι παρόμοια με ένα επιθυμητό αντικείμενο-ερώτημα

για παράδειγμα

τιμή

τιμή

1 365 μέρα

τιμή

1 365 μέρα

1 365 μέρα

συνάρτηση απόστασης από ειδικό

(πχ Ευκλείδεια απόσταση)

Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα

Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)

Πολυμέσα- λεπτομερώς

Πολυμέσα Motivation ορισμός προβλήματος

Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap

Κεντρική ιδέα

Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια

απόσταση τιμή

τιμή

1 τιμή

1

365 μέρα

1

365 μέρα

365 μέρα

Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα

Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και

πρόχειροrsquo έλεγχο

lsquoGEMINIrsquo - Παραστατικά

πχ std S1

F(S1)

1

365 μέρα

F(Sn)

Sn

πχ avg

1 365 μέρα

GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms

GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να

εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις

GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo

Time sequences Q what features

Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)

Time sequences

white noise

brown noise

Fourier spectrum

in log-log

Time sequences Eg

Time sequences conclusion colored noises are well approximated by their first few Fourier

coefficients colored noises appear in nature

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 7: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

τιμή

τιμή

1 365 μέρα

τιμή

1 365 μέρα

1 365 μέρα

συνάρτηση απόστασης από ειδικό

(πχ Ευκλείδεια απόσταση)

Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα

Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)

Πολυμέσα- λεπτομερώς

Πολυμέσα Motivation ορισμός προβλήματος

Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap

Κεντρική ιδέα

Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια

απόσταση τιμή

τιμή

1 τιμή

1

365 μέρα

1

365 μέρα

365 μέρα

Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα

Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και

πρόχειροrsquo έλεγχο

lsquoGEMINIrsquo - Παραστατικά

πχ std S1

F(S1)

1

365 μέρα

F(Sn)

Sn

πχ avg

1 365 μέρα

GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms

GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να

εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις

GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo

Time sequences Q what features

Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)

Time sequences

white noise

brown noise

Fourier spectrum

in log-log

Time sequences Eg

Time sequences conclusion colored noises are well approximated by their first few Fourier

coefficients colored noises appear in nature

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 8: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα

Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)

Πολυμέσα- λεπτομερώς

Πολυμέσα Motivation ορισμός προβλήματος

Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap

Κεντρική ιδέα

Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια

απόσταση τιμή

τιμή

1 τιμή

1

365 μέρα

1

365 μέρα

365 μέρα

Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα

Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και

πρόχειροrsquo έλεγχο

lsquoGEMINIrsquo - Παραστατικά

πχ std S1

F(S1)

1

365 μέρα

F(Sn)

Sn

πχ avg

1 365 μέρα

GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms

GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να

εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις

GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo

Time sequences Q what features

Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)

Time sequences

white noise

brown noise

Fourier spectrum

in log-log

Time sequences Eg

Time sequences conclusion colored noises are well approximated by their first few Fourier

coefficients colored noises appear in nature

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 9: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)

Πολυμέσα- λεπτομερώς

Πολυμέσα Motivation ορισμός προβλήματος

Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap

Κεντρική ιδέα

Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια

απόσταση τιμή

τιμή

1 τιμή

1

365 μέρα

1

365 μέρα

365 μέρα

Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα

Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και

πρόχειροrsquo έλεγχο

lsquoGEMINIrsquo - Παραστατικά

πχ std S1

F(S1)

1

365 μέρα

F(Sn)

Sn

πχ avg

1 365 μέρα

GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms

GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να

εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις

GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo

Time sequences Q what features

Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)

Time sequences

white noise

brown noise

Fourier spectrum

in log-log

Time sequences Eg

Time sequences conclusion colored noises are well approximated by their first few Fourier

coefficients colored noises appear in nature

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 10: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Πολυμέσα- λεπτομερώς

Πολυμέσα Motivation ορισμός προβλήματος

Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap

Κεντρική ιδέα

Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια

απόσταση τιμή

τιμή

1 τιμή

1

365 μέρα

1

365 μέρα

365 μέρα

Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα

Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και

πρόχειροrsquo έλεγχο

lsquoGEMINIrsquo - Παραστατικά

πχ std S1

F(S1)

1

365 μέρα

F(Sn)

Sn

πχ avg

1 365 μέρα

GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms

GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να

εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις

GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo

Time sequences Q what features

Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)

Time sequences

white noise

brown noise

Fourier spectrum

in log-log

Time sequences Eg

Time sequences conclusion colored noises are well approximated by their first few Fourier

coefficients colored noises appear in nature

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 11: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Κεντρική ιδέα

Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια

απόσταση τιμή

τιμή

1 τιμή

1

365 μέρα

1

365 μέρα

365 μέρα

Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα

Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και

πρόχειροrsquo έλεγχο

lsquoGEMINIrsquo - Παραστατικά

πχ std S1

F(S1)

1

365 μέρα

F(Sn)

Sn

πχ avg

1 365 μέρα

GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms

GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να

εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις

GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo

Time sequences Q what features

Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)

Time sequences

white noise

brown noise

Fourier spectrum

in log-log

Time sequences Eg

Time sequences conclusion colored noises are well approximated by their first few Fourier

coefficients colored noises appear in nature

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 12: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα

Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και

πρόχειροrsquo έλεγχο

lsquoGEMINIrsquo - Παραστατικά

πχ std S1

F(S1)

1

365 μέρα

F(Sn)

Sn

πχ avg

1 365 μέρα

GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms

GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να

εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις

GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo

Time sequences Q what features

Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)

Time sequences

white noise

brown noise

Fourier spectrum

in log-log

Time sequences Eg

Time sequences conclusion colored noises are well approximated by their first few Fourier

coefficients colored noises appear in nature

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 13: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και

πρόχειροrsquo έλεγχο

lsquoGEMINIrsquo - Παραστατικά

πχ std S1

F(S1)

1

365 μέρα

F(Sn)

Sn

πχ avg

1 365 μέρα

GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms

GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να

εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις

GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo

Time sequences Q what features

Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)

Time sequences

white noise

brown noise

Fourier spectrum

in log-log

Time sequences Eg

Time sequences conclusion colored noises are well approximated by their first few Fourier

coefficients colored noises appear in nature

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 14: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

lsquoGEMINIrsquo - Παραστατικά

πχ std S1

F(S1)

1

365 μέρα

F(Sn)

Sn

πχ avg

1 365 μέρα

GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms

GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να

εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις

GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo

Time sequences Q what features

Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)

Time sequences

white noise

brown noise

Fourier spectrum

in log-log

Time sequences Eg

Time sequences conclusion colored noises are well approximated by their first few Fourier

coefficients colored noises appear in nature

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 15: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms

GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να

εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις

GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo

Time sequences Q what features

Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)

Time sequences

white noise

brown noise

Fourier spectrum

in log-log

Time sequences Eg

Time sequences conclusion colored noises are well approximated by their first few Fourier

coefficients colored noises appear in nature

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 16: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να

εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις

GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo

Time sequences Q what features

Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)

Time sequences

white noise

brown noise

Fourier spectrum

in log-log

Time sequences Eg

Time sequences conclusion colored noises are well approximated by their first few Fourier

coefficients colored noises appear in nature

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 17: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo

Time sequences Q what features

Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)

Time sequences

white noise

brown noise

Fourier spectrum

in log-log

Time sequences Eg

Time sequences conclusion colored noises are well approximated by their first few Fourier

coefficients colored noises appear in nature

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 18: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Time sequences Q what features

Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)

Time sequences

white noise

brown noise

Fourier spectrum

in log-log

Time sequences Eg

Time sequences conclusion colored noises are well approximated by their first few Fourier

coefficients colored noises appear in nature

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 19: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)

Time sequences

white noise

brown noise

Fourier spectrum

in log-log

Time sequences Eg

Time sequences conclusion colored noises are well approximated by their first few Fourier

coefficients colored noises appear in nature

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 20: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Time sequences

white noise

brown noise

Fourier spectrum

in log-log

Time sequences Eg

Time sequences conclusion colored noises are well approximated by their first few Fourier

coefficients colored noises appear in nature

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 21: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Time sequences Eg

Time sequences conclusion colored noises are well approximated by their first few Fourier

coefficients colored noises appear in nature

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 22: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Time sequences conclusion colored noises are well approximated by their first few Fourier

coefficients colored noises appear in nature

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 23: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Time sequences

brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)

black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 24: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time

total cleanup-time

r-tree time

coeff kept

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 25: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Time sequences - improvements

improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT

could use segment averages [Yi+2000]

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 26: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 27: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Images - color

what is an image A 2-d array

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 28: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Images - color

Color histograms and distance function

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 29: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Images - color

Mathematically the distance function is

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 30: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Images - color

Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly

Q what to do A feature-extraction question

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 31: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Images - color

possible answers avg red avg green avg blue

it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 32: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Images - color

performance

time seq scan

w avg RGB

selectivity

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 33: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 34: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 35: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 36: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 37: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 38: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 39: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 40: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Images - shapes Performance ~10x faster

log( of IOs)

all kept

of features kept

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 41: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 42: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Case study Informedia next foils visualization features by space

by time by concept

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 43: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 44: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

time line

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 45: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

concept

space

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 46: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 47: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Sub-pattern matching

Problem find sub-sequences that match the given query pattern

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 48: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

$price

$price

1

$price

1

400 day

1

300 day

30

365 day

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 49: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Sub-pattern matching

Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 50: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 51: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Sub-pattern matching

Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 52: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Sub-pattern matching

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 53: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Sub-pattern matching

sequences -gt trails -gt MBRs in feature space

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 54: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Sub-pattern matching

Q do we store all points why not

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 55: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Sub-pattern matching

Q how to do range queries of duration w

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 56: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 57: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 58: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Multimedia - Detailed outline

multimedia Motivation problem definition

Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 59: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 60: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

FastMap

~100 O1

O2

O3

O4

O5 O1

0

1

1

100

100 O2

1

0

1

100

100 O3 1 1

O4 100 100

0 100 100 ~1

100 0 1

O5

100

100

100

1

0

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 61: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 62: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

MDS

Multi Dimensional Scaling

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 63: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Main idea projections We want a linear algorithm FastMap [SIGMOD95]

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 64: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

FastMap - next iteration

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 65: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Results

Documents cosine similarity -gt Euclidean distance (how)

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 66: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Results

bb reports

recipes

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 67: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP

rate JPY

HKD time

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 68: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Applications - financial

currency exchange rates [ICDE00] 1

DEM

08

06 HKD

04

USD(t)

FRF FRF(t-5)

DEM(t-5)

HKD(t)

FRF(t) DEM(t)

DEM

JPY(t)

JPY(t-5)

FRF GBP HKD JPY USD

USD(t)

USD(t-5)

02

0 USD(t-5)

-02

HKD(t-5)

USD

JPY

GBP(t-5)

GBP -04

-02 0 02

GBP(t)

04 06 08 1 12 14 16

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 69: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

VideoTrails [ACM MM97]

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 70: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 71: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of

Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast

Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification

and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 72: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

References

Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 73: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo

Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo

[1] httpcreativecommonsorglicensesαπό-nc-sa40

Ως Μη Εμπορική ορίζεται η χρήση

bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο

bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο

bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 74: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy

διαθέσιμο με

άδεια CC-BY

διαθέσιμο με άδεια

CC-BY-SA

διαθέσιμο με άδεια

CC-BY-NC-SA

διαθέσιμο με άδεια

CC-BY-NC

Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου

Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου

διαθέσιμο με άδεια

CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου

διαθέσιμο με άδεια

CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του

διαθέσιμο με άδεια

CC0 Public Domain

διαθέσιμο ως κοινό κτήμα

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού

χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 75: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει

το Σημείωμα Αναφοράς

το Σημείωμα Αδειοδότησης

τη δήλωση Διατήρησης Σημειωμάτων

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)

μαζί με τους συνοδευόμενους υπερσυνδέσμους

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B
Page 76: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων

Χρηματοδότηση

bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα

bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού

bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους

  • 10
  • 10_MultimediaIndexing
    • Slide Number 1
    • Slide Number 2
    • Slide Number 3
    • Slide Number 4
    • Slide Number 5
    • Slide Number 6
    • Slide Number 7
    • Slide Number 8
    • Slide Number 9
    • Slide Number 10
    • Slide Number 11
    • Slide Number 12
    • Slide Number 13
    • Slide Number 14
    • Slide Number 15
    • Slide Number 16
    • Slide Number 17
    • Slide Number 18
    • Slide Number 19
    • Slide Number 20
    • Slide Number 21
    • Slide Number 22
    • Slide Number 23
    • Slide Number 24
    • Slide Number 25
    • Slide Number 26
    • Slide Number 27
    • Slide Number 28
    • Slide Number 29
    • Slide Number 30
    • Slide Number 31
    • Slide Number 32
    • Slide Number 33
    • Slide Number 34
    • Slide Number 35
    • Slide Number 36
    • Slide Number 37
    • Slide Number 38
    • Slide Number 39
    • Slide Number 40
    • Slide Number 41
    • Slide Number 42
    • Slide Number 43
    • Slide Number 44
    • Slide Number 45
    • Slide Number 46
    • Slide Number 47
    • Slide Number 48
    • Slide Number 49
    • Slide Number 50
    • Slide Number 51
    • Slide Number 52
    • Slide Number 53
    • Slide Number 54
    • Slide Number 55
    • Slide Number 56
    • Slide Number 57
    • Slide Number 58
    • Slide Number 59
    • Slide Number 60
    • Slide Number 61
    • Slide Number 62
    • Slide Number 63
    • Slide Number 64
    • Slide Number 65
    • Slide Number 66
    • Slide Number 67
    • Slide Number 68
    • Slide Number 69
    • Slide Number 70
    • Slide Number 71
    • Slide Number 72
      • eclass_genika_B