Επισκόπηση Θεμάτων

23
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΜΣ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ: ΔΙΟΙΚΗΣΗ ΚΑΙ ΟΡΓΑΝΩΣΗ ΒΙΒΛΙΟΘΗΚΩΝ ΜΕ ΕΜΦΑΣΗ ΣΤΙΣ ΝΕΕΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ «Τεχνικές Σημασιολογικού Ιστού για πολλαπλές προβολές σε ετερογενείς συλλογές Ινστιτούτων Πολιτιστικής Κληρονομιάς» Σοφία Καρδαμύλα Εργασία στο μάθημα: Ηλεκτρονική Δημοσίευση Διδάσκον καθηγητής: Σαράντος Καπιδάκης Αθήνα 2007

description

ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΜΣ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ: ΔΙΟΙΚΗΣΗ ΚΑΙ ΟΡΓΑΝΩΣΗ ΒΙΒΛΙΟΘΗΚΩΝ ΜΕ ΕΜΦΑΣΗ ΣΤΙΣ ΝΕΕΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ. «Τεχνικές Σημασιολογικού Ιστού για πολλαπλές προβολές σε ετερογενείς συλλογές Ινστιτούτων Πολιτιστικής Κληρονομιάς» - PowerPoint PPT Presentation

Transcript of Επισκόπηση Θεμάτων

Page 1: Επισκόπηση Θεμάτων

ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ

ΠΜΣ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ:ΔΙΟΙΚΗΣΗ ΚΑΙ ΟΡΓΑΝΩΣΗ ΒΙΒΛΙΟΘΗΚΩΝ ΜΕ ΕΜΦΑΣΗ ΣΤΙΣ ΝΕΕΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ

ΠΛΗΡΟΦΟΡΙΑΣ

«Τεχνικές Σημασιολογικού Ιστού για πολλαπλές προβολές σε ετερογενείς συλλογές Ινστιτούτων Πολιτιστικής

Κληρονομιάς»

Σοφία Καρδαμύλα

Εργασία στο μάθημα: Ηλεκτρονική ΔημοσίευσηΔιδάσκον καθηγητής: Σαράντος Καπιδάκης

Αθήνα 2007

Page 2: Επισκόπηση Θεμάτων

Επισκόπηση ΘεμάτωνΣυλλογή Illuminated Manuscript

Συλλογή ARIA Masterpieces

Μεθοδολογία πρόσβασης στις συλλογές

χρησιμοποιώντας τις δυνατότητες & τα όρια της

τρέχουσας τεχνολογίας του Σημασιολογικού Ιστού

Αποτελέσματα

Συμπεράσματα

Προβληματισμοί

Page 3: Επισκόπηση Θεμάτων

Τα Ινστιτούτα Πολιτιστικής Κληρονομιάς (CH) φέρουν σημαντικές πληροφορίες για την

ανάπτυξη του πολιτισμού.

Οι συλλογές των Ινστιτούτων Πολιτιστικής Κληρονομιάς (CH) είναι ετερογενείς:

Περιέχουν διαφορετικά είδη αντικειμένων, με διαφορετική θεματολογία, περιγράφονται

με

την χρήση διαφορετικών σχημάτων περιγραφής και ελεγχόμενων λεξιλογίων και μπορεί

να έχουν αποθηκευτεί και είναι προσιτές μέσω διαφορετικών πληροφοριακών

συστημάτων.

Πρότυπα, πρωτόκολλα και κοινά σχήματα μεταδεδομένων Ενοποίηση συλλογών

Δημιουργία πύλης Πρόσβαση στις ενοποιημένες συλλογές

Τα Ινστιτούτα Πολιτιστικής Κληρονομιάς (CH) φέρουν σημαντικές πληροφορίες για την

ανάπτυξη του πολιτισμού.

Οι συλλογές των Ινστιτούτων Πολιτιστικής Κληρονομιάς (CH) είναι ετερογενείς:

Περιέχουν διαφορετικά είδη αντικειμένων, με διαφορετική θεματολογία, περιγράφονται

με

την χρήση διαφορετικών σχημάτων περιγραφής και ελεγχόμενων λεξιλογίων και μπορεί

να έχουν αποθηκευτεί και είναι προσιτές μέσω διαφορετικών πληροφοριακών

συστημάτων.

Πρότυπα, πρωτόκολλα και κοινά σχήματα μεταδεδομένων Ενοποίηση συλλογών

Δημιουργία πύλης Πρόσβαση στις ενοποιημένες συλλογές

Page 4: Επισκόπηση Θεμάτων

Illuminated Manuscript Συλλογή Εθνικής Ολλανδικής Βιβλιοθήκη (KB) Περιέχει: 10.000 μεσαιωνικές εικονογραφήσεις οι οποίες εκτός από

τις πρότυπες βιβλιογραφικές πληροφορίες σχολιάζονται και από θεματικά ευρετήρια που περιγράφουν

το περιεχόμενο της εικόνας Τα ευρετήρια ακολουθούν το Σχήμα Ταξινόμησης Iconclass Iconclass: Λεξιλόγιο 25.000 στοιχείων με κύριο σκοπό την

εικονογραφική ανάλυση Ένα αντικείμενο στο Iconclass αποτελείται από:

Μία Υποσημείωση (25F9) Μία συσχέτιση κειμένου (=παραμορφωμένα ζώα: τέρατα) Συνδέσμους θεματικών παραπομπών (cross-reference) Μηχανισμούς εξειδίκευσης θέματος (keys) Λέξεις κλειδιά (keywords)

Τα θέματα είναι οργανωμένα σε 9 ιεραρχικά επίπεδα

Page 5: Επισκόπηση Θεμάτων

Δομή Iconclass

Page 6: Επισκόπηση Θεμάτων

Αποτελέσματα αναζήτησης στη συλλογή «Illuminated Manuscript» της KB

Page 7: Επισκόπηση Θεμάτων

ARIA Masterpieces Συλλογή Μουσείου Rijks στο Άμστερνταμ Περιέχει: 700 αντικείμενα (πίνακες & γλυπτά) Τα θέματα στα ευρετήρια δημιουργούνται με βάση τον κατάλογο Aria Aria: ελεγχόμενο λεξιλόγιο, αποτελούμενο από 500 όρους και 3

υπολεξιλόγια, θεωρούμενο κυρίως ως πηγή αναζήτησης

1ο Υπολεξιλόγιο: προορίζεται για μη ειδικούς. Περιέχει θέματα όπως π.χ. ο Άντρας

2ο Υπολεξιλόγιο: προορίζεται για πιο εξειδικευμένους χρήστες. Περιέχει παρόμοια αλλά πιο υψηλής ποιότητας θέματα π.χ. Αντρικά πορτραίτα

3ο Υπολεξιλόγιο: Περιέχει μία πιο μικρή λίστα με 6 κατηγορίες αντικειμένων όπως π.χ. Γλυπτική

Η μοναδική σημασιολογική πληροφορία που υπάρχει στον κατάλογο είναι κάποιοι εξειδικευμένοι σύνδεσμοι μεταξύ των δύο πρώτων λεξιλογίων (σχέσεις ευρύτερης έννοιας)

Οι ιεραρχίες είναι δύο επιπέδων

Page 8: Επισκόπηση Θεμάτων

Βήμα 1οΤυποποίηση συλλογής

Βήμα 2οΕνοποίηση συλλογής

Βήμα 3οΠρόσβαση στη

συλλογή

Μεθοδολογία

Page 9: Επισκόπηση Θεμάτων

1ο βήμα: Τυποποίηση συλλογής Μετατροπή ελεγχόμενων λεξιλογίων Μετατροπή στοιχείων συλλογών

Αρχικά ΛεξιλόγιαIconclass

ARIA

Αρχικά ΛεξιλόγιαIconclass

ARIA

Πρότυπη SW απεικόνιση λεξιλογίων

Πρότυπη SW απεικόνιση συλλογών

1. Τυποποίηση συλλογής

Συντακτική διαλειτουργικότη

τα λεξιλογίων

Συντακτική και σημασιολογική

διαλειτουργικότητα δομής μεταδεδομένων

Αρχικές συλλογέςARIA Masterpieces

KB Manuscripts

Αρχικές συλλογέςARIA Masterpieces

KB Manuscripts

Page 10: Επισκόπηση Θεμάτων

Μετατροπή ελεγχόμενων λεξιλογίων

Ανάλυση στοιχείων Τυποποίηση γνώσης που περιέχουν

Πρότυπη τυποποίηση: Επιλογή πρότυπου μοντέλου κωδικοποίησης λεξιλογίων

σε γλώσσες SW Πρωτοβουλία SKOS (Simple Knowledge Organization

System): Παρέχει ένα πρότυπο μοντέλο κωδικοποίησης

των πιο διαδεδομένων πλάνων οργάνωσης της γνώσης

(θησαυροί, ταξ. Συστήματα) σε γλώσσες SW.

SKOS: rdf λεξιλόγιο (W3C SW)

Page 11: Επισκόπηση Θεμάτων

Μετατροπή στοιχείων συλλογών

Διατήρηση αρχικών δομών συλλογών Μη χρησιμοποίηση κοινού σχήματος

περιγραφής μεταδεδομένων Κατασκευή μικρών οντολογιών

μεταδεδομένων σε σχήμα rdf

Title: Mary Magdalene Year: 1487 Artist: Carlo Crivelli

Page 12: Επισκόπηση Θεμάτων

2ο βήμα: Ενοποίηση συλλογής

Προβλήματα Η σύνθετη φύση της γραφικής παράστασης RDF Η ετερογένεια στις δομές και την γλωσσολογία (ετικέτες)

Λύση Εφαρμογή χαρτογράφων

οντολογιώνΓνώση

Χαρτογράφησης

Γνώση Χαρτογράφηση

ς

2. Ενοποίηση συλλογής

Σημασιολογική διαλειτουργικότητα των

λεξιλογίων

Αποθήκευση SW περιγραφής σε

ένα κοινό interface και αναζήτηση

πληροφοριών μέσω αυτού

1. Τυποποίηση συλλογής

Page 13: Επισκόπηση Θεμάτων

Χαρτογράφος Falcon

Εργαλείο ευθυγράμμισης πολύπλοκων rdf/owl οντολογιών

Αναπτύχθηκε από το South East University of ChinaΕνσωματώνει δύο χαρτογράφους: τους LMO & GMO

LMO: Η ευθυγράμμιση στηρίζεται στο γλωσσικό ταίριασμα (σύγκριση συνώνυμων όρων κ.ά)

GMO: Η ευθυγράμμιση στηρίζεται στο δομικό ταίριασμα των γραφικών παραστάσεων.

Ο χαρτογράφος Falcon ενσωματώνει τις ευθυγραμμίσεις των LMO και GMO για να εξάγει αποτελέσματαΠροσδοκούμενα αποτελέσματα: Δημιουργία ισοδύναμων συνδέσμων μεταξύ των εννοιών και των σχέσεων των οντολογιών που συγκρίνονται

Page 14: Επισκόπηση Θεμάτων

Χαρτογράφος S-Match Γενικός χαρτογράφος ο οποίος χρησιμοποιείται για

ευθυγράμμιση λεξιλογίων με δενδροειδή δομή Αναπτύχθηκε από το University of Trento (Italy) Χρησιμοποιεί το πλήρες μονοπάτι ενός δενδροειδές

λεξιλογίου για την χαρτογράφησή του. ‘Έτσι η απόδοση σχεδόν πάντα αποτελείται από συνδέσμους εξειδίκευση από τις Iconclass έννοιες στις aria έννοιες

Οι χαρτογραφήσεις υπολογίζονται με την επιλογή της ισχυρότερης σημασιολογικής σχέσης, η οποία ανακαλύπτεται με έναν αλγόριθμο μεταξύ των εννοιών μίας οντολογίας

Δεν παρέχει ένα βαθμό ομοιότητας μεταξύ των εννοιών της οντολογίας αλλά τις σημασιολογικές τους σχέσεις (ισοδυναμία, πιο γενικός, λιγότερο γενικός, επικάλυψη κ.α)

IC Notation Λεξική συσχέτιση Iconclass Σχέση Ετικέτα ARIA

23 Η “seasons of the year represented by concepts other than […] landscapes

[…]”

Λιγότερο γενική “Landscapes”

Χαρτογράφηση με S-Match

Page 15: Επισκόπηση Θεμάτων

3ο βήμα: Πρόσβαση στη συλλογή Χρήση multi-faceted browsing

Η mfb περιλαμβάνει τον προσδιορισμό των τμημάτων μίας συλλογής

Για αναζήτηση στις ενοποιημένες συλλογές, χρησιμοποιούνται 3 όψεις: απλή, συνδυασμένη και ενοποιημένη

Ορισμός προσδιοριστικών

τμημάτων (φασέτες)

Ορισμός προσδιοριστικών

τμημάτων (φασέτες)

3. Πρόσβαση στη συλλογή

Εκτίμηση προδιαγραφών

2. Ενοποίηση συλλογής

Αναζήτηση

Page 16: Επισκόπηση Θεμάτων

Απλή όψη αναζήτησης Παρουσιάζει τις ενοποιημένες συλλογές από την πλευρά

της μίας συλλογής Τα στοιχεία της άλλης συλλογής είναι προσβάσιμα μέσω

την αντιστοίχησης των θεματικών τους σχολιασμών και των εννοιών με την τρέχουσα συλλογή

Αναζήτηση στις ενοποιημένες συλλογές με την χρησιμοποίηση του καταλόγου ARIA

Ευθυγράμμιση έννοιας «Animal Pieces» του ARIA και έννοιας «25F:animals» του Iconclass

Page 17: Επισκόπηση Θεμάτων

Συνδυασμένη όψη αναζήτησης Παρέχει ταυτόχρονη πρόσβαση στις συλλογές μέσω της

αντιστοίχησης των λεξιλογίων τους αναζητάμε στις ενοποιημένες συλλογές σαν να είναι μία συλλογή χρησιμοποιώντας δύο ευρετήρια

Αναζήτηση στις ενοποιημένες συλλογές με την χρησιμοποίηση των καταλόγων ARIA και IconclassΑναζήτηση στον ARIA με την έννοια «Animal Pieces» και περιορισμός αναζήτησης στο θέμα από τον Iconclass με «Classical Mythology and Ancient History» (βιολογικό & μυθολογικό κριτήριο)

Page 18: Επισκόπηση Θεμάτων

Ενοποιημένη όψη αναζήτησης Παρέχει πρόσβαση στις ενοποιημένες συλλογές μέσω ενός

συγχωνευμένου λεξιλογίου Η αυτόματη διαδικασία χαρτογράφησης δημιουργεί

συνδέσμους μεταξύ των δύο λεξιλογίων

Η ενοποιημένη όψη παρέχει και Aria έννοιες όπως “Birds” και μία έννοια Iconclass “29A: animals acting as human beings” για την περαιτέρω βελτίωση της αναζήτησης

Page 19: Επισκόπηση Θεμάτων

Λεπτομέρειες Browser

Το σχέδιο του browser εμπνεύστηκε από το περιβάλλον αναζήτησης Flamenco

Δοκιμή στον browser: http://stitch.cs.vu.nl/demo.html

STITCH (SemanTic Interoperability To access Cultural Heritage)

Ερευνητικό πρόγραμμα

Χρηματοδοτείται από τον Ολλανδικό Οργανισμό για την Επιστημονική Έρευνα (Netherlands Organisation for Scientific Research )

Στόχος: Η αξιολόγηση της εφαρμογής τεχνικών και εργαλείων του Σημασιολογικού Ιστού για την ενοποίηση ετερογενών συλλογών CH

Page 20: Επισκόπηση Θεμάτων

Αποτελέσματα

Αποτελέσματα ΧαρτογράφησηςS-Match 46%

Falcon 16%

ΑποτελέσματαΑποτελέσματα πρότυπης τυποποίησης ARIAARIA SKOS

Iconclass SKOS γραφική αναπαράσταση κλειδιών

ακρίβεια

ακρίβεια

Σχεδόν πλήρως συμβατή

Εν μέρει συμβατή

Page 21: Επισκόπηση Θεμάτων

Συμπεράσματα Η μετατροπή λεξιλογίων χρησιμοποιώντας τυποποιημένα πρότυπα είναι δυνατή και βοηθά στην

ανάπτυξή τους

Αν όλες οι συλλογές και τα λεξιλόγιά τους ήταν διαθέσιμα σε τυποποιημένη μορφή π.χ. skos,rdf, το

περιβάλλον θα μας παρείχε έναν πολύ πιο εύκολο τρόπο ενοποίησης ετερογενών συλλογών

Προβλήματα τυποποίησης (απώλεια πληροφοριών)

Βασιζόμενοι σε τέτοιες απεικονίσεις και σε αυτόματες χαρτογραφήσεις, μπορούμε να εκτελέσουμε

αναζήτηση μέσω ενός κοινού interface σε ετερογενείς συλλογές

Δύσκολη χαρτογράφηση και όχι πάντα ακριβής

Για την εκτέλεση σημασιολογικής ενοποίησης CH συλλογών με τον τρόπο που αναφέραμε στο

πείραμα, οι αυτόματες τεχνικές χαρτογράφησης είναι απαραίτητες, αλλά πρέπει οπωσδήποτε να

προσαρμοστούν

Η χρήση του Multi-Faceted Browsing παρέχει πολλαπλές προβολές ή σημεία πρόσβασης για το ίδιο

σετ μεταδεδομένων. Έτσι οι χρήστες μπορούν να επιλέξουν το λεξιλόγιο με το οποίο είναι

περισσότερο άνετοι και έτσι η ολοκληρωμένη πρόσβαση είναι δεδομένη

Page 22: Επισκόπηση Θεμάτων

Προβληματισμοί

Τελικά αξίζει να χρησιμοποιήσουμε τις αυτόματες τεχνικές

χαρτογράφησης για τα CH λεξιλόγια;

Κατά πόσο είναι εύκολο να χρησιμοποιηθεί η ίδια

μεθοδολογία για ενοποίηση περισσότερων των δύο συλλογών;

Τι αποτελέσματα θα έχουμε;

Page 23: Επισκόπηση Θεμάτων