Το DSpace ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών...

21
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΜΣ «ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ» ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ ΔΙΔΑΣΚΟΝΤΕΣ: ΚΑΠΙΔΑΚΗΣ ΣΑΡΑΝΤΟΣ ΓΕΡΓΑΤΣΟΥΛΗΣ ΕΜΜΑΝΟΥΗΛ Το DSpace ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006

description

ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΜΣ «ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ» ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ ΔΙΔΑΣΚΟΝΤΕΣ: ΚΑΠΙΔΑΚΗΣ ΣΑΡΑΝΤΟΣ ΓΕΡΓΑΤΣΟΥΛΗΣ ΕΜΜΑΝΟΥΗΛ. Το DSpace ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006. DSpace. Σύστημα αποθήκευσης ανοικτού κώδικα για τη διατήρηση ψηφιακού υλικού - PowerPoint PPT Presentation

Transcript of Το DSpace ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών...

Page 1: Το  DSpace  ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006

ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΜΣ «ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ»

ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ

ΔΙΔΑΣΚΟΝΤΕΣ:ΚΑΠΙΔΑΚΗΣ ΣΑΡΑΝΤΟΣ

ΓΕΡΓΑΤΣΟΥΛΗΣ ΕΜΜΑΝΟΥΗΛ

Το DSpace ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών

ΛΕΓΑΚΗ ΕΙΡΗΝΗ

ΙΟΥΝΙΟΣ 2006

Page 2: Το  DSpace  ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006

DSpace

Σύστημα αποθήκευσης ανοικτού κώδικα για τη διατήρηση ψηφιακού υλικού

Αποτέλεσμα διετούς συνεργασίας των Hewlett Packard Laboratories και MIT Libraries

Είναι διαθέσιμο ως λογισμικό ανοικτού κώδικα από το Νοέμβριο του 2002

Αναπτύχθηκε στα πλαίσια της διατήρησης του ψηφιακά παραγόμενου υλικού ώστε να αποφεύγεται η απώλεια αυτού

Page 3: Το  DSpace  ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006

Αρχιτεκτονική του Συστήματος DSpace

...

WorkflowManager

ContentManagement

API

E-person/Group

Manager

Authorisation

HistoryRecorder

BusinessLogic Layer

AdministrationToolkit

FederationServices

Storage API

DSpace Public API

Bitstream Storage ManagerRDBMS Wrapper

Search(LuceneWrapper)

Browse API

HandleManager

Web UI

OAIMetadataProvidingService

Batch ItemImporter

JDBC

PostgreSQL Filing System

ApplicationLayer

StorageLayer

CNRIHandleServer

Plug-in

ItemExporter

Page 4: Το  DSpace  ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006

Open Archival Information System (OAIS) Μοντέλο Αναφοράς (1/2)

Περιγράφει λειτουργικά μέρη συστημάτων που προορίζονται να διατηρούν πληροφορίες για ένα καθορισμένο σύνολο

Χρησιμεύει στην θεμελίωση της ορολογίας

Συνεισφέρει στον προσδιορισμό δυνατών σημείων αλλά και ελλειπόντων περιοχών σε υπάρχοντα συστήματα

Page 5: Το  DSpace  ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006

Open Archival Information System (OAIS) Μοντέλο Αναφοράς (2/2)

Data Management

ArchivalStorage

Access andDissemination

Ingest

Administration

DIDI

AIP AIP

SIP

DIP

P r

o d

u c

e r C

on

su

me

r

Management

Page 6: Το  DSpace  ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006

Αποθήκευση Αρχείων

Το βασικό Πακέτο Αρχειακών Πληροφοριών (AIP) του DSpace είναι το Στοιχείο (Item), π.χ. Στοιχεία είναι οι Μονάδες Αρχειακών Πληροφοριών (AIUs)

Αποθηκεύονται σε συστήματα σχεσιακών βάσεων δεδομένων Αποτελεσματική πρόσβαση Όχι μακροπρόθεσμο, βασίζεται σε λογισμικό ΒΔ

Κινούνται προς AIP μορφότυπα που βασίζονται σε πρότυπα (METS) Τα δεδομένα δεν ‘κλειδώνονται’ στο λογισμικό

DSpace Επιτρέπεται ανακατασκευή χωρίς λογισμικό

DSpace και Φορητότητα

Page 7: Το  DSpace  ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006

Δομή του DSpace Item

Item

Bundle

Bitstream Bitstream Format

Dublin CoreRecord

Page 8: Το  DSpace  ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006

Τεχνικά Μεταδεδομένα του Bitstream

Αναφορά στο μορφότυπο της ακολουθίας των bits

Μέγεθος σε bytes

Επιλογή περιγραφής σε ελεύθερο κείμενο

Δεν υπάρχει δυνατότητα περιγραφής των σχέσεων μεταξύ των Bitstreams σε ένα δεσμό (Bundle)

Page 9: Το  DSpace  ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006

Πληροφορίες για τα μορφότυπα των Bitstream

Σύντομη ονομασία και πλήρης περιγραφή Τύπου MIME Πληροφορίες για αυτόματη αναγνώριση

μορφοτύπου Επίπεδα υποστήριξης:

Υποστηρίζεται Αναγνωρίζεται Δεν υποστηρίζεται

Η αναπαράσταση πληροφοριών δεν διατίθεται τρεχόντως στο σύστημα

Page 10: Το  DSpace  ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006

Δείγμα DSpace AIP

hdl:123.456/789

Size: 12,456 bytesChecksum: AF45…

101010101011010110101011101010111010101011101010111010

10010101…..

HTML Format

title: Research Datacontributor.creator: Robert Tansleydescription.provenance: Submitted

by Robert Tansley 10-Mar-2003

Size: 49,142 bytesChecksum: 2B09…

101010101011010110101011101010111010101011101010

11101010010101…..

JPEG Format

Item

Bundle

Bitstream

Bitstream Format

DC Record

Bitstream

Bitstream Format

History Data

Page 11: Το  DSpace  ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006

Μετανάστευση και Αναδημιουργία κατεστραμμένου υλικού

Δεν διαχειρίζονται άμεσα από των κώδικα του DSpace

Στις βιβλιοθήκες MIT, υπάρχει καθορισμένη διαδικασία αντιγράφων σε μαγνητικές κασέτες

Μικρός κίνδυνος εξαιτίας της εξάρτησης από τη λειτουργική πλατφόρμα PostgreSQL για την αποκατάσταση της βάσης δεδομένων

Μετριάζεται από AIPs που βασίζονται στο METS

Page 12: Το  DSpace  ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006

Διαχείριση δεδομένων

Data Management

ArchivalStorage

Access andDissemination

Ingest

Administration

DIDI

AIP AIP

SIP

DIP

P r

o d

u c

e r C

on

su

me

r

Management

Page 13: Το  DSpace  ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006

Διαχείριση δεδομένων (1/2)

Εξουσιοδότηση Λίστα απλού ελέγχου πρόσβασης μη ιεραρχική

Πιστοποίηση Εξαρτάται από τα συστατικά μέρη στον τομέα

της εφαρμογής αφού οι μηχανισμοί ποικίλουν Η διεπαφή του χρήστη (UI) του MIT Web

χρησιμοποιεί X509 πιστοποιητικά Απλό στην αλλαγή (π.χ. να χρησιμοποιηθεί

πιστοποίηση NT domain)

Page 14: Το  DSpace  ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006

Διαχείριση δεδομένων (2/2)

Ευρετηρίαση Η χρήση σχεσιακής βάσης δεδομένων παρέχει

δείκτες ευρετηρίασης (indices) Δείκτες τίτλων, συγγραφέων, θεμάτων και

χρονολογιών για browsing (αποθηκευμένοι σε DBMS)

Ευρετηριασμένα μεταδεδομένα Dublin Core με τη χρήση της μηχανής αναζήτησης Jakarta Lucene

Page 15: Το  DSpace  ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006

Διαχείριση (Administration)

Εκτελείται κεντρικά (κυρίως αποτελεί ένα ζήτημα του User Interface)

Στα σχέδια είναι να επιτρέπεται περισσότερο σε τοπικό επίπεδο η διαχείριση από κοινότητες

Page 16: Το  DSpace  ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006

Εργαλεία Διαχείρισης

Εργαλεία Web UI Δημιουργία/ επεξεργασία μεταδεδομένων για

συλλογές Δημιουργία/ επεξεργασία διατήρησης καταγραφών

των χρηστών Έλεγχος εξουσιοδότησης ομάδων και πρόσβαση

στις λίστες ελέγχου Επεξεργασία των Items Απόσυρση των Items από το αρχείο Θεώρηση/ επεξεργασία του Dublin Core Θεώρηση/ επεξεργασία του μορφοτύπου Bitstream

Page 17: Το  DSpace  ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006

Διαδικασία εισαγωγής του DSpace

Batch ItemImporter

Web SubmitUI

Workflow

Item Installer

External SIP

DSpace SIP Archived Item(AIP)

INGEST PROCESS

Page 18: Το  DSpace  ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006

Επιλογές Εισαγωγής

Web UI – Διεπαφή χρήστη

Δεδομένα συγγραφέα σε απλό DSpace XML μορφότυπο εισαγωγής

Δημιουργία εργαλείων με τη χρήση DSpace Java APIs

Μετατροπή δεδομένων σε απλό DSpace XML μορφότυπο εισαγωγής

Page 19: Το  DSpace  ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006

Εγγύηση Ποιότητας

Submitter’sWorkspace

ReviewerWorkflowComplete

Submit Accept

Reject

Commit

Edit Metadata

Approver EditorAccept

Edit Metadata

Reject

Page 20: Το  DSpace  ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006

Μετασχηματισμός

Ονομάζεται επίσης ‘Μετανάστευση’ Δεν υπάρχουν ακόμη εργαλεία Πιθανές μελλοντικές κατευθύνσεις:

Αναγνώριση Items που απαιτούν Μετασχηματισμό

Εκτέλεση Μετασχηματισμού Τα πρωτότυπα πρέπει να κρατούνται σε

περίπτωση σφαλμάτων στο Μετασχηματισμό

Page 21: Το  DSpace  ως ένα Ανοικτό Αρχειακό Σύστημα Πληροφοριών ΛΕΓΑΚΗ ΕΙΡΗΝΗ ΙΟΥΝΙΟΣ 2006

Συμπεράσματα

Το DSpace είναι ένα χρήσιμο εργαλείο

Αλλά… Δεν αποτελεί ακόμη ένα πλήρες εργαλείο

ψηφιακής διατήρησης Ανάγκη ανάπτυξης και δοκιμασίας εργαλείων

Μετασχηματισμού (μετανάστευση) Ανάγκη περιγραφής περίπλοκων σχέσεων

μεταξύ των Bitstreams με τη βοήθεια του METS Ανάγκη παροχής καλύτερης διάχυσης

δυνατοτήτων Βελτίωση εργαλείων διαχείρισης