Post on 29-Jun-2015
description
Αποθηκεύεται το διαδίκτυο;
Βαγγέλης Μπάνοςhttp://vbanos.gr/
WEB ARCHIVING
Unconference, 9-10 Δεκεμβρίου 2013
Αποθηκεύεται το διαδίκτυο;
• Τι εννοείς;
• Τι είναι το web archiving;
• Η χρήση των web archives στην πράξη.
• Φτιάχνοντας το δικό μας web archive.
Τι είναι ο παγκόσμιος ιστός;
Ο Παγκόσμιος Ιστός είναι μία τεράστια συλλογή από ψηφιακάέγγραφα (τις ιστοσελίδες), που βρίσκονται αποθηκευμένα σε
υπολογιστές του Διαδικτύου.
Τι είναι ο παγκόσμιος ιστός;
Τι είναι ο παγκόσμιος ιστός;
Τι είναι ο παγκόσμιος ιστός;
Τι υπάρχει στο διαδίκτυο;
Τι ΔΕΝ υπάρχει στο διαδίκτυο;
Γιατί να αποθηκεύσουμε το διαδίκτυο;
1. Ορισμένες ιστοσελίδες περιέχουν μοναδικές πληροφορίες και δεδομένα.– Οι χρήστες δρουν και παίρνουν αποφάσεις με βάση
αυτές τις πληροφορίες.
2. Είναι ζωντανή καταγραφή της σύγχρονης1. Οικονομίας,2. Επιστήμης,3. Πολιτισμού,4. Κοινωνίας.
3. Διαφάνεια και ευθύνη.
Δεν είναι ήδη αποθηκευμένα όλα αυτά;
• Η απάντηση είναι: ΌΧΙ απαραίτητα.• Οι ιστοσελίδες κινδυνεύουν διότι:– Οι οργανισμοί που τις συντηρούν τις κλείνουν,– Οι οργανισμοί που τις συντηρούν παύουν να
υπάρχουν,– Καταστρέφονται λόγω εξωτερικών παραγόντων
(φωτιές, πλημμύρες, κ.α.)– Καταστρέφονται λόγω τεχνικών προβλημάτων– Οι πληροφορίες τους αλλοιώνονται επίτηδες!
Μια εταιρία με 73.000 blogs έκλεισε ξαφνικά
To Yahoo έκλεισε το GEOCITIES
Φυσικές καταστροφές επηρεάζουν το διαδίκτυο
Ιστοσελίδες αλλοιώνονται επίτηδες
Ιστοσελίδες αλλοιώνονται επίτηδες
Σας θυμίζει κάτι αυτό;
Αποθηκεύεται το διαδίκτυο;
• Τι εννοείς;
• Τι είναι το web archiving;
• Η χρήση των web archives στην πράξη.
• Φτιάχνοντας το δικό μας web archive.
Ιστοσελίδες αλλοιώνονται επίτηδες
Web Archiving
MTSR 2013, 22 Nov 2013, Thessaloniki 18
To Internet Archiveέχει κρατήσειαντίγραφα
WEB ARCHIVINGΗ διαδικασία συλλογής και αποθήκευσης τμημάτων του παγκόσμιου ιστού (WWW) με σκοπό την διαφύλαξή τους σε αρχείο για τους μελλοντικούς ερευνητές, ιστορικούς και το κοινό.
The process of collecting portions of the World Wide Web to ensure the information is preserved in an archive for future researchers, historians, and the public.
Προκλήσεις
• Πώς γίνεται τεχνικά;• Τι πρέπει να επιλέξω να αποθηκεύσω;– Ολόκληρο το website, κάποιες σελίδες; Ορισμένα
αρχεία;• Τι θέλω να κάνω με το archive που θα
δημιουργήσω;• Ποιος θα έχει πρόσβαση σε αυτό;• Σε ποιον ανήκει το περιεχόμενο;
Τεχνική πρόκληση η αποθήκευση των ιστοσελίδων
File(s) Software Hardware RECORD
Generic file archiving operation
Τεχνική πρόκληση η αποθήκευση των ιστοσελίδων
File(s)
Software
Hardware Website
File(s)
File(s)
File(s)
File(s)
File(s)
File(s)
Software
Software
Web archiving operation
Πως γίνεται;
• Επιλογή ιστοσελίδων για archiving:– Κρατικές υπηρεσίες, Εκπαιδευτικά ιδρύματα,– Προτάσεις του κοινού, Ιστοσελίδες της επικαιρότητας,– Μέσα ενημέρωσης, Μεγάλες εταιρίες.
Στρατηγικές web archiving
Ποιός ασχολείται με το web archiving;
Δεκάδες οργανισμοί ασχολούνται με το web archiving από το 1996.
International Internet Preservation Consortium
• Μέλη του IIPC– Εθνικές βιβλιοθήκες,– Ακαδημαϊκές βιβλιοθήκες,– Πολιτιστικοί οργανισμοί,– Πανεπιστήμια,– Εταιρίες ανάπτυξης λογισμικού για
archives
• Ιστορική αναδρομή– http://timeline.webarchivists.org/
Υποχρεώση της Εθνικής Βιβλιοθήκης
• Σύμφωνα με την UNESCO:– «μια εθνική βιβλιοθήκη είναι υπεύθυνη για τη
συγκέντρωση και διατήρηση της εθνικής πνευματικής, κυρίως εκδοτικής, παραγωγής προς όφελος των μελλοντικών γενιών».
• Στην Ελλάδα, σύμφωνα με το νόμο N.3149/03:– «οι εκδότες ή οι συγγραφείς, όταν δεν υπάρχει
εκδότης, υποχρεούνται να καταθέτουν τρία αντίτυπα κάθε είδους εντύπων που εκδίδουν στην Ε.Β.Ε. Η υποχρέωση κατάθεσης αφορά επίσης τις οπτικοακουστικές και τις ηλεκτρονικές εκδόσεις σε φυσική μορφή καθώς και τις ηλεκτρονικές εκδόσεις σε μορφή προσβάσιμη μέσω του Διαδικτύου».
• Τι γίνεται με το διαδίκτυο;
Bibliothèque nationale de France
2006: legal deposit extended to “signs, signals, writings, images, sounds or messages of any kind communicated to the public by electronic means”.
The goal is not to gather the «best of the web», but to preserve a collection representative of the webat a certain date.
Αποθηκεύεται το διαδίκτυο;
• Τι εννοείς;
• Τι είναι το web archiving;
• Η χρήση των web archives στην πράξη.
• Φτιάχνοντας το δικό μας web archive.
Internet Archive δραστηριότητες
• Βασικές λειτουργίες, πλοήγηση, αναζήτηση.• Ενδεικτικά:– Υπουργείο Παιδείας, 3 Ιουλίου 2010,
www.minedu.gov.gr– Υπουργείο Ανάπτυξης, 21 Δεκεμβρίου 2009
http://www.ypoian.gr/ – The White House, 7 Απριλίου 2000,
http://www.whitehouse.gov– BBC, 11 Σεπτεμβρίου 2001, http://www.bbc.co.uk/
Archive-It δραστηριότητες
• Βασικές λειτουργίες, πλοήγηση αναζήτηση, συλλογές.
• Ενδεικτικά:– Egypt Revolution and politics, American University
in Cairo,
– 2008 Beijing Olympic games,– Lybian Uprisings, University of Michigan,– Venice Biennale 2013
Αποθηκεύεται το διαδίκτυο;
• Τι εννοείς;
• Τι είναι το web archiving;
• Η χρήση των web archives στην πράξη.
• Φτιάχνοντας το δικό μας web archive.
Δημιουργώντας το δικό μας Web Archive
• Χρήση του προγράμματος HTTrack (Open Source)– Εγκατάσταση– Πρακτικές οδηγίες– Λειτουργίες– Παραδείγματα χρήσης• Archive http://2013.futurelibrary.gr/ • Archive http://www.auth.gr/
Θέματα που πρέπει να προσέχουμε
• Βάλτε όρια!– Filters για να ελέγχετε τα αρχεία που θέλετε να αντιγράψετε.– Bandwidth limits & Connection limits για να μην υπερφορτώσετε το
site που αντιγράφετε.– Time limits– Μην υπερφορτώνετε το δίκτυο της βιβλιοθήκης σας.
• Ελέγχετε το μέγεθος των αρχείων που έχετε κατεβάσει.• Ελέγχετε αν επιτρέπεται η αντιγραφή του website. (Copyright)
– Για προσωπική χρήση,– Για δημόσια χρήση στους υπολογιστές της βιβλιοθήκης.
• Αν δεν είστε σίγουροι, ζητήστε την άδεια του ιδιοκτήτη πριν ξεκινήσετε.
Σενάριο δημιουργίας ενός mini web archive στη Βιβλιοθήκη
• Εξοπλισμός:– Ένας τυπικός υπολογιστής με Windows και όσο μεγαλύτερο
σκληρό δίσκο γίνεται. (Πολλά ΤΒ).– Απαραίτητα backup disk (π.χ. USB).– Σύνδεση DSL– HTTRACK open source software
• Επιλογή sites τοπικού ενδιαφέροντος.• Κατάρτιση προγράμματος περιοδικού web archiving
(π.χ. 1 φορά τον μήνα).• Παροχή πρόσβασης στους επισκέπτες της Βιβλιοθήκης.
Ευχαριστώ θερμά
• Ερωτήσεις;
• Περαιτέρω επικοινωνία:– Web: http://vbanos.gr– Email: vbanos@gmail.com– Twitter: @vbanos