Αποθηκεύεται το διαδίκτυο; Web Archiving!

39
Αποθηκεύεται το διαδίκτυο; Βαγγέλης Μπάνος http://vbanos.gr/ WEB ARCHIVING Unconference, 9-10 Δεκεμβρίου 201

description

1. Τι εννοείς; 2. Τι είναι το web archiving; 3. H χρήση των web archives στην πράξη. 4. Φτιάχνοντας το δικό μας web archive.

Transcript of Αποθηκεύεται το διαδίκτυο; Web Archiving!

Page 1: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Αποθηκεύεται το διαδίκτυο;

Βαγγέλης Μπάνοςhttp://vbanos.gr/

WEB ARCHIVING

Unconference, 9-10 Δεκεμβρίου 2013

Page 2: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Αποθηκεύεται το διαδίκτυο;

• Τι εννοείς;

• Τι είναι το web archiving;

• Η χρήση των web archives στην πράξη.

• Φτιάχνοντας το δικό μας web archive.

Page 3: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Τι είναι ο παγκόσμιος ιστός;

Ο Παγκόσμιος Ιστός είναι μία τεράστια συλλογή από ψηφιακάέγγραφα (τις ιστοσελίδες), που βρίσκονται αποθηκευμένα σε

υπολογιστές του Διαδικτύου.

Page 4: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Τι είναι ο παγκόσμιος ιστός;

Page 5: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Τι είναι ο παγκόσμιος ιστός;

Page 6: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Τι είναι ο παγκόσμιος ιστός;

Page 7: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Τι υπάρχει στο διαδίκτυο;

Τι ΔΕΝ υπάρχει στο διαδίκτυο;

Page 8: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Γιατί να αποθηκεύσουμε το διαδίκτυο;

1. Ορισμένες ιστοσελίδες περιέχουν μοναδικές πληροφορίες και δεδομένα.– Οι χρήστες δρουν και παίρνουν αποφάσεις με βάση

αυτές τις πληροφορίες.

2. Είναι ζωντανή καταγραφή της σύγχρονης1. Οικονομίας,2. Επιστήμης,3. Πολιτισμού,4. Κοινωνίας.

3. Διαφάνεια και ευθύνη.

Page 9: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Δεν είναι ήδη αποθηκευμένα όλα αυτά;

• Η απάντηση είναι: ΌΧΙ απαραίτητα.• Οι ιστοσελίδες κινδυνεύουν διότι:– Οι οργανισμοί που τις συντηρούν τις κλείνουν,– Οι οργανισμοί που τις συντηρούν παύουν να

υπάρχουν,– Καταστρέφονται λόγω εξωτερικών παραγόντων

(φωτιές, πλημμύρες, κ.α.)– Καταστρέφονται λόγω τεχνικών προβλημάτων– Οι πληροφορίες τους αλλοιώνονται επίτηδες!

Page 10: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Μια εταιρία με 73.000 blogs έκλεισε ξαφνικά

Page 11: Αποθηκεύεται το διαδίκτυο; Web Archiving!

To Yahoo έκλεισε το GEOCITIES

Page 12: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Φυσικές καταστροφές επηρεάζουν το διαδίκτυο

Page 13: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Ιστοσελίδες αλλοιώνονται επίτηδες

Page 14: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Ιστοσελίδες αλλοιώνονται επίτηδες

Page 15: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Σας θυμίζει κάτι αυτό;

Page 16: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Αποθηκεύεται το διαδίκτυο;

• Τι εννοείς;

• Τι είναι το web archiving;

• Η χρήση των web archives στην πράξη.

• Φτιάχνοντας το δικό μας web archive.

Page 17: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Ιστοσελίδες αλλοιώνονται επίτηδες

Page 18: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Web Archiving

MTSR 2013, 22 Nov 2013, Thessaloniki 18

To Internet Archiveέχει κρατήσειαντίγραφα

Page 19: Αποθηκεύεται το διαδίκτυο; Web Archiving!

WEB ARCHIVINGΗ διαδικασία συλλογής και αποθήκευσης τμημάτων του παγκόσμιου ιστού (WWW) με σκοπό την διαφύλαξή τους σε αρχείο για τους μελλοντικούς ερευνητές, ιστορικούς και το κοινό.

The process of collecting portions of the World Wide Web to ensure the information is preserved in an archive for future researchers, historians, and the public.

Page 20: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Προκλήσεις

• Πώς γίνεται τεχνικά;• Τι πρέπει να επιλέξω να αποθηκεύσω;– Ολόκληρο το website, κάποιες σελίδες; Ορισμένα

αρχεία;• Τι θέλω να κάνω με το archive που θα

δημιουργήσω;• Ποιος θα έχει πρόσβαση σε αυτό;• Σε ποιον ανήκει το περιεχόμενο;

Page 21: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Τεχνική πρόκληση η αποθήκευση των ιστοσελίδων

File(s) Software Hardware RECORD

Generic file archiving operation

Page 22: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Τεχνική πρόκληση η αποθήκευση των ιστοσελίδων

File(s)

Software

Hardware Website

File(s)

File(s)

File(s)

File(s)

File(s)

File(s)

Software

Software

Web archiving operation

Page 23: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Πως γίνεται;

• Επιλογή ιστοσελίδων για archiving:– Κρατικές υπηρεσίες, Εκπαιδευτικά ιδρύματα,– Προτάσεις του κοινού, Ιστοσελίδες της επικαιρότητας,– Μέσα ενημέρωσης, Μεγάλες εταιρίες.

Page 24: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Στρατηγικές web archiving

Page 25: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Ποιός ασχολείται με το web archiving;

Δεκάδες οργανισμοί ασχολούνται με το web archiving από το 1996.

Page 26: Αποθηκεύεται το διαδίκτυο; Web Archiving!

International Internet Preservation Consortium

• Μέλη του IIPC– Εθνικές βιβλιοθήκες,– Ακαδημαϊκές βιβλιοθήκες,– Πολιτιστικοί οργανισμοί,– Πανεπιστήμια,– Εταιρίες ανάπτυξης λογισμικού για

archives

• Ιστορική αναδρομή– http://timeline.webarchivists.org/

Page 27: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Υποχρεώση της Εθνικής Βιβλιοθήκης

• Σύμφωνα με την UNESCO:– «μια εθνική βιβλιοθήκη είναι υπεύθυνη για τη

συγκέντρωση και διατήρηση της εθνικής πνευματικής, κυρίως εκδοτικής, παραγωγής προς όφελος των μελλοντικών γενιών».

• Στην Ελλάδα, σύμφωνα με το νόμο N.3149/03:– «οι εκδότες ή οι συγγραφείς, όταν δεν υπάρχει

εκδότης, υποχρεούνται να καταθέτουν τρία αντίτυπα κάθε είδους εντύπων που εκδίδουν στην Ε.Β.Ε. Η υποχρέωση κατάθεσης αφορά επίσης τις οπτικοακουστικές και τις ηλεκτρονικές εκδόσεις σε φυσική μορφή καθώς και τις ηλεκτρονικές εκδόσεις σε μορφή προσβάσιμη μέσω του Διαδικτύου».

• Τι γίνεται με το διαδίκτυο;

Page 28: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Bibliothèque nationale de France

2006: legal deposit extended to “signs, signals, writings, images, sounds or messages of any kind communicated to the public by electronic means”.

The goal is not to gather the «best of the web», but to preserve a collection representative of the webat a certain date.

Page 29: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Αποθηκεύεται το διαδίκτυο;

• Τι εννοείς;

• Τι είναι το web archiving;

• Η χρήση των web archives στην πράξη.

• Φτιάχνοντας το δικό μας web archive.

Page 30: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Επίσκεψη στο Internet Archive

• http://archive.org/

Page 31: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Internet Archive δραστηριότητες

• Βασικές λειτουργίες, πλοήγηση, αναζήτηση.• Ενδεικτικά:– Υπουργείο Παιδείας, 3 Ιουλίου 2010,

www.minedu.gov.gr– Υπουργείο Ανάπτυξης, 21 Δεκεμβρίου 2009

http://www.ypoian.gr/ – The White House, 7 Απριλίου 2000,

http://www.whitehouse.gov– BBC, 11 Σεπτεμβρίου 2001, http://www.bbc.co.uk/

Page 32: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Επίσκεψη στο Archive-It

• http://archive-it.org/

Page 33: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Archive-It δραστηριότητες

• Βασικές λειτουργίες, πλοήγηση αναζήτηση, συλλογές.

• Ενδεικτικά:– Egypt Revolution and politics, American University

in Cairo,

– 2008 Beijing Olympic games,– Lybian Uprisings, University of Michigan,– Venice Biennale 2013

Page 34: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Αποθηκεύεται το διαδίκτυο;

• Τι εννοείς;

• Τι είναι το web archiving;

• Η χρήση των web archives στην πράξη.

• Φτιάχνοντας το δικό μας web archive.

Page 35: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Το εργαλείο HTTrack

http://www.httrack.com

Page 36: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Δημιουργώντας το δικό μας Web Archive

• Χρήση του προγράμματος HTTrack (Open Source)– Εγκατάσταση– Πρακτικές οδηγίες– Λειτουργίες– Παραδείγματα χρήσης• Archive http://2013.futurelibrary.gr/ • Archive http://www.auth.gr/

Page 37: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Θέματα που πρέπει να προσέχουμε

• Βάλτε όρια!– Filters για να ελέγχετε τα αρχεία που θέλετε να αντιγράψετε.– Bandwidth limits & Connection limits για να μην υπερφορτώσετε το

site που αντιγράφετε.– Time limits– Μην υπερφορτώνετε το δίκτυο της βιβλιοθήκης σας.

• Ελέγχετε το μέγεθος των αρχείων που έχετε κατεβάσει.• Ελέγχετε αν επιτρέπεται η αντιγραφή του website. (Copyright)

– Για προσωπική χρήση,– Για δημόσια χρήση στους υπολογιστές της βιβλιοθήκης.

• Αν δεν είστε σίγουροι, ζητήστε την άδεια του ιδιοκτήτη πριν ξεκινήσετε.

Page 38: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Σενάριο δημιουργίας ενός mini web archive στη Βιβλιοθήκη

• Εξοπλισμός:– Ένας τυπικός υπολογιστής με Windows και όσο μεγαλύτερο

σκληρό δίσκο γίνεται. (Πολλά ΤΒ).– Απαραίτητα backup disk (π.χ. USB).– Σύνδεση DSL– HTTRACK open source software

• Επιλογή sites τοπικού ενδιαφέροντος.• Κατάρτιση προγράμματος περιοδικού web archiving

(π.χ. 1 φορά τον μήνα).• Παροχή πρόσβασης στους επισκέπτες της Βιβλιοθήκης.

Page 39: Αποθηκεύεται το διαδίκτυο; Web Archiving!

Ευχαριστώ θερμά

• Ερωτήσεις;

• Περαιτέρω επικοινωνία:– Web: http://vbanos.gr– Email: [email protected]– Twitter: @vbanos