Αποθηκεύεται το διαδίκτυο; Web Archiving!

Post on 29-Jun-2015

361 views 3 download

description

1. Τι εννοείς; 2. Τι είναι το web archiving; 3. H χρήση των web archives στην πράξη. 4. Φτιάχνοντας το δικό μας web archive.

Transcript of Αποθηκεύεται το διαδίκτυο; Web Archiving!

Αποθηκεύεται το διαδίκτυο;

Βαγγέλης Μπάνοςhttp://vbanos.gr/

WEB ARCHIVING

Unconference, 9-10 Δεκεμβρίου 2013

Αποθηκεύεται το διαδίκτυο;

• Τι εννοείς;

• Τι είναι το web archiving;

• Η χρήση των web archives στην πράξη.

• Φτιάχνοντας το δικό μας web archive.

Τι είναι ο παγκόσμιος ιστός;

Ο Παγκόσμιος Ιστός είναι μία τεράστια συλλογή από ψηφιακάέγγραφα (τις ιστοσελίδες), που βρίσκονται αποθηκευμένα σε

υπολογιστές του Διαδικτύου.

Τι είναι ο παγκόσμιος ιστός;

Τι είναι ο παγκόσμιος ιστός;

Τι είναι ο παγκόσμιος ιστός;

Τι υπάρχει στο διαδίκτυο;

Τι ΔΕΝ υπάρχει στο διαδίκτυο;

Γιατί να αποθηκεύσουμε το διαδίκτυο;

1. Ορισμένες ιστοσελίδες περιέχουν μοναδικές πληροφορίες και δεδομένα.– Οι χρήστες δρουν και παίρνουν αποφάσεις με βάση

αυτές τις πληροφορίες.

2. Είναι ζωντανή καταγραφή της σύγχρονης1. Οικονομίας,2. Επιστήμης,3. Πολιτισμού,4. Κοινωνίας.

3. Διαφάνεια και ευθύνη.

Δεν είναι ήδη αποθηκευμένα όλα αυτά;

• Η απάντηση είναι: ΌΧΙ απαραίτητα.• Οι ιστοσελίδες κινδυνεύουν διότι:– Οι οργανισμοί που τις συντηρούν τις κλείνουν,– Οι οργανισμοί που τις συντηρούν παύουν να

υπάρχουν,– Καταστρέφονται λόγω εξωτερικών παραγόντων

(φωτιές, πλημμύρες, κ.α.)– Καταστρέφονται λόγω τεχνικών προβλημάτων– Οι πληροφορίες τους αλλοιώνονται επίτηδες!

Μια εταιρία με 73.000 blogs έκλεισε ξαφνικά

To Yahoo έκλεισε το GEOCITIES

Φυσικές καταστροφές επηρεάζουν το διαδίκτυο

Ιστοσελίδες αλλοιώνονται επίτηδες

Ιστοσελίδες αλλοιώνονται επίτηδες

Σας θυμίζει κάτι αυτό;

Αποθηκεύεται το διαδίκτυο;

• Τι εννοείς;

• Τι είναι το web archiving;

• Η χρήση των web archives στην πράξη.

• Φτιάχνοντας το δικό μας web archive.

Ιστοσελίδες αλλοιώνονται επίτηδες

Web Archiving

MTSR 2013, 22 Nov 2013, Thessaloniki 18

To Internet Archiveέχει κρατήσειαντίγραφα

WEB ARCHIVINGΗ διαδικασία συλλογής και αποθήκευσης τμημάτων του παγκόσμιου ιστού (WWW) με σκοπό την διαφύλαξή τους σε αρχείο για τους μελλοντικούς ερευνητές, ιστορικούς και το κοινό.

The process of collecting portions of the World Wide Web to ensure the information is preserved in an archive for future researchers, historians, and the public.

Προκλήσεις

• Πώς γίνεται τεχνικά;• Τι πρέπει να επιλέξω να αποθηκεύσω;– Ολόκληρο το website, κάποιες σελίδες; Ορισμένα

αρχεία;• Τι θέλω να κάνω με το archive που θα

δημιουργήσω;• Ποιος θα έχει πρόσβαση σε αυτό;• Σε ποιον ανήκει το περιεχόμενο;

Τεχνική πρόκληση η αποθήκευση των ιστοσελίδων

File(s) Software Hardware RECORD

Generic file archiving operation

Τεχνική πρόκληση η αποθήκευση των ιστοσελίδων

File(s)

Software

Hardware Website

File(s)

File(s)

File(s)

File(s)

File(s)

File(s)

Software

Software

Web archiving operation

Πως γίνεται;

• Επιλογή ιστοσελίδων για archiving:– Κρατικές υπηρεσίες, Εκπαιδευτικά ιδρύματα,– Προτάσεις του κοινού, Ιστοσελίδες της επικαιρότητας,– Μέσα ενημέρωσης, Μεγάλες εταιρίες.

Στρατηγικές web archiving

Ποιός ασχολείται με το web archiving;

Δεκάδες οργανισμοί ασχολούνται με το web archiving από το 1996.

International Internet Preservation Consortium

• Μέλη του IIPC– Εθνικές βιβλιοθήκες,– Ακαδημαϊκές βιβλιοθήκες,– Πολιτιστικοί οργανισμοί,– Πανεπιστήμια,– Εταιρίες ανάπτυξης λογισμικού για

archives

• Ιστορική αναδρομή– http://timeline.webarchivists.org/

Υποχρεώση της Εθνικής Βιβλιοθήκης

• Σύμφωνα με την UNESCO:– «μια εθνική βιβλιοθήκη είναι υπεύθυνη για τη

συγκέντρωση και διατήρηση της εθνικής πνευματικής, κυρίως εκδοτικής, παραγωγής προς όφελος των μελλοντικών γενιών».

• Στην Ελλάδα, σύμφωνα με το νόμο N.3149/03:– «οι εκδότες ή οι συγγραφείς, όταν δεν υπάρχει

εκδότης, υποχρεούνται να καταθέτουν τρία αντίτυπα κάθε είδους εντύπων που εκδίδουν στην Ε.Β.Ε. Η υποχρέωση κατάθεσης αφορά επίσης τις οπτικοακουστικές και τις ηλεκτρονικές εκδόσεις σε φυσική μορφή καθώς και τις ηλεκτρονικές εκδόσεις σε μορφή προσβάσιμη μέσω του Διαδικτύου».

• Τι γίνεται με το διαδίκτυο;

Bibliothèque nationale de France

2006: legal deposit extended to “signs, signals, writings, images, sounds or messages of any kind communicated to the public by electronic means”.

The goal is not to gather the «best of the web», but to preserve a collection representative of the webat a certain date.

Αποθηκεύεται το διαδίκτυο;

• Τι εννοείς;

• Τι είναι το web archiving;

• Η χρήση των web archives στην πράξη.

• Φτιάχνοντας το δικό μας web archive.

Επίσκεψη στο Internet Archive

• http://archive.org/

Internet Archive δραστηριότητες

• Βασικές λειτουργίες, πλοήγηση, αναζήτηση.• Ενδεικτικά:– Υπουργείο Παιδείας, 3 Ιουλίου 2010,

www.minedu.gov.gr– Υπουργείο Ανάπτυξης, 21 Δεκεμβρίου 2009

http://www.ypoian.gr/ – The White House, 7 Απριλίου 2000,

http://www.whitehouse.gov– BBC, 11 Σεπτεμβρίου 2001, http://www.bbc.co.uk/

Επίσκεψη στο Archive-It

• http://archive-it.org/

Archive-It δραστηριότητες

• Βασικές λειτουργίες, πλοήγηση αναζήτηση, συλλογές.

• Ενδεικτικά:– Egypt Revolution and politics, American University

in Cairo,

– 2008 Beijing Olympic games,– Lybian Uprisings, University of Michigan,– Venice Biennale 2013

Αποθηκεύεται το διαδίκτυο;

• Τι εννοείς;

• Τι είναι το web archiving;

• Η χρήση των web archives στην πράξη.

• Φτιάχνοντας το δικό μας web archive.

Το εργαλείο HTTrack

http://www.httrack.com

Δημιουργώντας το δικό μας Web Archive

• Χρήση του προγράμματος HTTrack (Open Source)– Εγκατάσταση– Πρακτικές οδηγίες– Λειτουργίες– Παραδείγματα χρήσης• Archive http://2013.futurelibrary.gr/ • Archive http://www.auth.gr/

Θέματα που πρέπει να προσέχουμε

• Βάλτε όρια!– Filters για να ελέγχετε τα αρχεία που θέλετε να αντιγράψετε.– Bandwidth limits & Connection limits για να μην υπερφορτώσετε το

site που αντιγράφετε.– Time limits– Μην υπερφορτώνετε το δίκτυο της βιβλιοθήκης σας.

• Ελέγχετε το μέγεθος των αρχείων που έχετε κατεβάσει.• Ελέγχετε αν επιτρέπεται η αντιγραφή του website. (Copyright)

– Για προσωπική χρήση,– Για δημόσια χρήση στους υπολογιστές της βιβλιοθήκης.

• Αν δεν είστε σίγουροι, ζητήστε την άδεια του ιδιοκτήτη πριν ξεκινήσετε.

Σενάριο δημιουργίας ενός mini web archive στη Βιβλιοθήκη

• Εξοπλισμός:– Ένας τυπικός υπολογιστής με Windows και όσο μεγαλύτερο

σκληρό δίσκο γίνεται. (Πολλά ΤΒ).– Απαραίτητα backup disk (π.χ. USB).– Σύνδεση DSL– HTTRACK open source software

• Επιλογή sites τοπικού ενδιαφέροντος.• Κατάρτιση προγράμματος περιοδικού web archiving

(π.χ. 1 φορά τον μήνα).• Παροχή πρόσβασης στους επισκέπτες της Βιβλιοθήκης.

Ευχαριστώ θερμά

• Ερωτήσεις;

• Περαιτέρω επικοινωνία:– Web: http://vbanos.gr– Email: vbanos@gmail.com– Twitter: @vbanos