με θέμα:

21
1 Τμήμα Αρχειονομίας – Βιβλιοθηκονομίας Ιόνιο Πανεπιστήμιο Πρόγραμμα Μεταπτυχιακών Σπουδών « Εισαγωγή στην Επιστήμη της Πληροφόρησης» Εκπόνηση εργασίας στο μάθημα: «ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ» με θέμα: ¨Κατασκευή Ψηφιακών Βιβλιοθηκών για επιστημονικά στοιχεία: Μια Διερευνητική Μελέτη των Πρακτικών Δεδομένων στην Οικολογία Βιότοπων¨ (Building Digital Libraries for Scientific Data: An Exploratory Study of Data Practices in Habitat Ecology) Δήμου Παρασκευή Φεβρουάριος 2007

description

Τμήμα Αρχειονομίας – Βιβλιοθηκονομίας Ιόνιο Πανεπιστήμιο Πρόγραμμα Μεταπτυχιακών Σπουδών « Εισαγωγή στην Επιστήμη της Πληροφόρησης» Εκπόνηση εργασίας στο μάθημα: «ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ». με θέμα: - PowerPoint PPT Presentation

Transcript of με θέμα:

1

Τμήμα Αρχειονομίας – ΒιβλιοθηκονομίαςΙόνιο Πανεπιστήμιο

Πρόγραμμα Μεταπτυχιακών Σπουδών

« Εισαγωγή στην Επιστήμη της Πληροφόρησης»

Εκπόνηση εργασίας στο μάθημα:«ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ»

με θέμα:¨Κατασκευή Ψηφιακών Βιβλιοθηκών για επιστημονικά στοιχεία: Μια

Διερευνητική Μελέτη των Πρακτικών Δεδομένων στην Οικολογία Βιότοπων¨

(Building Digital Libraries for Scientific Data: An Exploratory Study of Data Practices in Habitat Ecology)

Δήμου Παρασκευή

Φεβρουάριος 2007

2

Περίληψη

Τα δεδομένα αποτελούν το επιστημονικό κεφάλαιο, οι ψηφιακές βιβλιοθήκες γίνονται πολυτιμότερες

Δημιουργία εργαλείων και υπηρεσιών Αντίληψη των πρακτικών δεδομένων των επιστημόνων

διερευνητική μελέτη για τους βιότοπους των οικολόγων (επιστημόνων) στο Εθνικό Ίδρυμα Επιστήμης (National Science Foundation/NSF) και το Center for Embedded Networked Sensing (CENS)

οι επιστήμονες είναι προθυμότεροι να μοιραστούν τα δεδομένα που δημοσιεύθηκαν ήδη από τα δεδομένα που προγραμματίζουν να δημοσιεύσουν, και είναι προθυμότεροι να μοιραστούν τα δεδομένα από όργανα παρά δεδομένα συλλεγμένα με το χέρι.

3

Εισαγωγή:

Η χρήση του “cyberinfrastructure” να διευκολύνει

διανεμημένα, τις επιτακτικές

πληροφορίες τα ευαίσθητα δεδομένα κ την συνεργατική έρευνα

Η έρευνα σε όλα τα επίπεδα γίνεται με ευαίσθητα δεδομένα και συνεργασίες,

Η δυνατότητα να μοιραστούν τα δεδομένα γίνεται ακόμα πιο επιτακτική

Οι ψηφιακές βιβλιοθήκες είναι απαραίτητες στην προσπάθεια του cyberinfrastructure

Η οικολογία βιότοπων αντιμετωπίζει τον επικείμενο κατακλυσμό δεδομένων καθώς επεκτείνονται οι ενοργανωμένοι μέθοδοι δίκτυα αισθητήρων (sensor

networks)

4

Cyberinfrastructure Ο cyberinfrastructure είναι ο όρος που

χρησιμοποιήθηκε από το Εθνικό Ίδρυμα Επιστήμης (National Science Foundation/NSF) και από άλλους για να περιγράψουν τους πόρους της τεχνολογίας πληροφόρησης, οι οποίοι χρησιμοποιούνται από ερευνητές, κλινικούς ερευνητές, μηχανικούς, καλλιτέχνες, γενικότερα από τους αποκαλουμένους «επιστήμονες», με σκοπό να δημιουργήσουν νέα γνώση.

Ο cyberinfrastructure είναι η συνεργασία οργάνων, αισθητήρων, υπολογιστικών συστημάτων μεγάλης απόδοσης, συστημάτων αποθήκευσης μεγάλου όγκου δεδομένων, πόρων δεδομένων και δυνατοτήτων απεικόνισης, που συνδέονται άρρηκτα με δίκτυα υψηλών ταχυτήτων και λειτουργούν με πολύ ανεπτυγμένα λογισμικά.

Αυτός ο όρος εσωκλείει ανθρώπους, διαδικασίες, εκπαίδευση, ασφάλεια, πολιτικές και δυνατότητες που συνεχίζουν να υπάρχουν με το πέρας του χρόνου.

5

Ερευνητική περιοχή

Δίδεται η ευκαιρία να μελετηθούν οι επιστημονικές πρακτικές δεδομένων και να δημιουργηθεί αρχιτεκτονική ψηφιακών βιβλιοθηκών προκειμένου να υποστηριχθεί η χρήση και η επαναχρησιμοποίηση των ερευνητικών δεδομένων.

Οι στόχοι του CENS είναι να αναπτυχθούν, και να εφαρμοστούν σε διαφορετικά επίπεδα, καινοτόμα ασύρματα δίκτυα αισθητήρων.

Οι επιστήμονες του CENS ερευνούν τις θεμελιώδεις ιδιότητες αυτών των συστημάτων σχεδιάζουν και αναπτύσσουν νέες τεχνολογίες εξερευνούν νέες επιστημονικές και εκπαιδευτικές εφαρμογές.

6

Ιστορικό: Οι ψηφιακές βιβλιοθήκες δεδομένων και ο

κατακλυσμός δεδομένων Οι νέες τεχνολογίες για τη συλλογή δεδομένων: οδηγούν στην παραγωγή

δεδομένων, σε μεγάλα ποσοστά

Οι επιστήμονες αδυνατούν: να αναλύσουν να ερμηνεύσουν να βγάλουν συμπεράσματα

βοήθεια να προσδιορίσουν να επιλέξουν τα δεδομένα για

την τωρινή χρήση για να συντηρήσουν τα

δεδομένα μακροπρόθεσμα.

Ένα αποτελεσματικό cyberinfrastructure: είναι αυτό που παρέχει στις

διανεμημένες κοινότητες- επιστημονικές και μη - την συνεχή πρόσβαση στα διανεμημένα δεδομένα και το λογισμικό που είναι συνήθως διαφανές, ασφαλές, και μόνιμο

7

Ποικιλία Δεδομένων CENS

Sensor Collected Application Data

Sensor CollectedProprioceptive Data

Sensor Collected

Performance Data

Hand Collected Application Data

Flow

Water depthAmmonium

AmmoniaPhosphate

Water temp

pH

Temperature

Conductivity

Chlorophyll

GPS/location

Time

Sap flow

CO2

Humidity

Rainfall

Packets transmitted

Packets received

ORP

PARMotor speed

Rudder angle

Heading

Roll/pitch/yaw

Soil moisture

Nitrate

CalciumChloride

Water potentialWind speed

Wind direction

Wind durationLeaf wetness

Routing table

Neighbor table

Fault detection

Awake time

Organism presence

Organism concentration

Battery voltage

Mercury

Methylmercury

Nutrient concentration

Nutrient presence

LandSat imagesMosscam

CDOM

Bird calls

8

Πρακτικές Διαχείρισης Δεδομένων

η αυτοματοποιημένη παραγωγή δεδομένων και η εργαστηριακή προετοιμασία,

οι ερευνητές λιγότερο πιθανό να διανέμουν τα δεδομένα.

η συλλογή και η ανάλυση δεδομένων τουλάχιστον αυτοματοποιημένες και κυρίως εργαστηριακές οι ερευνητές πιθανότερο να περιφρουρήσουν τα δεδομένα τους.

Τέτοιες συμπεριφορές αποτελούν τροχοπέδη στους επιστημονικούς κλάδους και δεν αρμόζουν στην επιστήμη.

9

Δεδομένα και πρακτικές οικολογίας βιότοπων

Η μελέτη της βιοποικιλότητας και των οικοσυστημάτων είναι μια σύνθετη διεπιστημονική περιοχή.

Τα συστήματα διαχείρισης δεδομένων για την οικολογική έρευνα έχουν εξελιχθεί από μεγάλα έργα, όπως: το Διεθνές Βιολογικό Πρόγραμμα (International Biological Program/IBP,

καθιερωμένο το 1964 από το Διεθνές Συμβούλιο των Επιστημονικών Ενώσεων),

το Πρόγραμμα Άτομο και Βιόσφαιρα (Man and the Biosphere/MAB, καθιερωμένο το 1971 από τα Ηνωμένα Έθνη)

το Αμερικάνικο Μακροπρόθεσμο Οικολογικό και Ερευνητικό πρόγραμμα (Long-term Ecological Research Program/LTER καθιερωμένο το 1980 από το Εθνικό Ίδρυμα Επιστήμης)

Το Δίκτυο Γνώσης για τη Biocomplexity (Knowledge Network for Biocomplexity/ KNB), [http://knb.ecoinformatics.org/], ένα χρηματοδοτημένο πρόγραμμα από το Εθνικό Ίδρυμα Επιστήμης

Η Οικολογική Γλώσσα Μεταδεδομένων (Ecological Metadata Language/

EML).

10

Υποδομή των πληροφοριών: προκλήσεις

Καταστήσουν τα επιστημονικά στοιχεία διαθέσιμα Επιστημονική κοινότητα Εκπαιδευτική κοινότητα

Διαχειριστούν τα επιστημονικά στοιχεία από τους αισθητήρες με πολλαπλούς τρόπους Ρέοντα στοιχεία Αρχειοθετημένα στοιχεία Κανονικές εξαρτήσεις αισθητήρων για τη βραχυπρόθεσμη συλλογή

δεδομένων Εξυπηρετήσουν τους πολλαπλούς επιστημονικούς τομείς, τα

προβλήματα και τα προγράμματα Βιολόγοι βιότοπων, περιβαλλοντικοί μηχανικοί, θαλάσσιοι βιολόγοι Μηχανικοί, επιστήμονες υπολογιστών, roboticists

Εξυπηρετήσουν τις διαφορετικές κοινότητες χρηστών με τα διαφορετικά διοικητικά πρότυπα δεδομένων Επιστήμονες, εσωτερικούς και διεθνείς Σπουδαστές και καθηγητές

11

Ερευνητικές ερωτήσεις εξετάζουν τα αρχικά στάδια του κύκλου ζωής των δεδομένων συλλέγονται καθαρίζονται,

αναλύονται, δημοσιεύονται,και γίνονται προσιτά. Χαρακτηριστικά δεδομένων:

Ποια δεδομένα παράγονται; Σε ποιον ανήκουν αυτά τα δεδομένα; Σε ποιον είναι αυτά τα δεδομένα χρήσιμα;

Διανομή δεδομένων: Πότε οι επιστήμονες θα μοιραστούν τα δεδομένα; Με ποιους θα μοιραστούν τα δεδομένα; Ποια είναι τα κριτήρια για τη διανομή; Ποιος μπορεί να εγκρίνει τη διανομή;

Πολιτική δεδομένων: Ποιες είναι οι δίκαιες πολιτικές για την παροχή της πρόσβασης σε αυτά τα δεδομένα; Ποιοι έλεγχοι, αποκλεισμοί, περιορισμοί χρήσης, ή άλλοι περιορισμοί απαιτούνται για να

βεβαιώσουν τη νομιμότητα της πρόσβασης και της χρήσης; Ποια πρότυπα δημοσίευσης των δεδομένων είναι τα κατάλληλα;

Αρχιτεκτονική δεδομένων: Ποια εργαλεία δεδομένων απαιτούνται κατά την διάρκεια του ερευνητικού σχεδίου; Ποια εργαλεία απαιτούνται για τη συλλογή και την απόκτηση δεδομένων; Ποια εργαλεία απαιτούνται για την ανάλυση δεδομένων; Ποια εργαλεία απαιτούνται για την δημοσίευση των δεδομένων; Ποια πρότυπα δεδομένων χρησιμοποιούν οι επιστήμονες που παράγουν την ανάγκη για

δεδομένα; Ποια πρότυπα δεδομένων χρειάζονται άλλοι για να χρησιμοποιήσουν τα δεδομένα;

12

Ερευνητική Μέθοδος

να καταλάβουν τις πρακτικές δεδομένων και τις λειτουργικές απαιτήσεις

να προσδιορίσουν που η αρχιτεκτονική συναντά την πολιτική

συνεντεύξεις συμμετεχόντων με σκοπό να συζητήσουν

την πολιτική διανομής των δεδομένων αναπτύξανε τις ερωτήσεις συνέντευξης για τα κίνητρα των

συμμετεχόντων, την κατανόηση των κινήτρων της κοινότητάς τους, τα εργαλεία που χρησιμοποιούνται στην καθημερινή εργασία, τους τρόπους που διαιρούν την εργασία, τις σχέσεις δύναμης εντός της

κοινότητάς και τους κανόνες για την κοινότητα

13

Αποτελέσματα (1/4)

έλλειψη στα καθιερωμένα πρότυπα για τη διαχείριση των δεδομένων αισθητήρων, συγκεκριμένα εκείνων που υποστηρίζουν τη διανομή δεδομένων μεταξύ των συναδέλφων

πρόθυμοι να συνεργαστούν μαζί επειδή χρειάζονται τα εργαλεία για να συλλάβουν, διαχειριστούν, και να μοιραστούν τα δεδομένα αισθητήρων αποτελεσματικότερα, αποδοτικότερα και ευκολότερα

να αξιολογήσει κανείς τις εμπειρίες των επιστημόνων με

την εφαρμογή αυτών των εργαλείων και των προτύπων και να αξιολογήσει τη χρησιμότητα αυτών των εργαλείων

14

Αποτελέσματα (2/4)Διανομή Δεδομένων

χρήσιμα σχόλια : οι επιστήμονες τι

δεδομένα θα μοιραστούν πότε, με ποιόν και με ποια κριτήρια

η προθυμία να μοιραστεί δεδομένα επηρεάζεται επίσης από την προσπάθεια που απαιτείται να συλλέξει δεδομένα.

τα συλλεγμένα με το χέρι δεδομένα του είναι πολυτιμότερα από τα δεδομένα που παράγονται με όργανα:

μια ηθική και επιστημονική ευθύνη να καθαρίσουν το σύνολο των δεδομένων, γεγονός που συνιστά την επιστημονική αξία τους

δεν σκέφτηκαν ότι τα δεδομένα τους θα ήταν χρήσιμα σε άλλους ερευνητές

15

Αποτελέσματα (3/4)Πολιτική Δεδομένων

Ποιες είναι κατάλληλες πολιτικές για την εξισορρόπηση των δικαιωμάτων και αρμοδιοτήτων για την πρόσβαση στα στοιχεία CENS

Τα πνευματικά δικαιώματα στις δημοσιεύσεις είναι ένα κοινό ζήτημα στην έρευνα.

Σε περιπτώσεις όπου η ενοργάνωση είναι ουσιαστική στη συλλογή δεδομένων, ερωτήματα προκύπτουν μερικές φορές ως προς το εάν οι άνθρωποι της τεχνικής υποστήριξης πρέπει να είναι συντάκτες.

… οι συνεργάτες της τεχνικής υποστήριξης παίρνουν μια αναγνώριση… αλλά δεν είναι ομο-συντάκτες σε μια επιστημονική δημοσίευση.

16

Αποτελέσματα (4/4)Αρχιτεκτονική Δεδομένων

Ο σχεδιασμός εργαλείων για την υποστήριξη της απόκτησης δεδομένων, της διαχείρισης, και

αρχειοθέτησης Ερευνητικός σχεδιασμός και

έλεγχος υπόθεσης έναν χάρτη της ερευνητικής περιοχής Πίνακας δεδομένων από κάθε αισθητήρα

Εξετάζουν τον εξοπλισμό και επιλέγουν την ποιότητα των παρατηρήσεων από τους αισθητήρες πριν αρχίζουν οποιαδήποτε πραγματική «επιστήμη».

Συλλογή και απόκτηση δεδομένων απροθυμία να λάβουν τις σειρές

δεδομένων κατ' ευθείαν από τους αισθητήρες χωρίς κατάλληλα εργαλεία για να αξιολογήσουν την καθαρότητα των δεδομένων

Απλές και διαφανείς μεθόδους για να βρουν τα πιθανά κενά στα δεδομένα

Ανάλυση δεδομένων Καθαρισμός

Προτίμηση γραφικών παραστάσεων

Έλεγχος έκδοσης Πολλαπλές εκδόσεις συνόλων

δεδομένων περιπλέκουν την ανάκτηση για τους δημιουργούς ή και για τους μελλοντικούς χρήστες

Εργαλεία Προτίμηση λογιστικών φύλλων excel Οι στήλες και οι πίνακες επιτρέπουν

στον επιστήμονα να προσδιορίσει τα κενά στα δεδομένα και να καθορίσει πώς να τα καθαρίσει

17

• Real time access to archived data and models

• Combine system filtering with manual identification, verification, context, sample collection

• Guide node placement, data collection, system debugging

Transform physical observations from batch to interactive process

Daily Average Temperature(Geostatistical Analyst)

Aspect(Spatial Analyst)

Slope(Spatial Analyst)

Elevation(Calculated from Contour)

Aerial Photograph(10.16cm/pixels)

Hourly Temperature for June 5 2004

0.000

5.000

10.000

15.000

20.000

25.000

30.000

0.000 5.000 10.000 15.000 20.000 25.000 30.000

Hour

Tem

pera

ture

Series1

Series2

Series3

Series4

Series5

Series6

Series7

Series8

Series9

Series10

Series11

Series12

Series13

Series14

Series15

Series16

Series17

Series18

Series19

Series20

3D Images

Graphs

Interactive data access and visualization in the field

18

Συμπεράσματα 1/2

συλλογική εργασία πολύ πιο αργή από την μεμονωμένη εργασία λόγω της προσπάθειας που περιλαμβάνεται στην εκμάθηση μιας κοινής γλώσσας και στην εύρεση κοινού εδάφους στα ερευνητικά ενδιαφέροντα.

πολλά από τα προβλήματα με τον καθαρισμό των δεδομένων και την αξιοπιστία των αισθητήρων, λόγω του ανώριμου σταδίου των οργάνων και των δικτύων.

ερευνητές εξέφρασαν την ευθύνη να επιβεβαιώσουν ότι οποιαδήποτε κοινά δεδομένα θα πρέπει να είναι τεκμηριωμένα αρκετά για να ερμηνευθούν σωστά.

ποιος ελέγχει τα δεδομένα από το πρόγραμμα, και ποιος έχει τα πρώτα πνευματικά δικαιώματα.

19

Συμπεράσματα 2/2

Τα εργαλεία απεικόνισης στον τομέα αυτό μπορεί να είναι λιγότερο χρήσιμα από ότι αναμενόταν, δεδομένου ότι αυτοί οι επιστήμονες θέλουν να πάρουν τα δεδομένα στα δικά τους εξοικειωμένα εργαλεία.

Η γρήγορη διαμόρφωση πρότυπων πηγών των δεδομένων στον επιστημονικό τομέα είναι μια ουσιαστική απαίτηση

Οι περισσότερες από τις ανωτέρω απαιτήσεις προτείνουν τα εργαλεία που επεξεργάζονται με το χέρι δεδομένα για αυτή την επιστημονική κοινότητα

20

Προβληματισμοί

μακροπρόθεσμος στόχος εξελικτικά εργαλεία διευκόλυνση στη διανομή και τη διόρθωση των επιστημονικών

δεδομένων Με τη βοήθεια των υπαρχουσών γλωσσών μεταδεδομένων (EML)

να αντιληφθεί η επιστημονική κοινότητα ότι η διαχείριση μεταδεδομένων είναι τα δεδομένα από κάθε αισθητήρα δικτύου, διανεμημένα στο πλαίσιο εργασίας της επιστημονικής έρευνας

Συζήτηση για απελευθέρωση περιορισμών Συζήτηση αναφορικά με την

υπεύθυνη χρήση των δεδομένων

21

Ευχαριστώ για την προσοχή σας!!!