Ανοιχτά Δεδομένα | Ρούτσης Φώτιος
-
Upload
resilient-athens -
Category
Data & Analytics
-
view
77 -
download
2
Transcript of Ανοιχτά Δεδομένα | Ρούτσης Φώτιος
Ανοικτά Δεδομένα
Εισαγωγικές ΈννοιεςΡούτσης Φώτιος
Attribution-ShareAlike 4.0 International
Ρούτσης Φώτης
routsis.gr
Οργανισμός Ανοικτών Τεχνολογιών ΕΕΛΛΑΚ
• Ιδρύθηκε το 2008• Μέλη
• 30 Ακαδημαϊκά Ιδρύματα,
Ερευνητικά Κέντρα και
Κοινωφελείς Οργανισμοί
ΕΕΛΛΑΚ
Ανάπτυξη και Προώθηση..
Ανοικτών ΠροτύπωνΑνοικτού ΛογισμικούΑνοικτού ΠεριεχομένουΑνοικτών ΔεδομένωνΑνοικτής ΔιακυβέρνησηςΑνοικτών Εκπαιδευτικών ΠηγώνΑδειών Creative CommonsΤεχνολογιών Ανοικτού Υλικού & Σχεδίων (open hardware & design)
ΕΕΛΛΑΚ
• Δουλεύουμε με το μοντέλο των έργων Ανοικτού
Λογισμικού• Εθελοντές, Συνεργασίες, Ομάδες Εργασίας• Σχεδιασμός, ανάπτυξη και υποστήριξη δράσεων που
αφορούν την ανοικτότητα
Πώς ;
ΕΕΛΛΑΚ
• Εκπαίδευση/Σεμινάρια για τα ανοιχτά δεδομένα• Εκδηλώσεις / Ημερίδες Ενημέρωσης• Προτάσεις Πολιτικής • Πιστοποίηση εκπαιδευτών & δεδομένων• Διεθνείς συνεργασίες: Open Data Institute
Ανοικτά Δεδομένα;
ΕΕΛΛΑΚ
Ιδρύθηκε από• Sir Tim Berners-Lee• Sir Nigel Shadbolt
Non Profit
65 Clifton Street, London, UK
“ We connect, equip and inspire people around the world to innovate with data. ”
Open Data InstituteInventor of the WWW
Open Data Institute
Ανοικτά ;
Ανοικτά Δεδομένα είναι Δεδομένα στα οποία ο καθένας μπορεί να έχει πρόσβαση, να τα χρησιμοποιήσει και τα διαμοιράσει.
- Open Data Institute- http://theodi.org/guide/what-open-data
Introduced in 2015
Ανοικτά Δεδομένα – Γιατί ;
Γιατί τώρα ;
• Νέα ατζέντα
• Πρότυπα και τεχνολογίες
• Βέλτιστες τακτικές και καθοδήγηση
by http://raconteur.net/
Δομημένη πληροφορία, αισθητήρες, συσκευές, ΙοΤ
25 Χρόνια
Το μέλλον ;
Τα τελευταία 25 χρόνια το διαδίκτυο (web of documents) απαριθμείται σε δισεκατομμύρια σελίδες. Ο ιστός των δεδομένων (web of data) θα
είναι κατά πολύ μεγαλύτερος.
Open Data Institute (2015) Open data means business: UK innovation across sectors and regions. London, UK. Available at http://theodi.org/open-data-means-business-uk-innovation-sectors-regions
Annual turnover €130bn 500K employees
Που κινούμαι ;
big data
Big Data
big data
(i) Η διαχείρισή τους απαιτεί ισχυρά εργαλεία και τεχνολογίες
(ii) .. Μεταφορικός όρος για να χαρακτηρίσει ένα δύσκολο πρόβλημα με δεδομένα
Τα έμαθα όλα ;
law and licensing
open datacertificates
open sourceopen standards
data quality
business modeltechnologies
big data
Τα Ανοικτά Δεδομένα που χρησιμοποιούμε θα πρέπει να φέρουν κατάλληλη άδεια χρήσης
Creative Commons
Public DomainOpen Database Licence
…
Γιατί άδεια χρήσης;
Οι άδειες χρήσης επιτρέπουν στον χρήστη να
κατανοεί με σαφήνεια ποιες ενέργειες και
εργασίες μπορεί να εκτελέσει στα δεδομένα
και τα μεταδεδομένα που συνοδεύουν.
https://thomaslevine.com/!/open-data-licensing/p2.png
Τα περισσότερα σετ δεδομένων δεν συνοδεύονται από άδεια χρήσης!
Ανοικτή Άδεια Χρήσης
Μια Ανοικτή Άδεια χρήσης επιτρέπει σε οποιονδήποτε να
έχει πρόσβαση, να χρησιμοποιήσει και να διαμοιράσει
δεδομένα, συμπεριλαμβανομένου εταιρίες που μπορούν να
το χρησιμοποιήσουν για εμπορικά προϊόντα και υπηρεσίες.
Οι Ανοικτές Άδειες ΧρήσηςΕπιτρέπουν• Την αναδημοσίευση των δεδομένων από τρίτους• Παραγωγή νέου περιεχομένου από τα δικά μας δεδομένα• Την παραγωγή χρήματος (εμπορική αξία) από υπηρεσίες που αξιοποιούν τα
δικά μας δεδομένα• Αναδημοσίευση περιεχομένου με χρέωση ποσού (fee)
Υποχρεώνουν • Οι χρήστες θα πρέπει να δηλώνουν την αρχική πηγή (Attribute) των
δεδομένων.• Οι χρήστες θα πρέπει να διανέμουν δεδομένα που παρήχθησαν από τη
επεξεργασία των αρχικών, με την ίδια άδεια χρήσης! (share alike)
Creative Commons
Έχουν αναπτυχθεί από την κοινότητα και δεν ελέγχονται από κάποια κεντρική αρχή.
Creative Commons
Τρία Επίπεδα- Public domain: CC0- Attribution: CC-by- attribution and share alike: CC-by-sa
Creative Commons BY- SA
Μορφότυπα!
Επεξεργασία ;
Έρευνες έχουν δείξει ότι ο καθαρισμός και προετοιμασία των δεδομένων για χρήση από τον καταναλωτή μπορεί να καταλάβει μέχρι και το 80% του συνολικού χρόνου !
Διατίθεται πληθώρα Open Source εργαλείων για τον καθαρισμό, την επεξεργασία και τη δημοσίευση δεδομένων.
Καθαρά & Μηχαναγνώσιμα Δεδομένα
Για την βέλτιστη δυνατή αξιοποίηση των Ανοικτών δεδομένων απαιτείται αυτά να είναι σε μηχαναγνώσιμη μορφή και καθαρά από διπλοεγγραφές και άσχετη πληροφορία
Μορφότυπος / format
Σαφώς προσδιορισμένο και προτυποποιημένο τρόπο κωδικοποίησης ψηφιακής πληροφορίας (για αποστολή ή για αποθήκευση σε αρχείο), έτσι ώστε ο παραλήπτης του μηνύματος να μπορεί να εξάγει την ορθή πληροφορία από αυτό.
Μορφές Ανοικτών Δεδομένων
Μορφότυπα (format) και τεχνολογίες Ανοικτών Δεδομένων ;
Αναγνωρίζετε
κάποια ;
Comma Seperated Values
CSV
eXtensible Markup Language
XML
JavaScript Object Notation
JSON
Resource Description Framework
RDF
SPARQL Queryable
Γεωγραφικά ΔεδομέναΓεωχωρικά Δεδομένα3διάστατες αναπαραστάσεις
KMLSHP
http://www.opengeospatial.org/standards/kml
Shapefile
5 starsΔιαθέσιμα στο διαδίκτυο σε οποιαδήποτε μορφή αλλά με Άδεια χρήσης Ανοικτών Δεδομένων
Διαθέσιμα σε μηχαναγνώσιμη μορφή (πχ excel αντί για σκαναρισμένο έγγραφο)
Χρήση ελεύθερου μορφότυπου (CSV αντί για excel)
χρήση URIs για την επισήμανση των δεδομένων μας (με τα URI να δίνουν πληροφορίες για τα δεδομένα μας)
Όλα τα παραπάνω συν τη διασύνδεση των δεδομένων μας με άλλα δεδομένα (linked data).
Δι@υγεια - API
Από τον Οκτώβριο 2010 αναρτώνται σε ένα σημείο στο διαδίκτυο όλες οι αποφάσεις πράξεων των κυβερνητικών και διοικητικών οργάνων (Νόμος 3861/2010)
https://diavgeia.gov.gr/
Ανοικτά Δεδομένα
Ν. 4305/2014 “Ανοικτή διάθεση και περαιτέρω χρήση εγγράφων, πληροφοριών και δεδομένων του δημόσιου τομέα..”
http://data.gov.gr
Open by Default !!
Tips – Export to CSV!
Tips – Κατάλληλα Δεδομένα
Τα ανοικτά δεδομένα προορίζονται για μηχανική επεξεργασία και δεν είναι απαραίτητο να είναι της ίδιας «εμφάνισης» με αυτά που προορίζονται για ανάγνωση από ανθρώπους.
Tips – Κατάλληλο Έγγραφο
Tips – Όχι τόσο..Κατάλληλο Έγγραφο
Tips – Σημεία προσοχής!
1. Αρχεία Open Format (csv, json, xml..)2. Σύντομοι περιγραφικοί τίτλοι στις ‘στήλες’3. Αποφεύγουμε ελληνικά ονόματα αρχείων4. Συνοδεύουμε αν χρειάζεται με ένα
σύντομο περιγραφικό κείμενο του τι περιέχει η κάθε στήλη και τι αφορά το σετ δεδομένων.
Case Study – Open Data
Ποιος ;
• Mastodon C• Open Health
Care UK
prescribinganalytics.com
Δεδομένα ;
• NHS Information Centre
• 11 εκατομμύρια εγγραφές συνταγών
Σκοπός ;
Θέλησαν να εντοπίσουν την αποτελεσματική η μη συνταγολόγηση φαρμάκων στατινών (statins) στο ΗΒ.
Γενόσημα VS Branded
Αποτέλεσμα ;
£200m θα μπορούσαν να «σωθούν» ..
Διαδικασία ;
H διαδικασία περιελάμβανε • τις συνταγές ανά χημική ουσία από το Σεπτ. 11• Τα γεωγραφικά διαμερίσματα του ΗΒ• Μαθηματική αναγωγή για την εκτίμηση του
κόστους των φαρμάκων.
Εύκολο ;
Κάθε μηνιαίο αρχείο με τις συνταγές που χρησιμοποίησαν ήταν τύπου .CSV και ήταν μεγέθους περίπου 500ΜΒ ..
https://github.com/MastodonC/nhs-prescription-analytics
Ευχαριστώ!
routsis.gr@froutsis