Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

57
Ανοικτά Δεδομένα Εισαγωγικές Έννοιες Ρούτσης Φώτιος Attribution-ShareAlike 4.0 International

Transcript of Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Page 1: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Ανοικτά Δεδομένα

Εισαγωγικές ΈννοιεςΡούτσης Φώτιος

Attribution-ShareAlike 4.0 International

Page 2: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Ρούτσης Φώτης

routsis.gr

Page 3: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Οργανισμός Ανοικτών Τεχνολογιών ΕΕΛΛΑΚ

• Ιδρύθηκε το 2008• Μέλη

• 30 Ακαδημαϊκά Ιδρύματα,

Ερευνητικά Κέντρα και

Κοινωφελείς Οργανισμοί

ΕΕΛΛΑΚ

Page 4: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Ανάπτυξη και Προώθηση..

Ανοικτών ΠροτύπωνΑνοικτού ΛογισμικούΑνοικτού ΠεριεχομένουΑνοικτών ΔεδομένωνΑνοικτής ΔιακυβέρνησηςΑνοικτών Εκπαιδευτικών ΠηγώνΑδειών Creative CommonsΤεχνολογιών Ανοικτού Υλικού & Σχεδίων (open hardware & design)

ΕΕΛΛΑΚ

Page 5: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

• Δουλεύουμε με το μοντέλο των έργων Ανοικτού

Λογισμικού• Εθελοντές, Συνεργασίες, Ομάδες Εργασίας• Σχεδιασμός, ανάπτυξη και υποστήριξη δράσεων που

αφορούν την ανοικτότητα

Πώς ;

ΕΕΛΛΑΚ

Page 6: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

• Εκπαίδευση/Σεμινάρια για τα ανοιχτά δεδομένα• Εκδηλώσεις / Ημερίδες Ενημέρωσης• Προτάσεις Πολιτικής • Πιστοποίηση εκπαιδευτών & δεδομένων• Διεθνείς συνεργασίες: Open Data Institute

Ανοικτά Δεδομένα;

ΕΕΛΛΑΚ

Page 7: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Ιδρύθηκε από• Sir Tim Berners-Lee• Sir Nigel Shadbolt

Non Profit

65 Clifton Street, London, UK

“ We connect, equip and inspire people around the world to innovate with data. ”

Open Data InstituteInventor of the WWW

Open Data Institute

Page 8: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Ανοικτά ;

Page 9: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Ανοικτά Δεδομένα είναι Δεδομένα στα οποία ο καθένας μπορεί να έχει πρόσβαση, να τα χρησιμοποιήσει και τα διαμοιράσει.

- Open Data Institute- http://theodi.org/guide/what-open-data

Introduced in 2015

Page 10: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Ανοικτά Δεδομένα – Γιατί ;

Page 11: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Γιατί τώρα ;

• Νέα ατζέντα

• Πρότυπα και τεχνολογίες

• Βέλτιστες τακτικές και καθοδήγηση

Page 12: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

by http://raconteur.net/

Page 13: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Δομημένη πληροφορία, αισθητήρες, συσκευές, ΙοΤ

25 Χρόνια

Το μέλλον ;

Τα τελευταία 25 χρόνια το διαδίκτυο (web of documents) απαριθμείται σε δισεκατομμύρια σελίδες. Ο ιστός των δεδομένων (web of data) θα

είναι κατά πολύ μεγαλύτερος.

Page 14: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Open Data Institute (2015) Open data means business: UK innovation across sectors and regions. London, UK. Available at http://theodi.org/open-data-means-business-uk-innovation-sectors-regions

Annual turnover €130bn 500K employees

Page 15: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος
Page 16: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος
Page 17: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος
Page 18: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος
Page 19: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος
Page 20: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Που κινούμαι ;

big data

Page 21: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Big Data

big data

(i) Η διαχείρισή τους απαιτεί ισχυρά εργαλεία και τεχνολογίες

(ii) .. Μεταφορικός όρος για να χαρακτηρίσει ένα δύσκολο πρόβλημα με δεδομένα

Page 22: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Τα έμαθα όλα ;

law and licensing

open datacertificates

open sourceopen standards

data quality

business modeltechnologies

big data

Page 23: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Τα Ανοικτά Δεδομένα που χρησιμοποιούμε θα πρέπει να φέρουν κατάλληλη άδεια χρήσης

Creative Commons

Public DomainOpen Database Licence

Page 24: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Γιατί άδεια χρήσης;

Οι άδειες χρήσης επιτρέπουν στον χρήστη να

κατανοεί με σαφήνεια ποιες ενέργειες και

εργασίες μπορεί να εκτελέσει στα δεδομένα

και τα μεταδεδομένα που συνοδεύουν.

Page 25: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

https://thomaslevine.com/!/open-data-licensing/p2.png

Τα περισσότερα σετ δεδομένων δεν συνοδεύονται από άδεια χρήσης!

Page 26: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Ανοικτή Άδεια Χρήσης

Μια Ανοικτή Άδεια χρήσης επιτρέπει σε οποιονδήποτε να

έχει πρόσβαση, να χρησιμοποιήσει και να διαμοιράσει

δεδομένα, συμπεριλαμβανομένου εταιρίες που μπορούν να

το χρησιμοποιήσουν για εμπορικά προϊόντα και υπηρεσίες.

Page 27: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Οι Ανοικτές Άδειες ΧρήσηςΕπιτρέπουν• Την αναδημοσίευση των δεδομένων από τρίτους• Παραγωγή νέου περιεχομένου από τα δικά μας δεδομένα• Την παραγωγή χρήματος (εμπορική αξία) από υπηρεσίες που αξιοποιούν τα

δικά μας δεδομένα• Αναδημοσίευση περιεχομένου με χρέωση ποσού (fee)

Υποχρεώνουν • Οι χρήστες θα πρέπει να δηλώνουν την αρχική πηγή (Attribute) των

δεδομένων.• Οι χρήστες θα πρέπει να διανέμουν δεδομένα που παρήχθησαν από τη

επεξεργασία των αρχικών, με την ίδια άδεια χρήσης! (share alike)

Page 28: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Creative Commons

Έχουν αναπτυχθεί από την κοινότητα και δεν ελέγχονται από κάποια κεντρική αρχή.

Page 29: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Creative Commons

Τρία Επίπεδα- Public domain: CC0- Attribution: CC-by- attribution and share alike: CC-by-sa

Page 30: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Creative Commons BY- SA

Page 31: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Μορφότυπα!

Page 32: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Επεξεργασία ;

Έρευνες έχουν δείξει ότι ο καθαρισμός και προετοιμασία των δεδομένων για χρήση από τον καταναλωτή μπορεί να καταλάβει μέχρι και το 80% του συνολικού χρόνου !

Διατίθεται πληθώρα Open Source εργαλείων για τον καθαρισμό, την επεξεργασία και τη δημοσίευση δεδομένων.

Page 33: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Καθαρά & Μηχαναγνώσιμα Δεδομένα

Για την βέλτιστη δυνατή αξιοποίηση των Ανοικτών δεδομένων απαιτείται αυτά να είναι σε μηχαναγνώσιμη μορφή και καθαρά από διπλοεγγραφές και άσχετη πληροφορία

Page 34: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Μορφότυπος / format

Σαφώς προσδιορισμένο και προτυποποιημένο τρόπο κωδικοποίησης ψηφιακής πληροφορίας (για αποστολή ή για αποθήκευση σε αρχείο), έτσι ώστε ο παραλήπτης του μηνύματος να μπορεί να εξάγει την ορθή πληροφορία από αυτό.

Page 35: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Μορφές Ανοικτών Δεδομένων

Μορφότυπα (format) και τεχνολογίες Ανοικτών Δεδομένων ;

Αναγνωρίζετε

κάποια ;

Page 36: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Comma Seperated Values

CSV

Page 37: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

eXtensible Markup Language

XML

Page 38: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

JavaScript Object Notation

JSON

Page 39: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Resource Description Framework

RDF

SPARQL Queryable

Page 40: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Γεωγραφικά ΔεδομέναΓεωχωρικά Δεδομένα3διάστατες αναπαραστάσεις

KMLSHP

http://www.opengeospatial.org/standards/kml

Shapefile

Page 41: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος
Page 42: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

5 starsΔιαθέσιμα στο διαδίκτυο σε οποιαδήποτε μορφή αλλά με Άδεια χρήσης Ανοικτών Δεδομένων

Διαθέσιμα σε μηχαναγνώσιμη μορφή (πχ excel αντί για σκαναρισμένο έγγραφο)

Χρήση ελεύθερου μορφότυπου (CSV αντί για excel)

χρήση URIs για την επισήμανση των δεδομένων μας (με τα URI να δίνουν πληροφορίες για τα δεδομένα μας)

Όλα τα παραπάνω συν τη διασύνδεση των δεδομένων μας με άλλα δεδομένα (linked data).

Page 43: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Δι@υγεια - API

Από τον Οκτώβριο 2010 αναρτώνται σε ένα σημείο στο διαδίκτυο όλες οι αποφάσεις πράξεων των κυβερνητικών και διοικητικών οργάνων (Νόμος 3861/2010)

https://diavgeia.gov.gr/

Page 44: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Ανοικτά Δεδομένα

Ν. 4305/2014 “Ανοικτή διάθεση και περαιτέρω χρήση εγγράφων, πληροφοριών και δεδομένων του δημόσιου τομέα..”

http://data.gov.gr

Open by Default !!

Page 45: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Tips – Export to CSV!

Page 46: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Tips – Κατάλληλα Δεδομένα

Τα ανοικτά δεδομένα προορίζονται για μηχανική επεξεργασία και δεν είναι απαραίτητο να είναι της ίδιας «εμφάνισης» με αυτά που προορίζονται για ανάγνωση από ανθρώπους.

Page 47: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Tips – Κατάλληλο Έγγραφο

Page 48: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Tips – Όχι τόσο..Κατάλληλο Έγγραφο

Page 49: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Tips – Σημεία προσοχής!

1. Αρχεία Open Format (csv, json, xml..)2. Σύντομοι περιγραφικοί τίτλοι στις ‘στήλες’3. Αποφεύγουμε ελληνικά ονόματα αρχείων4. Συνοδεύουμε αν χρειάζεται με ένα

σύντομο περιγραφικό κείμενο του τι περιέχει η κάθε στήλη και τι αφορά το σετ δεδομένων.

Page 50: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Case Study – Open Data

Page 51: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Ποιος ;

• Mastodon C• Open Health

Care UK

prescribinganalytics.com

Page 52: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Δεδομένα ;

• NHS Information Centre

• 11 εκατομμύρια εγγραφές συνταγών

Page 53: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Σκοπός ;

Θέλησαν να εντοπίσουν την αποτελεσματική η μη συνταγολόγηση φαρμάκων στατινών (statins) στο ΗΒ.

Γενόσημα VS Branded

Page 54: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Αποτέλεσμα ;

£200m θα μπορούσαν να «σωθούν» ..

Page 55: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Διαδικασία ;

H διαδικασία περιελάμβανε • τις συνταγές ανά χημική ουσία από το Σεπτ. 11• Τα γεωγραφικά διαμερίσματα του ΗΒ• Μαθηματική αναγωγή για την εκτίμηση του

κόστους των φαρμάκων.

Page 56: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Εύκολο ;

Κάθε μηνιαίο αρχείο με τις συνταγές που χρησιμοποίησαν ήταν τύπου .CSV και ήταν μεγέθους περίπου 500ΜΒ ..

https://github.com/MastodonC/nhs-prescription-analytics

Page 57: Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Ευχαριστώ!

routsis.gr@froutsis