Post on 31-Dec-2015
description
WORDNET
Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία
δίκτυο που αναπαριστά σημασιολογικές σχέσεις μεταξύ εννοιών
οι κορυφές αναπαριστούν έννοιες και οι ακμές σχέσεις
μια μορφή αναπαράστασης γνώσης (knowledge representation)
Σημασιολογικά Δίκτυα
δημιουργήθηε στο Πανεπιστήμιο του Princeton το 1985
εποπτεία του Καθ. Ψυχολογίας George A. Miller
τρέχουσα έκδοση 3.0 διανέμεται υπό παραλλαγή της BSD άδειας
χρήσης
WordNet
πρόκειται για: μεγάλη λεξικολογική βάση δεδομένων των Αγγλικών
περιέχει: ουσιαστικά, ρήματα, επίθετα, επιρήματα
διπλή φύση: λεξικού και θησαυρού
ομαδοποίηση λέξεων σε: σύνολα συνωνύμων όρων (synsets)
διασύνδεση synsets: εννοιολογική-σημασιολογική ή λεξικολογική σχέση
Εισαγωγή
synset (έννοια): ένα σύνολο από συνώνυμες λέξεις ή collocations
(συνδυασμοί λέξεων με ξεχωριστό νόημα) gloss (ορισμός):
σύντομος ορισμός μιας έννοιας
Ορολογία
Σημασιολογικές Σχέσεις
ουσιαστικά: υπερωνυμίας: το Y είναι υπερώνυμο του X όταν
κάθε X είναι μέρος του Y υπωνυμίας: το Y είναι υπώνυμο του X όταν κάθε Y
είναι μέρος του Y ολωνυμίας: το Y είναι ολώνυμο του X όταν το X
είναι μέρος του Y μερωνυμίας: το Y είναι μερώνυμο του X όταν το Y
είναι μέρος του X αντίστοιχες σχέσεις υπάρχουν και για τα
ρήματα, επίθετα και επιρήματα
Ιεραρχίες
Τα ουσιαστικά και τα ρήματα είναι οργανωμένα σε ιεραρχίες που ορίζονται από τις σχέσεις υπερωνυμίας
Στατιστικά
PoS Μοναδικά Λήμματα Synsets Συνολικά ζεύγη λέξεων - εννοιών
Ουσιαστικά 117798 82115 146312
Ρήματα 11529 13767 25047
Επίθετα 21479 18156 30002
Επιρήματα 4481 3621 5580
Σύνολο 155287 117659 206941
Σχετικά Projects
σημασιολογικά δίκτυα: σε άλλες γλώσσες (εκτός των αγγλικών)
web interfaces: πρόσβαση μέσω άλλων δικτύων
APIs: σε όλες σχεδόν τις γνωστές γλώσσες (πχ: C#, Java,
MySQL, Perl, PHP, PostgreSQL, Python, Ruby) extentions:
επέκταση των χαρακτηριστικών του ή ενσωμάτωση σε μεγαλύτερα συστήματα
mappings: μεταξύ διαφορετικών εκδόσεων
Μετρικές Σημασιολογικής Ομοιότητας
δίνουν την ομοιότητα μεταξύ δύο οποιωνδήποτε όρων ως προς συγκεκριμένες έννοιες
γνωστές μετρικές ομοιότητας: Leacock-Chodorow Similarity Wu-Palmer Similarity Resnik Similarity Jiang-Conrath Similarity Lin Similarity
Wu-Palmer Similarity
Συνδυάζει το βάθος ενός ζεύγους εννοιών στο WordNet και το βάθος του LCS (Least Common Subsumer) τους
Δικτυακοί Τόποι
WordNet official page: http://wordnet.princeton.edu/
WordNet Wikipedia page: http://en.wikipedia.org/wiki/WordNet
WordNet visualization: http://www.visuwords.com/
WordNet vocabulary helper: http://poets.notredame.ac.jp/cgi-bin/wn