Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και...

Post on 31-Dec-2015

42 views 2 download

description

Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία. WordNet. Σημασιολογικά Δίκτυα. δίκτυο που αναπαριστά σημασιολογικές σχέσεις μεταξύ εννοιών οι κορυφές αναπαριστούν έννοιες και οι ακμές σχέσεις μια μορφή αναπαράστασης γνώσης (knowledge representation). WordNet. - PowerPoint PPT Presentation

Transcript of Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και...

WORDNET

Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία

δίκτυο που αναπαριστά σημασιολογικές σχέσεις μεταξύ εννοιών

οι κορυφές αναπαριστούν έννοιες και οι ακμές σχέσεις

μια μορφή αναπαράστασης γνώσης (knowledge representation)

Σημασιολογικά Δίκτυα

δημιουργήθηε στο Πανεπιστήμιο του Princeton το 1985

εποπτεία του Καθ. Ψυχολογίας George A. Miller

τρέχουσα έκδοση 3.0 διανέμεται υπό παραλλαγή της BSD άδειας

χρήσης

WordNet

πρόκειται για: μεγάλη λεξικολογική βάση δεδομένων των Αγγλικών

περιέχει: ουσιαστικά, ρήματα, επίθετα, επιρήματα

διπλή φύση: λεξικού και θησαυρού

ομαδοποίηση λέξεων σε: σύνολα συνωνύμων όρων (synsets)

διασύνδεση synsets: εννοιολογική-σημασιολογική ή λεξικολογική σχέση

Εισαγωγή

synset (έννοια): ένα σύνολο από συνώνυμες λέξεις ή collocations

(συνδυασμοί λέξεων με ξεχωριστό νόημα) gloss (ορισμός):

σύντομος ορισμός μιας έννοιας

Ορολογία

Σημασιολογικές Σχέσεις

ουσιαστικά: υπερωνυμίας: το Y είναι υπερώνυμο του X όταν

κάθε X είναι μέρος του Y υπωνυμίας: το Y είναι υπώνυμο του X όταν κάθε Y

είναι μέρος του Y ολωνυμίας: το Y είναι ολώνυμο του X όταν το X

είναι μέρος του Y μερωνυμίας: το Y είναι μερώνυμο του X όταν το Y

είναι μέρος του X αντίστοιχες σχέσεις υπάρχουν και για τα

ρήματα, επίθετα και επιρήματα

Ιεραρχίες

Τα ουσιαστικά και τα ρήματα είναι οργανωμένα σε ιεραρχίες που ορίζονται από τις σχέσεις υπερωνυμίας

Στατιστικά

PoS Μοναδικά Λήμματα Synsets Συνολικά ζεύγη λέξεων - εννοιών

Ουσιαστικά 117798 82115 146312

Ρήματα 11529 13767 25047

Επίθετα 21479 18156 30002

Επιρήματα 4481 3621 5580

Σύνολο 155287 117659 206941

Σχετικά Projects

σημασιολογικά δίκτυα: σε άλλες γλώσσες (εκτός των αγγλικών)

web interfaces: πρόσβαση μέσω άλλων δικτύων

APIs: σε όλες σχεδόν τις γνωστές γλώσσες (πχ: C#, Java,

MySQL, Perl, PHP, PostgreSQL, Python, Ruby) extentions:

επέκταση των χαρακτηριστικών του ή ενσωμάτωση σε μεγαλύτερα συστήματα

mappings: μεταξύ διαφορετικών εκδόσεων

Μετρικές Σημασιολογικής Ομοιότητας

δίνουν την ομοιότητα μεταξύ δύο οποιωνδήποτε όρων ως προς συγκεκριμένες έννοιες

γνωστές μετρικές ομοιότητας: Leacock-Chodorow Similarity Wu-Palmer Similarity Resnik Similarity Jiang-Conrath Similarity Lin Similarity

Wu-Palmer Similarity

Συνδυάζει το βάθος ενός ζεύγους εννοιών στο WordNet και το βάθος του LCS (Least Common Subsumer) τους

Δικτυακοί Τόποι

WordNet official page: http://wordnet.princeton.edu/

WordNet Wikipedia page: http://en.wikipedia.org/wiki/WordNet

WordNet visualization: http://www.visuwords.com/

WordNet vocabulary helper: http://poets.notredame.ac.jp/cgi-bin/wn