Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και...

16
WORDNET Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία

description

Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία. WordNet. Σημασιολογικά Δίκτυα. δίκτυο που αναπαριστά σημασιολογικές σχέσεις μεταξύ εννοιών οι κορυφές αναπαριστούν έννοιες και οι ακμές σχέσεις μια μορφή αναπαράστασης γνώσης (knowledge representation). WordNet. - PowerPoint PPT Presentation

Transcript of Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και...

Page 1: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία

WORDNET

Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία

Page 2: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία

δίκτυο που αναπαριστά σημασιολογικές σχέσεις μεταξύ εννοιών

οι κορυφές αναπαριστούν έννοιες και οι ακμές σχέσεις

μια μορφή αναπαράστασης γνώσης (knowledge representation)

Σημασιολογικά Δίκτυα

Page 3: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία
Page 4: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία

δημιουργήθηε στο Πανεπιστήμιο του Princeton το 1985

εποπτεία του Καθ. Ψυχολογίας George A. Miller

τρέχουσα έκδοση 3.0 διανέμεται υπό παραλλαγή της BSD άδειας

χρήσης

WordNet

Page 5: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία

πρόκειται για: μεγάλη λεξικολογική βάση δεδομένων των Αγγλικών

περιέχει: ουσιαστικά, ρήματα, επίθετα, επιρήματα

διπλή φύση: λεξικού και θησαυρού

ομαδοποίηση λέξεων σε: σύνολα συνωνύμων όρων (synsets)

διασύνδεση synsets: εννοιολογική-σημασιολογική ή λεξικολογική σχέση

Εισαγωγή

Page 6: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία

synset (έννοια): ένα σύνολο από συνώνυμες λέξεις ή collocations

(συνδυασμοί λέξεων με ξεχωριστό νόημα) gloss (ορισμός):

σύντομος ορισμός μιας έννοιας

Ορολογία

Page 7: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία

Σημασιολογικές Σχέσεις

ουσιαστικά: υπερωνυμίας: το Y είναι υπερώνυμο του X όταν

κάθε X είναι μέρος του Y υπωνυμίας: το Y είναι υπώνυμο του X όταν κάθε Y

είναι μέρος του Y ολωνυμίας: το Y είναι ολώνυμο του X όταν το X

είναι μέρος του Y μερωνυμίας: το Y είναι μερώνυμο του X όταν το Y

είναι μέρος του X αντίστοιχες σχέσεις υπάρχουν και για τα

ρήματα, επίθετα και επιρήματα

Page 8: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία

Ιεραρχίες

Τα ουσιαστικά και τα ρήματα είναι οργανωμένα σε ιεραρχίες που ορίζονται από τις σχέσεις υπερωνυμίας

Page 9: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία
Page 10: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία
Page 11: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία
Page 12: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία

Στατιστικά

PoS Μοναδικά Λήμματα Synsets Συνολικά ζεύγη λέξεων - εννοιών

Ουσιαστικά 117798 82115 146312

Ρήματα 11529 13767 25047

Επίθετα 21479 18156 30002

Επιρήματα 4481 3621 5580

Σύνολο 155287 117659 206941

Page 13: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία

Σχετικά Projects

σημασιολογικά δίκτυα: σε άλλες γλώσσες (εκτός των αγγλικών)

web interfaces: πρόσβαση μέσω άλλων δικτύων

APIs: σε όλες σχεδόν τις γνωστές γλώσσες (πχ: C#, Java,

MySQL, Perl, PHP, PostgreSQL, Python, Ruby) extentions:

επέκταση των χαρακτηριστικών του ή ενσωμάτωση σε μεγαλύτερα συστήματα

mappings: μεταξύ διαφορετικών εκδόσεων

Page 14: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία

Μετρικές Σημασιολογικής Ομοιότητας

δίνουν την ομοιότητα μεταξύ δύο οποιωνδήποτε όρων ως προς συγκεκριμένες έννοιες

γνωστές μετρικές ομοιότητας: Leacock-Chodorow Similarity Wu-Palmer Similarity Resnik Similarity Jiang-Conrath Similarity Lin Similarity

Page 15: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία

Wu-Palmer Similarity

Συνδυάζει το βάθος ενός ζεύγους εννοιών στο WordNet και το βάθος του LCS (Least Common Subsumer) τους

Page 16: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία

Δικτυακοί Τόποι

WordNet official page: http://wordnet.princeton.edu/

WordNet Wikipedia page: http://en.wikipedia.org/wiki/WordNet

WordNet visualization: http://www.visuwords.com/

WordNet vocabulary helper: http://poets.notredame.ac.jp/cgi-bin/wn