Ενοποιημένη πρόσβαση σε ετερογενή σημασιολογικά δεδομένα
Διπλωματική Εργασία


Επιβλέπων Γιώργος Στάμου
Συσχετιζόμενο μάθημα Συστήματα και Τεχνολογίες Γνώσης

Περιγραφή

Στα πλαίσια του σημασιολογικού Ιστού έχουν αναπτυχθεί πολλά λεξιλόγια (π.χ. DBPedia Ontology, Schema.org, GEMET Thesaurus, MIMO Thesaurus, κοκ.) για τον σημασιολογικό χαρακτηρισμό διαφόρων ειδών περιεχομένου. Τα λεξιλόγια αυτά μπορεί να καλύπτουν είτε ευρείες περιοχές είτε να είναι εξειδικευμένα για κάποιο συγκεκριμένο γνωστικό αντικείμενο. Σε κάθε περίπτωση πολλές φορές μεταξύ των διαφόρων λεξιλογίων υπάρχουν αλληλοεπικαλύψεις με αποτέλεσμα οι ίδιοι ή παρεμφερείς όροι να ορίζονται ως διαφορετικοί σε πολλά διαφορετικά λεξιλόγια. Αν για κάποια εφαρμογή χρησιμοποιείται μόνο ένα λεξιλόγιο τότε δεν δημιουργείται πρόβλημα. Ωστόσο, σε εφαρμογές που συγκεντρώνουν περιεχόμενο από διάφορες εξωτερικές πηγές καθεμία από τις οποίες χρησιμοποιεί ένα ή περισσότερα διαφορετικά λεξιλόγια για τον σημασιολογικό χαρακτηρισμό του περιεχομένου, δημιουργείται η ανάγκη για τη χρήση ενός «ενιαίου» λεξιλογίου, ώστε και οι αλγόριθμοι αναζήτησης να είναι πιο αποτελεσματικοί και ο χρήστης να μπορεί να βλέπει το περιεχόμενο με ενιαίο τρόπο.

Στόχος της διπλωματικής αυτής είναι να διερευνηθούν οι δυνατότητες αυτόματης ή ημιαυτόματης παραγωγής ενός «ενοποιητικού» λεξιλογίου ή ενός «ενοποιητικού» τρόπου πρόσβασης σε δεδομένα που φέρουν σημασιολογικούς χαρακτηρισμούς διαφορετικών λεξιλογίων. Για τον σκοπό αυτό θα χρησιμοποιηθούν εργαλεία αντιστοίχισης και συγχώνευσης λεξιλογίων καθώς και οι πληροφορίες για ισοδύναμους όρους άλλων λεξιλογίων που περιέχουν κάποια λεξιλόγια (π.χ. δηλώσεις sameAs). Τα λεξιλόγια που θα χρησιμοποιηθούν μπορεί να είναι λεξιλόγια SKOS, παραλλαγές τους και όροι οντολογιών OWL. Τελικό ζητούμενο είναι να αναπτυχθεί μια εφαρμογή η οποία θα δέχεται ως είσοδο δύο ή περισσότερα λεξιλόγια και θα υπολογίζει το «ενοποιητικό λεξιλόγιο», ώστε στη συνέχεια να παρέχει ομοιόμορφη πρόσβαση μέσω αυτού του λεξιλογίου σε οποιαδήποτε βάση δεδομένων χρησιμοποιεί τα δεδομένα λεξιλόγια για τον σημασιολογικό χαρακτηρισμό του περιεχομένου.

Για περισσότερες πληροφορίες επικοινωνήστε με τον Γ. Στάμου (τηλ. 7723040, e-mail: gstam at cs.ntua.gr) και τον Αλέξανδρο Χορταρά (τηλ. 7722491, e-mail: achort at cs.ntua.gr).