Σύστημα συστάσεων βασισμένο σε γνώση
Διπλωματική Εργασία


Επιβλέπων Γιώργος Στάμου
Συσχετιζόμενο μάθημα Τεχνητή Νοημοσύνη

Περιγραφή

Τα συστήματα συστάσεων έχουν ως βασικό στόχο να προβλέψουν τις προτιμήσεις χρηστών για αντικείμενα, συνήθως με βάση τις προηγούμενες επιλογές τους. Για παράδειγμα, στον διαγωνισμό που οργάνωσε η πλατφόρμα Netflix, δινόταν ένας πίνακας που περιέχει βαθμολογίες που έδωσαν χρήστες σε ταινίες και σκοπός ήταν να γίνει επιτυχής πρόβλεψη για άγνωστες βαθμολογίες (για το σύστημα) που έδωσαν οι χρήστες. Οι περισσότερες διαδικτυακές πλατφόρμες (YouTube, Amazon, Facebook κτλ) χρησιμοποιούν τέτοια συστήματα για να δημιουργούν εξατομικευμένο περιεχόμενο για τους χρήστες τους. Ομοίως, οι μηχανές αναζήτησης χρησιμοποιούν ευρέως τις προηγούμενες επιλογές των χρηστών (clickthrough data) για να ταξινομούν τα αποτελέσματά που εμφανίζουν.

Μία βασική τεχνική που χρησιμοποιούν τα συστήματα συστάσεων είναι αυτή των φίλτρων συνεργασίας ή περιεχομένου (collaborative or content-based filtering), με βάση την οποία συγκρίνουν και ταξινομούν χαρακτηριστικά όμοιων χρηστών ή αντικειμένων, με τεχνικές όπως η παραγοντοποίηση πινάκων, τα νευρωνικά δίκτυα και άλλες. Οι τεχνικές αυτές έχουν πολύ καλά αποτελέσματα όταν υποστηρίζονται από δεδομένα μεγάλου πλήθους όμως σε εξειδικευμένα δεδομένα που το πλήθος των χρηστών είναι πολύ μικρό ή ενδιαφέρεται για εξεζητημένα κριτήρια, αυτά τα συστήματα αντιμετωπίζουν σημαντικά προβλήματα. Επιπλέον, όταν εμφανίζεται ένας νέος χρήστης στο σύστημα, τότε υπάρχει δυσκολία ταξινόμησής του αφού το σύστημα δεν γνωρίζει τίποτα για τις προτιμήσεις του (πρόβλημα ψυχρής εκκίνησης). Για την αντιμετώπιση των προβλημάτων αυτών, τα συστήματα συστάσεων που βασίζονται στη γνώση, χρησιμοποιούν βάσεις γνώσης για να περιορίσουν τα δεδομένα που πιθανά θα ενδιέφεραν ένα συγκεκριμένο χρήστη, αφού αυτός πρώτα επιλέξει επιθυμητά χαρακτηριστικά, με βάση τα οποία ταξινομούνται τα δεδομένα.

Στο πλαίσιο της διπλωματικής εργασίας αυτής θα γίνει ανάπτυξη και υλοποίηση ενός συστήματος συστάσεων σε χρήστες, με χρήση σημασιολογικών δεδομένων, που ταξινομούνται με βάση μία οντολογική γνώση. Οι προτάσεις θα γίνονται πάνω σε συλλογές από στιγμιότυπα και θα αφορούν είτε νέα δεδομένα ή νέα θέματα εμπλουτισμού των συλλογών. Μεθοδολογικά, στο πλαίσιο της εργασίας θα αναπτυχθεί και θα υλοποιηθεί ένας αλγόριθμος κατασκευής και πλοήγησης σε ένα δένδρο ορολογικής ταξινόμησης των σημασιολογικών δεδομένων. Το σύστημα συστάσεων που θα αναπτυχθεί, χρησιμοποιώντας προϋπάρχουσα γνώση, αναμένεται να αντιμετωπίζει καλύτερα το πρόβλημα της ψυχρής εκκίνησης.