Σύστημα Διαχείρισης Βάσης Δεδομένων για τη Δημιουργία «Συνόλων Δεδομένων» Αλγορίθμων Μηχανικής Μάθησης– Database Management System for "Machine Learning Datasets” Creation
Διπλωματική Εργασία


Επιβλέπων Ιάκωβος Βενιέρης
Συσχετιζόμενο μάθημα Δίκτυα Ευρείας Ζώνης

Περιγραφή

Σκοπός της διπλωματικής εργασίας είναι η σχεδίαση και ανάπτυξη μίας ολοκληρωμένης εφαρμογής εισαγωγής και ανάκτησης πληροφορίας σε κατάλληλα δομημένη βάση δεδομένων. Η είσοδος της εφαρμογής θα είναι ένα αρχείο (συνήθως φωτογραφίας, ήχου ή κειμένου) που θα παρουσιάζει / εμφανίζει το αντικείμενο και άλλα στοιχεία που χαρακτηρίζουν ένα αντικείμενο (πχ δενδροειδής κατηγοριοποίηση του αντικειμένου, βάρος / όγκος του αντικειμένου, άλλα χαρακτηριστικά του αντικειμένου σε μορφή συμβολοσειράς). Με τη σειρά της η εφαρμογή θα επιλέγει τον τύπο του αρχείου με χρήση μηχανικής μάθησης (file type identification) και θα καταχωρεί στη βάση όλη την πληροφορία εισόδου. Μία επιπλέον λειτουργία της εφαρμογής θα είναι η αναζήτηση και ανάκτηση πληροφοριών από διαδικτυακές βάσεις δεδομένων, προκειμένου να συμπληρώνονται πληροφορίες που χαρακτηρίζουν τα αντικείμενα που θα βρίσκονται αποθηκευμένα στη βάση δεδομένων.

Η βάση θα είναι δομημένη με χρήση οντολογιών για να είναι αποδοτική στην αποθήκευση και την ανάκτηση των πληροφοριών. Αποδοτική αποθήκευση νοείται η αποθήκευση μεγάλου όγκου πληροφοριών σε περιορισμένο χώρο, μιας και τελικός σκοπός είναι η δημιουργία ενός συνόλου δεδομένων που θα μπορεί να χρησιμοποιηθεί από αλγορίθμους μηχανικής μάθησης και το πλήθος των εγγραφών / αντικειμένων που είναι διαθέσιμα σε τέτοιους αλγορίθμους καθορίζει και την αποδοτικότητά τους. Αντίστοιχα, αποδοτική ανάκτηση νοείται η ανάκτηση σε σύντομο χρόνο από τη στιγμή που έγινε το εκάστοτε αίτημα στο σύστημα. Αυτό είναι απαιτητό, λόγω του ότι οι εφαρμογές που θα χρησιμοποιήσουν την πληροφορία μπορεί να εκτελούνται σε πραγματικό χρόνο και δεν είναι επιθυμητός ο μεγάλος χρόνος αναμονής του χρήστη μέχρι να λάβει τα επιθυμητά αποτελέσματα. Το τελικό σύστημα θα αξιολογηθεί με βάση την ικανότητά του να αναγνωρίζει σωστά τον τύπο του αρχείου που θα παρέχετε, όπως επίσης και με την απόδοσή του στην αποθήκευση και την ανάκτηση της πληροφορίας.

Η διπλωματική δίνει την δυνατότητα στον σπουδαστή να ασχοληθεί και να εξοικειωθεί με την ανάπτυξη βάσεων δεδομένων, όπου θα γίνεται η αποθήκευση της διαθέσιμης πληροφορίας και με τη μηχανική μάθηση, εφόσον για να είναι αξιοποιήσιμη η διαθέσιμη πληροφορία απαιτείται η αποθήκευσή της να γίνει σύμφωνα με τις αρχές την μηχανικής μάθησης.

Απαιτούμενες βασικές γνώσεις: Deep Learning frameworks (Tensorflow), Python, Μηχανική Μάθηση, Οντολογίες