Αλγόριθμος Εκπαίδευσης Νευρωνικού Δικτύου Χωρίς Σφάλματα για Προβλήματα Εντοπισμού Αντικειμένων
Διπλωματική Εργασία


Περιγραφή

Η παρούσα διπλωματική εργασία εστιάζει στις εφαρμογές ενός αλγορίθμου εκπαίδευσης νευρωνικών δικτύων χωρίς σφάλματα (0% loss - training set), του οποίου η μαθηματική απόδειξη θεμελιώθηκε για πρώτη φορά στη δημοσίευση [1]. Στην ίδια δημοσίευση ο αλγόριθμος δοκιμάστηκε με επιτυχία στο σύνολο δεδομένων MNIST.

Η εργασία περιλαμβάνει αρχικά την υλοποίηση του αλγορίθμου σε γλώσσες προγραμματισμού Python και Mojo, κάνοντας παραλλαγές και βελτιστοποιήσεις στην αρχική εκδοχή του κώδικα της δημοσίευσης [1] που γράφτηκε σε Matlab. Η παρούσα υλοποίηση θα δοκιμαστεί σε γνωστά σύνολα δεδομένων για προβλήματα ταξινόμησης, όπως τα MNIST και CIFAR-100, προκειμένου να επιβεβαιωθεί η λειτουργικότητα και η ακρίβειά του. Θα γίνει συγκριτική μελέτη της ταχύτητας και απόδοσης του αλγορίθμου μεταξύ των 3 γλωσσών υλοποίησης.

Έπειτα, θα διερευνηθεί πώς ο συγκεκριμένος αλγόριθμος, μπορεί να εφαρμοστεί και να γενικευθεί για προβλήματα κατάτμησης στιγμιότυπου και εντοπισμού αντικειμένων, που ανήκουν στο επιστημονικό κλάδο της όρασης υπολογιστών. Η υπόθεση εργασίας είναι ότι η μαθηματική απόδειξη του αλγορίθμου της δημοσίευσης [1], επειδή είναι ανεξάρτητη της μετρικής αξιολόγησης των προς εκπαίδευση νευρωνικών δικτύων, οδηγεί στο συμπέρασμα ότι ο αλγόριθμος μπορεί να γενικευθεί και σε προβλήματα με διαφορετικές μετρικές, από αυτές που αξιοποιούνται στα προβλήματα κατηγοριοποίησης (Precision, Recall, F1-score). Η παρούσα διπλωματική θα βασιστεί στην αξιοποίηση υπαρχόντων State of the Art μοντέλων βαθιάς μάθησης. Τελικός στόχο θα είναι η παρουσίαση μιας τεκμηριωμένης μεθοδολογίας για την επεκτασιμότητα του αλγορίθμου σε πιο πολύπλοκα προβλήματα του τομέα της όρασης υπολογιστών.

[1] Deng, Bo. 'Error-free Training for Artificial Neural Network.' arXiv preprint arXiv:2312.16060 (2023)

Επικοινωνία - Πληροφορίες: Παναγιώτης Τσανάκας (panag@cs.ntua.gr), Αθανάσιος Δελής (th.delis@gmail.com).