ΗΜΜΥ • Διδακτορικές Σπουδές

Στοχαστικές Διεργασίες και Βελτιστοποίηση στη Μηχανική Μάθηση

Κωδικός	722
Εξάμηνο	Εαρινό
Ώρες Διδασκαλίας - Ώρες Εργαστηρίου	2 - 1
Διδάσκοντες	Βασίλειος Μάγκλαρης

Περιγραφή

Επισκόπηση Μηχανικής Μάθησης: Επιβλεπόμενη, μη επιβλεπόμενη, ανταγωνιστική, ενισχυτική μάθηση. Linear & Logistic Regression, προσδιορισμός παραμέτρων Νευρωνικών Δικτύων με επιβλεπόμενη μάθηση, Back-Propagation Algorithm.

Μη Επιβλεπόμενη Μάθηση: K-Means Clustering, Ανάλυση Κυρίων Συνιστωσών (Principal Components Analysis - PCA).

Μηχανική Μάθηση και Βασικές Έννοιες Στατιστικής Μηχανικής: Αλυσίδες Markov, ταξινόμηση καταστάσεων, πιθανότητες μετάβασης, εξισώσεις Chapman-Kolmogorov, επαναληπτικότητα - παροδικότητα, αναλλοίωτες κατανομές, ασυμπτωτική συμπεριφορά. Μέθοδοι Monte Carlo προσομοίωσης αλυσίδων Markov, αλγόριθμος Metropolis-Hastings. Προσομοιωμένη Ανόπτηση (Simulated Annealing), δειγματοληψία Gibbs. Παραγωγικά Μοντέλα Μάθησης (Generative Models), Μηχανή Boltzmann, Restricted Boltzmann Machine (RBM), Δίκτυα Πεποίθησης Μεγάλου Βάθους (Deep Belief Nets-DBN).

Ενισχυτική Μάθηση και Δυναμικός Προγραμματισμός: Διαδικασίες Απόφασης Markov (Markov Decision Processes), κριτήριο βελτιστοποίησης Bellman (Bellman’s Optimality Criterion), αλγόριθμοι βελτιστοποίησης Δυναμικού Προγραμματισμού (Value and Policy Iteration algorithms). Προσεγγιστικές μέθοδοι δυναμικού προγραμματισμού, Q-Learning.

Ενισχυτική Μάθηση για Δρομολόγηση στο Internet: Αλγόριθμος Bellman – Ford, Border Gateway Protocols (BGP).

Εργαστηριακές Ασκήσεις

Στο PC Lab της ΣΗΜΜΥ με χρήση εργαλείων – βιβλιοθηκών Python.

Επιστροφή