Στοχαστικές Διεργασίες και Βελτιστοποίηση στη Μηχανική Μάθηση
Κωδικός | 722 |
---|---|
Εξάμηνο | Εαρινό |
Ώρες Διδασκαλίας - Ώρες Εργαστηρίου | 2 - 1 |
Διδάσκοντες | Βασίλειος Μάγκλαρης |
Περιγραφή
Επισκόπηση Μηχανικής Μάθησης: Επιβλεπόμενη, μη επιβλεπόμενη, ανταγωνιστική, ενισχυτική μάθηση. Linear & Logistic Regression, προσδιορισμός παραμέτρων Νευρωνικών Δικτύων με επιβλεπόμενη μάθηση, Back-Propagation Algorithm.
Μη Επιβλεπόμενη Μάθηση: K-Means Clustering, Ανάλυση Κυρίων Συνιστωσών (Principal Components Analysis - PCA).
Μηχανική Μάθηση και Βασικές Έννοιες Στατιστικής Μηχανικής: Αλυσίδες Markov, ταξινόμηση καταστάσεων, πιθανότητες μετάβασης, εξισώσεις Chapman-Kolmogorov, επαναληπτικότητα - παροδικότητα, αναλλοίωτες κατανομές, ασυμπτωτική συμπεριφορά. Μέθοδοι Monte Carlo προσομοίωσης αλυσίδων Markov, αλγόριθμος Metropolis-Hastings. Προσομοιωμένη Ανόπτηση (Simulated Annealing), δειγματοληψία Gibbs. Παραγωγικά Μοντέλα Μάθησης (Generative Models), Μηχανή Boltzmann, Restricted Boltzmann Machine (RBM), Δίκτυα Πεποίθησης Μεγάλου Βάθους (Deep Belief Nets-DBN).
Ενισχυτική Μάθηση και Δυναμικός Προγραμματισμός: Διαδικασίες Απόφασης Markov (Markov Decision Processes), κριτήριο βελτιστοποίησης Bellman (Bellman’s Optimality Criterion), αλγόριθμοι βελτιστοποίησης Δυναμικού Προγραμματισμού (Value and Policy Iteration algorithms). Προσεγγιστικές μέθοδοι δυναμικού προγραμματισμού, Q-Learning.
Ενισχυτική Μάθηση για Δρομολόγηση στο Internet: Αλγόριθμος Bellman – Ford, Border Gateway Protocols (BGP).
Εργαστηριακές Ασκήσεις
Στο PC Lab της ΣΗΜΜΥ με χρήση εργαλείων – βιβλιοθηκών Python.