Εξόρυξη Γνώσης από Δεδομένα


Κωδικός 715
Εξάμηνο Χειμερινό
Ώρες Διδασκαλίας - Ώρες Εργαστηρίου 2 - 1
Διδάσκοντες Γιώργος Στάμου, Ανδρέας-Γεώργιος Σταφυλοπάτης, Γεώργιος Αλεξανδρίδης (Ε.ΔΙ.Π.), Παρασκευή Τζούβελη (Ε.ΔΙ.Π.)

Περιγραφή

Εισαγωγή στην εξόρυξη γνώσης από δεδομένα. Σχετικές τεχνολογίες (Στατιστική, Μηχανική Μάθηση, DBMS, OLAP). Στόχοι και στάδια της εξόρυξης γνώσης. Τεχνικές εξόρυξης γνώσης. Μέθοδοι αναπαράστασης γνώσης. Προεπεξεργασία δεδομένων. Καθαρισμός, μετασχηματισμός και μείωση δεδομένων. Διακριτοποίηση και δημιουργία ιεραρχιών εννοιών. Αναπαράσταση γνώσης. Συνάφεια δεδομένων και προβλήματος, γνώση υποβάθρου, μέτρα ενδιαφέροντος πληροφορίας, αναπαράσταση δεδομένων εισόδου και εξόδου, διερευνητική ανάλυση δεδομένων & τεχνικές οπτικοποίησης. Ανάλυση χαρακτηριστικών. Γενίκευση χαρακτηριστικών, καταλληλότητα χαρακτηριστικών, σύγκριση κλάσεων, στατιστικά μέτρα. Κανόνες συσχέτισης. Κοινά στοιχειοσύνολα, αλγόριθμοι Apriori και FP-growth. Ταξινόμηση. Αλγόριθμος 1R, δέντρα αποφάσεων, ταξινόμηση βασισμένη σε κανόνες. Πρόβλεψη. Μπεϋζιανή ταξινόμηση, Μπεϋζιανά δίκτυα, πρόβλεψη βασισμένη σε στιγμιότυπα (πλησιέστεροι γείτονες). Εκτίμηση απόδοσης. Εκπαίδευση και αξιολόγηση, εκτίμηση ορθότητας, μέθοδοι συνόλων ταξινομητών, περιγραφή ελάχιστου μήκους. Ομαδοποίηση. Κ-μέσοι, DBSCAN, συσσωρευτική ιεραρχική μοντελοποίηση (HAC), αξιολόγηση ποιότητας της ομαδοποίησης. Εφαρμογές της εξόρυξης γνώσης από δεδομένα. Εξόρυξη γνώσης από κείμενα, εξόρυξη γνώσης από τον Παγκόσμιο Ιστό. Εργαλεία, βιβλιοθήκες και υπηρεσίες νέφους για την εξόρυξη γνώσης από δεδομένα.