Σύγκριση απόδοσης συστημάτων αποθήκευσης μεγάλων δεδομένων
Διπλωματική Εργασία
Επιβλέπων | Παναγιώτης Τσανάκας |
---|---|
Συσχετιζόμενο μάθημα | Λειτουργικά Συστήματα Υπολογιστών |
Περιγραφή
Στόχος Διπλωματικής Εργασίας
Στόχος είναι η εξοικείωση του φοιτητή με διάφορα μέσα αποθήκευσης δεδομένων που χρησιμοποιούνται σε μοντέρνα συστήματα, καθώς και η σύγκρισή τους με πιο παραδοσιακές μεθόδους.
Συνοπτική Περιγραφή Διπλωματικής Εργασίας
Αναζήτηση κάποιου αλγόριθμου μάθησης (της επιλογής του φοιτητή) καθώς και ένα σύνολο δεδομένων στο οποίο αυτός μπορεί να εφαρμοστεί. Ο φοιτητής θα πρέπει να τοποθετήσει τα δεδομένα σε μία πληθώρα συστημάτων αποθήκευσης δεδομένων (S3, HDFS, Elasticsearch, NFS, local-filesystem) και να συγκρίνει πώς η επιλογή του μέσου αποθήκευσης επηρεάζει την ταχύτητα του αλγορίθμου.
Προαπαιτούμενες γνώσεις
Linux, Python
Τύπος
Προγραμματιστική
Στοιχεία Επικοινωνίας
Κολαΐτης Άγγελος, neoaggelos@gmail.com, Διδακτορικός Φοιτητής
Γραφείο 0.03 στο Κτήριο Υπολογιστών (Ισόγειο)
Τσανάκας Παναγιώτης, panag@cs.ntua.gr, Καθηγητής
Ενδεικτική Βιβλιογραφία:
https://phoenixnap.com/kb/what-is-hdfs
https://www.elastic.co/elasticsearch/
http://www.iaeng.org/publication/WCECS2015/WCECS2015_pp814-818.pdf