Σύγκριση απόδοσης συστημάτων αποθήκευσης μεγάλων δεδομένων
Διπλωματική Εργασία


Περιγραφή

Στόχος Διπλωματικής Εργασίας

Στόχος είναι η εξοικείωση του φοιτητή με διάφορα μέσα αποθήκευσης δεδομένων που χρησιμοποιούνται σε μοντέρνα συστήματα, καθώς και η σύγκρισή τους με πιο παραδοσιακές μεθόδους.

Συνοπτική Περιγραφή Διπλωματικής Εργασίας

Αναζήτηση κάποιου αλγόριθμου μάθησης (της επιλογής του φοιτητή) καθώς και ένα σύνολο δεδομένων στο οποίο αυτός μπορεί να εφαρμοστεί. Ο φοιτητής θα πρέπει να τοποθετήσει τα δεδομένα σε μία πληθώρα συστημάτων αποθήκευσης δεδομένων (S3, HDFS, Elasticsearch, NFS, local-filesystem) και να συγκρίνει πώς η επιλογή του μέσου αποθήκευσης επηρεάζει την ταχύτητα του αλγορίθμου.

Προαπαιτούμενες γνώσεις

Linux, Python

Τύπος

Προγραμματιστική

Στοιχεία Επικοινωνίας

Κολαΐτης Άγγελος, neoaggelos@gmail.com, Διδακτορικός Φοιτητής

Γραφείο 0.03 στο Κτήριο Υπολογιστών (Ισόγειο)

Τσανάκας Παναγιώτης, panag@cs.ntua.gr, Καθηγητής

Ενδεικτική Βιβλιογραφία:

https://phoenixnap.com/kb/what-is-hdfs

https://min.io/

https://www.elastic.co/elasticsearch/

http://www.iaeng.org/publication/WCECS2015/WCECS2015_pp814-818.pdf