ΗΛΕΚΤΡΟΝΙΚΗ ΥΠΗΡΕΣΙΑ ΠΑΡΟΧΗΣ ΜΕΘΟΔΩΝ ΓΙΑ ΤΗΝ ΜΕΤΡΗΣΗ ΤΗΣ ΑΝΑΓΝΩΣΙΜΟΤΗΤΑΣ ΕΛΛΗΝΙΚΩΝ ΚΕΙΜΕΝΩΝ
Διπλωματική Εργασία
Επιβλέπων | Παναγιώτης Τσανάκας |
---|---|
Συσχετιζόμενο μάθημα | Τεχνολογίες Υπηρεσιών Λογισμικού |
Περιγραφή
ΠΕΡΙΛΗΨΗ: Σκοπός της εργασίας είναι η υλοποίηση υπηρεσίας μέσω διαδικτύου για την παροχή μεθόδων μέτρησης αναγνωσιμότητας Ελληνικών κειμένων.
ΠΛΑΤΦΟΡΜΑ ΕΡΓΑΣΙΑΣ: JavaScript, Java ,Python, Βιβλιοθήκες μηχανικής μάθησης, web application framework
ΣΥΝΤΟΜΗ ΠΕΡΙΓΡΑΦΗ: Με τον όρο αναγνωσιμότητα περιγράφουμε το πόσο εύκολα η δύσκολα γίνεται κατανοητό ένα κείμενο. Η αναγνωσιμότητα ενός κειμένου εξαρτάται από διάφορους παράγοντες, όπως η συνοχή της σύνταξης, η χρήση δύσκολων λέξεων και η δομή του κειμένου. Η μέτρηση αναγνωσιμότητας κειμένων αναφέρεται στον υπολογισμό της δυσκολίας ενός κειμένου και της ευκολίας που έχει ο αναγνώστης να το κατανοήσει. Οι μέθοδοι μέτρησης αναγνωσιμότητας παραδοσιακά βασίζονται είτε σε απλά μαθηματικά κριτήρια, όπως ο αριθμός των λέξεων ανά πρόταση, ο αριθμός των συλλαβών ανά λέξη, ο μέσος όρος συλλαβών ανά λέξη κ.λπ. ή σε στατιστική ανάλυση, δηλαδή στην ανάλυση των συντακτικών και λεξιλογικών χαρακτηριστικών του κειμένου. Τα τελευταία χρόνια, μοντέλα μηχανικής μάθησης έχουν προταθεί στην βιβλιογραφία για την πρόβλεψη της δυσκολίας ανάγνωσης ενός κειμένου.
Σκοπός της εργασίας είναι η δημιουργία ηλεκτρονικής υπηρεσίας που θα παρέχει μεθόδους για την μέτρηση της αναγνωσιμότητας Ελληνικών κειμένων και θα υποδεικνύει επίσης ποια μέρη ενδέχεται να προκαλέσουν δυσκολίες στον αναγνώστη.
Τα στάδια εκπόνησης της διπλωματικής εργασίας προβλέπονται ως εξής:
• Συλλογή Σωμάτων Κειμένων και Επισημείωση (annotation).
• Εξαγωγή λεξιλογικών, συντακτικών και μορφολογικών χαρακτηριστικών από τα κείμενα.
• Επιλογή και Υλοποίηση μεθόδων μέτρησης αναγνωσιμότητας
• Εκπαίδευση μοντέλων βαθιάς μηχανικής μάθησης για τη μέτρηση της αναγνωσιμότητας (BERT / Chat-GPT)
• Πειραματική Επαλήθευση αποτελεσμάτων
• Σχεδιασμός και Υλοποίηση API
• Σχεδιασμός και Υλοποίηση υπηρεσίας
ΣΧΕΤΙΚΟ ΥΛΙΚΟ
[1]. Λογισμικό αναγνωσιμότητας του Κέντρου Ελληνικής Γλώσσας https://www.greek-language.gr/certification/readability/index.html
[2]. Ablesbarkeitsmesser: A System for Assessing the Readability of German Text https://doi.org/10.1007/978-3-031-28241-6_28
[3]. Supervised and Unsupervised Neural Approaches to Text Readability https://aclanthology.org/2021.cl-1.6/
[4]. Automatic Readability Assessment of German Sentences with Transformer Ensembles https://aclanthology.org/2022.germeval-1.10
[5]. Universal Dependencies for Greek https://aclanthology.org/W17-0413.pdf
Επικοινωνία: Μάριος Κόνιαρης (mkoniari@central.ntua.gr), Μέλος Ε.ΔΙ.Π
Τσανάκας Παναγιώτης (panag@cs.ntua.gr)