ΠΡΟΣΟΜΟΙΩΣΗ ΠΟΛΙΤΙΚΩΝ ΣΥΖΗΤΗΣΕΩΝ ΜΕ ΧΡΗΣΗ ΜΕΓΑΛΩΝ ΓΛΩΣΣΙΚΩΝ ΜΟΝΤΕΛΩΝ
Διπλωματική Εργασία
Επιβλέπων | Παναγιώτης Τσανάκας |
---|---|
Συσχετιζόμενο μάθημα | Αλληλεπίδραση Ανθρώπου - Υπολογιστή |
Περιγραφή
ΠΕΡΙΛΗΨΗ: Σκοπός της εργασίας είναι η χρήση μεγάλων γλωσσικών μοντέλων (Large Language Models - LLMs) για την προσομοίωση πολιτικών συζητήσεων.
ΠΛΑΤΦΟΡΜΑ ΕΡΓΑΣΙΑΣ: Java ,Python, βιβλιοθήκες μηχανικής μάθησης
ΣΥΝΤΟΜΗ ΠΕΡΙΓΡΑΦΗ: Οι πρόσφατες εξελίξεις στην επεξεργασία της φυσικής γλώσσας, ειδικά η εμφάνιση των Μεγάλων Γλωσσικών Μοντέλων (LLMs), έχουν ανοίξει νέες δυνατότητες για την κατασκευή υπολογιστικών προσομοιώσεων σχεδιασμένων να αναπαράγουν με ακρίβεια την ανθρώπινη συμπεριφορά.
Στόχος της εργασίας είναι η εκπαίδευση και αξιολόγηση της ικανότητας των LLMs να δημιουργούν πειστικούς και ρεαλιστικούς διαλόγους πάνω σε πολιτικά θέματα, προσφέροντας μια καινοτόμο προσέγγιση στην ανάλυση της πολιτικής επικοινωνίας.
Τα στάδια εκπόνησης της διπλωματικής εργασίας προβλέπονται ως εξής:
- Μελέτη σχετικής βιβλιογραφίας
- ανασκόπηση της σχετικής βιβλιογραφίας σε θέματα επεξεργασίας φυσικής γλώσσας, Μεγάλων Γλωσσικών Μοντέλων, πολιτικής επικοινωνίας και ανάλυσης διαλόγου
- Συλλογή Σωμάτων Κειμένων (Ευρωπαϊκό - Ελληνικό κοινοβούλιο) & Προετοιμασία συνόλου δεδομένων εκπαίδευσης
- Συγκέντρωση κειμένων από διάφορες πηγές, όπως πρακτικά κοινοβουλευτικών συνεδριάσεων (Τα κείμενα θα εστιάζουν σε πολιτικά θέματα και θα περιλαμβάνουν διαλόγους μεταξύ πολιτικών προσώπων).
- Περιλαμβάνει τον καθαρισμό των δεδομένων, την οριοθέτηση των διαλόγων και την μετατροπή τους σε μορφή κατάλληλη για εκπαίδευση
- Εκπαίδευση μοντέλου
- Επιλογή κατάλληλου LLM / Προσαρμογή και βελτιστοποίηση των παραμέτρων του μοντέλου για την καλύτερη απόδοση στα δεδομένα.
- Πειραματική Επαλήθευση αποτελεσμάτων
- Διεξαγωγή πειραμάτων για την αξιολόγηση της ικανότητας του εκπαιδευμένου LLM να παράγει ρεαλιστικούς και πειστικούς πολιτικούς διαλόγους
ΣΧΕΤΙΚΟ ΥΛΙΚΟ
[1]. A Survey of Large Language Models https://arxiv.org/abs/2303.18223
[2]. A Survey on Evaluation of Large Language Models https://dl.acm.org/doi/full/10.1145/3641289
[3]. Lora: Low-rank adaptation of large language models https://arxiv.org/pdf/2106.09685
[4]. Systematic Biases in LLM Simulations of Debates https://arxiv.org/abs/2402.04049
[5]. ParlaMint Corpora https://www.clarin.eu/parlamint
[6]. LegalDocML -σχήμα XML για τη μοντελοποίηση κοινοβουλευτικών, νομοθετικών και δικαστικών εγγράφων https://www.oasisopen.org/committees/tc_home.php?wg_abbrev=legaldocml
Επικοινωνία: Μάριος Κόνιαρης (mkoniari@central.ntua.gr), Μέλος Ε.ΔΙ.Π
Τσανάκας Παναγιώτης (panag@cs.ntua.gr)