ΝΟΜΙΚΟ CHATBOT
Διπλωματική Εργασία


Περιγραφή

ΠΕΡΙΛΗΨΗ: Σκοπός της εργασίας είναι η δημιουργία Νομικού Chatbot με χρήση Large Language Models (LLM) και Retrieval-Augmented Generation (RAG).

ΠΛΑΤΦΟΡΜΑ ΕΡΓΑΣΙΑΣ: Python ή Javascript, βιβλιοθήκες μηχανικής μάθησης

ΣΥΝΤΟΜΗ ΠΕΡΙΓΡΑΦΗ: Η ραγδαία πρόοδος της τεχνητής νοημοσύνης και της επεξεργασίας φυσικής γλώσσας έχει δημιουργήσει νέες δυνατότητες για την αυτοματοποίηση και την υποστήριξη νομικών υπηρεσιών.

Σκοπός αυτής της διπλωματικής εργασίας είναι η ανάπτυξη ενός chatbot που παρέχει αξιόπιστες και ενημερωμένες νομικές πληροφορίες και απαντήσεις, σε χρήστες με διαφορετικό επίπεδο νομικής γνώσης, προσομοιώνοντας μια ανθρώπινη συνομιλία.

Τα συστήματα τύπου Chat Bots προσπαθούν να εξυπηρετήσουν τους χρήστες στην ανάκτηση της πληροφορίας που καλύπτει τις ανάγκες τους. Το RAG (Retrieval-Augmented Generation) είναι μια τεχνική που συνδυάζει την ανάκτηση πληροφοριών με την παραγωγή φυσικής γλώσσας για τη δημιουργία απαντήσεων σε ερωτήματα. Αυτή η προσέγγιση βελτιώνει την ικανότητα των Μεγάλων Γλωσσικών Μοντέλων (LLM) να παρέχουν πιο ακριβείς, ενημερωμένες και συγκεκριμένες απαντήσεις, καθώς ενσωματώνει πληροφορίες από γνωσιακές βάσεις κατά τη διαδικασία δημιουργίας των απαντήσεων.

Τα στάδια εκπόνησης της διπλωματικής εργασίας προβλέπονται ως εξής:

  • Μελέτη σχετικής βιβλιογραφίας σε θέματα Μεγάλων Γλωσσικών Μοντέλων, τεχνικών ανάκτησης πληροφορίας και Retrieval Augmented Generation (RAG)
  • Συλλογή Σωμάτων Κειμένων & Προετοιμασία συνόλου δεδομένων εκπαίδευσης
    • Περιλαμβάνει τον καθαρισμό των δεδομένων και την μετατροπή τους σε μορφή κατάλληλη για εκπαίδευση
  • Ανάπτυξη αρχιτεκτονικής και υλοποίηση του chatbot
    • Επιλογή εργαλείων και υποδομών (π.χ. μοντέλα LLM, πλατφόρμες RAG)
    • Επιλογή κατάλληλου LLM / Προσαρμογή και βελτιστοποίηση των παραμέτρων του μοντέλου για την καλύτερη απόδοση στα δεδομένα
  • Πειραματική Επαλήθευση αποτελεσμάτων
    • Ποιοτική και ποσοτική αξιολόγηση της απόδοσης του chatbot μέσω δοκιμαστικών συνομιλιών, ανάλυση ακρίβειας, συνάφειας και πληρότητας των απαντήσεων

Για την υλοποίηση της Δ.Ε., οι υποψήφιοι θα έχουν στην διάθεση τους μέρος της Ελληνικής Νομοθεσίας και Νομολογίας.

ΣΧΕΤΙΚΟ ΥΛΙΚΟ
[1]. A Survey of Large Language Models https://arxiv.org/abs/2303.18223
[2]. A Survey on Evaluation of Large Language Models https://dl.acm.org/doi/full/10.1145/3641289
[3]. Retrieval-Augmented Generation for Large Language Models: A Survey https://arxiv.org/abs/2312.10997
[4]. Benchmarking Large Language Models in Retrieval-Augmented Generation https://doi.org/10.1609/aaai.v38i16.29728
[5]. Improving Access to Justice with Legal Chatbots https://www.mdpi.com/2571-905X/3/3/23

Επικοινωνία: Μάριος Κόνιαρης (mkoniari@central.ntua.gr), Μέλος Ε.ΔΙ.Π

Τσανάκας Παναγιώτης (panag@cs.ntua.gr)