Ανάπτυξη Μηχανισμών Αυτόματης Εξαγωγής και Κατηγοριοποίησης Αναφορών σε Νομικά Κείμενα
Διπλωματική Εργασία


Περιγραφή

Περίληψη: Σκοπός της εργασίας είναι η μελέτη και ανάπτυξη μηχανισμών αυτόματης εξαγωγής, κατηγοριοποίησης και ανάκτησης συσχετίσεων με βάση αναφορές σε κείμενα νομικής φύσης

Πλατφόρμα Εργασίας: JavaScript, Java/ Python, Regular expressions

Σύντομη Περιγραφή: Η αναφορά είναι μια διευκρίνιση που επιτρέπει τον εντοπισμό ενός παραθέματος, τη μνεία ενός έργου ή μέρους έργου που έχει σχέση με το αντικείμενο του κειμένου ή την παραπομπή, μέσα στο ίδιο κείμενο ή σε υποσημειώσεις. Οι αναφορές που απαντώνται στα νομικά κείμενα ακολουθούν μια αυστηρή δομή, γεγονός που επιτρέπει την αυτόματη εξαγωγή τους με βάση ένα σύνολο κανόνων [1]. (Οι αποκλίσεις από τις επίσημες κατευθυντήριες γραμμές αποτελούν αξιοπρόσεκτη εξαίρεση π.χ., αλλαγές στα πρότυπα αναφοράς με την πάροδο του χρόνου, ανθρώπινος παράγοντας κλπ.)

Προς την κατεύθυνση αυτή, ανίχνευση και επίλυση αναφορών, η ΕΕ παρέχει το εργαλείο ανοιχτού λογισμικού Ref2Link, το οποίο υποστηρίζει τον πολυγλωσσικό εντοπισμό των νομικών πράξεων εντός της ΕΕ και χρησιμοποιεί τα πρότυπα αναπαράστασης νομικής πληροφορίας ELI και ECLI. Το αντικείμενο της διπλωματικής είναι η κατασκευή ενός συστήματος που θα επιτρέπει την αυτόματη συσχέτιση κειμένων με βάση τις αναφορές που περιέχουν. Δεδομένα εισόδου για το σύστημα θα είναι κείμενα νομικής φύσεως, νομοθεσία και νομολογία (δικαστικές αποφάσεις), σε μορφή κειμένου. Το σύστημα θα πρέπει να ανιχνεύει σε αυτά τις αναφορές που απαντώνται, όπως αναφορές στην νομοθεσία της Ελλάδος/ Ευρωπαϊκής Ένωσης, αναφορές σε Δικαστικές Αποφάσεις, βιβλιογραφικές αναφορές κτλ. Εν συνεχεία οι αναφορές αυτές θα κατηγοριοποιούνται κατάλληλα και θα εντοπίζεται το αναφερόμενο κείμενο. Το αρχικό και το αναφερόμενο κείμενο θα τροποποιούνται καταλλήλως για να συμπεριλάβουν τις ανιχνευμένες αναφορές (πχ προσθήκη υπερσυνδέσμου με anchor html tag). Για τα ζητούμενα της διπλωματικής έχει ήδη γίνει προηγούμενη εργασία τόσο σε ερευνητικό επίπεδο όσο και σε επίπεδο κώδικα. Τα αποτελέσματα αυτά μπορούν να επαναχρησιμοποιηθούν/ επεκταθούν, όπως και το εργαλείο Ref2Link.

Τα στάδια εκπόνησης της διπλωματικής εργασίας προβλέπονται ως εξής:

  • Διερεύνηση και Κατηγοριοποίηση των Αναφορών.
  • Εντοπισμός και Εξαγωγή Αναφορών
  • Ανάκτηση Αναφορών
  • Γραφική Απεικόνιση Αναφορών
  • Πειραματική Επαλήθευση αποτελεσμάτων (Δείκτες precision, recall)

Σχετικό Υλικό:

  1. Γενική Γραμματεία Της Κυβέρνησης - Εγχειρίδιο οδηγιών για την κωδικοποίηση της νομοθεσίας http://www.ggk.gov.gr/wp-content/uploads/2010/02/teliko_egxeiridio_odigion_gia_tin_kodikopoiisi_tis_nomothesias.pdf
  2. Ref2Link https://ec.europa.eu/isa2/solutions/ref2link_en
  3. ELI https://op.europa.eu/el/web/eu-vocabularies/eli
  4. ECLI https://data.europa.eu/data/datasets/european-case-law-identifier-ecli

Επικοινωνία: Μάριος Κόνιαρης (mkoniari@central.ntua.gr), Μέλος Ε.ΔΙ.Π

Τσανάκας Παναγιώτης (panag@cs.ntua.gr)