Βιβλιοθήκη ΟΠΑ - Ψηφιακό Αποθετήριο

ΠΥΞΙΔΑ Ιδρυματικό Αποθετήριο
και Ψηφιακή Βιβλιοθήκη

Όνομα χρήστη
Κωδικός πρόσβασης

Συλλογές :	Ιδρυματικό Αποθετήριο ΟΠΑ / AUEB Institutional Repository Σχολή Επιστημών και Τεχνολογίας της Πληροφορίας / School of Informatics Τμήμα Πληροφορικής / Department of Informatics Μεταπτυχιακές Εργασίες / Postgraduate dissertations

Τίτλος :	Γλωσσική μοντελοποίηση για την απόδοση συγγραφικής πατρότητας σε Ομηρικά κείμενα

Εναλλακτικός τίτλος :	Language modelling for authorship attribution in Homeric texts

Δημιουργός :	Φασόη, Μαρία Fasoi, Maria

Συντελεστής :	Παυλόπουλος, Ιωάννης (Επιβλέπων καθηγητής) Κωνσταντινίδου, Μαρία (Επιβλέπων καθηγητής) Ανδρουτσόπουλος, Ίων (Εξεταστής) Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής (Degree granting institution)

Τύπος :	Text

Φυσική περιγραφή :	71σ.

Γλώσσα :	el

Αναγνωριστικό :	http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=8128

Περίληψη :	Στην παρούσα διπλωματική εργασία εφαρμόστηκαν γλωσσικά μοντέλα, ώστε να μελετηθεί η απόδοση συγγραφικής πατρότητας ομηρικών κειμένων, που κατά την κρατούσα άποψη αποδίδονται στον ποιητή Όμηρο. Για την επίτευξη του σκοπού αυτού εφαρμόστηκαν στατιστικά και νευρωνικά γλωσσικά μοντέλα, τα οποία εκπαιδεύτηκαν στα ομηρικά έπη (Ιλιάδα και Οδύσσεια) και βαθμολογήθηκαν τόσο στα ίδια τα έπη όσο και στους καλούμενους Ομηρικούς ύμνους. Η βαθμολόγηση πραγματοποιήθηκε αφενός μεν μετρώντας με αυτόματο τρόπο τη γλωσσική συγγένεια ενός δείγματος κειμένου με το σύνολο του εκάστοτε γλωσσικού μοντέλου, αφετέρου δε ταξινομώντας αποσπάσματα ομηρικών κειμένων. Με αυτόν τον τρόπο, εντοπίστηκαν αποσπάσματα ομηρικών κειμένων να εμφανίζουν περισσότερη συγγένεια από άλλα αποσπάσματα σε γλωσσικό επίπεδο με το σύνολο των δεδομένων εκπαίδευσης. Πιο συγκεκριμένα, η ραψωδία Ο της Ιλιάδας με το σύνολο του έπους της Ιλιάδας και η ραψωδία β της Οδύσσειας με το συνολικό έπος της Οδύσσειας. Έπειτα, παρατηρήσαμε ότι η ραψωδία δ της Οδύσσειας εμφανίζει περισσότερη γλωσσική ομοιότητα με το έπος της Ιλιάδας και αντίστοιχα η ραψωδία Τ της Ιλιάδας με το έπος της Οδύσσειας. Ακολούθως, μελετήσαμε τη γλωσσική συγγένεια των Ομηρικών ύμνων Εἰς Ἀπόλλωνα, Εἰς Ἀφροδίτην, Εἰς Δημήτραν και Εἰς Ἑρμῆν με τα ομηρικά έπη και καταλήξαμε στο συμπέρασμα ότι ο ύμνος Εἰς Ἀφροδίτην εμφανίζει τη μεγαλύτερη γλωσσική συγγένεια με τα ομηρικά έπη. Τέλος, τα εν λόγω γλωσσικά μοντέλα αντιπαραβλήθηκαν με κρίσεις ανθρώπων-επισημειωτών, ώστε να ερευνηθεί η ικανότητά τους να κατηγοριοποιούν ορθά δοθέντα αποσπάσματα αρχαίων κειμένων στο αντίστοιχο έργο υπαγωγής τους. Συμπεράναμε ότι τα νευρωνικά γλωσσικά μοντέλα μακράς – βραχείας μνήμης δύνανται να ταξινομούν με μεγαλύτερη επιτυχία ομηρικά κείμενα στο αντίστοιχο έργο υπαγωγής τους απ’ ότι τα στατιστικά γλωσσικά μοντέλα και η ανθρώπινη κρίση. In the present thesis, language models were applied in order to study the authorship attribution of Homeric texts, which according to the prevailing view are attributed to the poet Homer. To achieve this goal, statistical and neural language models were applied, which were trained on the Homeric epics (Iliad and Odyssey) and were rated both in the epics themselves and in the so-called Homeric hymns. The grading was performed on the one hand by automatically measuring the linguistic affinity of a sample of text with the whole linguistic model, on the other hand by classifying excerpts from Homeric texts.In this way, excerpts from ancient texts were found to show more affinity than other excerpts at the linguistic level with the set of training data. More specifically, the rhapsody “Ο” of Iliad with the whole epic of the Iliad and the rhapsody “β” of Odyssey with the total epic of Odyssey. Next, we observed that the rhapsody “δ” of Odyssey shows more linguistic resemblance to the epic of Iliad and respectively the rhapsody “Τ” of Iliad to the epic Odyssey. Then, we studied the linguistic affinity of the Homeric hymns “To Apollo”, “To Aphrodite”, “To Demeter” and “To Hermes” with the Homeric epics and concluded that the hymn “To Aphrodite” shows the greatest linguistic affinity with the Homeric epics. Finally, these linguistic models were contrasted with human-annotators interpretation in order to investigate their ability to classify correctly given excerpts of ancient texts into their respective subordinate work. We conclude that neural language models long short- term memory can classify Homeric texts more successfully in their respective subordinate work than statistical language models and human interpretation.

Περίληψη :

Στην παρούσα διπλωματική εργασία εφαρμόστηκαν γλωσσικά μοντέλα, ώστε να μελετηθεί η απόδοση συγγραφικής πατρότητας ομηρικών κειμένων, που κατά την κρατούσα άποψη αποδίδονται στον ποιητή Όμηρο. Για την επίτευξη του σκοπού αυτού εφαρμόστηκαν στατιστικά και νευρωνικά γλωσσικά μοντέλα, τα οποία εκπαιδεύτηκαν στα ομηρικά έπη (Ιλιάδα και Οδύσσεια) και βαθμολογήθηκαν τόσο στα ίδια τα έπη όσο και στους καλούμενους Ομηρικούς ύμνους. Η βαθμολόγηση πραγματοποιήθηκε αφενός μεν μετρώντας με αυτόματο τρόπο τη γλωσσική συγγένεια ενός δείγματος κειμένου με το σύνολο του εκάστοτε γλωσσικού μοντέλου, αφετέρου δε ταξινομώντας αποσπάσματα ομηρικών κειμένων. Με αυτόν τον τρόπο, εντοπίστηκαν αποσπάσματα ομηρικών κειμένων να εμφανίζουν περισσότερη συγγένεια από άλλα αποσπάσματα σε γλωσσικό επίπεδο με το σύνολο των δεδομένων εκπαίδευσης. Πιο συγκεκριμένα, η ραψωδία Ο της Ιλιάδας με το σύνολο του έπους της Ιλιάδας και η ραψωδία β της Οδύσσειας με το συνολικό έπος της Οδύσσειας. Έπειτα, παρατηρήσαμε ότι η ραψωδία δ της Οδύσσειας εμφανίζει περισσότερη γλωσσική ομοιότητα με το έπος της Ιλιάδας και αντίστοιχα η ραψωδία Τ της Ιλιάδας με το έπος της Οδύσσειας. Ακολούθως, μελετήσαμε τη γλωσσική συγγένεια των Ομηρικών ύμνων Εἰς Ἀπόλλωνα, Εἰς Ἀφροδίτην, Εἰς Δημήτραν και Εἰς Ἑρμῆν με τα ομηρικά έπη και καταλήξαμε στο συμπέρασμα ότι ο ύμνος Εἰς Ἀφροδίτην εμφανίζει τη μεγαλύτερη γλωσσική συγγένεια με τα ομηρικά έπη. Τέλος, τα εν λόγω γλωσσικά μοντέλα αντιπαραβλήθηκαν με κρίσεις ανθρώπων-επισημειωτών, ώστε να ερευνηθεί η ικανότητά τους να κατηγοριοποιούν ορθά δοθέντα αποσπάσματα αρχαίων κειμένων στο αντίστοιχο έργο υπαγωγής τους. Συμπεράναμε ότι τα νευρωνικά γλωσσικά μοντέλα μακράς – βραχείας μνήμης δύνανται να ταξινομούν με μεγαλύτερη επιτυχία ομηρικά κείμενα στο αντίστοιχο έργο υπαγωγής τους απ’ ότι τα στατιστικά γλωσσικά μοντέλα και η ανθρώπινη κρίση.
In the present thesis, language models were applied in order to study the authorship attribution of Homeric texts, which according to the prevailing view are attributed to the poet Homer. To achieve this goal, statistical and neural language models were applied, which were trained on the Homeric epics (Iliad and Odyssey) and were rated both in the epics themselves and in the so-called Homeric hymns. The grading was performed on the one hand by automatically measuring the linguistic affinity of a sample of text with the whole linguistic model, on the other hand by classifying excerpts from Homeric texts.In this way, excerpts from ancient texts were found to show more affinity than other excerpts at the linguistic level with the set of training data. More specifically, the rhapsody “Ο” of Iliad with the whole epic of the Iliad and the rhapsody “β” of Odyssey with the total epic of Odyssey. Next, we observed that the rhapsody “δ” of Odyssey shows more linguistic resemblance to the epic of Iliad and respectively the rhapsody “Τ” of Iliad to the epic Odyssey. Then, we studied the linguistic affinity of the Homeric hymns “To Apollo”, “To Aphrodite”, “To Demeter” and “To Hermes” with the Homeric epics and concluded that the hymn “To Aphrodite” shows the greatest linguistic affinity with the Homeric epics. Finally, these linguistic models were contrasted with human-annotators interpretation in order to investigate their ability to classify correctly given excerpts of ancient texts into their respective subordinate work. We conclude that neural language models long short- term memory can classify Homeric texts more successfully in their respective subordinate work than statistical language models and human interpretation.

Λέξη κλειδί :	Ομηρικά έπη Ομηρικοί ύμνοι Επεξεργασία φυσικής γλώσσας Απόδοση συγγραφικής πατρότητας Στατιστικά γλωσσικά μοντέλα Νευρωνικά γλωσσικά μοντέλα μακράς-βραχείας μνήμης Homeric epics Homeric hymns Natural Language Processing (NLP) Authorship attribution Statistical Language Models (SLM) Neural language models Long Short-Term Memory (LSTM)

Λέξη κλειδί :

Ομηρικά έπη
Ομηρικοί ύμνοι
Επεξεργασία φυσικής γλώσσας
Απόδοση συγγραφικής πατρότητας
Στατιστικά γλωσσικά μοντέλα
Νευρωνικά γλωσσικά μοντέλα μακράς-βραχείας μνήμης
Homeric epics
Homeric hymns
Natural Language Processing (NLP)
Authorship attribution
Statistical Language Models (SLM)
Neural language models Long Short-Term Memory (LSTM)

Διαθέσιμο από :	2020-12-01 12:40:27

Ημερομηνία έκδοσης :	20-11-2020

Ημερομηνία κατάθεσης :	2020-12-01 12:40:27

Δικαιώματα χρήσης :	Free access

Άδεια χρήσης :

Αρχείο: Fasoi_2020.pdf

Τύπος: application/pdf

Είσοδος