ΠΥΞΙΔΑ Ιδρυματικό Αποθετήριο
και Ψηφιακή Βιβλιοθήκη
Συλλογές :

Τίτλος :Capturing temporal patterns in deliberations and discussions
Εναλλακτικός τίτλος :Ανίχνευση μοτίβων σε διαβουλεύσεις και συζητήσεις
Δημιουργός :Μπαλής, Ραφαήλ
Mpalis, Rafail
Συντελεστής :Pavlopoulos, Ioannis (Επιβλέπων καθηγητής)
Stafylakis, Themos (Εξεταστής)
Vassalos, Vasilios (Εξεταστής)
Athens University of Economics and Business, Department of Informatics (Degree granting institution)
Τύπος :Text
Φυσική περιγραφή :66p.
Γλώσσα :en
Αναγνωριστικό :http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=11758
Περίληψη :Η παρούσα διπλωματική εργασία διερευνά καινοτόμες προσεγγίσεις για τη σύνοψη και την απεικόνιση σχολίων (αναρτήσεων) από διαδικτυακές συζητήσεις και αξιολογήσεις, χρησιμοποιώντας έναν συνδυασμό παραδοσιακών μεθόδων μηχανικής μάθησης και Μεγάλων Γλωσσικών Μοντέλων γνωστά και ως “LLMs”. Η έρευνα επικεντρώνεται σε μεθόδους που περιλαμβάνουν ομαδοποίηση βάσει χρονικής σήμανσης, συσταδοποίηση, εξαγωγή θεμάτων και σύνοψη βάσει ετικετών (labeling), με στόχο τη βελτίωση της επεξεργασίας διαδικτυακών συζητήσεων ή σχολίων χρηστών. Εφαρμόζοντας αυτές τις μεθόδους σε διάφορα σύνολα δεδομένων, αξιολογούμε την απόδοσή τους χρησιμοποιώντας μετρικές όπως BLEU, ROUGE και BERTscore. Τα αποτελέσματα καταδεικνύουν την αποτελεσματικότητα των μοντέλων “Transformer”, ιδιαίτερα όταν συνδυάζονται με προηγμένες τεχνικές Μηχανικής Μάθησης, στη δημιουργία συνεκτικών και ακριβών συνοψίσεων. Η μελέτη αυτή συμβάλλει στην ανάπτυξη αποδοτικών αυτοματοποιημένων τεχνικών σύνοψης, προσφέροντας πολύτιμες γνώσεις για εφαρμογές σε πραγματικό χρόνο και επεξεργασία περιεχομένου συγκεκριμένων τομέων.
This thesis investigates innovative approaches for summarizing and visualizing comments (post) from online discussions and reviews using a combination of traditional machine learning methods and state-of-the-art Large Language Models (LLMs). The research focuses on methods consisting of grouping by timestamp, clustering, topic extraction, and label-based summarization to enhance the processing of online discussions or user-generated reviews. By applying these methods to various datasets, we evaluate their performance using metrics such as BLEU, ROUGE, and BERTscore. The results demonstrate the effectiveness of Transformer-based models, particularly when combined with advanced Machine Learning techniques, in generating coherent and accurate summaries. This study contributes to the development of efficient automated summarization techniques, offering valuable insights for real-time applications and domain-specific content processing.
Λέξη κλειδί :Τεχνικές σύνοψης
Σχόλια
Αξιολογήσεις
Επεξεργασία φυσικής γλώσσας
Μεγάλα γλωσσικά μοντέλα
Ταξινόμηση
Summarization techniques
Comments
Reviews
Natural Language Processing (NLP)
Large language models
Classification
Διαθέσιμο από :2024-12-05 00:13:34
Ημερομηνία έκδοσης :26-11-2024
Ημερομηνία κατάθεσης :2024-12-05 00:13:34
Δικαιώματα χρήσης :Free access
Άδεια χρήσης :

Αρχείο: Mpalis_2024.pdf

Τύπος: application/pdf