Συλλογές | |
---|---|
Τίτλος |
Finetuning of open source LLMs for specific domains |
Εναλλακτικός τίτλος |
Προσαρμογή μεγάλων γλωσσικών μοντέλων σε εξειδικευμένους τομείς |
Δημιουργός |
Stavropoulos, Christos, Σταυρόπουλος, Χρήστος |
Συντελεστής |
Vrontos, Ioannis Androutsopoulos, Ion Athens University of Economics and Business, Department of Informatics Vassalos, Vasilios |
Τύπος |
Text |
Φυσική περιγραφή |
45p. |
Γλώσσα |
en |
Αναγνωριστικό |
http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=11092 |
Περίληψη |
Large Language Models (LLMs) demonstrate remarkable capabilities in general language understanding exhibiting great performance in various natural language processing (NLP) tasks. Yet, their performance may face difficulties in specialized domains like law, healthcare and finance. This is a cause of specialized language and intricate terminologies found in these domains. Finetuning, a technique used to tailor LLMs to specific tasks, plays a crucial role in successfully adapting LLMs for specialized domains. This thesis investigates finetuning and efficient finetuning techniques. We will also investigate the replicability of the FinGPT methodology, explore potential enhancements, and evaluate the effectiveness of finetuning for domain-specific LLM development. Lastly, the potential of finetuning LLMs for Human Resources will be investigated. Τα μεγάλα γλωσσικά μοντέλα επιδεικνύουν εξαιρετικές δυνατότητες στην κατανόηση της γλώσσας, παρουσιάζοντας υψηλές επιδόσεις σε διάφορες εργασίες επεξεργασίας φυσικής γλώσσας. Ωστόσο, η απόδοσή τους συχνά μειώνεται σε εξειδικευμένους τομείς, όπως το δίκαιο, η υγειονομική περίθαλψη και τα οικονομικά, λόγω της εξειδικευμένης ορολογίας και της σύνθετης χρήσης της γλώσσας σε αυτούς τους τομείς. Η απόδοσή τους μπορεί να βελτιωθεί περαιτέρω προσαρμόζοντας αυτά τα μοντέλα σε συγκεκριμένους τομείς ή εργασίες μέσω μιας διαδικασίας που ονομάζεται finetuning. Στη παρούσα διπλωματική θα ερευνήσουμε την δυνατότητα αναπαραγωγής προσαρμοσμένων μοντέλων στα χρηματοοικονομικά, διερευνάμε επίσης πιθανές βελτιώσεις και αξιολογούμε την αποτελεσματικότητα της προσαρμογής. Τέλος θα εξετάσουμε τις δυνατότητες προσαρμογής στον τομέα του Ανθρώπινου Δυναμικού. |
Λέξη κλειδί |
Μεγάλα γλωσσικά μοντέλα Προσαρμογή Τεχνητή νοημοσύνη Large language models Finetuning Artificial Intelligence (AI) |
Διαθέσιμο από |
2024-03-17 15:18:37 |
Ημερομηνία έκδοσης |
07-03-2024 |
Ημερομηνία κατάθεσης |
2024-03-17 15:18:37 |
Δικαιώματα χρήσης |
Free access |
Άδεια χρήσης |
https://creativecommons.org/licenses/by/4.0/ |