Βιβλιοθήκη ΟΠΑ - Ψηφιακό Αποθετήριο

ΠΥΞΙΔΑ Ιδρυματικό Αποθετήριο
και Ψηφιακή Βιβλιοθήκη

Όνομα χρήστη
Κωδικός πρόσβασης

Συλλογές :	Ιδρυματικό Αποθετήριο ΟΠΑ / AUEB Institutional Repository Σχολή Επιστημών και Τεχνολογίας της Πληροφορίας / School of Informatics Τμήμα Πληροφορικής / Department of Informatics Μεταπτυχιακές Εργασίες / Postgraduate dissertations

Τίτλος :	Depression detection from transcribed dialogues using machine learning

Εναλλακτικός τίτλος :	Ανίχνευση κατάθλιψης από μεταγεγραμμένους διαλόγους με χρήση μηχανικής μάθησης

Δημιουργός :	Δελής, Νικόλαος Delis, Nikolaos

Συντελεστής :	Androutsopoulos, Ion (Επιβλέπων καθηγητής) Louridas, Panagiotis (Εξεταστής) Kotidis, Yannis (Εξεταστής) Athnes University of Economics and Business, Department of Informatics (Degree granting institution)

Τύπος :	Text

Φυσική περιγραφή :	88p.

Γλώσσα :	en

Αναγνωριστικό :	http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=9978

Περίληψη :	Οι ψυχιϰές ασϑένειες είναι ένα πολύ συχνό φαινόμενο της σημερινής εποχής. Πολλοί άνϑρωποι ταλαιπωρούνται ϰαϑημερινά από ϰάποια ψυχιϰή ασϑένεια. Δυστυχώς, τις περισσότερες φορές δε γίνεται εύϰολα αντιληπτό, αϰόμα ϰαι από ειδιϰούς, η ύπαρξη μιας ψυχιϰής ασϑένειας. Πολλές ψυχιϰές ασϑένειες ϑέλουν εϰτενείς εξετάσεις ϰαι παραϰολούϑηση από ειδιϰούς, για να εξάγουν ϰάποια διάγνωση. Στην παρούσα διπλωματιϰή εργασία εξετάζουμε πως η επεξεργασία φυσιϰής γλώσσας, η μηχανιϰή μάϑηση ϰαι τα βαϑιά νευρωνιϰά δίϰτυα μπορούν να βοηϑήσουν στην αναγνώριση της ϰατάϑλιψης. Χρησιμοποιήσαμε ένα σύνολο δεδομένων το οποίο περιέχει ψυχοϑεραπευτιϰές συνεδρίες, στις οποίες οι συμμετέχοντες έχουν συμπληρώσει ένα ερωτηματολόγιο ανίχνευσης ϰατάϑλιψης. Στη συνέχεια περνούν από μια συνέντευξη με έναν ηλεϰτρονιϰό υπολογιστή, την Ellie την οποία χειρίζεται άνϑρωπος από άλλο δωμάτιο. Τα σύνολα δεδομένων στον ερευνητιϰό χώρο των ψυχιϰών ασϑενειών, είναι μιϰρά ϰαι εμφανίζουν συνήϑως μεγάλη ανισορροπία μεταξύ των ϰλάσεων, με την ϰλάση που αναφέρεται η αντίστοιχη ψυχιϰή ασϑένεια να είναι μειοψηφία. Και το διϰό μας σύνολο δεδομένων έχει παρόμοια χαραϰτηριστιϰά ϰαι γι’ αυτό τον λόγο δοϰιμάσαμε διάφορες τεχνιϰές επαύξησης δεδομένων. Δοϰιμάσαμε από απλές μεϑόδους, όπως η λογιστιϰή παλινδρόμηση, μέχρι ανατροφοδοτούμενα νευρωνιϰά δίϰτυα ϰαι μοντέλα Transformers. Δείξαμε πως αυτό το πρόβλημα είναι δύσϰολο να αντιμετωπιστεί με μεϑόδους μηχανιϰής μάϑησης ϰαι χρειάζεται περαιτέρω έρευνα στη συγϰεϰριμένη περιοχή. Επίσης, δείξαμε πως με εϰτενή ϰαι προσεϰτιϰή προεπεξεργασία των δεδομένων μας μπορούμε να πετύχουμε ιϰανοποιητιϰά αποτελέσματα, συγϰεϰριμένα 0.7 macro average F1 score. Τέλος, προτείνουμε πιϑανές ϰατευϑύνσεις για μελλοντιϰή έρευνα στο συγϰεϰριμένο σύνολο δεδομένων αλλά ϰαι στην συγϰεϰριμένη ερευνητιϰή περιοχή γενιϰότερα. Mental health is a crucial challenge that requires our attention. Many people are suffering from mental illness every day. Unfortunately, most of the time it is not easily perceived, even by experts, that a mental illness exists. Many mental illnesses need extensive examinations and monitoring by experts to deduce a diagnosis. In this thesis, we examine how natural language processing, machine learning, and deep neural networks can help to detect depression. We used a dataset containing psychotherapy sessions in which participants completed a depression detection questionnaire. Then, they go through an interview with a computer, Ellie, which is operated by a person from another room. Data sets in the mental illness research area are small and usually show a large imbalance between classes, with the class referring to mental illness being the minority one. Our dataset also has similar characteristics and therefore we tried several data augmentation techniques. We tried simple methods, such as logistic regression, recurrent neural networks and transformers models. We showed that this problem is difficult to tackle and needs further research. We also showed that with extensive and careful data preprocessing we can achieve remarkable results, namely a 0.7 macro average F1 score. Finally, we suggest possible directions for future research on this dataset and in the specific research area in general.

Περίληψη :

Οι ψυχιϰές ασϑένειες είναι ένα πολύ συχνό φαινόμενο της σημερινής εποχής. Πολλοί άνϑρωποι ταλαιπωρούνται ϰαϑημερινά από ϰάποια ψυχιϰή ασϑένεια. Δυστυχώς, τις περισσότερες φορές δε γίνεται εύϰολα αντιληπτό, αϰόμα ϰαι από ειδιϰούς, η ύπαρξη μιας ψυχιϰής ασϑένειας. Πολλές ψυχιϰές ασϑένειες ϑέλουν εϰτενείς εξετάσεις ϰαι παραϰολούϑηση από ειδιϰούς, για να εξάγουν ϰάποια διάγνωση. Στην παρούσα διπλωματιϰή εργασία εξετάζουμε πως η επεξεργασία φυσιϰής γλώσσας, η μηχανιϰή μάϑηση ϰαι τα βαϑιά νευρωνιϰά δίϰτυα μπορούν να βοηϑήσουν στην αναγνώριση της ϰατάϑλιψης. Χρησιμοποιήσαμε ένα σύνολο δεδομένων το οποίο περιέχει ψυχοϑεραπευτιϰές συνεδρίες, στις οποίες οι συμμετέχοντες έχουν συμπληρώσει ένα ερωτηματολόγιο ανίχνευσης ϰατάϑλιψης. Στη συνέχεια περνούν από μια συνέντευξη με έναν ηλεϰτρονιϰό υπολογιστή, την Ellie την οποία χειρίζεται άνϑρωπος από άλλο δωμάτιο. Τα σύνολα δεδομένων στον ερευνητιϰό χώρο των ψυχιϰών ασϑενειών, είναι μιϰρά ϰαι εμφανίζουν συνήϑως μεγάλη ανισορροπία μεταξύ των ϰλάσεων, με την ϰλάση που αναφέρεται η αντίστοιχη ψυχιϰή ασϑένεια να είναι μειοψηφία. Και το διϰό μας σύνολο δεδομένων έχει παρόμοια χαραϰτηριστιϰά ϰαι γι’ αυτό τον λόγο δοϰιμάσαμε διάφορες τεχνιϰές επαύξησης δεδομένων. Δοϰιμάσαμε από απλές μεϑόδους, όπως η λογιστιϰή παλινδρόμηση, μέχρι ανατροφοδοτούμενα νευρωνιϰά δίϰτυα ϰαι μοντέλα Transformers. Δείξαμε πως αυτό το πρόβλημα είναι δύσϰολο να αντιμετωπιστεί με μεϑόδους μηχανιϰής μάϑησης ϰαι χρειάζεται περαιτέρω έρευνα στη συγϰεϰριμένη περιοχή. Επίσης, δείξαμε πως με εϰτενή ϰαι προσεϰτιϰή προεπεξεργασία των δεδομένων μας μπορούμε να πετύχουμε ιϰανοποιητιϰά αποτελέσματα, συγϰεϰριμένα 0.7 macro average F1 score. Τέλος, προτείνουμε πιϑανές ϰατευϑύνσεις για μελλοντιϰή έρευνα στο συγϰεϰριμένο σύνολο δεδομένων αλλά ϰαι στην συγϰεϰριμένη ερευνητιϰή περιοχή γενιϰότερα.
Mental health is a crucial challenge that requires our attention. Many people are suffering from mental illness every day. Unfortunately, most of the time it is not easily perceived, even by experts, that a mental illness exists. Many mental illnesses need extensive examinations and monitoring by experts to deduce a diagnosis. In this thesis, we examine how natural language processing, machine learning, and deep neural networks can help to detect depression. We used a dataset containing psychotherapy sessions in which participants completed a depression detection questionnaire. Then, they go through an interview with a computer, Ellie, which is operated by a person from another room. Data sets in the mental illness research area are small and usually show a large imbalance between classes, with the class referring to mental illness being the minority one. Our dataset also has similar characteristics and therefore we tried several data augmentation techniques. We tried simple methods, such as logistic regression, recurrent neural networks and transformers models. We showed that this problem is difficult to tackle and needs further research. We also showed that with extensive and careful data preprocessing we can achieve remarkable results, namely a 0.7 macro average F1 score. Finally, we suggest possible directions for future research on this dataset and in the specific research area in general.

Λέξη κλειδί :	Επεξεργασία φυσικής γλώσσας Μηχανική μάθηση Βαθιά μάθηση Κατάθλιψη Μεταγεγραμμένοι διάλογοι Natural Language Processing (NLP) Machine learning (ML) Deep learning Depression Transcribed dialogues

Διαθέσιμο από :	2023-01-11 12:21:16

Ημερομηνία έκδοσης :	12-12-2022

Ημερομηνία κατάθεσης :	2023-01-11 12:21:16

Δικαιώματα χρήσης :	Free access

Άδεια χρήσης :

Αρχείο: Delis_2022.pdf

Τύπος: application/pdf

Είσοδος