AUEB Library - Digital Repository

PYXIDA Institutional Repository
and Digital Library

Username
Password

Collections :	Ιδρυματικό Αποθετήριο ΟΠΑ / AUEB Institutional Repository Σχολή Διοίκησης Επιχειρήσεων / School of Business Τμήμα Λογιστικής και Χρηματοοικονομικής / Department of Accounting and Finance Διδακτορικές διατριβές / PhD Theses

Title :	Essays on textual analysis in finance

Alternative Title :	Δοκίμια στην ανάλυση κειμένου στα χρηματοοικονομικά

Creator :	Γκούμας, Νικόλαος Gkoumas, Nikolaos

Contributor :	Leledakis, Georgios (Επιβλέπων καθηγητής) Androutsopoulos, Ion (Εξεταστής) Pyrgiotakis, Emmanouil (Εξεταστής) Drakos, Konstantinos (Εξεταστής) Episcopos, Athanasios (Εξεταστής) Spyrou, Spyros (Εξεταστής) Tsekrekos, Andrianos (Εξεταστής) Athens University of Economics and Business, Department of Accounting and Finance (Degree granting institution)

Contributor :

Leledakis, Georgios (Επιβλέπων καθηγητής)
Androutsopoulos, Ion (Εξεταστής)
Pyrgiotakis, Emmanouil (Εξεταστής)
Drakos, Konstantinos (Εξεταστής)
Episcopos, Athanasios (Εξεταστής)
Spyrou, Spyros (Εξεταστής)
Tsekrekos, Andrianos (Εξεταστής)
Athens University of Economics and Business, Department of Accounting and Finance (Degree granting institution)

Type :	Text

Extent :	176p.

Language :	en

Identifier :	http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=11017

Abstract :	Η παρούσα διδακτορική διατριβή αποτελείται από πέντε κεφάλαια. Ειδικότερα, το πρώτο κεφάλαιο είναι εισαγωγικό και παρουσιάζει στον αναγνώστη με ένα σαφή και συνοπτικό τρόπο τους κύριους στόχους της παρούσας διατριβής.Το δεύτερο κεφάλαιο χρησιμοποιεί μεθόδους επεξεργασίας φυσικής γλώσσας προκειμένου να δημιουργήσει ποσοτικές απεικονίσεις της ποιοτικής πληροφορίας που εμπεριέχεται στις ετήσιες εκθέσεις των αμερικανικών τραπεζών. Στη συνέχεια τα εξαγόμενα κειμενικά χαρακτηριστικά συνδυάζονται με παραδοσιακά χρησιμοποιούμενες οικονομικές μεταβλητές ως εισροή σε μοντέλα μηχανικής μάθησης, συμπεριλαμβανομένου και βαθιάς μάθησης, με απώτερο στόχο την πρόβλεψη περιστατικών διαγραφής μετοχών από τα χρηματιστήρια NYSE/AMEX ή NASDAQ. Τα αποτελέσματα που παρουσιάζονται αποδεικνύουν ότι ο συνδυασμός αυτών των ετερογενών πηγών πληροφόρησης δύναται να οδηγήσει τόσο παραδοσιακά χρησιμοποιούμενες στατιστικές τεχνικές, π.χ., λογιστική παλινδρόμηση, όσο και πιο τεχνολογικά εξελιγμένες τεχνικές στο να επιτύχουν βέλτιστες προβλεπτικές επιδόσεις.Το τρίτο κεφάλαιο χρησιμοποιεί επίσης μεθόδους κειμενικής ανάλυσης αλλά από μία διαφορετική οπτική γωνία. Αναλυτικότερα, επιχειρείται η ποσοτικοποίηση της αβεβαιότητας που πηγάζει από τις ετήσιες εκθέσεις των αμερικανικών τραπεζών, μέσω του υπολογισμού του ποσοστού των λέξεων που ανήκουν στις αντίστοιχες κατηγορίες-λεξικά των Loughran and McDonald (2011). Στη συνέχεια εξετάζονται οι συσχετίσεις μεταξύ υψηλών ποσοστών αβέβαιων λέξεων και επικείμενων περιστατικών κατάρρευσης των τιμών των μετοχών των τραπεζών. H κύρια καινοτομία της έρευνας αυτής ανάγεται στο γεγονός ότι οι εν λόγω συσχετίσεις μελετώνται αφού ληφθεί υπόψη η φάση του οικονομικού κύκλου. Τα αποτελέσματα συνηγορούν υπέρ αυτού του εγχειρήματος μιας και παρουσιάζονται στατιστικά σημαντικές συσχετίσεις μόνο σε περιόδους ύφεσης. Το τέταρτο κεφάλαιο εστιάζει και πάλι σε περιστατικά κατάρρευσης των τιμών των μετοχών στον τραπεζικό τομέα των Ηνωμένων Πολιτειών. Ειδικότερα προσπαθεί να συνδέσει την εμφάνιση τέτοιων περιστατικών με την ανταγωνιστικότητα της αγοράς στην οποία η τράπεζα δραστηριοποιείται καθώς και με την κατοχή ή όχι χαρτοφυλακίων δανείων υψηλής διαφοροποίησης. Σύμφωνα με τα καταγεγραμμένα αποτελέσματα, τράπεζες που δραστηριοποιούνται σε ανταγωνιστικές αγορές είναι πιο πιθανό να βιώσουν περιστατικά κατάρρευσης της τιμής της μετοχής τους. Ωστόσο, η κατοχή χαρτοφυλακίων δανείων χαρακτηριζόμενα από υψηλή διαφοροποίηση φαίνεται να είναι ευεργετική για αυτές καθώς μειώνει την πιθανότητα εκδήλωσης τέτοιων συμβάντων.Τέλος, στο πέμπτο κεφάλαιο παρουσιάζονται τα κεντρικά συμπεράσματα της παρούσας διδακτορικής διατριβής καθώς και προτάσεις για μελλοντική έρευνα. This dissertation consists of five chapters. Chapter one is the introduction and presents in a clear and concise way the main objectives of this thesis.Chapter two employs natural language processing techniques in an effort to quantify the qualitative information emanating from U.S. banks’ annual reports. In turn, the obtained textual features are combined with conventional financial variables and fed as inputs to several machine learning models, including deep learning ones, to predict distressed delisting events from the NYSE/AMEX or NASDAQ exchanges. According to the documented results, the combination of these heterogenous information sources improves the classification performance of both traditional statistical techniques (e.g., logistic regression) as well as of sophisticated algorithms.Chapter three also employs textual analysis techniques, but this time from a different perspective. Particularly, annual report tone ambiguity proxies are constructed based on the fraction of ambiguous words, according to the sentiment word lists of Loughran and McDonald (2011). Then, the associations between the constructed tone ambiguity proxies and future stock price crash incidents are explored. However, the main innovation of this study is that these associations are examined after controlling for the state of the economy. The reported results are in favor of this conditional association, since we report statistically significant associations only during recessions.Chapter four is focused again on U.S. banks’ stock price crash incidents. Particularly, it explores the associations between the appearance of such incidents with the competition of the market that the banks operate, as well as with loan portfolio diversification activities. According to the documented results, banks that operate in highly competitive environments are more likely to experience stock price crash incidents. However, loan portfolio diversification activities are beneficial for them since they moderate their future stock price crash risk.Finally, chapter five presents the drawing conclusions of this dissertation and outlines avenues for future research.

Abstract :

Η παρούσα διδακτορική διατριβή αποτελείται από πέντε κεφάλαια. Ειδικότερα, το πρώτο κεφάλαιο είναι εισαγωγικό και παρουσιάζει στον αναγνώστη με ένα σαφή και συνοπτικό τρόπο τους κύριους στόχους της παρούσας διατριβής.Το δεύτερο κεφάλαιο χρησιμοποιεί μεθόδους επεξεργασίας φυσικής γλώσσας προκειμένου να δημιουργήσει ποσοτικές απεικονίσεις της ποιοτικής πληροφορίας που εμπεριέχεται στις ετήσιες εκθέσεις των αμερικανικών τραπεζών. Στη συνέχεια τα εξαγόμενα κειμενικά χαρακτηριστικά συνδυάζονται με παραδοσιακά χρησιμοποιούμενες οικονομικές μεταβλητές ως εισροή σε μοντέλα μηχανικής μάθησης, συμπεριλαμβανομένου και βαθιάς μάθησης, με απώτερο στόχο την πρόβλεψη περιστατικών διαγραφής μετοχών από τα χρηματιστήρια NYSE/AMEX ή NASDAQ. Τα αποτελέσματα που παρουσιάζονται αποδεικνύουν ότι ο συνδυασμός αυτών των ετερογενών πηγών πληροφόρησης δύναται να οδηγήσει τόσο παραδοσιακά χρησιμοποιούμενες στατιστικές τεχνικές, π.χ., λογιστική παλινδρόμηση, όσο και πιο τεχνολογικά εξελιγμένες τεχνικές στο να επιτύχουν βέλτιστες προβλεπτικές επιδόσεις.Το τρίτο κεφάλαιο χρησιμοποιεί επίσης μεθόδους κειμενικής ανάλυσης αλλά από μία διαφορετική οπτική γωνία. Αναλυτικότερα, επιχειρείται η ποσοτικοποίηση της αβεβαιότητας που πηγάζει από τις ετήσιες εκθέσεις των αμερικανικών τραπεζών, μέσω του υπολογισμού του ποσοστού των λέξεων που ανήκουν στις αντίστοιχες κατηγορίες-λεξικά των Loughran and McDonald (2011). Στη συνέχεια εξετάζονται οι συσχετίσεις μεταξύ υψηλών ποσοστών αβέβαιων λέξεων και επικείμενων περιστατικών κατάρρευσης των τιμών των μετοχών των τραπεζών. H κύρια καινοτομία της έρευνας αυτής ανάγεται στο γεγονός ότι οι εν λόγω συσχετίσεις μελετώνται αφού ληφθεί υπόψη η φάση του οικονομικού κύκλου. Τα αποτελέσματα συνηγορούν υπέρ αυτού του εγχειρήματος μιας και παρουσιάζονται στατιστικά σημαντικές συσχετίσεις μόνο σε περιόδους ύφεσης. Το τέταρτο κεφάλαιο εστιάζει και πάλι σε περιστατικά κατάρρευσης των τιμών των μετοχών στον τραπεζικό τομέα των Ηνωμένων Πολιτειών. Ειδικότερα προσπαθεί να συνδέσει την εμφάνιση τέτοιων περιστατικών με την ανταγωνιστικότητα της αγοράς στην οποία η τράπεζα δραστηριοποιείται καθώς και με την κατοχή ή όχι χαρτοφυλακίων δανείων υψηλής διαφοροποίησης. Σύμφωνα με τα καταγεγραμμένα αποτελέσματα, τράπεζες που δραστηριοποιούνται σε ανταγωνιστικές αγορές είναι πιο πιθανό να βιώσουν περιστατικά κατάρρευσης της τιμής της μετοχής τους. Ωστόσο, η κατοχή χαρτοφυλακίων δανείων χαρακτηριζόμενα από υψηλή διαφοροποίηση φαίνεται να είναι ευεργετική για αυτές καθώς μειώνει την πιθανότητα εκδήλωσης τέτοιων συμβάντων.Τέλος, στο πέμπτο κεφάλαιο παρουσιάζονται τα κεντρικά συμπεράσματα της παρούσας διδακτορικής διατριβής καθώς και προτάσεις για μελλοντική έρευνα.
This dissertation consists of five chapters. Chapter one is the introduction and presents in a clear and concise way the main objectives of this thesis.Chapter two employs natural language processing techniques in an effort to quantify the qualitative information emanating from U.S. banks’ annual reports. In turn, the obtained textual features are combined with conventional financial variables and fed as inputs to several machine learning models, including deep learning ones, to predict distressed delisting events from the NYSE/AMEX or NASDAQ exchanges. According to the documented results, the combination of these heterogenous information sources improves the classification performance of both traditional statistical techniques (e.g., logistic regression) as well as of sophisticated algorithms.Chapter three also employs textual analysis techniques, but this time from a different perspective. Particularly, annual report tone ambiguity proxies are constructed based on the fraction of ambiguous words, according to the sentiment word lists of Loughran and McDonald (2011). Then, the associations between the constructed tone ambiguity proxies and future stock price crash incidents are explored. However, the main innovation of this study is that these associations are examined after controlling for the state of the economy. The reported results are in favor of this conditional association, since we report statistically significant associations only during recessions.Chapter four is focused again on U.S. banks’ stock price crash incidents. Particularly, it explores the associations between the appearance of such incidents with the competition of the market that the banks operate, as well as with loan portfolio diversification activities. According to the documented results, banks that operate in highly competitive environments are more likely to experience stock price crash incidents. However, loan portfolio diversification activities are beneficial for them since they moderate their future stock price crash risk.Finally, chapter five presents the drawing conclusions of this dissertation and outlines avenues for future research.

Subject :	Ανάλυση κειμένου Μηχανική μάθηση Κίνδυνος κατάρρευσης των τιμών των μετοχών Περιστατικά διαγραφής μετοχών Textual analysis Machine learning (ML) Stock price crash risk Distressed delisting events

Date Available :	2024-02-17 00:19:41

Date Issued :	13-02-2024

Date Submitted :	2024-02-17 00:19:41

Access Rights :	Free access

Licence :

File: Gkoumas_2024.pdf

Type: application/pdf

Login