Abstract : | Over the last years, most of economy sectors adopted digital technologies to improve business connections and efficiency. The integration of technologies like artificial intelligence, advanced analytics, and machine learning are revolutionizing many industries’ operating model. As technology enables businesses to make data-driven, business-critical decisions, artificial intelligence (AI) will be the number one key component of the digital age of credit risk area in the near future. Once AI becomes the standard in all other sectors, financial institutes will invest in machine learning for risk-related processes, by taking advantage of new digitally available data sources that can factor into a credit model. Traditional logistic regression models (probability of default - PD) have been market best practice for years despite that they underperform in capturing complex relationships that may be present in the real data. The purpose of this thesis is to build alternative models for credit scoring using artificial intelligence and machine learning algorithms that can be adaptable to incoming new data sources and changing economic landscape and compare its performance with traditional approaches. Modelling includes Random Forest and Extreme Gradient Boosting (XGBoost). lso, a part of this thesis come up with the traditional binning process of the data and make the continuous data as a form of a discrete with an appropriate way and compares this process with the machine learning point of view. Τα τελευταία χρόνια, οι περισσότεροι τομείς της οικονομίας υιοθέτησαν ψηφιακές τεχνολογίες για τη βελτίωση των επιχειρηματικών συνδέσεων και της αποτελεσματικότητας τους. Η ενσωμάτωση τεχνολογιών όπως η τεχνητή νοημοσύνη, η προηγμένη ανάλυση και η μηχανική μάθηση φέρνουν επανάσταση στο λειτουργικό μοντέλο πολλών βιομηχανιών. Καθώς η τεχνολογία επιτρέπει στις επιχειρήσεις να λαμβάνουν αποφάσεις βάση των δεδομένων σε κρίσιμες για τις επιχειρήσεις περιπτώσεις, η τεχνητή νοημοσύνη (AI) θα είναι το νούμερο ένα βασικό στοιχείο της ψηφιακής εποχής της περιοχής του πιστωτικού κινδύνου στο εγγύς μέλλον.Μόλις το AI γίνει το πρότυπο σε όλους τους άλλους τομείς, τα χρηματοπιστωτικά ιδρύματα θα επενδύσουν στη μηχανική μάθηση για διαδικασίες που σχετίζονται με τον κίνδυνο εκμεταλλευόμενες νέες ψηφιακά διαθέσιμες πηγές δεδομένων που μπορούν να αποτελέσουν ένα πιστωτικό μοντέλο. Τα παραδοσιακά μοντέλα λογιστικής παλινδρόμησης (πιθανότητα αθέτησης - PD) είναι η βέλτιστη πρακτική της αγοράς για χρόνια, παρά το γεγονός ότι έχουν χαμηλή απόδοση στην καταγραφή πολύπλοκων σχέσεων που μπορεί να υπάρχουν στα πραγματικά δεδομένα. Σκοπός αυτής της διατριβής είναι η δημιουργία εναλλακτικών μοντέλων βαθμολόγησης πίστωσης χρησιμοποιώντας αλγόριθμους τεχνητής νοημοσύνης και μηχανικής μάθησης που μπορούν να προσαρμόζονται στις εισερχόμενες νέες πηγές δεδομένων και στο μεταβαλλόμενο οικονομικό τοπίο και να συγκριθεί η απόδοσή τους με αυτήν της παραδοσιακής προσέγγισης. Τα μοντέλο περιλαμβάνουν το Random Forest και το Extreme Gradient Boosting (XGBoost).Επίσης, ένα μέρος αυτής της διατριβής έρχεται με την παραδοσιακή διαδικασία binning των δεδομένων και κάνει τα συνεχή δεδομένα ως μια μορφή διακριτών μεταβλητών μέσω κατάλληλου τρόπου και συγκρίνει αυτήν τη διαδικασία με την άποψη της μηχανικής μάθησης.
|
---|