Συλλογές | |
---|---|
Τίτλος |
Statistical learning methods with an application on credit card default in Taiwan |
Εναλλακτικός τίτλος |
Στατιστικές μέθοδοι εκμάθησης με εφαρμογή στην αθέτηση πληρωμών πιστωτικής κάρτας στην Ταϊβάν |
Δημιουργός |
Spinos, Panagiotis, Σπίνος, Παναγιώτης |
Συντελεστής |
Athens University of Economics and Business, Department of Economics Tzavalis, Elias Arvanitis, Stylianos Kyriazidou, Aikaterini |
Τύπος |
Text |
Φυσική περιγραφή |
70 p. |
Γλώσσα |
en |
Αναγνωριστικό |
http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=6033 |
Περίληψη |
Ο σκοπός αυτής της διπλωματικής εργασίας είναι, αρχικά, να προσδιορίσει τον όρο «πιστοληπτική βαθμολόγηση» και πώς ο όρος χρησιμοποιείται στην βιβλιογραφία. Στη συνέχεια, και αφού ο όρος αυτός έχει διαπιστωθεί, λαμβάνει χώρα μία σύγκριση διαφόρων τεχνικών μηχανικής εκμάθησης, η οποία συνοδεύεται από μία μελέτη περίπτωσης, κατά την οποία οι προαναφερθείσες τεχνικές χρησιμοποιούνται για να προβλεφθεί η συμπεριφορά χρηστών πιστωτικής κάρτας. Στην ουσία, γίνεται προσπάθεια για κατάταξη των αιτούντων πίστωσης σε κατηγορίες, και πιο συγκεκριμένα, είτε στην κατηγορία αθέτησης, είτε στην κατηγορία μη αθέτησης πληρωμών. Η μελέτη χωρίζεται σε πέντε ενότητες. Στην πρώτη ενότητα, παρέχονται οι διάφοροι ορισμοί της πιστοληπτικής βαθμολόγησης, ακολουθούμενοι από μία συνοπτική σύγκριση μεταξύ των στατιστικών συστημάτων και των παλαιότερων συστημάτων, που απαιτούν προσωπική κρίση για τον καθορισμό της πιστοληπτικής βαθμολογίας. Στη δεύτερη ενότητα, αναπτύσσεται μια βιβλιογραφική ανασκόπηση παλαιότερων μελετών, που αφορά την εξέλιξη του παραπάνω όρου στο χρόνο, τις εφαρμογές του, καθώς και τους κυριότερους καθοριστικούς του παράγοντες. H τρίτη ενότητα περιλαμβάνει τη σύγκριση των έξι τεχνικών που χρησιμοποιήθηκαν σε αυτή τη μελέτη, τη παρουσίαση του υπόβαθρού τους, καθώς και πλεονεκτήματα και μειονεκτήματα της καθεμίας. Η τέταρτη ενότητα περιέχει την ανάλυση ενός συνόλου δεδομένων που αφορά την αθέτηση ή μη αθέτηση πληρωμών από χρήστες πιστωτικής κάρτας στην Ταϊβάν, και συγκρίνει στην πράξη τις προαναφερθείσες τεχνικές. Η προσοχή, εδώ, είναι στραμμένη στην ικανότητα ταξινόμησης της κάθε μεθόδου. Επίσης, στην ίδια ενότητα εξετάζεται η μεταχείριση και η προ-επεξεργασία του συνόλου δεδομένων. Τέλος, η πέμπτη ενότητα περιλαμβάνει τα συμπεράσματα αυτής της μελέτης και κάποια περαιτέρω σχόλια πάνω στα αποτελέσματα, που αφορούν την εν δυνάμει γενίκευσή τους σε άλλα σενάρια, ή υπό άλλες συνθήκες ή σύνολα δεδομένων. The aim of the thesis is to firstly, define the term “credit scoring” and how the term is used in the literature. After establishing the term, a comparison of different machine learning techniques is elaborated along with a case study analysis that takes place, in which the various machine learning techniques will be implemented to predict a credit-card customer’s behavior. In essence, an attempt is made to classify credit applicants into classes, more specifically, payment default or no-default.This postgraduate study is divided into five sections. In the first section, the various definitions of credit scoring are provided, followed by a brief comparison of statistical credit scoring systems versus judgmental systems that were used in the past. In the second section, a literature review of past papers is elaborated, regarding the development of credit scoring over the time, credit scoring applications, as well as the key determinants of it. The third section includes a comparison of the six techniques that are employed in this study, a presentation of their background, in addition to advantages and disadvantages of each one. The fourth section contains a data set analysis which aims at the case of customers’ default payments in Taiwan and compares the previously mentioned mining techniques in practice. The focus is steered towards each method’s classification performance. The data manipulation and pre-processing stage are also discussed in this section. Lastly, section five includes the main conclusions of this study and some additional remarks on the results, concerning the potential of their generalization in other scenarios or under other circumstances and data sets. |
Λέξη κλειδί |
Μηχανές διανυσμάτων υποστήριξης Τυχαίο δάσος Νευρωνικά δίκτυα Support Vector Machines (SVM) Μηχανική εκμάθηση Πιστοληπτική βαθμολόγηση Random forest Credit scoring Neural networks Machine learning |
Διαθέσιμο από |
2018-05-03 22:59:29 |
Ημερομηνία έκδοσης |
04/30/2018 |
Ημερομηνία κατάθεσης |
2018-05-03 22:59:29 |
Δικαιώματα χρήσης |
Free access |
Άδεια χρήσης |
https://creativecommons.org/licenses/by/4.0/ |