Abstract : | Οι επιχειρήσεις αποτελούν ένα πολύ σημαντικό τμήμα πελατείας για όλες τις τράπεζες. Η βέλτιστη εξυπηρέτηση τους και η ανάπτυξη μακροπρόθεσμων σχέσεων συνεργασίας αποτελούν βασική προτεραιότητα. Στο πλαίσιο της πελατοκεντρικής στρατηγικής, η τράπεζα επενδύει σε καινοτόμες τεχνολογίες προκειμένου μέσω της ανάλυσης δεδομένων να αντλήσει όσο το δυνατόν περισσότερες πληροφορίες και γνώση για το πελατολόγιό της.Ο σκοπός της διπλωματικής εργασίας ήταν η ανάπτυξη ενός μοντέλου μηχανικής μάθησης για την εκτίμηση του τζίρου των business banking πελατών και συγκεκριμένα των νομικών προσώπων, για το έτος 2019. Πρώτο και κύριο στάδιο της εργασίας αποτέλεσε η εύρεση δεδομένων για την μεταβλητή στόχο, καθώς και διερεύνηση διάφορων δεδομένων που σχετίζονται με αυτή. Στη συνέχεια, υλοποιήθηκε καθαρισμός των δεδομένων και παραγωγή βασικών στατιστικών των μεταβλητών. Τέλος, στο περιβάλλον VDMML του SAS Viya, πραγματοποιήθηκε όλη η διαδικασία ανάπτυξης των στατιστικών μοντέλων, υλοποιώντας τις κυριότερες τεχνικές pre-processing και εφαρμόζοντας τους σημαντικότερους αλγορίθμους μηχανικής μάθησης.Τελικά, αξιολογήθηκαν όλα τα μοντέλα χρησιμοποιώντας τις βασικές μετρικές σύγκρισης της απόδοσης και επιλέχτηκε αυτό με τα καλύτερα αποτελέσματα. Προκειμένου να αξιολογηθεί περεταίρω η απόδοση του επικρατέστερου μοντέλου, χρησιμοποιήθηκε ένα δείγμα πελατών με γνωστό κύκλο εργασιών σαν test set. Tα αποτελέσματα κρίθηκαν ικανοποιητικά και συνεπώς οι εκτιμήσεις που προκύπτουν από ανάλυση μπορούν να χρησιμοποιηθούν για την καλύτερη κατανόηση του πελατολογίου αλλά και ως δεδομένα εισόδου σε επερχόμενα έργα. Business clients are considered as a very important part of the business for all banks. Their optimal service and the development of long-term cooperation relationships are a key priority. As part of their customer-centric strategy, banks invest in innovative technologies in order to gain as much information and useful insights about its customer base as possible through data analysis. The purpose of this thesis was to develop a machine learning model for estimating the turnover of business banking clients and in particular legal entities, for the year 2019. The first and main stage of the work was to find data for the variable target, as well as to investigate various data related to it. Then, the data were cleaned, and basic statistics of the variables were produced. Finally, in the VDMML environment of SAS Viya, the whole process of developing statistical models was carried out by implementing the main pre-processing techniques and applying the most important machine learning algorithms. Finally, all models were evaluated using the basic performance comparison metrics and the one with the best results was selected. In order to further evaluate the performance of the dominant model, a sample of customers having known turnover as a test set was used. The results were considered satisfactory and therefore the estimates resulting from the analysis can be used for a better understanding of the clientele but also as input data for upcoming projects.
|
---|