Abstract : | Η παρούσα εργασία εξετάζει την εφαρμογή των τεχνικών προβλεπτικής μοντελοποίησης στην διαδικασία επιλογής μεταπτυχιακών φοιτητών στο πρόγραμμα της Επιχειρηματικής Αναλυτικής του Οικονομικού Πανεπιστημίου Αθηνών (ΟΠΑ). Επικεντρώνοντας την προσοχή και αξιοποιώντας τα ιστορικά δεδομένα από προηγούμενους κύκλους εισαγωγής, ακολουθώντας όλες τις απαραίτητες τεχνικές ανωνυμοποίησης, διεξήχθη ένας λεπτομερής καθαρισμός και επεξεργασία δεδομένων για την ανάδειξη μοτίβων και συσχετίσεων μεταξύ των χαρακτηριστικών των ενδιαφερόμενων φοιτητών τόσο για τα προγράμματα Πλήρους Απασχόλησης όσο και Μερικής Απασχόλησης ξεχωριστά.Με μια ποικίλη συλλογή αλγορίθμων μηχανικής μάθησης - συμπεριλαμβανομένων της λογιστικής παλινδρόμησης, του δέντρου απόφασης, του τυχαίου δάσους, του Κ-NN και της SVM - η μεταπτυχιακή εργασία εξετάζει την απόδοσή τους και την ικανότητά τους στην πρόβλεψη των αποτελεσμάτων εισαγωγής στο συγκεκριμένο μεταπτυχιακό πρόγραμμα. Διεξήχθησαν διάφορες επαναλήψεις οδηγώντας στην εκπαίδευση και αξιολόγηση των μοντέλων χρησιμοποιώντας την διαίρεση των δεδομένων για εκπαίδευση και αξιολόγηση, με και χωρίς κλιμάκωση δεδομένων για να εξεταστεί η απόδοση των προβλεπτικών μοντέλων υπό διαφορετικές συνθήκες. Επιπλέον, διεξήχθη μια εστιασμένη έρευνα χρησιμοποιώντας μεταβλητές που επιλέχθηκαν από την παλινδρόμηση LASSO, προσφέροντας βαθύτερη επίγνωση για τα πιο επιδραστικά χαρακτηριστικά τα οποία συνήθως επηρεάζουν την απόφαση αποδοχής ή μη των ενδιαφερόμενων φοιτητών.Σε επόμενες επαναλήψεις, η μεταπτυχιακή εργασία λαμβάνει επίσης υπόψη τη σημασία της εφαρμογής του k-fold cross-validation για να διασφαλίσει την αξιοπιστία του μοντέλου και να μειώσει τα προβλήματα υπερ-προσαρμογής με στόχο την ενίσχυση της αξιοπιστίας και της γενίκευσης των προβλεπτικών μοντέλων. Ως σημείο αναφοράς, στο τέλος εξετάστηκε επίσης η απόδοση ενός τεχνητού νευρωνικού δικτύου (ANN) έναντι των παραδοσιακών μεθόδων παρέχοντας πολύτιμες συγκριτικές εισηγήσεις.Τα ευρήματα υπογραμμίζουν την αποτελεσματικότητα και την ικανότητα των παραδοσιακών τεχνικών μοντελοποίησης, με τα κορυφαία μοντέλα να επιτυγχάνουν ποσοστό ακρίβειας περίπου 74% τόσο για τα προγράμματα Πλήρους Απασχόλησης όσο και Μερικής Απασχόλησης. This thesis conducts an examination of predictive modeling techniques as applied to admission processes within the MSc Business Analytics program at the Athens University of Economic & Business in Greece. Drawing upon historical data from previous admission cycles, following all the necessary anonymization techniques, a detailed data cleansing, data processing and exploratory data analysis was conducted to uncover unique insights and shed light on distinctive patterns for both the Full-time and Part-time programs separately. A diverse array of machine learning algorithms – including logistic regression, decision tree, random forest, K-NN and SVM – the study examines their performance and capability in predicting admission outcomes. Various iterations were conducted leading to the models being trained and evaluated using traditional train-test splits, with and without data scaling to examine their performance under varying conditions. Furthermore, a focused investigation is conducted using variables selected from LASSO regression, offering deeper insights into the most influential predictors of admission success. In subsequent iterations, the study also took into consideration the importance of employing k-fold cross-validation to ensure model robustness and mitigate overfitting issues with an aim to enhance the reliability and generalization ability of the predictive models. As a benchmark, at the end the study also explored the performance of an artificial neural network (ANN) against traditional methods providing valuable comparative insights. The findings underscore the efficacy and the capability of the traditional modeling techniques with top-performing models achieving an accuracy rate of approximately 74% for both the Full-time and Part-time programs. It is important at this point to highlight that undergraduate GPA and undergraduate field of study act as crucial predictors showcasing their significance in admission decision-making process.
|
---|