Περίληψη : | The need for personalized recommendation has increased hand in hand with the increasing volume of available information through the internet. The overabundance of information, such as commercial products or potential connections in social networks, has driven the development of recommender systems. A recommender system typically learns the user interests from past recorded activities, and consistently processes item candidates to generate user-specificrecommendations. This M.Sc. thesis focuses on the “cold-start” problem in recommendation i.e.,the situation where either a new user desires recommendations, or a brand-new item is to berecommended. Cold-start is especially challenging to recommender systems, since no past interaction data is available to infer the user interests or the item peculiarities. In this thesis two methods are proposed to tackle the cold-start problem, both utilizing available user and item metadata information. The first method combines pre-trained user and item latent factors with metadata features and introduces a modification in the learning process, that enables the model to make recommendations even when latent factors are not available. The second method is a hybrid matrix factorization model that learns user and item representations as combinations of their meta-dataand preference latent factors. The two methods are implemented and evaluated in a banking use case, where banking products are recommended to new customers. The use case dataset is verysparse from the customer’s perspective and has product popularity bias, making therecommendation problem very challenging. Throughout the experimental study, several conclusions are drawn regarding the methods’ performance and parameter sensitivity. Both methods manage to effectively handle the cold-start problem, yielding significant improvements, in terms of Mean Average Precision and Recall, over a baseline popular product recommender and a simple Latent Factor Model in both the warm and cold scenarios. Ο όλο και αυξανόμενος όγκος πληροφορίας που είναι διαθέσιμος μέσω του διαδικτύου, έχει δημιουργήσει την ανάγκη για εξατομικευμένες προτάσεις (recommendations). Η υπερπληθώρα πληροφοριών, όπως εμπορικά προϊόντα ή πιθανές συνδέσεις στα κοινωνικά δίκτυα, έχει οδηγήσει στην ανάπτυξη συστημάτων για την παραγωγή προσωποποιημένων προτάσεων. Ένα τέτοιο σύστημα συνήθως «μαθαίνει» τα ενδιαφέροντα του χρήστη από ιστορικάκαταγεγραμμένες δραστηριότητες του και επεξεργάζεται τα υποψήφια αντικείμενα για να δημιουργήσει προτάσεις. Αυτή η διπλωματική εργασία εστιάζει στο πρόβλημα της «κρύας εκκίνησης» (“cold-start”) των συστημάτων προτάσεων, δηλαδή στην κατάσταση κατά την οποίαείτε ένας νέος χρήστης επιθυμεί προτάσεις είτε ένα νέο αντικείμενο πρέπει να προταθεί. Η ψυχρή εκκίνηση είναι ένα ιδιαίτερα δύσκολο πρόβλημα για αυτά τα συστήματα, καθώς δεν υπάρχουν διαθέσιμα ιστορικά δεδομένα για νέους χρήστες ή αντικείμενα, ώστε να συναχθούν τα ενδιαφέροντα και οι ιδιαιτερότητές τους. Σε αυτή την εργασία προτείνονται δύο μέθοδοι για την αντιμετώπιση του προβλήματος, που αξιοποιούν τις διαθέσιμες μετα-πληροφορίες των χρηστών και των αντικειμένων. Η πρώτη μέθοδος συνδυάζει προεκπαιδευμένες λανθάνουσες αναπαραστάσεις (latent representations) χρηστών και αντικειμένων με τα διαθέσιμα μετα δεδομένα και εισάγει μια τροποποίηση στη διαδικασία μάθησης, που επιτρέπει στο μοντέλο να κάνει προτάσεις ακόμα και όταν οι λανθάνουσες αναπαραστάσεις δεν είναι διαθέσιμες. Η δεύτερη μέθοδος είναι μια «υβριδική» παραγοντοποίηση του πίνακα προτιμήσεων που μαθαίνειλανθάνουσες αναπαραστάσεις για τους χρήστες και τα αντικείμενα ως συνδυασμούς λανθανόντων αναπαραστάσεων των μεταδεδομένων τους και των προτιμήσεών τους. Οι δύο μέθοδοι εφαρμόζονται και αξιολογούνται σε ένα πρόβλημα τραπεζικής, όπου τραπεζικά προϊόντα προτείνονται σε νέους πελάτες. Το σετ δεδομένων της πειραματικής μελέτης διαθέτει μικρό πλήθος αγορών από την πλευρά του πελάτη, ενώ οι περισσότερες αγορές αφορούν λίγα «δημοφιλή» προϊόντα, χαρακτηριστικά που προσθέτουν σημαντική δυσκολία στο πρόβλημα παραγωγής προτάσεων. Κατά την πειραματική μελέτη εξάγονται αρκετά συμπεράσματα σχετικάμε την απόδοση των μεθόδων και την ευαισθησία τους ως προς τις παραμέτρους. Και οι δύο μέθοδοι καταφέρνουν να χειριστούν αποτελεσματικά το πρόβλημα της ψυχρής εκκίνησηςαποφέροντας σημαντική βελτίωση, από άποψη Mean Average Precision και Recall, σε σύγκρισημε μια βασική στρατηγική πρότασης μόνο των δημοφιλών προϊόντων και ενός απλού latent factor μοντέλου τόσο στο σενάριο θερμής όσο και στο σενάριο κρύας εκκίνησης.
|
---|