Abstract : | Η διπλωματική εργασία χρησιμοποιεί τεχνικές και αλγορίθμους Επεξεργασίας Φυσικής Γλώσσας (NLP) για την ακριβή πρόβλεψη του είδους στο οποίο ανήκει μια ταινία, λαμβάνοντας υπόψιν το περιεχόμενο της. Η μοντελοποίηση της πληροφορίας και η ανάπτυξη των αλγορίθμων στοχεύουν στην ανακάλυψη και πρόβλεψη της σημασιολογίας που έχει το γραπτό περιεχόμενο μιας ταινίας, με σκοπό την αναγνώριση των ταινιών που είναι σχετικές μεταξύ τους. Ο ερευνητής συνέλεξε γραπτή πληροφορία για κάθε ταινία όπως την λίστα των ηθοποιών, την πλοκή, τον τίτλο και την γραπτή αξιολόγηση του κοινού. Τα μοντέλα χρησιμοποιώντας την γραπτή πληροφορία, εκπαιδεύονται ώστε να δώσουν σημασία στις λέξεις που κατατάσσουν μία ταινία σε ένα ή πολλά είδη. Αρχικά, η διπλωματική αναλύει εκτενώς τις μεθόδους για την σωστή επεξεργασία γραπτού κειμένου, ώστε αυτό να καταστεί κατάλληλο για την εκπαίδευση νευρωνικών δικτύων και την ορθή πρόβλεψη των ειδών στα οποία ανήκει μία ταινία. Στην συνέχεια, εκπαιδεύονται και αξιολογούνται επτά διαφορετικά μοντέλα μηχανικής μάθησης. Κατά τη διαδικασία αξιολόγησης εφαρμόστηκαν ποικίλες τεχνικές για την εκτίμηση των προβλέψεων του κάθε μοντέλου. Τα βάρη του νευρωνικού δικτύου με τις περισσότερες αμερόληπτες και ακριβείς προβλέψεις χρησιμοποιήθηκαν στην ανάπτυξη ενός συστήματος το οποίο προτείνει ταινίες στους χρήστες βάσει των προτιμήσεων τους και του περιεχομένου των ταινιών. Στόχος του συστήματος είναι να παραστήσει σε ένα πολυδιάστατο χώρο τα εκπαιδευμένα βάρη κάθε ταινίας και επί αυτών να προτείνει τις κατάλληλες ταινίες στον χρήστη. Ένας διαδραστικός συνομιλητής, chatbot, ενσωματώνει την λειτουργία του εν λόγω συστήματος και η πρόσβαση σε αυτόν γίνεται μέσω του κοινωνικού δικτύου Facebook Messenger. Τέλος, στην διπλωματική εκπονείται έρευνα μέσω ερωτηματολογίου με στόχο την σύγκριση του συστήματος που υλοποιήθηκε με δύο παρόμοια συστήματα της αντίστοιχης πλατφόρμας κοινωνικού δικτύου. Το ερωτηματολόγιο συγκρίνει τα τρία συστήματα μεταξύ τους ως προς την ικανοποίηση του χρήστη στις προτάσεις ταινιών, την αίσθηση επικοινωνίας ρομπότ-ανθρώπου και την πλοήγηση του χρήστη στην εφαρμογή. The thesis uses Natural Language Processing (NLP) techniques and algorithms to accurately predict the genre to which a movie belongs, taking into account the movie’s content. The modeled information and the algorithms developed aim to discover and to predict the semantics of the written content of a movie, in order to identify groups of movies that are related to each other. The researcher collected written information for each movie such as the list of actors, the plot, the title, and the written evaluation of the audience. Deep neural models, using the written information, are trained to pay attention to the words that classify a movie into one or more genres. Initially, the techniques for the correct processing of written text are extensively analyzed, so that the text becomes suitable for the training of neural networks and the correct prediction of the movies’ genre(s). Seven different deep neural networks are trained and evaluated. During the evaluation process, various methods were applied to estimate the models’ predictions. The neural network weights with the most unbiased and accurate predictions were used in the development of a recommendation system that proposes movies to users based on their preferences and movie content. The aim of the recommender system is to represent in a multidimensional space the trained weights of each movie and suggest to the user movies similar to his preferences. An interactive chatbot, developed on Facebook Messenger, integrates the operation of the recommender system. Finally, research is conducted through a questionnaire with the aim of comparing the system developed by the author with two similar systems of the respective social network platform. The questionnaire compares the three recommender systems with each other in terms of user satisfaction in movie suggestions, the human-computer interaction, and user navigation across the application.
|
---|