Βιβλιοθήκη ΟΠΑ - Ψηφιακό Αποθετήριο

ΠΥΞΙΔΑ Ιδρυματικό Αποθετήριο
και Ψηφιακή Βιβλιοθήκη

Όνομα χρήστη
Κωδικός πρόσβασης

Συλλογές :	Ιδρυματικό Αποθετήριο ΟΠΑ / AUEB Institutional Repository Σχολή Επιστημών και Τεχνολογίας της Πληροφορίας / School of Informatics Τμήμα Πληροφορικής / Department of Informatics Μεταπτυχιακές Εργασίες / Postgraduate dissertations

Τίτλος :	Explainability in machine learning: an application on retail industry

Εναλλακτικός τίτλος :	Επεξηγησιμότητα στη μηχανική μάθηση: μία εφαρμογή σε δεδομένα λιανικής

Δημιουργός :	Ανδρεάδης, Γεώργιος Andreadis, Georgios

Συντελεστής :	Pavlopoulos, Ioannis (Επιβλέπων καθηγητής) Androutsopoulos, Ion (Εξεταστής) Vassalos, Vasilios (Εξεταστής) Athnes University of Economics and Business, Department of Informatics (Degree granting institution)

Τύπος :	Text

Φυσική περιγραφή :	55p.

Γλώσσα :	en

Αναγνωριστικό :	http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=10242

Περίληψη :	Οι εξελίξεις στο χώρο της μηχανικής μάθησης έχουν οδηγήσει στην ανάπτυξη πολύπλοκων μοντέλων με σκοπό την επίλυση πολύπλοκων προβλημάτων. Για αυτόν το λόγο, έγινε επιτακτική η ανάγκη να μπορούν οι αποφάσεις των αυτών των μοντέλων να επεξηγηθούν και να είναι ερμηνεύσιμες. Σε αυτήν τη διπλωματική εργασία, κάνουμε αρχικά μία έρευνα για τις σύγχρονες επεξηγηματικές μεθόδους που μπορούν να εφαρμοστούν σε μοντέλα μηχανικής μάθησης. Έπειτα, περιγράφουμε τα απλά ερμηνεύσιμα μοντέλα και τα πιο πολύπλοκα μοντέλα που είναι πολλές φορές καλύτερα στις προβλέψεις αλλά όχι άμεσα και εύκολα ερμηνεύσιμα. Τα πειράματα τα κάναμε σε ένα σύνολο από δεδομένα λιανικής που περιέχει τιμές και έσοδα πολλών ανταγωνιστών που παράγουν το ίδιο προϊόν. Ο κύριος στόχος είναι να εξάγουμε χρήσιμα συμπεράσματα σχετικά με τις συσχετίσεις μεταξύ των ανταγωνιστών και το κατά πόσο το ένα επηρεάζει το άλλο. Για να το καταφέρουμε αυτό, πρώτα διερευνήσαμε τα δεδομένα και εκπαιδεύσαμε μοντέλα μηχανικής μάθησης τα οποία να μπορούν να προβλέψουν τα έσοδα των εταιρειών, και μετά να αναλύσουμε με επεξηγηματικές μεθόδους, όπως Shapley Values, ποιοι ανταγωνιστές συνεισέφεραν περισσότερο στις συγκεκριμένες προβλέψεις. Στο τέλος, πραγματοποιήσαμε μία εφαρμογή για μία συγκεκριμένη μάρκα από την αρχή μέχρι το τέλος, ως παράδειγμα του πώς μπορεί να βοηθήσουν οι μέθοδοι αυτοί τους άμεσα ενδιαφερόμενους που παίρνουν τις επιχειρηματικές αποφάσεις. The research and need for explainability and interpretability of machine learning models has been exponentially growing in recent years, resulting in many state-of-the-art approaches. The present thesis starts with an in-depth literature review, to record the various approaches of explainable machine learning, and to better understand the notions that enclose the explainability methods. We continue by describing the numerous interpretable models, both the more complex models that are widely used by machine learning community, as well as the methods that more easily comprehensible by humans. For our experiments, we used a small dataset from retail industry, including prices and turnovers of various competitor brands. Our main goal is to gain insights about the behavior of the various brands and the relationship between their prices and their turnovers. We built models that can predict the turnovers based on the prices of the same and the rest of the brands. Afterwards we implement explainability methods, like Shapley Values, to understand the underlying relations (if any) between the different brands. Finally, we apply the existed methods, performing an end-to-end analysis of one use case in order to provide an example on how these methods can be helpful for stakeholders

Περίληψη :

Οι εξελίξεις στο χώρο της μηχανικής μάθησης έχουν οδηγήσει στην ανάπτυξη πολύπλοκων μοντέλων με σκοπό την επίλυση πολύπλοκων προβλημάτων. Για αυτόν το λόγο, έγινε επιτακτική η ανάγκη να μπορούν οι αποφάσεις των αυτών των μοντέλων να επεξηγηθούν και να είναι ερμηνεύσιμες. Σε αυτήν τη διπλωματική εργασία, κάνουμε αρχικά μία έρευνα για τις σύγχρονες επεξηγηματικές μεθόδους που μπορούν να εφαρμοστούν σε μοντέλα μηχανικής μάθησης. Έπειτα, περιγράφουμε τα απλά ερμηνεύσιμα μοντέλα και τα πιο πολύπλοκα μοντέλα που είναι πολλές φορές καλύτερα στις προβλέψεις αλλά όχι άμεσα και εύκολα ερμηνεύσιμα. Τα πειράματα τα κάναμε σε ένα σύνολο από δεδομένα λιανικής που περιέχει τιμές και έσοδα πολλών ανταγωνιστών που παράγουν το ίδιο προϊόν. Ο κύριος στόχος είναι να εξάγουμε χρήσιμα συμπεράσματα σχετικά με τις συσχετίσεις μεταξύ των ανταγωνιστών και το κατά πόσο το ένα επηρεάζει το άλλο. Για να το καταφέρουμε αυτό, πρώτα διερευνήσαμε τα δεδομένα και εκπαιδεύσαμε μοντέλα μηχανικής μάθησης τα οποία να μπορούν να προβλέψουν τα έσοδα των εταιρειών, και μετά να αναλύσουμε με επεξηγηματικές μεθόδους, όπως Shapley Values, ποιοι ανταγωνιστές συνεισέφεραν περισσότερο στις συγκεκριμένες προβλέψεις. Στο τέλος, πραγματοποιήσαμε μία εφαρμογή για μία συγκεκριμένη μάρκα από την αρχή μέχρι το τέλος, ως παράδειγμα του πώς μπορεί να βοηθήσουν οι μέθοδοι αυτοί τους άμεσα ενδιαφερόμενους που παίρνουν τις επιχειρηματικές αποφάσεις.
The research and need for explainability and interpretability of machine learning models has been exponentially growing in recent years, resulting in many state-of-the-art approaches. The present thesis starts with an in-depth literature review, to record the various approaches of explainable machine learning, and to better understand the notions that enclose the explainability methods. We continue by describing the numerous interpretable models, both the more complex models that are widely used by machine learning community, as well as the methods that more easily comprehensible by humans. For our experiments, we used a small dataset from retail industry, including prices and turnovers of various competitor brands. Our main goal is to gain insights about the behavior of the various brands and the relationship between their prices and their turnovers. We built models that can predict the turnovers based on the prices of the same and the rest of the brands. Afterwards we implement explainability methods, like Shapley Values, to understand the underlying relations (if any) between the different brands. Finally, we apply the existed methods, performing an end-to-end analysis of one use case in order to provide an example on how these methods can be helpful for stakeholders

Λέξη κλειδί :	Επεξηγήση μοντέλων Μηχανική μάθηση Ανάλυση δεδομένων Explainability Interpretability Machine learning (ML) Data analysis Shapley Additive exPlanations (SHAP) Local Interpretable Model-agnostic Explanation (LIME)

Διαθέσιμο από :	2023-03-21 09:43:54

Ημερομηνία έκδοσης :	30-11-2022

Ημερομηνία κατάθεσης :	2023-03-21 09:43:54

Δικαιώματα χρήσης :	Free access

Άδεια χρήσης :

Αρχείο: Andreadis_2022.pdf

Τύπος: application/pdf

Είσοδος