Βιβλιοθήκη ΟΠΑ - Ψηφιακό Αποθετήριο

ΠΥΞΙΔΑ Ιδρυματικό Αποθετήριο
και Ψηφιακή Βιβλιοθήκη

Όνομα χρήστη
Κωδικός πρόσβασης

Συλλογές :	Ιδρυματικό Αποθετήριο ΟΠΑ / AUEB Institutional Repository Σχολή Επιστημών και Τεχνολογίας της Πληροφορίας / School of Informatics Τμήμα Πληροφορικής / Department of Informatics Μεταπτυχιακές Εργασίες / Postgraduate dissertations

Τίτλος :	Text classification for the detection of food recalls

Εναλλακτικός τίτλος :	Ταξινόμηση κειμένων για τον εντοπισμό ανακλήσεων τροφίμων

Δημιουργός :	Χασάπης, Αλέξανδρος Chasapis, Alexandros

Συντελεστής :	Παυλόπουλος, Ιωάννης (Επιβλέπων καθηγητής) Μαλακασιώτης, Πρόδρομος (Εξεταστής) Βασσάλος, Βασίλειος (Εξεταστής) Athens University of Economics and Business, Department of Informatics (Degree granting institution)

Τύπος :	Text

Φυσική περιγραφή :	47p.

Γλώσσα :	en

Αναγνωριστικό :	http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=8136

Περίληψη :	Σην παρούσα διπλωματική εργασία, έγινε χρήση μοντέλων μηχανικής και βαθιάς μάθησης με σκόπο την ταξινόμηση κειμένων που σχετίζονται με ανακλήσεις τροφίμων. Η ανάκληση τροφίμων ορίζεται ως: “Δράσεις που λήφθηκαν για την απομάκρυνση από την αγορά, τη διανομή και την κατανάλωση, τροφίμων που ενδέχεται να αποτελούν κίνδυνο για τους καταναλωτές”. Κάθε ανάκληση τροφίμου είναι ένα κείμενο που περιέχει το είδος του προϊόντος που ανακλήθηκε, το συγκεκριμένο προϊόν, την κατηγορία του κινδύνου που ανήκει και τον συγκεκριμένο κίνδυνο. Τα πειράματα βασίστηκαν στην ταξινόμηση κάθε ανάκλησης τροφίμου στις προηγούμενες κατηγορίες. Αρχικα, ταξινομήσαμε τις ανακλήσεις στις κυριότερες κατηγορίες κινδύνου και προϊόντος χρησιμοποιώντας δύο μοντέλα μηχανικής μάθησης, ένα Logistic Regression και ένανRandom Forests Classifier. Έπειτα, έπρεπε να ταξινομήσουμε τις ανακλήσεις στην ακριβή κατηγορία κινδύνου και προϊόντος. Καθώς το πρόβλημα αυτό είναι αυξημένης δυσκολίας, εκπαιδεύσαμε μοντέλα βαθιάς μάθησης, όπως Ανατροφοδοτούμενα Νευρωνικά Δίκτυα αμφίδρομης ή απλής κατεύθυνσης (LSTM καιBiLSTM), και συγκρίναμε την επίδοση τους με μοντέλα μηχανικής μάθησης, έναν SVM και έναν Random Forests Classifier. Σε κάθε πείραμα, τα μοντέλα βαθιάς μάθησης είχαν καλύτερη επίδοση από τα υπόλοιπα, ειδικά στην ταξινόμηση ανακλήσεων στις κατηγορίες κινδύνου. In this, thesis we experimented with machine and deep learning models in order to apply text classification on food recalls from online announcements. A food recall is defined as: “Action taken to remove from sale, distribution and consumption foods which may pose a safety risk to consumers”. Each food recall is a text, which includes the kind of the product that have been removed, the specific product, the kind of the hazard of the product and the specific hazard. Initially, we classified food recalls on the kind of hazard and product type they belong to, using two machine learning models, the Logistic Regression and the Random Forests Classifier. Then, we had to classify each recall on all the different specific products and hazards. For that purpose, we developed deep neural networks, like Recurrent Neural Networks (RNNs) with Long short-term memory (LSTM) architecture and LSTMs with bidirectional strategy, and we compared their performance with two baseline models, the SVM Classifier and a Random Forests Classifier. In every experiment, deep neural networks outperformed the baseline models, especially on the classification on the hazard types.

Περίληψη :

Σην παρούσα διπλωματική εργασία, έγινε χρήση μοντέλων μηχανικής και βαθιάς μάθησης με σκόπο την ταξινόμηση κειμένων που σχετίζονται με ανακλήσεις τροφίμων. Η ανάκληση τροφίμων ορίζεται ως: “Δράσεις που λήφθηκαν για την απομάκρυνση από την αγορά, τη διανομή και την κατανάλωση, τροφίμων που ενδέχεται να αποτελούν κίνδυνο για τους καταναλωτές”. Κάθε ανάκληση τροφίμου είναι ένα κείμενο που περιέχει το είδος του προϊόντος που ανακλήθηκε, το συγκεκριμένο προϊόν, την κατηγορία του κινδύνου που ανήκει και τον συγκεκριμένο κίνδυνο. Τα πειράματα βασίστηκαν στην ταξινόμηση κάθε ανάκλησης τροφίμου στις προηγούμενες κατηγορίες. Αρχικα, ταξινομήσαμε τις ανακλήσεις στις κυριότερες κατηγορίες κινδύνου και προϊόντος χρησιμοποιώντας δύο μοντέλα μηχανικής μάθησης, ένα Logistic Regression και ένανRandom Forests Classifier. Έπειτα, έπρεπε να ταξινομήσουμε τις ανακλήσεις στην ακριβή κατηγορία κινδύνου και προϊόντος. Καθώς το πρόβλημα αυτό είναι αυξημένης δυσκολίας, εκπαιδεύσαμε μοντέλα βαθιάς μάθησης, όπως Ανατροφοδοτούμενα Νευρωνικά Δίκτυα αμφίδρομης ή απλής κατεύθυνσης (LSTM καιBiLSTM), και συγκρίναμε την επίδοση τους με μοντέλα μηχανικής μάθησης, έναν SVM και έναν Random Forests Classifier. Σε κάθε πείραμα, τα μοντέλα βαθιάς μάθησης είχαν καλύτερη επίδοση από τα υπόλοιπα, ειδικά στην ταξινόμηση ανακλήσεων στις κατηγορίες κινδύνου.
In this, thesis we experimented with machine and deep learning models in order to apply text classification on food recalls from online announcements. A food recall is defined as: “Action taken to remove from sale, distribution and consumption foods which may pose a safety risk to consumers”. Each food recall is a text, which includes the kind of the product that have been removed, the specific product, the kind of the hazard of the product and the specific hazard. Initially, we classified food recalls on the kind of hazard and product type they belong to, using two machine learning models, the Logistic Regression and the Random Forests Classifier. Then, we had to classify each recall on all the different specific products and hazards. For that purpose, we developed deep neural networks, like Recurrent Neural Networks (RNNs) with Long short-term memory (LSTM) architecture and LSTMs with bidirectional strategy, and we compared their performance with two baseline models, the SVM Classifier and a Random Forests Classifier. In every experiment, deep neural networks outperformed the baseline models, especially on the classification on the hazard types.

Λέξη κλειδί :	Μηχανική μάθηση Επεξεργασία φυσικής γλώσσας Ταξινόμηση κειμένου Machine learning Natural Language Processing (NLP) Text classification

Διαθέσιμο από :	2020-12-06 17:54:27

Ημερομηνία έκδοσης :	31-10-2020

Ημερομηνία κατάθεσης :	2020-12-06 17:54:27

Δικαιώματα χρήσης :	Free access

Άδεια χρήσης :

Αρχείο: Chasapis_2020.pdf

Τύπος: application/pdf

Είσοδος