Συλλογές
Τίτλος Mixed membership classification
Εναλλακτικός τίτλος Ταξινόμηση με μικτή συμμετοχή μέλους
Δημιουργός Σουμπασαϊ, Γκρισέλντα, Subashaj, Griselda
Συντελεστής Athens University of Economics and Business, Department of Management Science and Technology
Chatziantoniou, Damianos
Papastamoulis, Panagiotis
Karlis, Dimitrios
Τύπος Text
Φυσική περιγραφή 101p.
Γλώσσα en
Αναγνωριστικό http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=11541
Περίληψη Mixed membership models are popular models with practical applications in a variety of fields, offering solutions to the challenges of analyzing complex, multi-faceted data. These models create a statistical framework where data points can belong to multiple categories in different proportions, offering a more nuanced approach compared to traditional classification methods. This study delves into three mixed membership models. The Grade of Membership (GoM), the Latent Dirichlet Allocation (LDA) and the Mixed Membership Stochastic Block (MMSB) Models. The GoM model proves beneficial when individuals show membership in latent categories, as seen in medical diagnoses, effectively capturing complex disease patterns. LDA is commonly used for text analysis and topic modeling, aiding in extracting themes from large text collections and resolving the issue of categorizing documents with multiple topics. The MMSB model tackles social network analysis by understanding the roles and affiliations of entities within networks, shedding light on the multifaceted relationships within social structures. Through practical application of these models in real world data such as individual surveys, document analysis and social network data, this research showcases how these models improve accuracy and interpretation of complex datasets. Even though there were difficulties, with the complexity of computations and the absence of already built packages for using the GoM and MMSB models, it is managed the creation of custom algorithms to run these models. By applying the Expectation - Maximization algorithm in both scenarios this research shows how mixed membership models can help to better grasp data patterns. In the case of LDA model, is utilized an existing package and applied the Collapsed Gibbs Sampling method. The results highlight directions for future research focusing on algorithmic efficiency and model interpretability.
Τα μοντέλα με μικτή συμμετοχή μέλους είναι δημοφιλή μοντέλα με πρακτικές εφαρμογές σε διάφορους τομείς, προσφέροντας λύσεις στις προκλήσεις της ανάλυσης πολύπλοκων, πολύπλευρων δεδομένων. Αυτά τα μοντέλα δημιουργούν ένα στατιστικό πλαίσιο όπου τα σημεία δεδομένων μπορούν να ανήκουν σε πολλές κατηγορίες με διαφορετικές αναλογίες, προσφέροντας ετσι μια πιο διαφοροποιημένη προσέγγιση σε σύγκριση με τις παραδοσιακές μεθόδους ταξινόμησης. Αυτή η μελέτη εμβαθύνει σε τρία μοντέλα με μικτή συμμετοχή μέλους. Τα μοντέλα αυτα ειναι το Grade of Membership (GoM),το Latent Dirichlet Allocation (LDA) και το Mixed Membership Stochastic Block (MMSB) model. Το μοντέλο GoM αποδεικνύεται ωφέλιμο όταν τα άτομα εμφανίζουν συμμετοχή σε λανθάνουσες κατηγορίες, όπως φαίνεται στις ιατρικές διαγνώσεις, καταγράφοντας αποτελεσματικά σύνθετα πρότυπα ασθενειών. Το LDA χρησιμοποιείται συνήθως για ανάλυση κειμένου και μοντελοποίηση θεμάτων, βοηθώντας στην εξαγωγή θεμάτων από μεγάλες συλλογές κειμένων και στην επίλυση του ζητήματος της κατηγοριοποίησης εγγράφων με πολλά θέματα. Το μοντέλο MMSB αντιμετωπίζει την ανάλυση κοινωνικών δικτύων κατανοώντας τους ρόλους και τις σχέσεις των οντοτήτων μέσα στα δίκτυα, ρίχνοντας φως στις πολύπλευρες σχέσεις μέσα στις κοινωνικές δομές. Μέσω πρακτικής εφαρμογής αυτών των μοντέλων σε δεδομένα πραγματικού κόσμου, όπως μεμονωμένες έρευνες, ανάλυση εγγράφων και δεδομένα κοινωνικών δικτύων, αυτή η έρευνα δείχνει πώς αυτά τα μοντέλα βελτιώνουν την ακρίβεια και την ερμηνεία πολύπλοκων συνόλων δεδομένων. Παρόλο που υπήρχαν δυσκολίες, με την πολυπλοκότητα των υπολογισμών και την απουσία ήδη ενσωματωμένων πακέτων για τη χρήση των μοντέλων GoM και MMSB, αυτο διαχείριζεται με την δημιουργία προσαρμοσμένων αλγορίθμων για την εκτέλεση αυτών των μοντέλων.Εφαρμόζοντας τον αλγόριθμο Expectation-Maximization και στα δύο σενάρια, αυτή η έρευνα δείχνει πώς τα μικτά μοντέλα μελών μπορούν να βοηθήσουν στην καλύτερη κατανόηση των μοτύβων των δεδομένων.Στην περίπτωση του μοντέλου LDA, χρησιμοποιείται ένα υπάρχον πακέτο και εφαρμόζεται η μέθοδος Collapsed Gibbs Sampling. Τα αποτελέσματα τονίζουν την ανάγκη για μελλοντική έρευνα με επίκεντρο την αλγοριθμική απόδοση και την ερμηνευσιμότητα του μοντέλου.
Λέξη κλειδί Μοντέλα στοχαστικών μπλοκ με μεικτή συμμετοχή
Λανθάνουσα Dirichlet κατανομή
Βαθμός συμμετοχής
Μοντέλα με μικτή συμμετοχή μέλους
Mixed membership models
Grade of Membership (GoM)
Latent Dirichlet Allocation (LDA)
Mixed Membership Stochastic Block (MMSB) models
Διαθέσιμο από 2024-10-12 17:15:28
Ημερομηνία έκδοσης 04-10-2024
Ημερομηνία κατάθεσης 2024-10-12 17:15:28
Δικαιώματα χρήσης Free access
Άδεια χρήσης https://creativecommons.org/licenses/by/4.0/