Abstract : | The present dissertation focuses on cluster analysis methods to mixed type data. Hence, data that are not exclusively comprised of a single type ofvariable, but may combine continuous and categorical variables. This kind of data may be usually seen in real-world situations. In the current master thesis, we first present some common clustering techniques of mixed-type data. Later, we present more thoroughly five methods that have drawn attention in recent years. Finally, we present an application of three of those methods to a clinical trial data set of mixed-type data and compare their results. Η παρούσα διατριβή εστιάζει σε μεθόδους ανάλυσης συστάδων σε δεδομένα μεικτού τύπου. Δηλαδή, δεδομένα τα οποία δεν αποτελούνται αποκλειστικά από έναν τύπο μεταβλητών, αλλά συνδυάζουν συνεχείς και κατηγορικές μεταβλητές. Στον πραγματικό κόσμο τέτοιου είδους δεδομένα μπορεί να συναντήσουμε συχνά. Στην παρούσα διπλωματική εργασία παρουσιάζουμε αρχικά κάποιες από τις πιο συνήθεις τεχνικές συσταδοποίησης τέτοιου είδους δεδομένων και στη συνέχεια παρουσιάζουμε πιο αναλυτικά πέντε μεθόδους οι οποίες έχουν τραβήξει το ενδιαφέρον στην βιβλιογραφία τα τελευταία χρόνια. Τέλος, παρουσιάζουμε μία εφαρμογή των τριών αυτών μεθόδων σε δεδομένα μεικτού τύπου κλινικής δοκιμής και συγκρίνουμε τα αποτελέσματα.
|
---|