Περίληψη : | Hidden Markov models (HMMs) are models in which the distributionthat generates an observation depends on the state of an underlying and unobserved Markov process. HMMs have been employed in a variety of areas, including signal processing, bioinformatics, environment and ecology, and are noted for their flexibility and computational efficiency. In an HMM’sbasic model formulation, the consecutive time points spent in each state, called the dwell time, follows a geometric distribution. This assumption is mathematically and computationally very convenient and allows for an efficient likelihood evaluation and inference, however in some applications may be too restrictive or inappropriate. Hidden semi-Markov models (HSMMs)generalize hidden Markov models by allowing the dwell time in each state to follow any distribution on the positive integers. This generalization comes at a cost, since the likelihood evaluation is not straightforward. For that reason, a strategy of fitting HSMMs by using an HMM to represent the HSMM of interest is shown. With this way, the whole HMM methodology becomes applicable to the more general class of HSMMs. The approach is illustrated using a real data set on yearly counts of major earthquakes in the world. A variety of standard discrete parametric distributions for the dwell times is examined, such as the shifted Poisson or negative binomial, and the relative performance of HMMs and HSMMs is investigated. Τα κρυπτο-μαρκοβιανά μοντέλα (HMM) είναι μοντέλα στα οποία η κατανομήπου δημιουργεί μια παρατήρηση εξαρτάται από την κατάσταση μιας υποκείμενης και μη παρατηρούμενης διαδικασίας Markov. Τα HMM έχουν χρησιμοποιηθεί σε διάφορους τομείς, όπως η επεξεργασία σήματος, η βιοπληροφορική, το περιβάλλον και η οικολογία, και διακρίνονται για την ευελιξία και την υπολογιστική τους απόδοση. Σε ένα HMM, ο συνεχόμενος διαδοχικός χρόνος που ξοδεύεται σε μία κατάσταση, που ονομάζονται χρόνος παραμονής, ακολουθεί μια γεωμετρική κατανομή. Αυτή η υπόθεση είναι μαθηματικά και υπολογιστικά πολύ βολική και επιτρέπει έναν άμεσο υπολογισμό της πιθανοφάνειας και αποτελεσματική στατιστική συμπερασματολογία, ωστόσο σε ορισμένες εφαρμογές μπορεί να είναι πολύ περιοριστική ή ακατάλληλη. Τα κρυπτο-ημιμαρκοβιανά μοντέλα (HSMM) γενικεύουν τα HMM, επιτρέποντας στον χρόνο παραμονής σε κάθε κατάσταση να ακολουθεί οποιαδήποτε κατανομή στους θετικούς ακέραιους. Αυτή η γενίκευση έρχεται όμως με ένα κόστος, καθώς ο υπολογισμός της πιθανοφάνειας δεν είναι πλέον άμεσος. Για το λόγο αυτό, παρουσιάζεται μια στρατηγική προσαρμογής του HSMM, χρησιμοποιώντας ένα HMM για την αναπαράσταση του. Με αυτόν τον τρόπο, ολόκληρη η μεθοδολογία των HMM γίνεται εφαρμόσιμη στη γενικότερη κατηγορία των HSMM. Η προσέγγιση απεικονίζεται χρησιμοποιώντας ένα πραγματικό σύνολο δεδομένων σχετικά με τον ετήσιοαριθμό μεγάλων σεισμών στον κόσμο. Εξετάζονται διάφοροι τύποι διακριτώνπαραμετρικών κατανομών για τους χρόνους παραμονής, όπως η μετατοπισμένη Poisson ή η αρνητική διωνυμική, και διερευνάται η σχετική απόδοση των HMMκαι HSMM.
|
---|