Συλλογές | |
---|---|
Τίτλος |
Discrete time Markov decision processes: theory and applications |
Εναλλακτικός τίτλος |
Μαρκοβιανά μοντέλα αποφάσεων διακριτού χρόνου: θεωρία και εφαρμογές |
Δημιουργός |
Μπούττνερ, Δημήτριος, Bouttner, Dimitrios |
Συντελεστής |
Βακερούδης, Σταύρος Athens University of Economics and Business, Department of Statistics Zazanis, Michael Kyriakidis, Epaminondas |
Τύπος |
Text |
Γλώσσα |
en |
Αναγνωριστικό |
http://www.pyxida.aueb.gr/index.php?op=view_object&object_id=9577 |
Περίληψη |
In this project the basic theory of Markov Decision Processes (MDP's) is presented. It is explained how these models are defined and in which problems they are needed. Three basic algorithms for optimizing systems that can be modeled as MDP's are discussed: The Policy Iteration, Value Iteration and Linear Programming algorithms. The basic theoretical background, such as the convergence of the algorithms, is explained in detail. The convergence is proved under certain conditions that are met in most realistic problems. Finally, numerical examples of real world applications are solved and the results and the performance of the algorithms is commented. Στην παρούσα εργασία παρουσιάζεται η βασική θεωρία των Μαρκοβιανών Μοντέλων Αποφάσεων. Εξηγείται πως ορίζονται τα μοντέλα και σε ποια προβλήματα χρειάζονται. Μελετώνται τριες βασικοί αλγόριθμοι για τη βελτιστοποίηση συστημάτων που μπορούν να μοντελοποιηθούν ως Μαρκοβιανές διαδικασίες διακριτού χρόνου: Ο αλγόριθμος Policy Iteration, ο Value Iteration και ο αλγόριθμος που βασίζεται στο γραμμικό προγραμματισμό. Η βασική θεωρία, όπως για παράδειγμα αυτή που αποδεικνύει τη σύγκιση των αλγορίθμων, εξηγείται με λεπτομέρια. Η σύγκλιση των αλγορίθμων αποδεικνύεται στην παρούσα κάτω από περιοριμούς οι οποίοι ικανοποιούνται στα περισσότερα πρακτικά προβλήματα. Τέλος, λύνονται αριθμητικά προβλήματα βελτιστοποίησης που προκύπτουν από ρεαλιστικές εφαρμογές και σχολιάζεται η απόδοση των αλγορίθμων. |
Λέξη κλειδί |
Μαρκοβιανά μοντέλα αποφάσεων Discrete time Markov Decision Processes (MDPs) Διακριτός χρόνος |
Διαθέσιμο από |
2022-07-13 15:22:55 |
Ημερομηνία έκδοσης |
2022 |
Ημερομηνία κατάθεσης |
2022-07-13 15:22:55 |
Δικαιώματα χρήσης |
Free access |
Άδεια χρήσης |
https://creativecommons.org/licenses/by/4.0/ |