Περίληψη : | Σκοπός της παρούσας εργασίας είναι η ανασκόπηση των πιο σημαντικών μεθοδολογιών μοντελοποίησης πρόβλεψης ποδοσφαιρικών αγώνων και εφαρμογή κάποιων από αυτές σε πραγματικά δεδομένα, με σκοπό τον έλεγχο της προβλεπτικής τους δύναμης. Οι μέθοδοι μπορούν να κατηγοριοποιηθούν σε δύο ομάδες, εκτίμησης των αναμενόμενων γκολ ανά ομάδα και εκτίμησης πιθανότητας του τελικού αποτελέσματος για κάθε δοθέντα αγώνα. Μετά από παράθεση επιχειρηματολογίας, αποφασίστηκε να προχωρήσουμε με την πρώτη κατηγορία και να εφαρμόσουμε τις πιο δημοφιλείς τεχνικές εκτίμησης αναμενόμενων γκολ στα 5 κορυφαία ευρωπαϊκά πρωταθλήματα. Όλα τα μοντέλα εκπαιδεύτηκαν χρησιμοποιώντας δεδομένα της χρονιάς 2017-2018 και στη συνέχεια έγιναν προβλέψεις για κάθε αγωνιστική για την επόμενη χρονιά 2018-2019, με την ταυτόχρονη επανεκπαίδευση των μοντέλων μετά το πέρας κάθε αγωνιστικής. Όλα τα αποτελέσματα παρατίθενται και αναλύονται. Η αρχική εξερευνητική ανάλυση κάθε πρωταθλήματος χρησιμοποιήθηκε για να ερμηνεύσει τα ευρήματα και να εξηγήσει γιατί τελικά κάθε ένα έχει διαφορετικό ισχυρότερο μοντέλο πρόβλεψης. Στο τελευταίο κεφάλαιο αποφασίστηκε να γίνει χρήση του Bivariate Poisson μοντέλου και να γενικευτεί, έτσι ώστε να υποστηρίξει την στοιχηματική τιμολόγηση ενός αγώνα σε εξέλιξη, και πιο συγκεκριμένα κάποιες βασικές και δημοφιλείς παράγωγες αγορές, ενώ στην συνέχεια έγινε μια απευθείας σύγκριση με έναν κορυφαίο ευρωπαϊκό πάροχο αθλητικού στοιχήματος The scope of this thesis is to review the most important methodologies of soccer predictive modelling and apply some of them in real data in order to test their power. The methodologies can be classified into two main categories, estimating the expected goals per team and estimating the outcome probability for any given match. By discussing the proper arguments, we decided to go with the first methodology and apply the most popular techniques of estimating goal expectancy to the Top 5 European Leagues. All models were trained using actual data from season 2017-2018, and then predictions were carried on a matchday basis for the following season 2018-2019, by applying retraining after the end of each. At the end of the analysis, all findings are presented and discussed. An early explanatory analysis of each League is used to explain why eventually each League’s fixtures can be best predicted using a different model. In the final chapter we decided to use the Bivariate Poisson model and expand it to an in-play bet pricing model, able to offer derivative prices to some basic and popular bet markets, and finally a direct comparison was made with a prominent European Bookmaker.
|
---|