Abstract : | Το επίκεντρο αυτής της μελέτης είναι η εφαρμογή του Pythagorean Expectation τύπου και η σύγκρισή του με διαφορετικές μεθόδους μηχανικής μάθησης σε δεδομένα της Ευρωλίγκας. Σχετικά με το Pythagorean Expectation, χρησιμοποιήσαμε την παραδοσιακή μορφή αυτού του τύπου και ερευνήσαμε τον βέλτιστο εκθέτη του τύπου σε κάθε χρονολογικό έτος των δεδομένων μας και καταλήξαμε στο βέλτιστο, συνολικά, το οποίο στη συνέχεια συγκρίθηκε επίσης με άλλες τιμές από άλλες σχετικές μελέτες στον χώρο του μπάσκετ. Επιπλέον, το αντίστοιχο διάστημα εμπιστοσύνης 95% για αυτήν την τιμή ορίζεται χρησιμοποιώντας τη μέθοδο bootstrap. Στη συνέχεια, εφαρμόστηκε το Pythagorean Expectation χρησιμοποιώντας ως εκθέτη τη σχετική βέλτιστη τιμή για την πρόβλεψη του τελικού αριθμού νικών για κάθε ομάδα με βάση τους πόντους στα μισά της σεζόν που σημειώθηκαν για κάθε ομάδα. Όσον αφορά τις μεθόδους μηχανικής μάθησης, εφαρμόστηκαν πέντε διαφορετικά μοντέλα ανάλογα με την προσέγγιση που ακολουθήθηκε και το σύνολο δεδομένων. Πιο συγκεκριμένα, ένα μοντέλο πολλαπλής γραμμικής παλινδρόμησης και ένα μοντέλο διωνυμικής παλινδρόμησης με βάση τις μέσες τιμές για κάθε ομάδα στατιστικών boxscore. Προκειμένου το Pythagorean Expectation να είναι συγκρίσιμο με αυτούς τους τύπους παλινδρόμησης, διεξήχθη ένα μοντέλο πολλαπλής παλινδρόμησης και ένα μοντέλο διωνυμικής παλινδρόμησης χρησιμοποιώντας ως μεταβλητές τους πόντους της κάθε ομάδας. Επιπλέον, ένα ακόμη διωνυμικό μοντέλο λογιστικής παλινδρόμησης πραγματοποιήθηκε σε σύνολο δεδομένων επιπέδου παιχνιδιού χρησιμοποιώντας ως μεταβλητές τη μέση τιμή των στατιστικών στοιχείων boxscore. Πραγματοποιήθηκαν δύο μοντέλα με βάση την πολλαπλή παλινδρόμηση σε επίπεδο κατάταξης και δύο διωνυμικές λογιστικές παλινδρομήσεις σε επίπεδο κατάταξης. Ένα μοντέλο λογιστικής παλινδρόμησης πραγματοποιήθηκε σε επίπεδο παιχνιδιού. Εφαρμόζοντας σταδιακή παλινδρόμηση με βάση το κριτήριο AIC, το μοντέλο πολλαπλής παλινδρόμησης και το μοντέλο διωνυμικής λογιστικής παλινδρόμησης χρησιμοποιώντας μόνο ως μεταβλητές τους πόντους, προβλέπουν με ελάχιστη μεγαλύτερη ακρίβεια τον τελικό αριθμό των νικών των ομάδων γενικά. The focus of this study is the Pythagorean Expectation formula application and its comparison to different machine learning methods on Euroleague data. For Pythagorean expectation, we used the traditional structure of this formula and we investigated the optimal exponent of the formula on each of the seasons of our data and concluded to the optimal, in overall, which afterwards was also compared with other values from other related studies in the game of basketball. Additionally, the respective 95% confidence interval for this value is defined by using the bootstrap method. Subsequently, Pythagorean expectation was applied using as exponent the related optimal value to predict the final number of wins for each team based on the half season points scored and allowed for each team. Regarding the machine learning methods, five different models were applied depending on the approach followed and on the dataset. More specifically, one multiple regression model and one binomial regression model based on mean values for each team of boxscore statistics. In order for Pythagorean expectation to be comparable with these type of regressions, one multiple regression model and one binomial regression model using as covariates points scored and points allowed were conducted. Additionally, one more binomial logistic regression model was performed on game level dataset using as covariates the mean value of boxscore statistics. Two models were performed based on multiple regression on ranking level and two binomial logistic regressions on ranking level. One logistic regression model was performed on game level. By applying stepwise regression based on AIC criterion, the multiple regression model and the binomial logistic regression model using only as covariates points scored and points allowed, predict more accurately the final number of wins of teams in general. However, it must be noted that Pythagorean expectation is slightly lacking in terms of predictions.
|
---|