Abstract : | The aim of this project is to study the demand of bike sharing systems and try to understand what other variables influence the total number of rentals. The main objective is to create a predictive model for the demand of 10 stations of the Capital Bikeshare, one of the U.S.A.’s largest bicycle sharing systems on an hourly basis. At first, I did some research on the topic and the methodologies that have been used to develop a predictive model for the system’s demand forecasting. The next step was to acquire the necessary data for our analysis. This required downloading data from Capital Bikeshare website, Washington D.C.’s local government website (https://www.capitalbikeshare.com/system-data) and weather data from an internet weather service website (www.timeanddate.com.). In this project we are going to use historical data for two years from 2018 to 2019 on an hourly basis. The data mentioned above were aggregated into one single dataset. For our analysis, we chose 10 stations of the bike sharing system to study. Once the data for the 10 selected stations were gathered, the R programming language was used to visualize and explore the data. Then, time series forecasting models were built to predict the demand of bikes of each station. For most of the station the models gave us good predictions, but they were not the best that we could get. After fitting the models, it was obvious that data incorporated more than one seasonal component, and this was something that the models that were trained could not handle to result in better prediction. Στόχος αυτής της εργασίας είναι να μελετήσει και να προβλέψει τη ζήτηση ενός συστημάτος κοινής χρήσης ποδηλάτων και να προσπαθήσει να κατανοήσει ποιες άλλες μεταβλητές επηρεάζουν τον συνολικό αριθμό των ενοικιάσεων. Ο κύριος στόχος είναι να δημιουργηθεί ένα μοντέλο πρόβλεψης για τη ζήτηση 10 σταθμών του Capital Bikeshare, ενός από τα μεγαλύτερα συστήματα κοινής χρήσης ποδηλάτων των ΗΠΑ σε ωριαία βάση. Αρχικά, έγινε κάποια έρευνα σχετικά με το θέμα και τις μεθοδολογίες που έχουν χρησιμοποιηθεί για την ανάπτυξη ενός προγνωστικού μοντέλου για την πρόβλεψη ζήτησης του συστήματος. Το επόμενο βήμα ήταν να αποκτήσουμε τα απαραίτητα δεδομένα για την ανάλυσή μας. Αυτό απαιτούσε λήψη δεδομένων από τον ιστότοπο Capital Bikeshare, τον ιστότοπο της τοπικής κυβέρνησης της Ουάσιγκτον DC (https://www.capitalbikeshare.com/system-data) και δεδομένα καιρού από έναν ιστότοπο μετεωρολογικής υπηρεσίας στο Διαδίκτυο (www.timeanddate.com.). Σε αυτό το project πρόκειται να χρησιμοποιήσουμε ιστορικά δεδομένα για δύο χρόνια από το 2018 έως το 2019 σε ωριαία βάση. Τα δεδομένα που αναφέρονται παραπάνω συγκεντρώθηκαν σε ένα ενιαίο σύνολο δεδομένων. Για την ανάλυσή μας, επιλέξαμε 10 σταθμούς του συστήματος κοινής χρήσης ποδηλάτων για μελέτη. Μόλις συγκεντρώθηκαν τα δεδομένα για τους 10 επιλεγμένους σταθμούς, χρησιμοποιήθηκε η γλώσσα προγραμματισμού R για την οπτικοποίηση και την εξερεύνηση των δεδομένων. Στη συνέχεια, κατασκευάστηκαν μοντέλα πρόβλεψης χρονοσειρών για την πρόβλεψη της ζήτησης των ποδηλάτων κάθε σταθμού. Για το μεγαλύτερο μέρος του σταθμού τα μοντέλα μας έδωσαν καλές προβλέψεις, αλλά δεν ήταν ό,τι καλύτερο μπορούσαμε. Μετά την τοποθέτηση των μοντέλων, ήταν προφανές ότι τα δεδομένα ενσωματώνουν περισσότερα από ένα εποχιακά στοιχεία, και αυτό ήταν κάτι που τα μοντέλα που εκπαιδεύτηκαν δεν μπορούσαν να χειριστούν για να έχουν καλύτερη πρόβλεψη.
|
---|