Abstract : | Η καθυστέρηση της εξάπλωσης των έξυπνων μετρητών στους καταναλωτές χαμηλής τάσης πανευρωπαϊκά, παρατείνει το πρόβλημα πρόβλεψης της κατανάλωσης ηλεκτρικής ενέργειας. Ανάμεσα στους άμεσα επηρεαζόμενους βρίσκονται και οι προμηθευτές ηλεκτρικής ενέργειας της Λιανικής Αγοράς (Προμηθευτές), οι οποίοι προμηθεύουν με ρεύμα τους τελικούς καταναλωτές. Η παρούσα μελέτη αναπτύσσει ένα μοντέλο πρόβλεψης της μηνιαίας κατανάλωσης ηλεκτρικής ενέργειας για τον μεγαλύτερο Προμηθευτή στην Ελληνική Δημοκρατία (Ελλάδα). Ο Προμηθευτής διαθέτει ένα χαρτοφυλάκιο με περισσότερους από 4,6 εκατομμύρια μετρητές (παροχές), οι οποίοι επί του παρόντος τιμολογούνται κάθε δύο μήνες με βάση τις εκτιμήσεις κατανάλωσης και κάθε τέσσερις μήνες με βάση τη μέτρηση του Διαχειριστή του Ελληνικού Συστήματος Διανομής (ΔΣΔ). Ελλείψει έξυπνων μετρητών, τα πραγματικά δεδομένα κατανάλωσης είναι διαθέσιμα μόνο μέσω της επιτόπιας καταμέτρησης από κλιμάκια του ΔΣΔ. Ως αποτέλεσμα τα δεδομένα αποτελούνται από καταμετρήσεις που ποικίλουν τόσο ως προς την περίοδο αναφοράς όσο και ως προς τη διάρκεια της περιόδου αυτής για κάθε καταναλωτή. Σε αντίθεση με την πλειονότητα της υπάρχουσας βιβλιογραφίας, σχετικά με την πρόβλεψη χρονοσειρών κατανάλωσης ηλεκτρικής ενέργειας, η οποία είτε κάνει πρόβλεψη μιας μονοδιάστατης χρονοσειράς, είτε πολλών ‘παράλληλων’ χρονοσειρών με τι μορφή μίας πολυδιάστατης χρονοσειράς, η παρούσα μελέτη χρησιμοποιεί τη μέθοδο των πολλαπλών μονοδιάστατων / πολυδιάστατων χρονοσειρών. Αυτή η μέθοδος δίνει την δυνατότητα της εκπαίδευσης ενός μοντέλου επί πολλαπλών χρονοσειρών διαφορετικού μεγέθους και περιόδου αναφοράς, καθιστώντας την ιδανική για το παρόν πρόβλημα. Το πρόβλημα μοντελοποιείται ως πρόβλεψη πολλαπλών χρονοσειρών (multiple timeseries) μηνιαίων δεδομένων κατανάλωσης ηλεκτρικής ενέργειας, σε δείγμα περίπου εννέα χιλιάδων πραγματικών καταναλωτών, με δεδομένα κατανάλωσης από το 2018 έως το 2022. Η ανάγκη του Προμηθευτή για μηνιαίες προβλέψεις, συν του γεγονότος ότι οι μετρήσεις γίνονται αθροιστικά σε τετραμηνιαίες περιόδους, απαιτεί την επαύξηση-μετασχηματισμό (augmentation) των αρχικών δεδομένων σε μηνιαία. Η παρούσα μελέτη εξετάζει τόσο τις κλασικές μεθόδους στατιστικής, όσο και αυτές της μηχανικής μάθησης (MM) και της βαθιάς μάθησης (BM). Τα αποτελέσματα δείχνουν ότι ένα μοντέλο πολλαπλών μονοδιάστατων χρονοσειρών LightGBM, ξεπερνά το υπάρχον μοντέλο του ΔΣΔ, καθώς και μοντέλα μηχανικής και βαθιάς μάθησης, επιτυγχάνοντας περίπου 23% και 14% βελτίωση της πρόβλεψης όσον αφορά τις μετρικές RMSE και MAPE αντίστοιχα, σε εκτός δείγματος δεδομένα. Επιπλέον, τα αποτελέσματα υποδεικνύουν ότι τα μοντέλα πολλαπλών χρονοσειρών επιτυγχάνουν καλύτερες επιδόσεις, από τα μοντέλα μονής χρονοσειράς, τόσο όσον αφορά τις προβλέψεις δεδομένων εκτός δείγματος όσο και στον χρόνο εκτέλεσης (συμπεριλαμβανομένων των χρόνων εκπαίδευσης και πρόβλεψης). The delay of smart meters roll-out to low voltage consumers globally does prolong the electricity consumption forecasting problem for retail power providers. The current study develops a monthly electricity consumption forecasting model for the biggest power provider in the Hellenic Republic (Greece). The provider has a portfolio of more than 4.6 million meters that are currently being invoiced every two months based on the consumption estimations and every four months based on the measuring of the Hellenic Distribution System Operator (DSO). In the absence of smart meters the actual consumption data are available only through the on-site metering of the DSO, thus vary both in the period of aggregation as well as in their period duration among the different consumers. Hence the two-month invoices based on estimations create significant fluctuations in electricity charges, reducing the quality of the service, and the consumer experience. Most of the existing literature on electricity timeseries forecasting, either does single univariate or multivariate timeseries forecasting. The current study utilizes the method of multiple univariate/multivariate timeseries, to fit thousands of different size and period timeseries in one model. The need of the provider for monthly forecasts and the measurements being in variations of four-month aggregations, requires the augmentation of the original data. The problem is modelled as a multiple timeseries forecasting of monthly electricity consumption data, in a sample of approximately nine thousand real consumers, with consumption data from 2018 to 2022. The study considers both classic timeseries methods as well as Machine Learning (ML) and Deep Learning (DL). The results show that a multiple univariate timeseries LightGBM model, outperforms the existing model of the DSO, as well as deep learning models, achieving approximately 23% and 14% forecasting improvement regarding the out-of-sample RMSE and MAPE metrics respectively. Moreover, the results indicate that the multiple timeseries fit models outperform, the single timeseries models both regarding the out-of-sample data forecasts as well as the time efficiency (including training and prediction times).
|
---|