Περίληψη : | Ένα πρόβλημα που απασχολεί όλο και περισσότερες χώρες ανά τον κόσμο είναι οι δασικές πυρκαγιές. Η σημαντικότητα του συγκεκριμένου ζητήματος δεν εξαρτάται μόνο από τις ανθρώπινες απώλειες, αλλά και τις επιπτώσεις στο περιβάλλον και στην οικονομία. Σήμερα υπάρχουν μέθοδοι που έχουν την δυνατότητα να προβλέψουν τις δασικές πυρκαγιές ώστε να σταματήσουν λίγο μετά την εκδήλωση τους ή και ακόμη και πριν συμβούν. Ένας τρόπος είναι με την χρήση της νέας τεχνολογίας και πιο συγκεκριμένα της Τηλεπισκόπησης και των Γεωγραφικών Συστημάτων Πληροφοριών που μέσω δορυφορικών εικόνων η άλλων τρόπων μπορούν να ανιχνεύσουν την φωτιά και να προβλέψουν την πορεία της. Η λύση αυτή όμως απαιτεί ειδική επεξεργασία των δεδομένων και σε πολλές περιπτώσεις το κόστος είναι μεγάλο. Ένας άλλος τρόπος είναι η ανάλυση δεδομένων προκειμένου να προβλεφθούν οι δασικές πυρκαγιές. Τα πλεονεκτήματα της συγκεκριμένης λύσης είναι το χαμηλό κόστος και η εύκολη επεξεργασία των δεδομένων. Στην παρούσα εργασία με την χρήση δύο μεθόδων, της γραμμικής παλινδρόμησης και του τυχαίου δάσους θα προβλέψουμε την έκταση της καμένης γης στην Εύβοια και θα συγκρίνουμε ποια μέθοδο έχει μεγαλύτερη ακρίβεια και καλύτερη απόδοση. Για αυτό το σκοπό συλλέξαμε και αναλύσαμε δεδομένα από την πυροσβεστική και μετεωρολογική υπηρεσία για την περίοδο 2020-2022 που αφορούν την Εύβοια και χωρίσαμε σε δύο βάσεις τα δεδομένα μας με κριτήριο την έκταση της καμένης γης και εφαρμόσαμε τις παραπάνω μεθόδους. Επίσης χωρίσαμε την βλάστηση της Ευβοίας σε 5 μεγάλες κατηγορίες και προσθέσαμε και την συγκεκριμένη μεταβλητή στο μοντέλο μας. Τέλος με σκοπό την υποστήριξη των τοπικών εμπλεκόμενων φορέων και βελτιστοποίηση των αποφάσεων τους σχετικά με την πρόληψη μελλοντικών πυρκαγιών αλλά και την καλύτερη κατανομή των πυροσβεστικών δυνάμεων, αρχικά δημιουργήσαμε ένα δέντρο απόφασης με τον αλγόριθμο j48 με αρκετά καλά αποτελέσματα και στην συνέχεια πραγματοποιήσαμε περιγραφική εξόρυξη (descriptive mining) στα δεδομένα με σκοπό τον εντοπισμό συσχετίσεων ή μοτίβων μεταξύ τους. Οι μέθοδοι που χρησιμοποιήσαμε ήταν η ομαδοποίηση σε 4 συστάδες των δεδομένων με παρόμοια χαρακτηριστικά μεταξύ τους με τον αλγόριθμο k-mean. Με τους αλγορίθμους Apriori και GSP προσπαθήσαμε να ανακαλύψουμε σχέσεις και κανόνες, αρχικά μεταξύ των μεταβλητών με κυριότερο στόχο εάν υπάρχει σχέση αναμεσά στην έκταση της καμένης γης και την κατεύθυνση του ανέμου και στην συνέχεια σε επίπεδο διαφορετικής συστάδας. A problem that is increasingly affecting more and more countries around the world is forest fires. The importance of this issue depends not only on the human losses but also on the impact on the environment and the economy. Today some methods have the potential to predict forest fires so that they can be stopped shortly after their occurrence or even before they happen. One way is using new technology, in particular remote sensing and Geographical Information Systems, which through satellite images or other means can detect the fire and predict its course. However, this solution requires special data processing and in many cases the costs are high. Another way is to analyze data to predict forest fires. The advantages of this solution are low cost and easy data processing. In this paper by using two methods, linear regression, and random forest, we will predict the area of burnt land in Evia and we will compare which method has higher accuracy and better performance. For this purpose, we collected and analyzed data from the fire and meteorological service for the period 2020-2022 concerning Evia and divided our data into two databases based on the extent of burnt land and applied the above methods. We also divided the vegetation of Evia into 5 major categories and added this variable to our model. Finally, to support local stakeholders and optimize their decisions regarding the prevention of future fires and the better allocation of firefighting forces, we first created a decision tree with the algorithm j48 with quite good results and then we performed descriptive mining on the data to identify correlations or patterns between them. The methods we used were clustering into 4 clusters of data with similar characteristics between them using the k-mean algorithm. With the Apriori and GSP algorithms, we tried to discover relationships and rules, first between the variables with the main objective of finding out if there is a relationship between the area of burnt land and wind direction and then at the level of different cluster
|
---|