Περίληψη : | Το ζήτημα της ενοποίησης δεδομένων αποτελεί ένα αντικείμενο συνεχούς έρευνας στο πεδίο των τεχνολογιών πληροφορικής που εστιάζουν στη διαχείριση και ανάλυση δεδομένων. Ειδικότερα, τα δεδομένα που παράγονται και συλλέγονται στο πλαίσιο λειτουργίας των μεγάλων σύγχρονων πόλεων αποτελούν ένα χαρακτηριστικό παράδειγμα του όγκου και ετερογένειας στοιχείων που συνυπάρχουν σε ένα οικοσύστημα και μπορούν δυνητικά να αξιοποιηθούν για παραγωγή χρήσιμης πληροφορίας. Η κοινωνική και οικονομική ζωή, η διαχείριση ενέργειας, υδάτων και απορριμμάτων, ο αθλητισμός, ο πολιτισμός, το αστικό περιβάλλον, ο τουρισμός είναι μερικοί από τους τομείς που συλλειτουργούν και αλληλεπιδρούν εντός του «ζωντανού όργανισμού» που ονομάζεται πόλη. Στην παρούσα εργασία εξετάζεται, υπό το πρίσμα των τεχνολογικών παραμέτρων των λειτουργιών αυτών, η αποτελεσματική διαχείριση και αξιοποίηση των δεδομένων που παράγονται από τις αντίστοιχες δραστηριότητες. Στη συνέχεια, πραγματοποιείται εκτενής αναφορά στο ρόλο που διαδραματίζουν τα Big Data και τα Open Data στη διαμόρφωση των τεχνολογιών διαχείρισης δεδομένων και ειδικότερα σε αυτές που έχουν εφαρμογή σε πόλεις. Το πρώτο μέρος ολοκληρώνεται με την παράθεση των κύριων τεχνολογικών προσεγγίσεων ενοποίησης δεδομένων εστιάζοντας κατά βάση στην χρήση των οντολογιών όπου αξιοποιείται αποτελεσματικά ο σαφής εννοιολογικός προσδιορισμός του πλήθους των δεδομένων που διαχειρίζεται η πόλη (Ontology-Based Data Access). Στο δεύτερο μέρος της εργασίας υλοποιείται το πειραματικό σκέλος της OBDA προσέγγισης με χρήση πραγματικών δεδομένων που συλλέχθηκαν από οργανισμούς της πόλης της Αθήνας. Για να καταστεί εφικτή η πειραματική εφαρμογή του OBDA framework που επιλέχθηκε (Ontop) αρχικά είναι απαραίτητο να «καθαριστούν» τα δεδομένα. Στη συνεχεία, ανά κατηγορία, θα εισαχθούν σε εννέα διακριτές βάσεις δεδομένων που θα δημιουργηθούν για το σκοπό αυτό. Το επόμενο βήμα είναι η δημιουργία μία οντολογίας πόλης. Θα αξιοποιηθούν τυχόν υφιστάμενες οντολογίες και όπου απαιτείται θα προσαρμοσθούν κατάλληλα για την πόλη της Αθήνας και τα διαθέσιμα δεδομένα. Τέλος, θα πραγματοποιηθεί η σύνδεση της οντολογίας με τις υποκείμενες βάσεις δεδομένων και η εκτέλεση ερωτημάτων στην οντολογία μέσω της γλώσσας SPARQL. Από αυτή τη διαδικασία θα επιχειρηθεί η τυχόν ανάδειξη του συγκριτικού πλεονεκτήματος που προσφέρει η αξιοποίηση σημασιολογικής πληροφορίας στον τομέα ενοποίησης δεδομένων μέσω της χρήσης οντολογιών. Data integration is a subject of continuous research in the field of information technologies focusing on data management and analysis. In particular, the data generated and collected in the context of the operation of large modern cities are a prime example of the volume and heterogeneity of elements that co-exist in an ecosystem and can potentially be exploited to produce useful information. Social and economic life, energy, water and waste management, sports, culture, urban environment, and tourism are some of the areas that co-operate and interact within the "living organism" called the city.In the present thesis, it is considered, in the light of the technological parameters of these functions, the efficient management and exploitation of the data generated by the respective activities. Subsequently, there is an extensive reference to the role played by Big Data and Open Data in the formation of data management technologies, and in particular those that apply to cities. The first part concludes with the disclosure of the main technological approaches to data integration, focusing mainly on the use of ontologies that effectively use the clear conceptual determination of the amount of data managed by the city (Ontology-Based Data Access).In the second part of the thesis the experimental part of the OBDA approach is implemented, using real data collected by organizations in the city of Athens. In order to allow the experimental implementation of the OBDA framework chosen (Ontop) it is first necessary to "clean" the data. Subsequently, by category, they will be inserted into nine distinct databases to be created for this purpose. The next step is to create a city ontology. Any existing ontologies will be exploited and, where appropriate, they will be adapted to the city of Athens and the available data. Finally, the connection of the ontology to the underlying databases and the querying of the ontology through the SPARQL language, will take place.This process will attempt to highlight the comparative advantage of using semantic information in the field of data integration through the use of ontologies.
|
---|