Περίληψη : | Τα datalakes είναι μια κοινή λύση διαχείρισης δεδομένων για οργανισμούς που επιθυμούν μια ολιστική ενοποιημένη εικόνα των δεδομένων τους. Εμπνευσμένος από την άνοδο της σημασιολογικής προσέγγισης τους, η παρούσα διατριβή επιχειρεί να εμβαθύνει στις εφαρμογές των γραφημάτων γνώσης στο πλαίσιο των semantic data lakes και να διακρίνει τις επιτεύξιμες δυνατότητες σε αυτές. Η παρούσα διατριβή ξεκινά με μια σύντομη ερμηνεία της ιστορικής εξέλιξης των συστημάτων διαχείρισης δεδομένων, ξετυλίγοντας το κουβάρι της σημερινής ανάγκης για semantics. Στη συνέχεια, προχωρά με την αποσαφήνιση των θεωρητικών προϋποθέσεων που στηρίζουν την τρέχουσα σημασιολογική άνοδο. Δίνεται ιδιαίτερη έμφαση στην αξιοποίηση των actioning και decisioning knowledge graph για την υλοποίηση του σημασιολογικού επιπέδου, αντλώντας έμπνευση από τη δουλειά των Jesús Barrasa & Webber (2021) στους τους γράφους γνώσης. Τέλος, σκιαγραφεί την πρακτική εφαρμογή των actioning και decisioning γράφων γνώσης στo semantic datalake της Niovity. Με την επαύξηση του γράφου γνώσης της Niovity και τη ανάδειξη των semantics της με τη χρήση σύγχρονων τεχνολογιών γράφων, καταδεεικνύεται πώς κατασκευάστηκε ένας ενοποιημένος γράφος γνώσης πάνω στην τρέχουσα δομή δεδομένων της, με στόχο: (α) Τη καλύτερη διαχείριση των δεδομέων καθ' όλη τη διάρκεια του κύκλου ζωής του dalake (εξερεύνηση δεδομένων, data integration και lineage, οπτικοποίηση και διακυβέρνηση) και διευκόλυση εσωτερικών λειτουργιών της εταιρείας (διαχείριση μεταδεδομένων) με τη διαμόρφωση ενός actioning knowledge graph. (β) Την αναβάθμιση των graph δυνατοτήτων του data lake (graph queries, graph data science) με το σχηματισμό ενός decisioning knowledge graph. (γ) Τις δυνατότητες τεχνητής νοημοσύνης και μηχανικής μάθησης. Είναι απαραίτητο να υπογραμμιστεί ότι η παρούσα διατριβή παρουσιάζει συγκεκριμένες υλοποιήσεις, συμπεριλαμβανομένων αρχιτεκτονικών αποφάσεων, καθώς και θεωρητική διερεύνηση, συμπεριλαμβανομένων προτεινόμενων οντολογιών, με οριζόντιο και συνοπτικό τρόπο. Στόχος είναι να παράσχει ένα θεμελιώδες πλαίσιο για μελλοντική επέκταση και διεξοδική διερεύνηση. Επιπλέον, έχει σκοπό να παρακινήσει και άλλους οργανισμούς να εξετάσουν την αξιοποίηση των γράφων γνώσης στους αντίστοιχους τομείς τους. Data lakes are a common data management solution for organizations that desire a holistic consolidated view of their data. Ignited by the advent of semantics and the idea of enriching data with contextual information, the present thesis endeavors to delve into knowledge graphs applications within semantic data lakes and to discern the attainable capabilities therein. This thesis begins with a brief interpretation of the historical evolution of data management solutions, unraveling the current need for semantics. It then proceeds with the theoretical prerequisite clarification that underpins the current semantic anode. It places special emphasis on the utilization of actioning and decisioning knowledge graphs for implementing the semantic layer, drawing inspiration from Jesús Barrasa & Webber (2021) work on knowledge graphs. Ultimately, this thesis delineates the practical application of decisioning and actioning knowledge graphs on Niovity’s semantic data lake. By augmenting the corporation’s current implemented graph and semantics with state-of-the-art graph technologies, it demonstrates how a unified knowledge graph was built atop its current data fabric and how it leveraged its capabilities in several fronts, including (a) Better data management throughout its lifecycle (data exploration, integration, lineage, visualization and governance) and in-house operational conveniences (dev-ops, dev-experience, other metadata management) by forming an actioning knowledge graph. (b) Data lake’s graph capabilities empowerment (graph queries, graph traversal, graph science) by forming a decisioning kg. (c) Establish groundwork for AI and ML possibilities. It is imperative to underscore that this thesis presents concrete implementations, including code and architectural decisions, as well as theoretical investigation, including proposed ontologies, in a horizontal and concise manner. The aim is to provide a foundational framework for future expansion and in-depth exploration. Furthermore, it serves as a motivating example for other organizations to consider the utilization of knowledge graphs within their respective domains.
|
---|