Περίληψη : | Η εξόρυξη γνώσης από μεγάλες αποθήκες δεδομένων έχει εξελιχθεί σε ένα από τα βασικότερα ερευνητικά ζητήματα στον τομέα των βάσεων δεδομένων, της μηχανικής μάθησης, της στατιστικής, καθώς επίσης και ως μία σημαντική δυνατότητα για καινοτομία στις επιχειρήσεις. Οι δικτυακές εφαρμογές που διαχειρίζονται μεγάλες αποθήκες δεδομένων έχουν αρχίσει να κάνουν χρήση διαφόρων τεχνικών εξόρυξης γνώσης, με σκοπό τη βελτίωση της ποιότητας των παρεχόμενων υπηρεσιών μέσω της μελέτης της συμπεριφορά των πελατών και της εξαγωγής χρήσιμων συμπερασμάτων από αυτήν. Πλήθος από διαφορετικές τεχνικές και αλγορίθμους έχουν αναπτυχθεί, οι οποίοι μπορούν να χρησιμοποιηθούν για να αναλύσουμε τα δεδομένα και να αντλήσουμε γνώση μέσα από μεγάλα σύνολα δεδομένων. Ένα σημαντικό πρόβλημα που αφορά στα αποτελέσματα της διαδικασίας εξόρυξης γνώσης είναι η ανάπτυξη αποδοτικών δεικτών αξιολόγησης της ποιότητας των αποτελεσμάτων της ανάλυσης. Αυτό είναι γνωστό ως πρόβλημα εκτίμηση της ποιότητας και είναι ένα βασικό θέμα της όλης διαδικασίας εξόρυξης γνώσης. Ένα άλλο ανοικτό ερευνητικό θέμα στην διαδικασία εξόρυξης γνώσης σε σχέση με την ποιότητα είναι η αναπαράσταση και διαχείριση της αβεβαιότητας(uncertainty). Η αβεβαιότητα είναι ένα έμφυτο χαρακτηριστικό των δεδομένων και σχετίζεται με διάφορες πλευρές αυτών όπως: α) ατελής πληροφορία, β) παρουσίαση των ποικίλων συγκεντρώσεων που παρουσιάζουν τα γνωρίσματα, και γ) χρήση ποιοτικών περιγραφών των τιμών των γνωρισμάτων και των συσχετίσεων μεταξύ τους. Ωστόσο, υπάρχουν σχετικά λίγες προσπάθειες οι οποίες να αφορούν σε τεχνικές ανάλυσης δεδομένων που να διαχειριστούν αποτελεσματικά την αβεβαιότητα. Οι παραδοσιακές προσεγγίσεις παράγουν αποφάσεις βασισμένες σε κατηγοριοποιήσεις που δεν λαμβάνουν υπόψη τους την αβεβαιότητα. Αυτό σημαίνει ότι οι κατηγορίες δεν είναι επικαλυπτόμενες και τα δεδομένα θεωρούνται ότι ανήκουν με τον ίδιο βαθμό σε μία και μόνο κατηγορία. Είναι φανερό λοιπόν ότι δεν υπάρχει η έννοια αναπαράστασης της αβεβαιότητας στις προτεινόμενες μεθόδους, παρότι η χρήση και ανακάλυψη της αβεβαιότητας αναγνωρίζεται στην εξόρυξη γνώσης. Για το λόγο αυτό, το ενδιαφέρον της ερευνητικής κοινότητας έχειεπικεντρωθεί στην μελέτη νέων προσεγγίσεων εξόρυξης γνώσης οι οποίες να διαχειρίζονται την αβεβαιότητα που εμπεριέχεται στα δεδομένα.
|
---|