Περίληψη : | Το Διαδίκτυο είναι το κατεξοχήν χρησιμοποιούμενο επικοινωνιακό μέσο για την ανταλλαγή δεδομένων μεταξύ οποιωνδήποτε διασυνδεμένων υπολογιστών. Έκανε την εμφάνιση του στις αρχές της δεκαετίας του ’90 και άλλαξε ριζικά τα θεμέλια της επικοινωνίας που είχαν εδραιωθεί μέχρι και τότε. Έχει επιφέρει επανάσταση στο χώρο τον υπολογιστών και των τηλεπικοινωνιών, ενώ σε πολλές χώρες, συμπεριλαμβανομένης και της Ελλάδας, κατοχυρώνεται συνταγματικά το αναφαίρετο δικαίωμα ελεύθερης πρόσβασης κάθε πολίτη σε αυτό. Παρέχει την απαραίτητη τεχνολογία για παγκόσμια επικοινωνία (broadcasting) καθώς είναι ένας μηχανισμός για διασπορά πληροφοριών και αλληλεπίδρασης ανάμεσα σε χρήστες και τους υπολογιστές τους, χωρίς να αποτελεί εμπόδιο η γεωγραφική τοποθεσία. Ενώ ξεκίνησε ως μέσο για ακαδημαϊκές και ερευνητικές εφαρμογές, ήδη από το τέλος του 1994 η χρήση του για εμπορικές εφαρμογές είχε ξεπεράσει την προσδοκία όλων εκείνων που ασχολούνταν ερευνητικά με αυτό.Ωστόσο, η εξέλιξη της τεχνολογίας δεν αφήνει αδιάφορο το Διαδίκτυο, το οποίο ενσωματώνει νέες τεχνολογίες και διευρύνει το πεδίο δράσης του, εδραιώνοντας όλο και περισσότερο τη συμμετοχή των χρηστών στη διαμόρφωση του περιεχομένου του. Πλέον οι χρήστες έχουν τη δυνατότητα να συνεισφέρουν δυναμικά στη δημιουργία και μεταβολή των δεδομένων που κινούνται μέσω αυτού. Η νέα μορφή του Διαδικτύου, το Web 2.0, παρέχει εργαλεία και τεχνολογίες για ενεργή συμμετοχή των χρηστών στην παραγωγή πληροφοριών που κινούνται σε αυτό, ενώ ο χρήστης ξεφεύγει από το μονόδρομο της κατανάλωσης πληροφοριών.Σημαντικό εργαλείο που παρέχουν οι Web 2.0 υπηρεσίες στους χρήστες είναι οι κοινωνικές επισημειώσεις. Μια επισημείωση είναι ένας όρος ή φράση που σχετίζεται με ένα κομμάτι πληροφορίας και επιτρέπει στο χρήστη τον εύκολο εντοπισμό της σε μεταγενέστερη αναζήτηση. Οι όροι που χρησιμοποιούνται αποτελούν προσωπική επιλογή του χρήστη και εκφράζουν την οπτική γωνία με την οποία προσεγγίζει την πληροφορία που επισημειώνει. Η χρήση των κοινωνικών επισημειώσεων έγινε ευρέως γνωστή από ιστοσελίδες που σχετίζονται με υπηρεσίες του Web 2.0 και στη συνέχεια επεκτάθηκε σε όλο το φάσμα των διαδικτυακών υπηρεσιών.Ο τομέας που παρουσιάζει σημαντική εξέλιξη και δυνατότητες βελτίωσης στις υπηρεσίες που παρέχει, χρησιμοποιώντας τα εργαλεία των κοινωνικών επισημειώσεων και του Web 2.0, είναι ο τομέας των υπηρεσιών πληροφόρησης και των βιβλιοθηκών. Μια βιβλιοθήκη κατέχει τεράστιες ποσότητες πληροφορίας, οι οποίες μπορούν να συνδυαστούν με τις νέες υπηρεσίες που προσφέρονται, ώστε να γίνουν πιο προσιτές και περισσότερο αξιοποιήσιμες από τους χρήστες. Ιδιαίτερα σε ότι αφορά της ψηφιακές βιβλιοθήκες, ο χρήστης έχει τη δυνατότητα να εμπλουτίσει το ψηφιακό τους περιεχόμενο με κοινωνικές επισημειώσεις της δικής του επιλογής, συνδέοντας τα ενδιαφέροντα και την προσωπική του οπτική με τα τεκμήρια που αναζητά. Αυτός ο νέος τρόπο οργάνωσης γνώσης επιτρέπει στους χρήστες την εύκολη αναζήτηση τεκμηρίων χρησιμοποιώντας τόσο το λεξιλόγιο της βιβλιοθήκης, στην οποία γίνεται η αναζήτηση, όσο και το δικό τους λεξιλόγιο όρων, ανοίγοντας το δρόμο για προσφορά πιο αποδοτικών και εξελιγμένων υπηρεσιών αναζήτησης. Διευρύνεται η επικοινωνία μεταξύ χρηστών και βιβλιοθηκών, καθώς απομακρύνεται το μοντέλο της αυστηρής ορολογίας που ορίζουν οι βιβλιοθηκονόμοι και πλησιάζει η ευέλικτη και λιγότερο αυστηρή γλώσσα των χρηστών, για την περιγραφή των τεκμηρίων.Σκοπός της παρούσας διπλωματικής είναι η ανάπτυξη ενός συστήματος για τη βελτίωση και τη διαμόρφωση του περιεχομένου μιας βιβλιοθήκης από τους χρήστες της. Προτείνεται μια μεθοδολογία για τη διευκόλυνση των αναζητήσεων των χρηστών, ενσωματώνοντας ένα μέρος από τις κοινωνικές επισημειώσεις που οι ίδιοι έχουν επιλέξει, στο αρχείο καθιερωμένων όρων. Το αρχείο καθιερωμένων όρων περιλαμβάνει τις θεματικές επικεφαλίδες που έχουν χρησιμοποιηθεί για το χαρακτηρισμό κάθε τεκμηρίου της βιβλιοθήκης και εκφράζει τη γλώσσα που χρησιμοποιούν οι βιβλιοθηκονόμοι για την περιγραφή των βιβλίων του καταλόγου. Σημαντικός στόχος της μεθοδολογίας είναι η επίτευξη της «χρυσής τομής» και η επιλογή των επισημειώσεων με τέτοιο τρόπο ώστε, αφενός να διατηρηθεί η λειτουργικότητα του καταλόγου της βιβλιοθήκης, χωρίς την εισαγωγή περιττών πληροφοριών και αφετέρου να αξιοποιηθούν οι πληροφορίες που λαμβάνονται από τους χρήστες.Αρχικά, ερευνάται το περιβάλλον του συστήματος και αναλύεται η έκταση του προβλήματος που υπάρχει στο αντικείμενο της μελέτης. Υπολογίζεται η επικάλυψη μεταξύ βασικών αρχείων δεδομένων της βιβλιοθήκης, όπως το αρχείο καθιερωμένων όρων, το αρχείο του συνόλου των επερωτήσεων των χρηστών και το σύνολο των κοινωνικών επισημειώσεων. Διαπιστώνεται ο βαθμός επικάλυψης μεταξύ των τριών αρχείων, από τον οποίο προκύπτουν τα περιθώρια βελτίωσης που επιδέχεται το σύστημα.Στη συνέχεια, γίνεται η επιλογή των επισημειώσεων που αξίζουν να μελετηθούν για τον εμπλουτισμό του αρχείου καθιερωμένων όρων. Χωρίζονται σε δύο κατηγορίες, σε «χρήσιμες» και «μη χρήσιμες», ανάλογα με το αν προσφέρουν επιπρόσθετη πληροφορία για τις εγγραφές που επισημειώνουν. Το κριτήριο που καθορίζει την κατάταξή τους στις ομάδες είναι η λεξικογραφική ταύτισή της επισημείωσης με το τεκμήριο που επισημειώνει. Σε περίπτωση υψηλής ταύτισης με κάποιον όρο που υπάρχει στην εγγραφή του καταλόγου για το συγκεκριμένο τεκμήριο, είναι πιθανόν η επιπρόσθετη πληροφορία που φέρει η επισημείωση να είναι περιττή και η σημασία της να καλύπτεται από άλλες λέξεις που ήδη υπάρχουν στην εγγραφή. Ο έλεγχος αυτός βοηθάει στην αποφυγή εισαγωγής περιττής πληροφορίας στα αρχεία της βιβλιοθήκης. Υλοποιήθηκαν τρεις διαφορετικοί αλγόριθμοι για την εξέταση των ζευγαριών τεκμηρίου-επισημείωσης, ενώ επιλέχθηκε ο ένας από αυτούς για την εξαγωγή της συσχέτισης του κάθε ζευγαριού.Επόμενο βήμα είναι η λήψη πρόσθετων πληροφοριών για τα ζευγάρια από ηλεκτρονικές υπηρεσίες βιβλιοθηκών όπως είναι το Google Books και το LibraryThing. To Google Books αποτελεί μια υπηρεσία δωρεάν αναζήτησης βιβλίων, μέσω της οποίας οι χρήστες μπορούν να ανακτήσουν αποσπάσματα ή το πλήρες κείμενο των βιβλίων που τους ενδιαφέρουν, να τα οργανώσουν σε βιβλιοθήκες και να καταχωρήσουν σχόλια και επισημειώσεις για αυτά. Το LibraryThing, επίσης, αποτελεί διαδικτυακή υπηρεσία που επιτρέπει στους χρήστες να καταλογογραφήσουν και να οργανώσουν τα βιβλία της αρεσκείας τους, καθώς και να προσθέσουν δικές τους επισημειώσεις σε αυτά. Συγκεκριμένα, ανακτήθηκαν από το Google Books οι πληροφορίες για τη χρήση του όρου της επισημείωσης από το συγγραφέα, μέσα στο κείμενο του βιβλίου και από το LibraryThing, αναζητήθηκε το πλήθος των χρηστών που επισημείωσαν το συγκεκριμένο βιβλίο με τον όρο αυτό. Οι δύο αυτές τιμές συνδυάζονται και εκφράζουν την πραγματική αξία της επισημείωσης για το τεκμήριο με το οποίο σχετίζεται.Τέλος, ορίστηκαν τρεις μετρικές με σκοπό την αξιολόγηση της μεθοδολογίας που χρησιμοποιήθηκε, για τον εμπλουτισμό των δεδομένων των καταλόγων. Ερευνάται το ποσοστό της βελτίωσης που επήλθε μετά την εφαρμογή των παραπάνω μεθόδων, ενώ αξιολογείται η συνολική εικόνα του συστήματος μετά τον εμπλουτισμό. Ενώ προτείνεται ενδεικτικά το σύνολο των επισημειώσεων που πρέπει να εισαχθεί στο αρχείο καθιερωμένων όρων, παραμένει στη διακριτική ευχέρεια του βιβλιοθηκονόμου η τελική επιλογή, ο οποίος έχει στη διάθεση του εργαλείο γραφικής αναπαράστασης των αποτελεσμάτων για τη διευκόλυνση της επιλογής του.Ως αντικείμενο μελέτης χρησιμοποιήθηκε η βιβλιοθήκη του Παντείου Πανεπιστημίου Αθηνών, η οποία προμήθευε με δεδομένα από τα αρχεία καταγραφής της, το σύνολο της έρευνας. Το ηλεκτρονικό σύστημα της βιβλιοθήκης, το OPACIAL, παρέχει στους χρήστες τη δυνατότητα απομακρυσμένης αναζήτησης τεκμηρίων, χρησιμοποιώντας διάφορα κριτήρια όπως ο τίτλος του βιβλίου, ο/οι συγγραφέας/εις, ο εκδοτικός οίκος, το ISBN κλπ. Στόχος είναι η βελτίωση του συστήματος, εμπλουτίζοντας τα σημεία πρόσβασης των εγγραφών με κοινωνικές επισημειώσεις, ώστε να επιτευχθεί αποδοτικότερη αναζήτηση με χρήση του λεξιλογίου των χρηστών. Internet is the most widely used means of communication for information exchange between any computers connected to it. It first appeared in the early ‘90s and since then, it has fundamentally changed communication as known. Internet has revolutionalised the fields of informatics and telecommunications and in many countries, including Greece, free access to Internet is a constitutional right for all citizens. Being a tool for information dissemination and interaction among users and their computers, it provides the technological foundations for global communication (e.g. broadcasting technology) regardless of the geographical borders. Although it was first used as a tool in academic and research applications, its use in the commercial sector since the end of 1994 has surpassed everyone’s expectations.However, the technological developments do not leave Internet unaffected; the latter integrates new technologies and in doing so, its scope keeps expanding which in turn allows for the users’ increasing participation to the enrichment and determination of its scope. Internet users are now empowered to dynamically contribute to the creation or even alteration of the Internet data. In fact, Web 2.0, the new Internet form, provides tools and features for the users’ active participation to the generation of electronically transmitted information, while at the same time users go one step above the mere information use.A significant benefit of the Web 2.0 services is the social tag. The social tag is a term or a phrase related to a piece of information that allows the user to easily trace that piece of information in a subsequent search. The terms used are personalised – selected by the users themselves – and indicate the perspective under which users approach the tagged piece of information. Popularised by Web 2.0 related webpages, the use of social tags was soon adopted by all Internet services. Library science and information services are fields with signs of significant development as well as with a great potential for improvement through the utilisation of Web 2.0 technologies. A library is by definition a vast pool of data which, alongside the latest available services, can be more easily accessible and better utilised by the users. As specifically regards digital libraries, users are able to enrich their digital content through the selected social tags and incorporate their personal interests and perspectives into the items they search for. This new way of organising knowledge allows users to easily search for any items by using both the library glossary and terminology and their own vocabulary. Consequently, they contribute to the creation of more effective and more sophisticated search engine services. At the same time, the actual communication between the users and the libraries increases and the model of rigid terminology provided by librarians gives its place to a flexible and less strictly defined users’ language for the item specification.Within this context, the purpose of this dissertation is the development of a system for the shaping and enhancement of the library content by its own users. A methodology for facilitating users’ searches is recommended. This methodology integrates a part of the social tags selected by the users into basic cataloguing archives such as the authority file. The authority file includes the subject headings that have been used in the labelling of every library item and denotes the language cataloguers use to describe the catalogued items. Primary goal of the recommended methodology is to achieve the “golden ratio” and select the tags in a way that not only will the functionality of the library catalogue be preserved, free of any unnecessary information, but the users’ data input will also be taken into consideration.As a first step, the system environment and the dimensions of the issue identified in the study are analysed. The overlapping elements between basic library data files (e.g. the authority file, the users’ follow-up queries file and the total amount of the social tags) are determined and then the extent of overlap between these three types of files is established. This will show the improvement requirements of the system. Subsequently, the social tags that will serve the enrichment of the authority file are selected. These social tags are divided into two groups: “useful” and “non-useful” depending on whether they offer any additional information on the entries these tags are associated with. The categorisation into these two groups is based on the lexicographical identification of the tag with the tagged item. In the case of high identification with a term existing in the catalogue entry for a particular item, it is highly probable that the additional piece of information revealed by the tag is useless since other words in the entry will semantically prevail over the tag. This type of cross-check pre-empts the entry of any unnecessary information in the library archives. In this dissertation, three different algorithms are employed for the examination of the relationship between items and tags and one of them is chosen for determining the relationship of each “item-tag” pair.The next step of this process is the acquisition of additional information about the abovementioned pairs from electronic library resources, such as Google Books and LibraryThing. Google Books, on one hand, is a book search engine free of charge which provides users with the whole text or segments of the books and also enables them to organise them in their own libraries and even tag them or comment on them. On the other hand, LibraryThing is an electronic service that enables users to catalogue and categorise the books of their interest as well as add their own tags to them. For the purposes of this dissertation, any information about how the author(s) use the tagged term throughout their text is extracted from Google Books whereas LibraryThing provides the total number of users who have tagged that particular item with the specific term. These two values combined indicate the actual value of the tag with respect to the item associated to that tag.Finally, three scores are employed for the evaluation of the applied methodology in this dissertation. The degree of improvement following the use of this methodology is examined and the post-enrichment system is assessed. The social tags that should be incorporated in the authority file are suggested, but in the end it is the cataloguer who will decide upon and determine the social tags according to the available graphic visualisation of the findings.Object of analysis in this dissertation is the library of Panteion University of Athens whose record files form the database of this study. OPACIAL, the electronic system of the library, provides users with the option of distance item search through different filtering criteria such as the title, the author(s), the publishing house, the ISBN number etc. The aim of this research is the enhancement of the system in question through the enrichment of the entries with social tags which eventually will pave the way for a more effective item search by means of the users’ vocabulary.
|
---|