Περίληψη : | Η πληροφορία βρίσκεται παντού. Ο σημερινός τρόπος ζωής, η παρείσφρυση του διαδικτύου και των υπολογιστικών μηχανών στη καθημερινότητα έχει δημιουργήσει μία μαζική παραγωγή δεδομένων, έτοιμα για διαχείρηση με σκοπό την περαιτέρω διερεύνηση συσχετήσεων και δημιουργίας προβλέψεων. Για την ακρίβεια τα δεδομένα παράγονται με ταχύτατους ρυθμόυς όπου πλέον οι ερευνητές καλούνται να αντιμετωπίσουν το πρόβλημα των μεγάλων δεδομένων, ή αλλιώς πρόβλημα μεγάλων διαστάσεων των μεταβλητών. Η μηχανική μάθηση, χειρίζεται εδώ και αρκετά χρόνια τα δεδομένα και έχει δημιουργήσει προσδοκίες για ακόμα μεγαλύτερη εμβάθυνση στον κόσμο της πληροφορίας. Η Επεξεργασία φυσικής γλώσσας είναι μια καινοτόμος μέθοδος διαχείρησης δεδομένων η οποία δίνει τη δυνατότητα στις μηχανές να εκμεταλλευτούν τη πληροφορία του γραπτού λόγου και να αποδομίσουν την πληροφορία αυτή, για χρήση πέρα από το κλασικό σύστημα των αριθμών. Σκοπός της παρούσας πτυχιακής εργασίας είναι η παρουσίαση και η ανάλυση σύγχρονων τεχνικών πρόβλεψης μηχανικής μάθησης μέσω παλινδρόμισης Μακρο-οικονομικών μεταβλητών των Ηνωμένων πολιτειών της Αμερικής. Τα μοντέλα με τις βέλτιστες προβλέψεις θα ενισχυθούν με πληροφορία φυσικής γλώσσας, με στόχο τον σχολιασμό της επίδρασης της πληροφορίας φυσικής γλώσσας στην βελτίωση των μακρο-οικονομικών προβλέψεων. Data is generated and collected everywhere in modern days. This produces an exponential growth in datasets in various of forms. There are so much data engineered and collected that modern day’s researchers face the biggest disadvantage of big data datasets, large dimensionality. On the other hand, the possibilities and the advantages are so many that new innovative methods are created in order to produce, collect and manipulate data for researching purposes. Textual analysis is a cutting-edge data engineering method that is acquired by Natural language processing, which is a combination between neurolinguistics and computer science. Natural language processing following the exponential trend of another popular computer science topic, Machine learning, expands even further the deep abilities of computers to predict and make decisions, by giving machines the opportunity to exploit information and correlations by using the textual data, and surpassing the boundaries of classical numerical datasets. In this dissertation modern Machine Learning models will be presented and will handle macroeconomic big data datasets, in order to produce forecasts for US economy macroeconomic variables. Furthermore, textual analysis dataset made from wall street journal articles published the last years will be induced in the forecasting models of the US economy, in order to reinforce the machine learning forecasts, and compare the results.
|
---|