-
Το μάθημα συνιστά μία εισαγωγή στις σύγχρονες τάσεις που διαμορφώνουν το πλαίσιο της διαχείρισης και της αναλυτικής επεξεργασίας των δεδομένων με στόχο την υποστήριξη των διαδικασιών λήψης αποφάσεων. Πιο συγκεκριμένα, εξετάζονται τεχνολογίες και περιβάλλοντα ανάπτυξης εφαρμογών που αφορούν στην προετοιμασία, στην προεπεξεργασία και στην οργάνωση των δεδομένων με στόχο την αναλυτική τους επεξεργασία προς εξόρυξη πληροφορίας από μεγάλες βάσεις δεδομένων.
Με την επιτυχή ολοκλήρωση του μαθήματος ο φοιτητής / τρια θα είναι σε θέση να:
1) διακρίνει τη διαφορά μεταξύ ενός κλασικού περιβάλλοντος βάσης δεδομένων που διεκπεραιώνει συναλλαγές σε πραγματικό χρόνο από μία αποθήκη δεδομένων
2) περιγράφει τα επιμέρους στάδια της ροής της επεξεργασίας στην αποθήκη δεδομένων
3) εκτιμά την έννοια της αγοράς δεδομένων (data mart)
4) δημιουργεί/παράγει μία αποθήκη δεδομένων εφαρμόζοντας βασικές τεχνικές όπως τα σχήματα αστέρα, χιονονιφάδας και αστερισμού
5) γνωρίζει τις βασικές έννοιες της αναλυτικής επεξεργασίας με άμεση επικοινωνία,
6) δημιουργεί/παράγει πολυδιάστατους κύβων δεδομένων
7) εφαρμόζει τις τέσσερις βασικές πράξεις επεξεργασίας των κύβων δεδομένων, ειδικότερα: (α) τεμαχισμού σε φέτες, (β) τεμαχισμού σε κύβους, σύμπτυξης ή συνάθροισης, (γ) ανάπτυξης και (δ) περιστροφής
8) εφαρμόζει τεχνικές MOLAP (Multidimensional OLAP) και ROLAP (Relational OLAP) στην υλοποίηση συστημάτων OLAP
9) διακρίνει τη διαφορά της έννοιας ‘δεδοµένα’ από την έννοια ‘πληροφορία’
10) εκτιμά τη σημασία και τη χρησιμότητα των διαφόρων τύπων γραφικής απεικόνισης των δεδομένων αυτών καθεαυτών, καθώς επίσης και της απεικόνισης των αποτελεσμάτων στην έξοδο της αναλυτικής τους επεξεργασίας
11) αναγνωρίζει την αποτελεσματικότητα των τεχνικών ελάττωσης των διαστάσεων (dimensionality reduction) σε ειδικές περιπτώσεις εφαρμογών αναλυτικής επεξεργασίας δεδομένων
12) ερμηνεύει και εφαρμόζει στην πράξη βασικές τεχνικές εξόρυξης πληροφορίας από βάσεις δεδοµένων, όπως η παραγωγή κανόνων συσχετισµού, η δηµιουργία δένδρου αποφάσεων και η παραγωγή συστάδων δεδομένων
13) αναπτύσσει/παράγει κώδικα εξόρυξης πληροφορίας από δεδομένα χρησιμοποιώντας τα προγραμματιστικά περιβάλλοντα WEKA και RStudio
14) διακρίνει τις επιδόσεις των διαφόρων τεχνικών εξόρυξης πληροφορίας
15) ερμηνεύει τα αποτελέσµατα που προκύπτουν στην έξοδο της αναλυτικής επεξεργασίας
16) αναπτύσσει/παράγει κώδικα παραγωγής συστάσεων (recommendations) οι οποίες εξυπηρετούν στόχους στρατηγικής πωλήσεων (και όχι µόνον)
17) περιγράφει την ποιοτική διαφοροποίηση του παραδείγματος της αναλυτικής επεξεργασίας δεδομένων του σημασιολογικού ιστού από εκείνο των δεδομένων τα οποία οργανώνονται ώστε η διαχείρησή τους να γίνεται μέσω ενός τυπικού περιβάλλοντος DBMS/OLAP/Data Warehouse
Στην αίθουσα (διαλέξεις) και στο εργαστήριο (ασκήσεις πράξης)
Διαθεσιμότητα επιλεγμένων διαλέξεων του μαθήματος σε μορφοποίηση ψηφιακού βίντεο, μέσω του εξυπηρετητή Video on Demand του τμήματος.
Χρήση περιβάλλοντος εικονικής μηχανής (virtual machine) της διεθνούς σύμπραξης DBTechNet με προ-εγκατεστημένο λογισμικό διαφόρων (ελεύθερων) συστημάτων RDBMS: IBM DB2 Express-C, Oracle Express, PostgreSQL, MySQL, Virtuoso.
Χρήση εξειδικευμένου λογισμικού της Oracle για OLAP επεξεργασία και ειδικότερα το (α) Oracle Warehouse Builder, (β) Analytic Workspace Manager for Oracle OLAP.
Πρόσβαση σε και χρήση του εκπαιδευτικού περιεχομένου των αντίστοιχων μαθημάτων της διεθνούς σύμπραξης DBTechNet (http://dbtech.uom.gr): (a) OLAP & Data Warehousing, (b) Knowledge Discovery from Database Management Systems.
Υποστήριξη της μαθησιακής διαδικασίας μέσω της ηλεκτρονικής πλατφόρμας Moodle.
Δραστηριότητα | Φόρτος Εργασίας Εξαμήνου |
Διαλέξεις | 13 x 4= 52 |
Πρακτική εξάσκηση στο σπίτι | 13 x 1 = 13 |
Ασκήσεις στο εργαστήριο | 13 x 2 = 26 |
Επικοινωνία / συνεργασία | 8 |
Αυτοτελής μελέτη | 18 x 4.5 = 81 |
Σύνολο Μαθήματος (30 ώρες φόρτου εργασίας ανά πιστωτική μονάδα) | 180 |
Ι. Γραπτή τελική εξέταση (100%) στο θεωρητικό μέρος του μαθήματος με ερωτήσεις πολλαπλής επιλογής και ασκήσεις επί της θεματολογίας του μαθήματος που περιλαμβάνει:
– Ασκήσεις εφαρμογής αλγόριθμων εξόρυξης πληροφορίας από μικρά σύνολα δεδομένων
– Ασκήσεις στις (βραχείας διάρκειας ) όψεις SQL
– Ασκήσεις επί των βημάτων προεπεξεργασίας τα οποία απαιτούνται για την προσαρμογή/τροφοδοσία συνόλου δεδομένων στην είσοδο συγκεκριμένου αλγόριθμου προς αναλυτική επεξεργασία
– Ερωτήσεις πολλαπλής επιλογής που αφορούν στην ποιοτική αξιολόγηση του αποτελέσματος στην έξοδο της αναλυτικής επεξεργασίας (confusion matrix, recall, precision, κλπ.)
– Ασκήσεις εφαρμογής τεχνικών ελάττωσης των διαστάσεων των δεδομένων εισόδου
– Ερωτήσεις πολλαπλής επιλογής και ασκήσεις επί περιπτώσεων σύγκρισης των επιδόσεων μοντέλων και τεχνικών αναλυτικής επεξεργασίας δεδομένων
– Ασκήσεις δημιουργίας αποθήκης δεδομένων με σχήματα αστέρα, χιονονιφάδας, αστερισμού
– Ασκήσεις εφαρμογής τεχνικών ROLAP
– Ερωτήσεις πολλαπλής επιλογής που αφορούν στην επεξεργασία του περιεχομένου αποθήκης δεδομένων
ΙΙ. Προαιρετική εργασία εξαμήνου (έως το 35% του τελικού βαθμού στο μάθημα)
– Το θέμα της εργασίας προτείνεται από τον φοιτητή ή επιλέγεται από υποψήφια θέματα που προτείνει ο καθηγητής και σχετίζεται πάντα με τεχνολογίες και τεχνικές της θεματολογίας του μαθήματος
– Η εργασία μπορεί να εκπονείται από έναν ή το πολύ δύο φοιτητές
– Οι εργασίες παρουσιάζονται από τους φοιτητές στο ακροατήριο του μαθήματος σε ημερομηνίες οι οποίες τοποθετούνται στις δύο τελευταίες διδακτικές εβδομάδες του ακαδημαϊκού εξαμήνου. Βαθμολογούνται από τον καθηγητή ή τους συν-διδάσκοντες καθηγητές του μαθήματος
Το ως άνω σχήμα αξιολόγησης γνωστοποιείται στους ενδιαφερόμενους φοιτητές (α) μέσω της ιστοσελίδας του τμήματος, (β) μέσω των σελίδων του μαθήματος στην ηλεκτρονική πλατφόρμα Moodle, και (γ) με ανακοινώσεις στη διάρκεια των πρώτων διαλέξεων κατά την έναρξη του κάθε ενός ακαδημαϊκού εξαμήνου.
α) Ελληνική
β) Διεθνής