Παρουσίαση/Προβολή
ΔΕΤ603 Διαχείριση και Επεξεργασία Μεγάλου Όγκου Δεδομένων
(MST188) - Ζηδιανάκης Εμμανουήλ
Περιγραφή Μαθήματος
Η δημοφιλία του Παγκοσμίου Ιστού και του διαδικτυακού εμπορίου δημιουργεί πολλά εξαιρετικά μεγάλα σύνολα δεδομένων, από τα οποία μπορεί να αλιευθεί πληροφορία μέσω της εξόρυξης δεδομένων.
Το μάθημα αυτό επικεντρώνεται σε πρακτικούς αλγορίθμους για την επίλυση βασικών προβλημάτων στην Εξόρυξη Δεδομένων ακόμη και στα μεγαλύτερα από τα σύνολα δεδομένων.
Το μάθημα αρχίζει με συζήτηση του πλαισίου map-reduce, ενός σημαντικού εργαλείου για τον αυτόματο παραλληλισμό αλγορίθμων. Εξετάζονται τα προβλήματα εύρεσης συχνών στοιχειοσυνόλων και ομαδοποίησης, το καθένα από τη σκοπιά ότι τα δεδομένα είναι πολύ μεγάλα για να χωρούν στην κύρια μνήμη.
Εξηγείται επίσης η χρήση του τοπικά ευαίσθητου κατακερματισμού. Αυτή η τεχνική αξίζει να γίνει ευρύτερα γνωστή, επειδή είναι αποτελεσματική όταν αναζητούνται όμοια αντικείμενα σε μία πολλή μεγάλη συλλογή, καθώς δεν χρειάζεται να συγκριθεί το κάθε ζεύγος αντικειμένων. Επίσης εξηγούνται αλγόριθμοι επεξεργασίας ροών για την Εξόρυξη Δεδομένων, τα οποία καταφθάνουν πολύ γρήγορα, ώστε να μην είναι εφικτή η εξαντλητική επεξεργασία τους. Στη συνέχεια καλύπτονται η ιδέα του PageRank με τις σχετικές τεχνικές.
Θα μας απασχολήσουν επίσης δύο εφαρμογές: συστήματα συστάσεων και διαφημίσεις στον Παγκόσμιο Ιστό, όπου η κάθε μία τους είναι ζωτικής σημασίας στο ηλεκτρονικό εμπόριο.
Ημερομηνία δημιουργίας
Πέμπτη 10 Φεβρουαρίου 2022
-
Δεν υπάρχει περίγραμμα