15
Μαϊ
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Πρόγραμμα Προπτυχιακών Σπουδών
ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ
Νικολάου Τζήμου
με θέμα
Κατανεμημένη και Online Διατήρηση Γραφικών Μοντέλων στο Apache Flink
Distributed and Online Maintenance of Graphical Models in Apache Flink
Εξεταστική Επιτροπή
Καθηγητής Αντώνιος Δεληγιαννάκης (επιβλέπων)
Καθηγητής Μίνως Γαροφαλάκης
Αναπληρωτής Καθηγητής Βασίλειος Σαμολαδάς
Περίληψη
Με την αυξανόμενη ανάγκη για ανάλυση των δεδομένων σε μεγάλη κλίμακα, η κατανεμημένη μηχανική μάθηση έχει αποκτήσει σημασία τα τελευταία χρόνια. Τα δεδομένα συνήθως περιγράφονται από ένα μεγάλο αριθμό από αλληλοσχετιζόμενες μεταβλητές και μια σημαντική διεργασία είναι να μπορούμε να περιγράψουμε την από κοινού κατανομή όλων των μεταβλητών, επιτρέποντας την λήψη συμπερασμών και προβλέψεων. Ωστόσο η “απευθείας” μοντελοποίηση της από κοινού κατανομής όλων των μεταβλητών είναι μη εφικτή, αφού η πολυπλοκότητα ενός τέτοιου μοντέλου αυξάνεται εκθετικά με τον αριθμό των μεταβλητών. Εστιάζουμε στα Bayesian Networks, τα οποία αποτελούν τον “πατέρα” των γραφικών μοντέλων και παρουσιάζουμε μια διαφορετική προσέγγιση που είναι “επικοινωνιακά” αποδοτική χρησιμοποιώντας την ευρέως γνωστή μέθοδο του Functional Geometric Monitoring, για την συνεχή εκμάθηση και διατήρηση των Bayesian Networks πάνω σε κατανεμημένο περιβάλλον. Τέλος τα πειραματικά αποτελέσματα επιβεβαιώνουν την λειτουργικότητα της προτεινομένης προσέγγισης.
Abstract
With the growing need for large scale data analysis, distributed machine learning has grown importance in recent years. The raw data is described by a large number of interrelated variables and an important task is to describe the joint probability distribution over these variables, allowing simultaneously interferences and predications to be made. Directly modeling of joint probability distribution of all these variables may be infeasible, since the complexity of such model grown exponential with the number of variables. We focus on Bayesian Networks, the father of graphical models and present a different communication-efficient approach using the well-known method of Functional Geometric Monitoring, for continuously learning and maintenance of Bayesian Networks in a distributed streaming model. Finally, the experimental results confirm the functionality of proposed method.
Meeting ID: 934 8985 3189
Password: 221573