BEGIN:VCALENDAR
VERSION:2.0
PRODID:-//TUC//Events//EN
CALSCALE:GREGORIAN
BEGIN:VTIMEZONE
TZID:Europe/Athens
TZNAME:EEST
DTSTART:19700329T030000
RRULE:FREQ=YEARLY;BYDAY=-1SU;BYMONTH=3
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0300
TZNAME:EET
DTSTART:19701025T040000
RRULE:FREQ=YEARLY;BYDAY=-1SU;BYMONTH=10
END:STANDARD
END:VTIMEZONE
BEGIN:VEVENT
CREATED:20260603T125726Z
LAST-MODIFIED:20260603T125726Z
DTSTAMP:20260614T010313Z
UID:1781388193@tuc.gr
SUMMARY:Παρουσίαση Διπλωματικής Εργασίας κας
  Αλεξάνδρας Γκαραγκάνη - Σχολή ΗΜΜΥ
LOCATION:
DESCRIPTION:https://www.ece.tuc.gr/el/katalogos-
 ekdiloseon?tx_tucevents2_tuceventsdi
 splay%5Baction%5D=show&tx_tucevents2
 _tuceventsdisplay%5Bcontroller%5D=Ev
 ent&tx_tucevents2_tuceventsdisplay%5
 Bevent%5D=8439&cHash=d6700d431b588bb
 f791226b0ec884a9c\nΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗ
 Σ\n Σχολή Ηλεκτρολόγων Μηχανικών και
  Μηχανικών Υπολογιστών\n Πρόγραμμα Π
 ροπτυχιακών Σπουδών\n ΠΑΡΟΥΣΙΑΣΗ ΔΙΠ
 ΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ\n ΓΚΑΡΑΓΚΑΝΗ ΑΛΕΞ
 ΑΝΔΡΑΣ\n με θέμα\n Βελτιστοποίηση Φι
 λικών προς το Δίκτυο Συστάσεων με Χρ
 ήση Ενισχυτικής Μάθησης για Χρήστες 
 με Μνήμη\n Using Reinforcement Learn
 ing to Optimize Network-friendly Rec
 ommendations for Users with Memory\n
  Εξεταστική Επιτροπή\n Καθηγητής Θρα
 σύβουλος Σπυρόπουλος (επιβλέπων)\n Κ
 αθηγητής Μιχαήλ Ζερβάκης\n Καθηγητής
  Μιχαήλ Λαγουδάκης\n Περίληψη\n Η ελ
 αχιστοποίηση του κόστους μετάδοσης π
 εριεχομένου από το δίκτυο, διατηρώντ
 ας παράλληλα την ικανοποίηση του χρή
 στη αποτελεί πρόκληση για τις σύγχρο
 νες πλατφόρμες περιεχομένου. Οι υπάρ
 χουσες υλοποιήσεις Συστημάτων Συστάσ
 εων Φιλικά προς το Δίκτυο αντιμετωπί
 ζουν αυτήν την πρόκληση κατευθύνοντα
 ς τους χρήστες προς αποθηκευμένο, χα
 μηλού κόστους περιεχόμενο. Είναι γεγ
 ονός ωστόσο, ότι η συντριπτική πλειο
 ψηφία τους υποθέτει ένα στατικό μοντ
 έλο χρήστη, στο οποίο η πιθανότητα α
 ποδοχής μιας σύστασης παραμένει αμετ
 άβλητη καθ΄ όλη τη διάρκεια μιας συν
 εδρίας. Αυτή η απλοποίηση δεν είναι 
 ρεαλιστική, ένας χρήστης που λαμβάνε
 ι επανειλημμένα συστάσεις χαμηλής πο
 ιότητας θα χάσει τελικά την εμπιστοσ
 ύνη του στο σύστημα, πιθανόν αγνοώντ
 ας τις συστάσεις και καταφεύγοντας σ
 ε αναζήτηση ακριβού περιεχομένου μέσ
 ω της μπάρας αναζήτησης. Αυτό λοιπόν
  το πρόβλημα κληθήκαμε να αντιμετωπί
 σουμε στην παρούσα διπλωματική εργασ
 ία, επεκτείνοντας το πλαίσιο των Mar
 kov Decision Processes (MDP) για Συσ
 τάσεις Φιλικές προς το Δίκτυο. Μοντε
 λοποιήσαμε την εμπιστοσύνη του χρήστ
 η ως μεταβλητή κατάστασης που εξελίσ
 σεται κατά τη διάρκεια μιας συνεδρία
 ς με βάση την ποιότητα των συστάσεων
  εξετάζοντας δύο μοντέλα. Το πρώτο ε
 ίναι το μοντέλο Σταθερής Εμπιστοσύνη
 ς, που χρησιμεύει ως βάση σύγκρισης.
  Το δεύτερο, πρόκειται για ένα απλό 
 μοντέλο Μεταβαλλόμενης Εμπιστοσύνης,
  στο οποίο η πιθανότητα προσοχής του
  χρήστη αυξάνεται μετά από συστάσεις
  υψηλής σχετικότητας και μειώνεται μ
 ε συστάσεις χαμηλής. Το τελευταίο μο
 ντέλο εφαρμόζει μια νέα στρατηγική, 
 όπου η βέλτιστη πολιτική συστήνει ακ
 ριβά αλλά υψηλής σχετικότητας αντικε
 ίμενα στην αρχή μιας συνεδρίας για ν
 α χτίσει εμπιστοσύνη, δημιουργώντας 
 έναν χρήστη που δυναμικά αυξάνει την
  εμπιστοσύνη του στο Σύστημα Συστάσε
 ων. Για μεγάλους καταλόγους περιεχομ
 ένου που οι επιλυτές MDP δεν μπορούν
  να διαχειριστούν υπολογιστικά, προτ
 είνουμε μια προσέγγιση Q-Learning χω
 ρίς μοντέλο, που προσεγγίζει τη βέλτ
 ιστη πολιτική. Επικυρώνουμε την εγκυ
 ρότητα του μοντέλου μας μέσω προσομο
 ιώσεων σε συνθετικούς καταλόγους, κα
 θώς και σε πραγματικούς, στις οποίες
  εφαρμόζουμε διάφορα σύνολα παραμέτρ
 ων για να αποτυπώσουμε διαφορετικές 
 συμπεριφορές.\n Abstract \n Minimizi
 ng the network cost of content deliv
 ery while maintaining user satisfact
 ion is a challenge for content platf
 orms. Existing work on Network-Frien
 dly Recommendation Systems (NF-RS) a
 ddress this by moving users toward c
 ached content, but the majority assu
 mes a static user model, where the p
 robability of accepting a recommenda
 tion remains constant through a sess
 ion. This is unrealistic because a u
 ser who repeatedly receives low-qual
 ity cached recommendations will lose
  trust in the system and eventually 
 ignore it, resorting to expensive co
 ntent retrieved from the search bar.
  In this thesis, we extend the Marko
 v Decision Process (MDP) framework f
 or Network-Friendly Recommendations 
 by modeling trust as a variable that
  evolves during a session based on t
 he quality of recommendations. We co
 nsider two models: a Fixed-Trust mod
 el, our baseline, and an Adaptive-Tr
 ust model, where the user’s attentio
 n probability rises after high-utili
 ty suggestions and falls after poor 
 ones. The latter model introduces th
 e invest and exploit strategy, where
  the optimal far-sighted policy reco
 mmends costly but high-utility items
  early in a session to build trust, 
 creating a user that is able to incr
 ease her confidence to our Recommend
 er System. For large content catalog
 s the exact MDP solvers could not co
 mputationally handle, we propose a m
 odel-free Q-Learning approach that a
 pproximates the optimal policy. We v
 alidate our framework through extens
 ive simulations over synthetic and r
 eal-world catalog topologies, on whi
 ch we apply a number of different pa
 rameter sets to capture different be
 haviors.\n  \n
STATUS:CONFIRMED
ORGANIZER;RSVP=FALSE;CN=TUC;CUTYPE=TUC:mailto:webmaster@tuc.gr
DTSTART:20260605T123000
DTEND:20260605T133000
TRANSP:OPAQUE
CLASS:DEFAULT
END:VEVENT
END:VCALENDAR