07
Μαρ
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Πρόγραμμα Προπτυχιακών Σπουδών
ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ
Ανδρέα Καλλιντέρη
με θέμα
Δημιουργία Παραμετροποιήσιμων Ρομποτικών Περιβαλλόντων Ενισχυτικής Μάθησης
Building Configurable Reinforcement Learning Robotic Environments
Εξεταστική Επιτροπή
Καθηγητής Γεώργιος Χαλκιαδάκης (επιβλέπων)
Καθηγητής Θρασύβουλος Σπυρόπουλος
Καθηγητής Μιχαήλ Λαγουδάκης
Περίληψη
Η δημιουργία τυποποιημένων υλοποιήσεων περιβάλλοντος και ενός API για OpenAI/Gym, έχει επηρεάσει την πρόσφατη έρευνα για ενισχυτική μάθηση. Ωστόσο, το περιορισμένο αριθμό και δυνατότητες τρέχον σύνολο περιβαλλόντων αποτελεί εμπόδιο για την περαιτέρω εξέλιξη των αλγορίθμων ενισχυτικής μάθησης.
Στην παρούσα διπλωματική εργασία, έχουμε αναπτύξει και παρέχουμε μια ποικιλία νέων περιβαλλόντων και πλαισίων για ρομποτική ενισχυτική μάθηση, συμπεριλαμβανομένων των Gymnasium/Mujoco-v5, Gymnasium-Robotics/Maze-v5, και Gymnasium-MaMuJoCo.
Επίσης, παρέχουμε σύνολα δεδομένων για χρήση από offline RL μεθόδους σε περιβάλλοντα Gymnasium/MuJoCo με το Minari API. Οι συνεισφορές αυτές μπορούν να επιτρέψουν στους ερευνητές να αναπτύξουν και να δοκιμάσουν νέους αλγορίθμους σε ένα πιο ρεαλιστικό περιβάλλον, το οποίο θα οδηγήσει σε πιο ισχυρούς και γενικευμένους αλγορίθμους ενισχυτικής μάθησης.
Abstract
The creation of standardized environments and an API for OpenAI/Gym has had a transformative impact on reinforcement learning research.
However, the current set of standardized environments needs to be extended so as to contribute to further advancements in reinforcement learning algorithms.
In this thesis, we have developed and provided a plethora of novel environments and frameworks for robotic reinforcement learning, including Gymnasium/Mujoco-v5, Gymnasium-Robotics/Maze-v5, and Gymnasium-Robotics/MaMuJoCo.
These advancements can potentially enable researchers to develop and test new algorithms in a more realistic and challenging environment, which will ultimately lead to more robust and generalizable reinforcement learning algorithms.
Meeting ID: 931 9703 9006
Password: 561314