02
Ιουλ
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Πρόγραμμα Προπτυχιακών Σπουδών
ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ
ΗΛΕΚΤΡΑΣ-ΔΕΣΠΟΙΝΑΣ ΠΑΠΑΜΑΤΘΑΙΑΚΗ
με θέμα
Ανάλυση και Τμηματοποίηση Στεφανιαίων Αρτηριών χρησιμοποιώντας Προηγμένες Τεχνικές Βαθιάς Μάθησης
Analysis and Segmentation of Coronary Arteries using Novel Deep Learning Techniques
Εξεταστική Επιτροπή
Καθηγητής Ζερβάκης Μιχαήλ (Επιβλέπων)
Καθηγητής Σπυρόπουλος Θρασύβουλος
Καθηγητής Σταυρουλάκης Γεώργιος (Σχολή ΜΠΔ)
Περίληψη
Η στεφανιαία νόσος (CAD) συγκαταλέγεται μεταξύ των κύριων αιτιών θανάτου παγκοσμίως. Δεδομένου ότι οι υφιστάμενες διαγνωστικές μέθοδοι είναι κυρίως επεμβατικές, παρατηρείται αυξανόμενο ενδιαφέρον για την ανάπτυξη ακριβών, μη επεμβατικών εναλλακτικών λύσεων. Στο πλαίσιο αυτό, οι εξελίξεις στη βαθιά μάθηση έχουν αποδειχθεί καθοριστικές για την εκτίμηση διαγνωστικών δεικτών. Η ακριβής τρισδιάστατη μοντελοποίηση των στεφανιαίων αρτηριών είναι ζωτικής σημασίας για την υποστήριξη αξιόπιστων, μη επεμβατικών διαγνωστικών διαδικασιών. Η παρούσα διπλωματική εργασία διερευνά τη χρήση τεχνικών βαθιάς μάθησης για την τμηματοποίηση των στεφανιαίων αρτηριών σε εικόνες αξονικής στεφανιογραφίας (CTA), με στόχο τη διευκόλυνση της έγκαιρης διάγνωσης και τη βελτίωση των θεραπευτικών παρεμβάσεων. Συγκρίνονται και αξιολογούνται δύο μοντέλα: το Basic U-Net, ένα συνελικτικό νευρωνικό δίκτυο (CNN), και το UNETR, ένα μοντέλο βασισμένο σε αρχιτεκτονική τύπου transformer. Και τα δύο μοντέλα υλοποιούνται στο ίδιο υπολογιστικό πλαίσιο, ώστε να διασφαλιστεί άμεση και δίκαιη σύγκριση.
Λαμβάνοντας υπόψη το αυξανόμενο ενδιαφέρον για τις αρχιτεκτονικές transformer στον ιατρικό τομέα, η παρούσα σύγκριση αποσκοπεί στην αξιολόγηση του κατά πόσο αυτές οι τεχνικές παρουσιάζουν ουσιαστική προοπτική για την πρόοδο της έρευνας στην τμηματοποίηση ιατρικών εικόνων. Αν και τα πειραματικά αποτελέσματα έδειξαν υψηλή ακρίβεια και για τα δύο μοντέλα, το Basic U-Net παρουσίασε σταθερά καλύτερη απόδοση από το UNETR, ιδίως σε συνθήκες περιορισμένων δεδομένων και υπολογιστικών πόρων. Η ποσοτική αξιολόγηση με τον Συντελεστή Ομοιότητας Dice (DSC) κατέδειξε μέση τιμή 90,56% για το Basic U-Net, έναντι 89,57% για το UNETR. Παρόλο που θεωρητικά το UNETR υπερέχει στην αποτύπωση εξαρτήσεων μεγάλου εύρους, η απόδοσή του φαίνεται να περιορίστηκε από την υψηλή απαίτηση σε δεδομένα και την ευαισθησία του σε υπολογιστικούς περιορισμούς.
Τα ευρήματα αυτά καταδεικνύουν ότι οι συνελικτικές αρχιτεκτονικές παραμένουν πιο αξιόπιστες σε περιβάλλοντα με περιορισμένους πόρους και υπογραμμίζουν τη σημασία της επιλογής κατάλληλου μοντέλου και του μεγέθους του συνόλου δεδομένων στις ιατρικές εφαρμογές αυτού του πεδίου. Συνολικά, η παρούσα έρευνα επιβεβαιώνει ότι η βαθιά μάθηση είναι εφαρμόσιμη για την τμηματοποίηση των στεφανιαίων αρτηριών και ενισχύει περαιτέρω την προοπτική αξιοποίησής της σε μη επεμβατικές διαγνωστικές διαδικασίες για τη στεφανιαία νόσο.
Abstract
Coronary Artery Disease (CAD) is among the principal causes of death globally. Since current diagnostic methods are primarily invasive, there is an increasing interest in accurate, non-invasive alternatives. In this regard, deep learning developments have proven pivotal in estimating diagnostic indices. 3D modeling of coronary arteries in an accurate manner is crucial for enabling dependable, non-invasive diagnostic processes. This thesis explores the use of deep learning for coronary arteries segmentation in computed tomography angiography (CTA) images, with a view towards facilitating early diagnosis and improving treatments. Two models are compared and evaluated: Basic U-Net, a convolutional neural network (CNN), and a transformer-based model, UNETR. Both are implemented within the same framework so that a direct and fair comparison is ensured.
Considering the increasing interest in transformer architectures within the medical field, this comparison intends to assess whether they hold tangible potential for improving the research in medical image segmentation. Although experimental results indicated that both models had high accuracy, Basic U-Net performed consistently better than UNETR, especially when there were constraints of limited data and computational resources. A quantitative evaluation using the Dice Similarity Coefficient (DSC) revealed an average score for Basic U-Net of 90.56%, in comparison to 89.57% for UNETR. Although theoretically, UNETR has an advantage in capturing dependencies over greater distances, its performance was likely constrained by its higher data requirements and sensitivity to computational limitations.
These findings indicate that convolutional architectures remain more reliable under low-resource conditions and highlight the importance of model selection and dataset size when it comes to medical applications in this field. Overall, the research affirms that deep learning is feasible for coronary arteries segmentation and further supports its potential application for non-invasive diagnostic processes for CAD.