Κατάλογος Εκδηλώσεων

24
Ιαν

Παρουσίαση Διπλωματικής Εργασίας κ. Πατίκου Ιωάννη - Σχολή ΗΜΜΥ

Κατηγορία: Παρουσίαση Διπλωματικής Εργασίας

Λ - Κτίριο Επιστημών/ΗΜΜΥ, 141Π-36,141Π-37, Αίθουσα Συνεδριάσεων Σχολής ΗΜΜΥ

24/01/2020 12:00 - 13:00

Περιγραφή:

Τίτλος: Ταξινόμηση των Πολυπόδων του Παχέος Εντέρου, που Ανιχνεύθηκαν κατά τη Διάρκεια μιας Κολονοσκόπησης, ως Αδενωματώδεις ή Υπερπλαστικοί με τη χρήση Αλγορίθμων Ανάλυσης Εικόνας και Μηχανικής Μάθησης (Classification of Colorectal Polyps Detected during Standard Colonoscopy as Adenomatous or Hyperplastic using Image Analysis and Machine Learning Algorithms)

Εξεταστική Επιτροπή:

Καθηγητής Μιχαήλ Ζερβάκης (Επιβλέπων)

Καθηγητής Γεώργιος Σταυρακάκης

Δρ. Ελευθερία Σεργάκη, μέλος ΕΔΙΠ

Περίληψη:

Σήμερα, ο καρκίνος του παχέος εντέρου αποτελεί μία από τις συχνότερες αιτίες θανάτου από καρκίνο παγκοσμίως. Έρευνες έχουν δείξει ότι ο συγκεκριμένος καρκίνος είναι άρρηκτα συνδεδεμένος με τους πολύποδες του παχέος εντέρου. Η συντριπτική πλειοψηφία των γαστρεντερικών καρκινωμάτων θεωρείται ότι προέρχεται από αδενωματώδεις πολύποδες και επομένως, η έγκαιρη ανίχνευσή τους μπορεί να εμποδίσει την περαιτέρω ανάπτυξη καρκίνου. Ως εκ τούτου, ερευνώνται και αναπτύσσονται νέες μέθοδοι που προσπαθούν να ενισχύσουν το ποσοστό επιτυχούς ανίχνευσης αδενώματος (ADR). Η χρήση τεχνικών τεχνητής νοημοσύνης (AI), όπως η βαθιά μάθηση, και ειδικά τα συνελικτικά νευρωνικά δίκτυα (CNNs), αρχίζουν να εμφανίζονται σαν βοηθήματα στη γαστρεντερική ενδοσκόπηση. Τα CNNs μπορούν να αποτελέσουν σημαντικότατο υποστηρικτικό ιατρικό εργαλείο αυτόματης ιατρικής διάγνωσης των καρκινικών όγκων και των πολυπόδων του παχέος εντέρου. Για το λόγο αυτό, τέσσερα διαφορετικά CNN μοντέλα εφαρμόστηκαν στην παρούσα εργασία. Τα τρία πρώτα ασχολούνται με το πρόβλημα της ανίχνευσης πολυπόδων, ενώ το τέταρτο ασχολείται με την ταξινόμηση των πολυπόδων σε αδενώματα και υπερπλαστικούς πολύποδες. Και στα δύο προβλήματα έχουμε δυαδική ταξινόμηση. Στην πρώτη περίπτωση, οι εικόνες ταξινομούνται σε κατηγορίες "Πολύποδας" και "Υγιές" και στη δεύτερη περίπτωση σε "Αδένωμα" και "Υπερπλαστικός". Ένας συνδυασμός διαφόρων τεχνικών βελτίωσης εφαρμόστηκε στα πρώτα τρία μοντέλα για να ελεγχθεί πώς επηρεάζουν την απόδοση των CNNs. Αυτές οι μέθοδοι είναι η Augmentation, η Dropout Regularization και η τεχνική Transfer Learning. Στο μοντέλο CNN για την κατηγοριοποίηση των πολυπόδων σε αδενώματα και υπερπλαστικούς πολύποδες τα δεδομένα αφορούσαν τις τιμές των χαρακτηριστικών υφής GLCM των εικόνων. Τα δεδομένα που χρησιμοποιήθηκαν στην εργασία συλλέχθηκαν αναδρομικά από το προσωπικό αρχείο του ιατρού Κωνσταντίνου Πατίκου. Από 750 ασθενείς συνολικά συγκεντρώθηκαν 1576 εικόνες; 798 περιέχουν πολύποδες και 778 απεικονίζουν υγιές έντερο. Οι 798 εικόνες πολυπόδων χωρίζονται σε δύο κατηγορίες; 424 εικόνες με αδενοματώδεις πολύποδες και 374 με υπερπλαστικούς. Όλα τα δεδομένα προέρχονται από κοινό ενδοσκόπιο. Τα δεδομένα δεν είναι ιδιαίτερα ομοιόμορφα, καθώς οι εικόνες διαφέρουν σε μεγέθυνση, εστίαση ή χρωματισμό. Τα σύνολα δεδομένων εκπαίδευσης και επαλήθευσης για το πρόβλημα εντοπισμού πολυπόδων περιέχουν 1470 και 106 εικόνες αντίστοιχα. Τα σύνολα δεδομένων εκπαίδευσης και επαλήθευσης για το πρόβλημα ταξινόμησης των πολυπόδων αποτελούνται από 170 και 34 εικόνες αντίστοιχα. Η αποτελεσματικότητα των προτεινόμενων μοντέλων αξιολογήθηκε μετρώντας την ακρίβεια, την ευαισθησία και την ειδικότητα. Το πιο αποτελεσματικό σενάριο που ασχολήθηκε με το πρόβλημα του εντοπισμού πολυπόδων σημείωσε 92,2% accuracy, 94,4% sensitivity, 90,6% specificity, 90,9% precision, 9,4% FPR και 5,6% FNR σε δεδομένα που δεν είχε ξαναδεί. Το μόνο σενάριο που αντιμετώπισε το πρόβλημα ταξινόμησης πολυπόδων επέτυχε 85% accuracy, 88,8% sensitivity, 81,3% specificity, 84,2% specificity, 18,7% FPR και 11,1% FNR.

Λέξεις Κλειδιά: Καρκίνος παχέος εντέρου, Κοινή κολονοσκόπηση, Πολύποδες παχέος εντέρου, Αδενώματα, Υπερπλαστικοί, Τεχνητή Νοημοσύνη, Deep Learning, Συνελικτικά Νευρωνικά Δίκτυα (CNN), Ανίχνευση Πολυπόδων, Ταξινόμηση Πολυπόδων, Augmentation, Dropout, Transfer Learning, GLCM texture, Sensitivity, Specificity, False Positive Ratio (FPR), False Negative Ratio (FNR)

Abstract:

Nowadays, colorectal cancer (CRC) is one of the most frequent causes of cancer fatality worldwide. Researches have shown CRC’s intimate relation to colorectal polyps. The vast majority of all gastrointestinal carcinomas are considered to originate from adenomatous polyps and as a result, their early detection could prevent their transformation to cancer. Hence, new methods that are trying to enhance the adenoma detection rate (ADR) are being researched and developed. The employment of artificial intelligence (AI) techniques, like deep learning, and especially convolutional neural networks (CNNs), helps to identify cancerous tumors and colonic polyps. The CNN architecture is well-suited by design to provide beneficial solutions, including polyp detection and classification. On that account, four different CNN models have been implemented in the current thesis. The first three are dealing with the polyp detection problem, while the fourth one performs polyp’s classification as ‘‘adenomatous’’ and ‘’hyperplastic’’. In both tasks, a binary classification takes place. In the first case, image data are classified into "polyp" and "healthy" categories and in the second case into "adenomas" and "hyperplastic". A combination of various improving techniques has been applied in the first three models to see how they affect the performance of the CNNs. These methods consist of: Image Data Augmentation, the Dropout Regularization technique and the Transfer Learning technique. In the CNN model for polyp classification as adenomatous and hyperplastic polyps, the data were related to the values of the GLCM texture features of the images. The data, used in this thesis, were collected retrospectively from the extensive personal archive of doctor Konstantinos Patikos. From a total of 750 patients, 1576 images were collected; 798 contain polyps and 778 depict a healthy colon. The 798 images with polyps are separated into two categories; 424 pictures with adenomatous polyps and 374 pictures with hyperplastic polyps. All the data come from standard colonoscope, which uses white light for the inspection of the bowel wall. The images are not very uniform, as they tend to differ in zoom, focus or coloration. The training and testing datasets for the polyp detection task contain 1470 and 106 samples respectively. The training and testing datasets for the polyp classification problem consist of 170 and 34 samples each. Performance metrics like Accuracy, Sensitivity, and Specificity were measured to evaluate the effectiveness of the proposed models. The most efficient scenario that dealt with the polyp detection task scored 92.2% accuracy, 94.4% sensitivity, 90.6% specificity, 90.9% precision, 9.4% FPR and 5.6% FNR over unseen data. The only scenario that confronted the polyp classification problem achieved 85% accuracy, 88.8% sensitivity, 81.3% specificity, 84.2% precision, 18.7% FPR and 11.1% FNR.

Keywords: Colorectal Cancer (CRC), Standard Colonoscopy, Colorectal Polyps, Gastrointestinal, Adenomas, Hyperplastic, Adenoma Detection Rate (ADR), Artificial Intelligence (AI), Deep Learning, Convolutional Neural Networks (CNNs), Polyp Detection, Polyp Classification, Augmentation, Dropout, Transfer Learning, GLCM texture, Sensitivity, Specificity, False Positive Ratio (FPR), False Negative Ratio (FNR)

Προσθήκη στο ημερολόγιό μου