Απόδοση αλγορίθμων μηχανικής μάθησης για την πρόβλεψη της εξέλιξης της άνοιας σε ασθενείς με κλινική μνήμης
Mar 25, 2022
Για περισσότερες πληροφορίες:ali.ma@wecistanche.com
Αφηρημένη
ΣΗΜΑΣΙΑ
Οι αλγόριθμοι μηχανικής μάθησης θα μπορούσαν να χρησιμοποιηθούν ως βάση για βοηθήματα λήψης κλινικών αποφάσεων για την ενίσχυση της κλινικής πρακτικής.
ΣΚΟΠΟΣ
Να αξιολογήσει την ικανότητα των αλγορίθμων μηχανικής μάθησης να προβλέψουν τη συχνότητα της άνοιας εντός 2 ετών σε σύγκριση με τα υπάρχοντα μοντέλα και να καθορίσουν τη βέλτιστη αναλυτική προσέγγιση και τον αριθμό των απαιτούμενων μεταβλητών.
ΣΧΕΔΙΑΣΜΟΣ, ΣΚΗΣΗ ΚΑΙ ΣΥΜΜΕΤΕΧΟΝΤΕΣ
Αυτή η προγνωστική μελέτη χρησιμοποίησε δεδομένα από μια υποψήφια κοόρτη 15 307 συμμετεχόντων χωρίς άνοια στην αρχή για να πραγματοποιήσει μια δευτερεύουσα ανάλυση παραγόντων που θα μπορούσαν να χρησιμοποιηθούν για την πρόβλεψη της συχνότητας εμφάνισης άνοιας. Οι συμμετέχοντες παρευρέθηκαν στο Εθνικό Συντονιστικό Κέντρο Αλτσχάιμερμνήμηκλινικές σε όλες τις Ηνωμένες Πολιτείες μεταξύ 2005 και 2015. Οι αναλύσεις διενεργήθηκαν από τον Μάρτιο έως τον Μάιο του 2021. ΕΚΘΕΣΕΙΣ 258 μεταβλητές που καλύπτουν τομείς κλινικών μέτρων που σχετίζονται με την άνοια και παραγόντων κινδύνου.
ΚΥΡΙΑ ΑΠΟΤΕΛΕΣΜΑΤΑ ΚΑΙ ΜΕΤΡΑ
Το κύριο αποτέλεσμα ήταν περιστατικό άνοιας όλων των αιτιών που διαγνώστηκε εντός 2 ετών από την αρχική αξιολόγηση.
Charlotte James, Ph.D. Janice M. Ranson, Ph.D. Richard Everson, Ph.D. David J. Llewellyn, PhD
ΑΠΟΤΕΛΕΣΜΑΤΑ
Σε ένα δείγμα {{0}} συμμετεχόντων (μέση [SD] ηλικία, 72,3 [9,8] έτη· 9129 [6{{2{{0}} τοις εκατό ] γυναίκες και 6178 [4{{24 }} τοις εκατό ] άνδρες) χωρίς άνοια κατά την έναρξη, 1568 (10 τοις εκατό ) έλαβαν διάγνωση άνοιας εντός 2 ετών από την αρχική τους αξιολόγηση. Σε σύγκριση με 2 υπάρχοντα μοντέλα πρόβλεψης κινδύνου άνοιας (δηλαδή, Παράγοντες Καρδιαγγειακού Κινδύνου, Γήρανση και Επίπτωση Κινδύνου Άνοιας και Σύντομο Δείκτης Έλεγχου Άνοιας), οι αλγόριθμοι μηχανικής μάθησης ήταν ανώτεροι στην πρόβλεψη περιστατικών άνοιας κάθε αιτίας εντός 2 ετών. Ο αλγόριθμος δέντρων ενισχυμένων με κλίση είχε μέση (SD) συνολική ακρίβεια 92 τοις εκατό (1 τοις εκατό ), ευαισθησία 0.45 (0.05), ειδικότητα 0.97 (0.01) και περιοχή κάτω από την καμπύλη 0,92 (0,01) χρησιμοποιώντας και τις 258 μεταβλητές. Η ανάλυση μεταβλητής σημασίας έδειξε ότι μόνο 6 μεταβλητές απαιτούνταν για τους αλγόριθμους μηχανικής μάθησης για να επιτευχθεί ακρίβεια 91 τοις εκατό και εμβαδόν κάτω από την καμπύλη τουλάχιστον 0,89. Οι αλγόριθμοι μηχανικής μάθησης εντόπισαν επίσης έως και το 84 τοις εκατό των συμμετεχόντων που έλαβαν μια αρχική διάγνωση άνοιας που στη συνέχεια αντιστράφηκε σε ήπια γνωστική έκπτωση ή γνωστικά μη εξασθενημένη, υποδηλώνοντας πιθανή εσφαλμένη διάγνωση.
ΣΥΜΠΕΡΑΣΜΑΤΑ ΚΑΙ ΣΧΕΤΙΚΟΤΗΤΑ
Αυτά τα ευρήματα υποδηλώνουν ότι οι αλγόριθμοι μηχανικής μάθησης θα μπορούσαν να προβλέψουν με ακρίβεια την περιστατική άνοιας εντός 2 ετών σε ασθενείς που λαμβάνουν φροντίδα σεμνήμηκλινικές που χρησιμοποιούν μόνο 6 μεταβλητές. Αυτά τα ευρήματα θα μπορούσαν να χρησιμοποιηθούν για την ενημέρωση της ανάπτυξης και επικύρωσης βοηθημάτων λήψης αποφάσεωνμνήμηκλινικές.

Κάντε κλικ για να καταγράψετε DHT για μνήμη
Εισαγωγή
Πολλοί ασθενείς αξιολογήθηκαν σε εξειδικευμένα περιβάλλοντα, όπως π.χμνήμηκλινικές, δεν έχουν άνοια όταν παρευρίσκονται για πρώτη φορά.1 Η διαφοροποίηση μεταξύ των ασθενών που αναπτύσσουν άνοια εντός ενός κλινικά σχετικού χρονικού πλαισίου και εκείνων που παραμένουν χωρίς άνοια είναι σημαντική, καθώς αυτή η γνώση μπορεί να χρησιμοποιηθεί για να δοθεί προτεραιότητα στους ασθενείς για έρευνες παρακολούθησης και παρεμβάσεις. Ο εντοπισμός ασθενών με υψηλό κίνδυνο εμφάνισης άνοιας αποτελεί πρόκληση για τους κλινικούς γιατρούς. Μια προσέγγιση είναι να εστιάσουμε σε όσους έχουν ήπια γνωστική εξασθένηση (MCI) όταν αξιολογήθηκαν αρχικά και να προσκαλέσουμε αυτούς τους ασθενείς για παρακολούθηση. Ωστόσο, αυτό μπορεί να οδηγήσει σε σημαντική εσφαλμένη ταξινόμηση για ασθενείς που δεν στοχεύουν στην παρακολούθηση αλλά που αναπτύσσουν άνοια και ασθενείς που στοχεύουν περαιτέρω έρευνες αλλά δεν αναπτύσσουν άνοια. Οι περισσότεροι ασθενείς σε κλινική μνήμης με MCI δεν εξελίσσονται σε άνοια ακόμη και μετά από 10 χρόνια, με ετήσιο ποσοστό μετατροπής 9,6 τοις εκατό .2
Τα βοηθήματα λήψης κλινικών αποφάσεων μπορεί να βελτιώσουν την ικανότητα των κλινικών γιατρών να εκτιμούν την έναρξη της άνοιας. Υπάρχουν διαθέσιμα βοηθήματα για τη λήψη κλινικών αποφάσεων για την εκτίμηση της μεσοπρόθεσμης και μακροπρόθεσμης επίπτωσης της άνοιας σε διαφορετικούς πληθυσμούς. Για παράδειγμα, ο Δείκτης Κινδύνου Καρδιαγγειακού Κινδύνου, Γήρανση και Επίπτωση της Άνοιας (CAIDE)3 σχεδιάστηκε για να προβλέψει τον κίνδυνο ανάπτυξης άνοιας σε 20 χρόνια για μεσήλικες και ο Σύντομος Δείκτης Έλεγχου Άνοιας (BDSI)4 στοχεύει στην αναγνώριση ηλικιωμένων ασθενείς να στοχεύσουν σε γνωστικό προσυμπτωματικό έλεγχο προσδιορίζοντας τον κίνδυνο να αναπτύξουν άνοια σε 6 χρόνια. Ωστόσο, από ό,τι γνωρίζουμε, δεν έχει αναπτυχθεί κανένα βοήθημα λήψης κλινικών αποφάσεων για την πρόβλεψη της συχνότητας εμφάνισης της άνοιας στις κλινικές μνήμης για μια συντομότερη κλινικά σχετική περίοδο.

Η μηχανική μάθηση (ML) επιτρέπει τη μόχλευση πληροφοριών από μεγάλα και πολύπλοκα σύνολα δεδομένων. Πρόσφατα, έχει εφαρμοστεί στη διάγνωση της άνοιας και στην πρόβλεψη κινδύνου.5-9 Ωστόσο, αυτά τα μοντέλα συχνά ενσωματώνουν πληροφορίες που δεν είναι συνήθως διαθέσιμες στη συνήθη κλινική πρακτική, όπως προηγμένη νευροαπεικόνιση, γενετικές δοκιμές και βιοδείκτες εγκεφαλονωτιαίου υγρού, περιορίζοντας την κλινική εφαρμογή σε εξειδικευμένες ή ερευνητικές ρυθμίσεις.
Ερευνήσαμε εάν οι τεχνικές ML μπορούν να χρησιμοποιηθούν για την πρόβλεψη της συχνότητας εμφάνισης της άνοιας σε μια περίοδο 2-χρόνων, χρησιμοποιώντας δεδομένα κλινικής μνήμης από την Εθνική Η.Π.Α.ΑλτσχάιμερΣυντονιστικό Κέντρο (NACC). Εξετάσαμε επίσης το ελάχιστο σύνολο μεταβλητών που απαιτούνται για τα μοντέλα ML για την επίτευξη πλήρους διαγνωστικής απόδοσης.

Μέθοδοι
Η μελέτη NACC έλαβε δεοντολογική έγκριση από το συμβούλιο θεσμικής αναθεώρησης κάθε τοποθεσίας προτού μπορέσει να συνεισφέρει δεδομένα και όλοι οι συμμετέχοντες είχαν παράσχει ενημερωμένη γραπτή συγκατάθεση. Αυτή η προγνωστική μελέτη κρίθηκε ότι εξαιρείται από θεσμική δεοντολογική έγκριση, επειδή χρησιμοποιήσαμε δεδομένα που είχαν συλλεχθεί προηγουμένως χωρίς ταυτοποίηση. Τα δεδομένα που χρησιμοποιούνται σε αυτή τη μελέτη είναι διαθέσιμα κατόπιν αιτήματος δεδομένων στο NACC. Αυτή η μελέτη αναφέρεται σύμφωνα με την κατευθυντήρια γραμμή αναφοράς για τη Διαφανή Αναφορά Μοντέλου Πρόβλεψης Πολυμεταβλητών για Ατομική Πρόγνωση ή Διάγνωση (TRIPOD). Τα δεδομένα αναλύθηκαν από τον Μάρτιο έως τον Μάιο του 2021.
Δείγμα μελέτης
Χρησιμοποιήσαμε δεδομένα που συλλέγαμε προηγουμένως από το NACC Uniform Data Set (UDS).10 Το UDS περιέχει δεδομένα προοπτικής κοόρτης από το Εθνικό Ινστιτούτο των ΗΠΑ για τη ΓήρανσηΑλτσχάιμερΝόσοςΚέντρο προγράμματος για πολυκεντρική συνεργατική έρευνα με θέμαΑλτσχάιμερνόσοςκαι άλλες νευροεκφυλιστικές διαταραχές.11 Το σύνολο δεδομένων μας αποτελείται από δεδομένα κλινικής μνήμης που συλλέχθηκαν μεταξύ Σεπτεμβρίου 2005 και Φεβρουαρίου 2015 από τις 30ΑλτσχάιμερΝόσοςΚέντρα που βρίσκονται στις Ηνωμένες Πολιτείες. Το σύνολο δεδομένων περιλαμβάνει κοινωνικοδημογραφικά χαρακτηριστικά συμμετεχόντων και συμμετεχόντων, οικογενειακό ιστορικό, λειτουργική κατάσταση, 12 συμπτώματα συμπεριφοράς (αξιολογημένα με αποτελέσματα ερωτηματολογίου νευροψυχιατρικής απογραφής13), μπαταρία νευροψυχολογικού τεστ, 14 και διάγνωση κλινικής άνοιας NACC, που έχουν εκχωρηθεί από κάθεΑλτσχάιμερΝόσοςΚέντρο χρησιμοποιώντας δημοσιευμένα κλινικά διαγνωστικά κριτήρια με βάση την τυποποιημένη κλινική αξιολόγηση UDS. Λεπτομέρειες για τα διαγνωστικά κριτήρια που υιοθετήθηκαν από το πρωτόκολλο UDS και τις σχετικές οδηγίες έχουν δημοσιευθεί προηγουμένως.15

Χρησιμοποιήσαμε τις εκδόσεις 1 και 2 του UDS, οι οποίες περιλαμβάνουν 32 573 συμμετέχοντες σε κλινική μνήμης με βασική αξιολόγηση. Αν και τα μοντέλα μας έχουν σχεδιαστεί για να προβλέψουν τη συχνότητα εμφάνισης άνοιας εντός 2 ετών, για να λάβουν υπόψη τη διακύμανση του χρόνου μεταξύ των ραντεβού παρακολούθησης, συμπεριλάβαμε την παρακολούθηση που έλαβε χώρα εντός 29 μηνών από την αρχική επίσκεψη για να διασφαλίσουμε ότι η επίσκεψη ήταν είτε η πρώτη είτε δεύτερο ραντεβού παρακολούθησης.
Μεταβλητή Αποτελέσματος
Η μεταβλητή έκβασης ήταν η διάγνωση της άνοιας για όλες τις αιτίες εντός 29 μηνών (περίπου 2 ετών) από την αρχική αξιολόγηση. Αυτό περιλαμβάνει υποτύπους άνοιας, όπως η άνοια Alzheimer, η άνοια με σώματα Lewy, η αγγειακή άνοια και άλλοι πιο σπάνιοι υποτύποι. Η άνοια Alzheimer διαγνώστηκε σύμφωνα με τα κριτήρια NINCSD-ADRDA,16 η αγγειακή άνοια διαγνώστηκε σύμφωνα με τα κριτήρια NINDS-AIREN,17 Η άνοια Lewy body (LBD) διαγνώστηκε σύμφωνα με την τρίτη έκθεση των κριτηρίων Dementia with Lewy Bodies Consortium,18 και frontotemp διαγνώστηκε σύμφωνα με τα κριτήρια του Neary και των συνεργατών του 1998.19
Υποψήφιοι Προγνωστικοί
Συμπεριλάβαμε όλες τις κλινικά σχετικές μεταβλητές που συλλέχθηκαν κατά την αρχική επίσκεψη στις εκδόσεις 1 και 2 του UDS (eΠίνακας 1 στο Συμπλήρωμα). Εξαιρέσαμε μεταβλητές με τιμές ελεύθερου κειμένου, όπως ονόματα φαρμάκων, και μεταβλητές που ήταν σταθερές σε όλους τους συμμετέχοντες, όπως ο αριθμός επίσκεψης. Δημιουργήθηκαν τέσσερις συνθετικές μεταβλητές για να βοηθήσουν στην αξιολόγηση της σημασίας της μεταβλητής (αυτές οι μεταβλητές θα πρέπει να κατατάσσονται σε χαμηλά επίπεδα). 3 από αυτές τις μεταβλητές ήταν μεταθέσεις υπαρχουσών μεταβλητών (1 δυαδική, 1 κατηγορική και 1 αριθμητική μεταβλητή) και 1 μεταβλητή δημιουργήθηκε τυχαία από μια κανονική κατανομή. Αυτό είχε ως αποτέλεσμα συνολικά 258 μεταβλητές.
Οι μεταβλητές από το UDS που έχουν ενσωματωθεί στα μοντέλα μας περιλαμβάνουν δημογραφικά χαρακτηριστικά συμμετεχόντων (15 μεταβλητές), δημογραφικά χαρακτηριστικά συμμετεχόντων (7 μεταβλητές), οικογενειακό ιστορικό (3 μεταβλητές), ιατρικό ιστορικό (47 μεταβλητές), φάρμακα (21 μεταβλητές), σωματικές (12 μεταβλητές ) και νευρολογικά (4 μεταβλητές) αποτελέσματα εξέτασης, Ενοποιημένη Κλίμακα Βαθμολόγησης Νόσου Πάρκινσον 20 (UDPRS) (28 μεταβλητές), Κλίμακα Κλινικής Διαβάθμισης Άνοιας (CDR) 21 (8 μεταβλητές), λειτουργική κατάσταση (10 μεταβλητές), μπαταρία νευροψυχολογικού τεστ (50 μεταβλητές) , Κλίμακα Γηριατρικής Κατάθλιψης (17 μεταβλητές) και κλινική εκτίμηση των συμπτωμάτων (32 μεταβλητές). Από αυτές τις μεταβλητές, 239 (93 τοις εκατό ) έλειπαν για τουλάχιστον 1 συμμετέχοντα και όλοι οι συμμετέχοντες είχαν τουλάχιστον 1 μεταβλητή.
Ανάπτυξη Μοντέλου
Υλοποιήσαμε 4 αλγόριθμους ML22: λογιστική παλινδρόμηση (LR), 23 μηχανή διανυσμάτων υποστήριξης (SVM), 24 τυχαία δάση (RF), 25,26 και δέντρα ενισχυμένα με κλίση (XGB)27 (eMethods στο Συμπλήρωμα). Αυτοί οι αλγόριθμοι εκτελούν μια εργασία ταξινόμησης: καθορίζουν εάν ένας συμμετέχων εμπίπτει στην κατηγορία 0 (προβλέπεται ότι θα παραμείνει χωρίς άνοια 29 μήνες από την έναρξη) ή στην κατηγορία 1 (προβλέπεται ότι θα εμφανίσει περιστατική άνοια εντός 29 μηνών από την έναρξη). Η ταξινόμηση βασίζεται σε μεταβλητές που καταγράφηκαν κατά την πρώτη τους επίσκεψη σε κλινική μνήμης (βασική γραμμή). Για την υλοποίηση των αλγορίθμων ML, χρησιμοποιήσαμε τη βιβλιοθήκη Python sci-kit-learn (Python Software Foundation),28 με 5-πτυχή διασταυρούμενη επικύρωση (eMethods in the Supplement). Οι τιμές που λείπουν καταλογίστηκαν με δειγματοληψία με αντικατάσταση από τιμές που δεν λείπουν. Όλη η επεξεργασία και η ανάλυση δεδομένων υλοποιήθηκαν στην Python έκδοση 3.9, NumPy έκδοση 1.19.4 και sci-kit-learn έκδοση 0.24.0.
Στατιστική ανάλυση
Αξιολόγηση Μοντέλου
Αξιολογήσαμε την απόδοση όλων των μοντέλων συγκρίνοντας τη συνολική τους ακρίβεια, την ευαισθησία και την ειδικότητά τους για τα κατώφλια απόφασης που προκαθορίζονται στη βιβλιογραφία (υφιστάμενα μοντέλα) ή ένα όριο 0.5 (μοντέλα ML), τα οποία σταθμίζουν εξίσου τα ψευδώς θετικά και ψευδώς αρνητικά σφάλματα. Η περιοχή κάτω από τη χαρακτηριστική καμπύλη λειτουργίας του δέκτη (AUC)29 χρησιμοποιήθηκε για να συνοψίσει την απόδοση του μοντέλου σε όλα τα πιθανά όρια και επομένως τις σταθμίσεις σφαλμάτων λανθασμένης ταξινόμησης.
Σύγκριση με υπάρχοντα μοντέλα
Το BDSI και το CAIDE είναι υπάρχοντα μοντέλα πρόβλεψης κινδύνου άνοιας που αποδίδουν στους ασθενείς μια βαθμολογία που αντιπροσωπεύει τον κίνδυνο εμφάνισης άνοιας σε μεγαλύτερα χρονικά διαστήματα. Για να εξαχθούν οι βαθμολογίες κινδύνου BDSI και CAIDE, επιλέξαμε μεταβλητές από το UDS που αντιστοιχούν περισσότερο σε μεταβλητές που χρησιμοποιήθηκαν προηγουμένως (πίνακας 2 στο Συμπλήρωμα). Η απόδοση των μοντέλων μας ML συγκρίθηκε με εκείνη των BDSI και CAIDE για την πρόβλεψη της συχνότητας εμφάνισης άνοιας 2- ετών.
Απόδοση μοντέλου σε υποτύπους άνοιας
Η άνοια μπορεί να έχει ποικίλες αιτίες, που αντιστοιχούν σε διαφορετικούς υποτύπους άνοιας. Για να αξιολογήσουμε την ικανότητα των μοντέλων ML να εντοπίζουν διαφορετικούς υποτύπους άνοιας, χωρίσαμε τις περιπτώσεις άνοιας που εμφανίστηκαν σε άνοια Alzheimer, LBD, αγγειακή άνοια και άλλους υποτύπους άνοιας. Χρησιμοποιώντας αυτές τις 4 διαστρωμάτωση, υπολογίσαμε το ποσοστό των συμμετεχόντων που ταξινομήθηκαν σωστά (αληθινό θετικό ποσοστό) και συγκρίναμε τις καμπύλες ROC για κάθε μοντέλο ML.
Διερεύνηση Διαγνωστικής Σταθερότητας
Η κλινική διάγνωση της άνοιας είναι γνωστό ότι ενσωματώνει ασθενείς στους οποίους αρχικά γίνεται λανθασμένη διάγνωση (ουσιαστικά τόσο ψευδώς θετικά όσο και ψευδώς αρνητικά σφάλματα).31 Ορίζουμε την αναστροφή ως όταν ένας συμμετέχων που διαγνώστηκε με άνοια έως και 2 χρόνια μετά την πρώτη του επίσκεψη σε κλινική μνήμης και στη συνέχεια λαμβάνει διάγνωση χωρίς άνοια (είτε MCI είτε μη εξασθενημένη γνωστική λειτουργία) εντός 2 ετών από τη διάγνωση της άνοιας. Με το σκεπτικό ότι αυτές οι αναστροφές είναι ασταθείς διαγνώσεις και πιθανόν να ήταν αποτέλεσμα λανθασμένης διάγνωσης άνοιας, ερευνήσαμε την ακρίβεια ταξινόμησης των μοντέλων ML σε ένα δείγμα συμμετεχόντων με αναστροφή (eMethods in the Supplement). Χρησιμοποιήσαμε τη συνάρτηση αθροιστικής κατανομής (CDF) των βαθμολογιών ταξινόμησης που προέκυψαν από κάθε μοντέλο ML για να συγκρίνουμε τους συμμετέχοντες με αναστροφή με ασθενείς που εμφάνισαν άνοια και ασθενείς που παρέμειναν χωρίς άνοια.
Αποτελέσματα
Αφού εξαιρέθηκαν {{0}} συμμετέχοντες με διάγνωση άνοιας κατά την έναρξη, 4557 συμμετέχοντες που δεν είχαν δεδομένα παρακολούθησης και 573 συμμετέχοντες που είχαν την πρώτη τους παρακολούθηση περισσότερο από 29 μήνες μετά την πρώτη τους επίσκεψη , το τελικό αναλυτικό δείγμα περιείχε 15 307 συμμετέχοντες (μέση [SD] ηλικία, 72,3 [9,8] έτη· 9129 [60 τοις εκατό ] γυναίκες και 6178 [40 τοις εκατό ] άνδρες). Τα χαρακτηριστικά του δείγματος φαίνονται στον Πίνακα 1. Μέσα σε 2 χρόνια από την έναρξη, 1568 συμμετέχοντες (10 τοις εκατό ) έλαβαν διάγνωση άνοιας. Από τους 1568 συμμετέχοντες που έλαβαν διάγνωση άνοιας, 273 (17 τοις εκατό) διαγνώστηκαν από έναν μόνο κλινικό ιατρό και 1216 (78 τοις εκατό) διαγνώστηκαν από μια ομάδα συναίνεσης. για 79 συμμετέχοντες (5 τοις εκατό), η πηγή της διάγνωσης δεν προσδιορίστηκε. Τα βασικά μέτρα απόδοσης που αξιολογούν την προγνωστική ισχύ κάθε μοντέλου δίνονται στον Πίνακα 2. Σε σύγκριση με τα υπάρχοντα μοντέλα, τα μοντέλα ML ήταν ανώτερα στην ικανότητά τους να προβλέψουν εάν ένα άτομο θα αναπτύξει άνοια εντός 2 ετών και ξεπέρασαν τα υπάρχοντα μοντέλα σε όλα τα μέτρα. Όλα τα μοντέλα ML είχαν παρόμοια καλή απόδοση, με το XGB να έχει τη μεγαλύτερη ισχύ όταν μετράται με συνολική ακρίβεια (92 τοις εκατό ) και AUC (μέση τιμή [SD], 0,92 [0,01]). Η χαρακτηριστική καμπύλη λειτουργίας του δέκτη για κάθε μοντέλο καταδεικνύει την ομοιότητα μεταξύ των μοντέλων ML και την υπεροχή τους σε σύγκριση με τα 2 υπάρχοντα μοντέλα κινδύνου (Εικόνα 1).


Απόδοση μοντέλου σε υποτύπους άνοιας
Για να αξιολογήσουμε την απόδοση του μοντέλου ML σε διαφορετικούς υποτύπους άνοιας, χωρίσαμε τον πληθυσμό σε 4 υποτύπους άνοιας: άνοια Alzheimer (1285 συμμετέχοντες), LBD (82 συμμετέχοντες), αγγειακή άνοια (21 συμμετέχοντες) και άλλους υποτύπους άνοιας (180 συμμετέχοντες). Το μοντέλο LR ήταν το καλύτερο στον εντοπισμό της άνοιας Αλτσχάιμερ και άλλων υποτύπων, ταξινομώντας σωστά 589 συμμετέχοντες (46 τοις εκατό) με άνοια Αλτσχάιμερ και 99 συμμετέχοντες (55 τοις εκατό) με άλλους υποτύπους. Το μοντέλο SVM είχε καλύτερη απόδοση σε συμμετέχοντες με LBD, ταξινομώντας σωστά 40 συμμετέχοντες (49 τοις εκατό ). Όλα τα μοντέλα ταξινόμησαν σωστά 7 συμμετέχοντες (33 τοις εκατό) με αγγειακή άνοια. Οι χαρακτηριστικές καμπύλες λειτουργίας δέκτη δείχνουν ότι όλα τα μοντέλα είχαν περίπου εξίσου καλή απόδοση σε κάθε υποτύπο (εικόνα 1 στο Συμπλήρωμα).
Διερεύνηση Ελάχιστου Αριθμού Μεταβλητών
Ένα πιθανό μειονέκτημα της χρήσης μιας προσέγγισης ML είναι ο μεγάλος αριθμός των μεταβλητών που εμπλέκονται. Καθώς ο αριθμός των μεταβλητών που απαιτούνται από ένα μοντέλο αυξάνεται, η εφαρμογή σε κλινικό περιβάλλον γίνεται λιγότερο πρακτική και η ερμηνευσιμότητα του μοντέλου μειώνεται. Για να εκτιμήσουμε πόσες μεταβλητές απαιτούσε κάθε μοντέλο ML για να επιτύχει την ισοδύναμη προγνωστική ισχύ με αυτήν που βρήκαμε χρησιμοποιώντας και τις 258 μεταβλητές (Πίνακας 2), αξιολογήσαμε πώς η AUC μεταβλήθηκε με τον αριθμό των μεταβλητών που περιλαμβάνονται στα μοντέλα. Συγκεκριμένα, κατατάξαμε τις μεταβλητές για κάθε μοντέλο ταξινομώντας τις κατά φθίνουσα σειρά σπουδαιότητας (δηλαδή, η διακριτική ισχύς κάθε μεταβλητής σύμφωνα με τον αλγόριθμο· eMethods στο Συμπλήρωμα). Στη συνέχεια, επανεκπαιδεύσαμε κάθε μοντέλο με έναν αυξανόμενο αριθμό μεταβλητών, ξεκινώντας από τις πιο σημαντικές. Διαπιστώσαμε ότι όλα τα μοντέλα απαιτούσαν μόνο 22 μεταβλητές για την επίτευξη διαγνωστικών επιδόσεων που δεν διακρίνονται στατιστικά από τη βέλτιστη μέση απόδοσή τους (Εικόνα 2, eΕικόνα 2 στο Συμπλήρωμα). Οι συνθετικές μεταβλητές που προστέθηκαν για να διασφαλιστεί η εγκυρότητα της αξιολόγησης της σημασίας της μεταβλητής δεν ήταν στις 22 κορυφαίες μεταβλητές για κανένα μοντέλο, αντανακλώντας το γεγονός ότι μετά την επίτευξη πλήρους διαγνωστικής απόδοσης, υπήρχαν ελάχιστες πληροφορίες για τον ισχυρό προσδιορισμό της κατάταξης της μεταβλητής.
Προσδιορισμός Βασικών Παραγόντων Κινδύνου
Από τις 22 πιο σημαντικές μεταβλητές για κάθε μοντέλο, μόνο 5 ήταν κοινές σε όλα τα μοντέλα (δηλαδή, κλινική κρίση μείωσης της μνήμης, γνωστικές ικανότητες, συμπεριφορά, ικανότητα διαχείρισης υποθέσεων ή αλλαγές κινητικότητας και κίνησης, χρόνος για την ολοκλήρωση του Trail Making Test Μέρος Β· CDR: διαταραχή προσανατολισμού· CDR: βλάβη στο σπίτι και τα χόμπι· και επίπεδο ανεξαρτησίας). Από τις υπόλοιπες μεταβλητές, υπήρχαν 10 ζεύγη που είχαν συσχετισμό μεγαλύτερο από 0.7, υποδεικνύοντας ότι ήταν παρόμοιες μεταβλητές (πίνακας 3 στο Συμπλήρωμα). Υπολογίζοντας αυτή τη συσχέτιση με την ανταλλαγή μεταβλητών που είχαν υψηλή συσχέτιση, διαπιστώσαμε ότι υπήρχαν 6 εξαιρετικά προγνωστικές μεταβλητές (κλινική κρίση της πτώσης, χρόνος για την ολοκλήρωση της δοκιμής Trail Making Part B, 3 συστατικά του CDR [προσανατολισμός, μνήμη, και σπίτι και χόμπι απομείωση], και επίπεδο ανεξαρτησίας) που ήταν κοινά σε όλα τα μοντέλα ML (πίνακας 4 στο Συμπλήρωμα). Εκπαιδεύοντας κάθε μοντέλο χρησιμοποιώντας μόνο αυτές τις μεταβλητές, διαπιστώσαμε ότι για τα LR και XGB, δεν υπήρξε σημαντική μείωση στη διαγνωστική απόδοση: χρησιμοποιώντας αυτό το βασικό σύνολο 6 μεταβλητών, αυτά τα μοντέλα είχαν μέση ακρίβεια (SD) 91 τοις εκατό (0 ποσοστό ) για LR και 91 τοις εκατό (1 τοις εκατό ) για XGB και μέση (SD) AUC 0,89 (0.01) για LR και 0,89 (0,02) για XGB (eΠίνακας 5 στο Συμπλήρωμα).
Διαγνωστική σταθερότητα
Από τους 1568 συμμετέχοντες που έλαβαν διάγνωση άνοιας μέσα σε 2 χρόνια, εντοπίσαμε 130 (8 τοις εκατό ) ότι εμφάνιζαν αναστροφή, οι οποίοι πιθανότατα αρχικά είχαν λανθασμένη διάγνωση και ως εκ τούτου λανθασμένα επισημάνθηκαν για σκοπούς ML. Διαπιστώσαμε ότι ενώ οι αναστροφές αναφέρθηκαν μόνο στο 0,8 τοις εκατό των συμμετεχόντων, αντιστοιχούσαν σε 92 έως 109 συμμετέχοντες (7 τοις εκατό -8 τοις εκατό ) των εσφαλμένων ταξινομημένων συμμετεχόντων, με μια μικρή διακύμανση μεταξύ των μοντέλων (Πίνακας 3). Το μοντέλο RF είχε την υψηλότερη διαγνωστική σταθερότητα, εντοπίζοντας σωστά 109 από τους 130 συμμετέχοντες με αναστροφή (84 τοις εκατό ) ταξινομώντας τους ως προβλεπόμενους ως απαλλαγμένους από άνοια στα 2 χρόνια. Για να διερευνήσουμε τη διαγνωστική σταθερότητα των μοντέλων ML, αφαιρέσαμε τους συμμετέχοντες με αναστροφή κατά τη διάρκεια της εκπαίδευσης (eMethods στο Συμπλήρωμα). Μετά την επανεκπαίδευση των μοντέλων χωρίς αναστροφές, διαπιστώσαμε ότι η RF εντόπισε 106 συμμετέχοντες που παρουσίασαν αναστροφές (διάμεσος [IQR], 82 τοις εκατό [78 τοις εκατό -82 τοις εκατό ]), η SVM εντόπισε 93 συμμετέχοντες που παρουσίασαν αναστροφές (διάμεσος [IQR], Το 72 τοις εκατό [69 τοις εκατό -74 τοις εκατό ]) και το LR και το XGB εντόπισαν 92 συμμετέχοντες που παρουσίασαν αναστροφές (διάμεσος [IQR], 71 τοις εκατό [68 τοις εκατό -75 τοις εκατό ]). Τα IQR λήφθηκαν με την εκκίνηση των συμμετεχόντων που παρουσίασαν αναστροφή.

Για να κατανοήσουμε τη διαφορά μεταξύ των εσφαλμένων ταξινομημένων συμμετεχόντων, των συμμετεχόντων με αναστροφή και των συμμετεχόντων που ανέπτυξαν άνοια χωρίς αναστροφή, αναλύσαμε τα CDF των βαθμολογιών ταξινόμησης που ελήφθησαν από κάθε μοντέλο ML. Διαπιστώσαμε ότι οι βαθμολογίες των λανθασμένων συμμετεχόντων και των συγκεκριμένων συμμετεχόντων με αναστροφή ήταν διαφορετικές από τους συμμετέχοντες που ανέπτυξαν άνοια και αυτούς που δεν είχαν (εικόνα 3 στο Συμπλήρωμα). Τα CDF των βαθμολογιών ταξινόμησης για συμμετέχοντες που δεν εμφάνισαν άνοια έπεσαν στο αριστερό άκρο κάθε γραφικής παράστασης, υποδεικνύοντας ότι τα μοντέλα ML έδωσαν σε αυτούς τους συμμετέχοντες χαμηλή πιθανότητα να αναπτύξουν άνοια. Αντίθετα, για τους συμμετέχοντες που όντως ανέπτυξαν άνοια, τα CDF έπεσαν στα δεξιά των τμημάτων: τους ανατέθηκε μεγάλη πιθανότητα να αναπτύξουν άνοια. Για όλα τα μοντέλα, η κατανομή των βαθμολογιών για τους συμμετέχοντες με αναστροφή έπεσε στα αριστερά από εκείνη των συμμετεχόντων που ανέπτυξαν άνοια, πράγμα που σημαίνει ότι οι συμμετέχοντες με αναστροφή αξιολογήθηκαν ως με μικρότερη πιθανότητα να αναπτύξουν άνοια σύμφωνα με αυτά τα μοντέλα.
Συζήτηση
Σε αυτήν την προγνωστική μελέτη, οι αλγόριθμοι ML είχαν ανώτερη προγνωστική ακρίβεια σε σύγκριση με το BDSI και το CAIDE στην πρόβλεψη της επίπτωσης της άνοιας εντός 2 ετών από την πρώτη αξιολόγηση της κλινικής μνήμης ενός ασθενούς. Δύο από τους αλγόριθμους ML αξιολογήθηκαν για την επίτευξη ακρίβειας 91 τοις εκατό και AUC 0,89 με μόνο 6 βασικές μεταβλητές. Οι αναλύσεις ευαισθησίας υποδεικνύουν ότι τα μοντέλα ML θα μπορούσαν να ταξινομήσουν σωστά ένα υψηλό ποσοστό συμμετεχόντων που εμφάνισαν αναστροφή, οι οποίοι δυνητικά είχαν λανθασμένη διάγνωση εντός 2 ετών από την αρχική τους επίσκεψη. Αυτή η μελέτη έχει πολλά πλεονεκτήματα, συμπεριλαμβανομένου του μεγάλου δείγματος ασθενών που προέρχονται από πολλαπλές κλινικές μνήμης στις Ηνωμένες Πολιτείες, του ευρέος φάσματος τεχνικών ML που χρησιμοποιούνται, της συγκριτικής αξιολόγησης έναντι των υπαρχόντων μοντέλων κινδύνου και της διερεύνησης της διαγνωστικής σταθερότητας και της πιθανής εσφαλμένης διάγνωσης.
Προηγούμενες μελέτες σχετικά με τη χρήση του ML για την πρόβλεψη του κινδύνου άνοιας έχουν επικεντρωθεί στη μετατροπή από μη εξασθενημένη γνωστική λειτουργία σε άνοια Alzheimer ή MCI,6,8 ή στη μετατροπή από MCI σε άνοια Alzheimer.5 Αυτές οι προσεγγίσεις είναι λιγότερο χρήσιμες σε κλινικό περιβάλλον, καθώς αποκλείουν άλλοι τύποι άνοιας5,6,8 ή ασθενείς που αρχικά δεν έχουν γνωστική βλάβη.5 Τα δεδομένα που χρησιμοποιήθηκαν σε αυτές τις μελέτες περιελάμβαναν τομογραφία εκπομπής ποζιτρονίων,5,8 και βιοδείκτες εγκεφαλονωτιαίου υγρού,8 από τους οποίους δεν είναι συνήθως διαθέσιμοι σε ένα περιβάλλον κλινικής μνήμης. Μια μελέτη από τους Lin et al6 το ξεπέρασε αυτό χρησιμοποιώντας δεδομένα NACC για να βρει ένα σύνολο 15 μη επεμβατικών κλινικών μεταβλητών για την αξιολόγηση του κινδύνου μετατροπής από μη εξασθενημένη γνωστική λειτουργία σε MCI σε μια περίοδο 4- ετών. Ωστόσο, η κατασκευή του MCI παραμένει κάπως αμφιλεγόμενη,32 και τα ποσοστά μετατροπής μεταξύ MCI και άνοιας είναι συχνά χαμηλά.32,33 Τα μοντέλα ML συμπληρώνουν αυτές τις αναλύσεις και έχουν το πλεονέκτημα ότι ενσωματώνουν μόνο 6 βασικές μεταβλητές σε μια κλινικά σχετική χρονική κλίμακα και προβλέπουν την αποτέλεσμα της άνοιας κάθε αιτίας.
Από τα υπάρχοντα μοντέλα που διερευνήθηκαν στη μελέτη μας, το μοντέλο CAIDE ήταν το λιγότερο ακριβές στην πρόβλεψη του κινδύνου άνοιας σε διάστημα 2 ετών, κάτι που δεν προκαλεί έκπληξη, δεδομένου ότι αναπτύχθηκε για την πρόβλεψη του μακροπρόθεσμου κινδύνου άνοιας σε ενήλικες μέσης ηλικίας για πολύ μεγαλύτερο χρονικό διάστημα. περίοδος παρακολούθησης 20 ετών. Το BDSI απέδωσε καλύτερα από το CAIDE, πιθανότατα αντανακλώντας ότι σχεδιάστηκε για χρήση σε ενήλικες μεγαλύτερης ηλικίας για μια πιο μέτρια περίοδο παρακολούθησης 6 ετών. Ωστόσο, όλα τα μοντέλα ML ξεπέρασαν τα υπάρχοντα μοντέλα. Χρησιμοποιώντας όλες τις μεταβλητές, το XGB ήταν η πιο ισχυρή προσέγγιση ML στην πρόβλεψη ασθενών που ήταν πιθανό να διαγνωστούν με άνοια μέσα σε 2 χρόνια, υποδηλώνοντας ότι ο τρόπος με τον οποίο εκπαιδεύονται τα νέα δέντρα αποφάσεων για τη διόρθωση των σφαλμάτων των τριών τελευταίων έχει ως αποτέλεσμα οριακή απόδοση. κέρδος. Ωστόσο, το XGB φαινόταν επίσης να είναι η λιγότερο ικανή προσέγγιση για τον εντοπισμό των συμμετεχόντων που εμφάνισαν αναστροφή, δηλαδή, εκείνους που είχαν αρχικά διαγνωστεί με άνοια εντός 2 ετών και η διάγνωση αυτή αντιστράφηκε εντός 2 ετών από την αρχική διάγνωση.
Η απόδοση των μοντέλων ML μπορεί να μειωθεί σημαντικά από εσφαλμένα δεδομένα προπόνησης.34 Αντιθετικά, η εξαίρεση των δεδομένων προπόνησης με εσφαλμένη σήμανση δεν βελτιώνει πάντα την απόδοση.35 Καθώς το επίπεδο θορύβου στα δεδομένα εκπαίδευσης αυξάνεται, η τιμή εξαίρεσης ή μείωσης αυτού του θορύβου μειώνεται εάν Ο ίδιος θόρυβος υπάρχει στα δεδομένα επικύρωσης.36 Έτσι, το φιλτράρισμα των δεδομένων εκπαίδευσης μπορεί ακόμη και να μειώσει τα δεδομένα ακύρωσης απόδοσης, όπως διαπιστώθηκε σε αυτή τη μελέτη. Ωστόσο, όταν το επίπεδο εσφαλμένης επισήμανσης είναι μικρότερο από περίπου 20 τοις εκατό έως 40 τοις εκατό , η κατάργηση των εσφαλμένων δεδομένων μπορεί να βελτιώσει την ακρίβεια των δεδομένων επικύρωσης, ακόμη και αν αυτά ενσωματώνουν εσφαλμένα δεδομένα.35,37,38 Αυτό δείχνει τη σημασία της διερεύνησης της διαγνωστικής σταθερότητας στην εκπαίδευση και δεδομένα επικύρωσης: ακόμη και τα τυπικά δεδομένα κριτηρίου ενσωματώνουν σφάλματα.
Το παρατηρούμενο ποσοστό αναστροφής (8 τοις εκατό ) ήταν παρόμοιο με αυτό που βρέθηκε σε μια μελέτη του 2019 που βασίζεται σε διαφορετικό πληθυσμό των ΗΠΑ.31 Στη μελέτη μας, το ποσοστό των ψευδώς θετικών βρέθηκε να ποικίλλει από 7 τοις εκατό έως 19 τοις εκατό, ανάλογα με το γνωστικό αξιολόγηση που χρησιμοποιείται. Από ό,τι γνωρίζουμε, αυτή είναι η πρώτη ανάλυση πιθανής εσφαλμένης διάγνωσης στο NACC UDS και υποδηλώνει ότι η χρήση της ML ως βοήθημα λήψης κλινικών αποφάσεων έχει τη δυνατότητα να μειώσει τη λανθασμένη διάγνωση των ψευδώς θετικών έως και 84 τοις εκατό . Δεδομένου ότι οι ασθενείς που εμφανίζουν αναστροφή είναι οριακά από διαγνωστική άποψη, από κλινική άποψη, μπορεί να είναι λογικό να παρακολουθούνται ούτως ή άλλως, δεδομένου ότι υπάρχουν λόγοι για κλινικό ενδιαφέρον. Έτσι, το XGB μπορεί να είναι το καλύτερο μοντέλο για ένα βοήθημα κλινικής λήψης αποφάσεων. Εναλλακτικά, μια προσέγγιση συνόλου που κάνει δευτερεύουσες προβλέψεις σχετικά με την πιθανή διαγνωστική σταθερότητα και την πιθανότητα λανθασμένης ταξινόμησης μπορεί να αποδειχθεί ακόμη πιο χρήσιμη.
Περιορισμοί
Αυτή η μελέτη έχει αρκετούς περιορισμούς. Πρώτον, τόσο το CAIDE όσο και το BDSI αναπτύχθηκαν χρησιμοποιώντας διαφορετικούς πληθυσμούς από αυτόν που χρησιμοποιήθηκε σε αυτή τη μελέτη. Δεν είχαν όλες οι μεταβλητές που χρησιμοποιήθηκαν για την ανάπτυξη αυτών των μοντέλων ακριβές ισοδύναμο στο UDS, το οποίο μπορεί να επηρέασε την απόδοσή τους σε αυτό το σύνολο δεδομένων. Δεύτερον, η μέθοδος που χρησιμοποιείται για την απόδοση των δεδομένων μπορεί να οδηγήσει σε σφάλμα καταλογισμού. Συγκεκριμένα, ο καταλογισμός αντικαθιστά όλες τις τιμές που λείπουν με μια αριθμητική τιμή, ωστόσο ορισμένες τιμές λείπουν λόγω της σχέσης τους με μια άλλη τιμή. Επομένως, το γεγονός ότι λείπει μια τιμή είναι ενημερωτικό. Ωστόσο, ενώ οι συμμετέχοντες είχαν κατά μέσο όρο 14% έλλειψη δεδομένων, οι 6 βασικές μεταβλητές που προσδιορίστηκαν έλειπαν για ένα μέσο όρο 1 τοις εκατό των συμμετεχόντων. Τρίτον, αν και η μελέτη μας χρησιμοποίησε ένα μεγάλο δείγμα συμμετεχόντων σε κλινικές μνήμης στις Ηνωμένες Πολιτείες, καθιστώντας τα αποτελέσματά μας εξαιρετικά εφαρμόσιμα σε αυτό το περιβάλλον, ο βαθμός στον οποίο αυτά τα αποτελέσματα θα γενικευθούν σε άλλους πληθυσμούς είναι άγνωστος.
συμπεράσματα
Αυτή η προγνωστική μελέτη διαπίστωσε ότι τα μοντέλα ML ξεπέρασαν τα υπάρχοντα μοντέλα πρόβλεψης κινδύνου άνοιας και μπορεί να έχουν τη δυνατότητα να βελτιώσουν την πρόβλεψη της περιστατικής άνοιας για 2 χρόνια στις κλινικές μνήμης. Έξι βασικοί παράγοντες για τον κίνδυνο άνοιας που εντοπίστηκαν σε αυτή τη μελέτη μπορεί να έχουν τη δυνατότητα να βελτιώσουν την κλινική πρακτική στις κλινικές μνήμης, εάν ενσωματωθούν σε μελλοντικά βοηθήματα λήψης κλινικών αποφάσεων.
ΒΙΒΛΙΟΓΡΑΦΙΚΕΣ ΑΝΑΦΟΡΕΣ
1. Hejl A, Høgh P, Waldemar G. Δυνητικά αναστρέψιμες καταστάσεις σε 1000 διαδοχικούς ασθενείς κλινικής μνήμης. J Neurol Neurosurg Psychiatry.
2. Mitchell AJ, Shiri-Feshki M. Ρυθμός εξέλιξης της ήπιας γνωστικής εξασθένησης σε άνοια—μια μετα-ανάλυση 41 ισχυρών αρχικών μελετών κοόρτης. Acta Psychiatr Scand. 2009; 119(4):252-265.
3. Barnes DE, Beiser AS, Lee Α, et al. Ανάπτυξη και επικύρωση ενός σύντομου δείκτη προσυμπτωματικού ελέγχου άνοιας για την πρωτοβάθμια περίθαλψη. Άνοια Αλτσχάιμερ. 2014;10(6):656-665.e1. doi:10.1016/j.jalz.2013.11.006
4. Kivipelto M, Ngandu T, Laatikainen T, Winblad B, Soininen H, Tuomilehto J. Βαθμολογία κινδύνου για την πρόβλεψη του κινδύνου άνοιας σε 20 χρόνια μεταξύ των μεσήλικων ατόμων: μια διαχρονική, βασισμένη στον πληθυσμό μελέτη. Lancet Neurol. 2006; 5(9):735-741. doi:10.1016/S{10}}(06)70537-3
5. Cui Y, Liu B, Luo S, et al. Πρωτοβουλία Νευροαπεικόνισης για τη Νόσο του Αλτσχάιμερ. Προσδιορισμός της μετατροπής από ήπια γνωστική εξασθένηση στη νόσο του Αλτσχάιμερ χρησιμοποιώντας πολυμεταβλητούς προγνωστικούς παράγοντες. PLoS One.
6. Lin M, Gong P, Yang T, Ye J, Albin RL, Dodge HH. Αναλυτικές προσεγγίσεις μεγάλων δεδομένων στο σύνολο δεδομένων NACC: ενίσχυση εμπλουτισμού προκλινικών δοκιμών. Διαταραχή Alzheimer Dis Assoc. 2018;32(1):18-27.
7. Park JH, Cho HE, Kim JH, et al. Πρόβλεψη μηχανικής μάθησης της συχνότητας εμφάνισης της νόσου του Αλτσχάιμερ χρησιμοποιώντας μεγάλης κλίμακας διοικητικά δεδομένα υγείας. NPJ Digit Med. 2020; 3(1): 46.
8. Zhan Υ, Chen Κ, Wu X, et al; Πρωτοβουλία Νευροαπεικόνισης για τη Νόσο του Αλτσχάιμερ. Αναγνώριση μετατροπής από φυσιολογική γνωστική ικανότητα ηλικιωμένων σε νόσο του Αλτσχάιμερ χρησιμοποιώντας μηχανή πολλαπλών τρόπων υποστήριξης φορέα.J Alzheimers Dis. 2015; 47(4):1057-1067.
9. Burgos N, Colliot O. Μηχανική μάθηση για ταξινόμηση και πρόβλεψη εγκεφαλικών ασθενειών: πρόσφατες εξελίξεις και επερχόμενες προκλήσεις. Curr Opin Neurol. 2020;33(4):439-450.
10. Beekly DL, Ramos EM, Lee WW, et al; NIA Κέντρα Νόσων Alzheimer. Η βάση δεδομένων του Εθνικού Συντονιστικού Κέντρου Αλτσχάιμερ (NACC): το Ενιαίο σύνολο δεδομένων. Διαταραχή Alzheimer Dis Assoc. 2007;21(3):249-258.
11. Εθνικό Ινστιτούτο για τη Γήρανση. Ερευνητικά Κέντρα για τη Νόσο του Αλτσχάιμερ. Πρόσβαση στις 21 Μαΐου 2021.
12. Pfeffer RI, Kurosaki TT, Harrah CH Jr, Chance JM, Filos S. Μέτρηση λειτουργικών δραστηριοτήτων σε ηλικιωμένους ενήλικες στην κοινότητα. J Gerontol. 1982;37(3):323-329.
13. Kaufer DI, Cummings JL, Ketchel Ρ, et αϊ. Επικύρωση του NPI-Q, μια σύντομη κλινική μορφή της Νευροψυχιατρικής Απογραφής. J Neuropsychiatry Clin Neurosci. 2000;12(2):233-239.
14. Weintraub S, Salmon D, Mercaldo Ν, et αϊ. Ενιαίο σύνολο δεδομένων (UDS): η μπαταρία νευροψυχολογικού τεστ. Διαταραχή Alzheimer Dis Assoc. 2009;23(2):91-101.
15. Morris JC, Weintraub S, Chui HC, et αϊ. The Uniform Data Set (UDS): κλινικές και γνωστικές μεταβλητές και περιγραφικά δεδομένα από Κέντρα Νόσων Alzheimer. Διαταραχή Alzheimer Dis Assoc. 2006;20(4):210-216.
16. McKhann G, Drachman D, Folstein M, Katzman R, Price D, Stadlan EM. Κλινική διάγνωση της νόσου του Αλτσχάιμερ: έκθεση της Ομάδας Εργασίας NINCDS-ADRDA υπό την αιγίδα της Ομάδας Εργασίας του Υπουργείου Υγείας και Ανθρωπίνων Υπηρεσιών για τη Νόσο του Αλτσχάιμερ. Νευρολογία. 1984;34(7):939-944.
17. Román GC, Tatemichi TK, Erkinjuntti Τ, et al. Αγγειακή άνοια: διαγνωστικά κριτήρια για ερευνητικές μελέτες: έκθεση του διεθνούς εργαστηρίου NINDS-AIREN. Νευρολογία. 1993;43(2):250-260.
18. McKeith IG, Dickson DW, Lowe J, et al; Κοινοπραξία για DLB. Διάγνωση και διαχείριση της άνοιας με σώματα Lewy: τρίτη έκθεση της Κοινοπραξίας DLB. Νευρολογία.
19. Neary D, Snowden JS, Gustafson L, et al. Μετωποκροταφικός λοβιακός εκφυλισμός: συναίνεση σχετικά με κλινικά διαγνωστικά κριτήρια. Νευρολογία. 1998; 51(6):1546-1554.
20. Martínez-Martín P, Gil-Nagel A, Gracia LM, Gómez JB, Martínez-Sarriés J, Bermejo F; Η Συνεταιριστική Πολυκεντρική Ομάδα. Χαρακτηριστικά και δομή ενοποιημένης κλίμακας αξιολόγησης της νόσου του Πάρκινσον. Mov Disord. 1994; 9 (1):76-83.
21. Morris JC. Clinical Dementia Rating: ένα αξιόπιστο και έγκυρο διαγνωστικό και σταδιοποιητικό μέτρο για την άνοια τύπου Alzheimer. Int Psychogeriatr. 1997;9(S1)(suppl 1):173-176.
22. Hastie T, Tibshirani R, Friedman J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer Science & Business Media; 2009.
23. Hosmer Jr DW, Lemeshow S, Sturdivant RX. Εφαρμοσμένη Logistic Regression. John Wiley & Sons; 2013.
24. Cortes C, Vapnik V. Υποστήριξη-διανυσματικά δίκτυα. Mach Learn. 1995; 20(3):273-97. doi: 10.1007/BF00994018
25. Breiman L. Τυχαία δάση. Mach Learn. 2001;45(1):5-32. doi:10.1023/A:1010933404324
26. Χο ΤΚ. Δάση τυχαίας απόφασης. Στο: Πρακτικά 3ου Διεθνούς Συνεδρίου για την Ανάλυση και την Αναγνώριση Εγγράφων. IEEE; 1995:278-282.
27. Friedman JH. Ενίσχυση στοχαστικής κλίσης. Υπολογιστική Στατιστική Ανάλυση Δεδομένων. 2002; 38(4):367-78.
28. Pedregosa F, Varoquaux G, Gramfort A, et al, Scikit-learn: machine learning in Python. J Mach Learn Res. 2011; 12:2825-2830.
29. Krzanowski WJ, Hand DJ. Καμπύλες ROC για συνεχή δεδομένα. CRC Press; 2009.
30. Fawcett, T. Μια εισαγωγή στην ανάλυση ROC. Lett αναγνώρισης προτύπων. 2006;27(8):861-874. doi: 10.1016/j. Patric.2005.10.010
31. Ranson JM, Kuźma E, Hamilton W, Muniz-Terrera G, Langa KM, Llewellyn DJ. Προγνωστικοί παράγοντες εσφαλμένης ταξινόμησης άνοιας όταν χρησιμοποιούνται σύντομες γνωστικές αξιολογήσεις. Neurol Clin Pract. 2019;9(2):109-117.
32. Bruscoli M, Lovestone S. Είναι το MCI πραγματικά μόνο πρώιμη άνοια: μια συστηματική ανασκόπηση των μελετών μετατροπής. Int Psychogeriatr. 2004;16(2):129-140.
33. Farias ST, Mungas D, Reed BR, Harvey D, DeCarli C. Πρόοδος ήπιας γνωστικής εξασθένησης σε άνοια στην κλινική έναντι των κοορτών που βασίζονται στην κοινότητα. Arch Neurol. 2009; 66(9):1151-1157.
34. Guan D, Yuan W, Ma T, Khattak AM, Chow F. Εξάλειψη ευαίσθητων στο κόστος των δεδομένων εκπαίδευσης με εσφαλμένη σήμανση. Inf Sci. 2017; 402:170-81.
35. Brodley CE, Friedl MA. Αναγνώριση λανθασμένων δεδομένων εκπαίδευσης.J Artif Intelligence Res.
36. Quinlan JR. Επαγωγή δέντρων απόφασης. Mach Learn. 1986;1(1):81-106.
37. Brodley CE, Friedl MA. Εντοπισμός και εξάλειψη περιπτώσεων εκπαίδευσης με εσφαλμένη επισήμανση. Στο: AAAI '96: Πρακτικά του δέκατου τρίτου Εθνικού Συνεδρίου για την Τεχνητή Νοημοσύνη. AAAI; 1996:799-805.
38. Brodley CE, Friedl MA. Βελτίωση της αυτοματοποιημένης χαρτογράφησης κάλυψης γης με τον εντοπισμό και την εξάλειψη των εσφαλμένων παρατηρήσεων από τα δεδομένα εκπαίδευσης. Στο: IGARSS '96: 1996 International Geoscience and Remote Sensing Symposium. IEEE;1996:1379-1381.
