Η τεχνητή νοημοσύνη (ΤΝ) μπορεί να υποστηρίξει αποτελεσματικά τους γιατρούς στη διαγνωστική διαδικασία. Κάνει διαφορετικά λάθη από τους ανθρώπους — και αυτή η συμπληρωματικότητα αντιπροσωπεύει ένα προηγουμένως ανεκμετάλλευτο πλεονέκτημα. Μια διεθνής ομάδα απέδειξε συστηματικά για πρώτη φορά ότι ο συνδυασμός της ανθρώπινης εμπειρογνωμοσύνης με τα μοντέλα ΤΝ οδηγεί στις πιο ακριβείς διαγνώσεις ανοιχτού τύπου. Η εργασία τους δημοσιεύεται στα Πρακτικά της Εθνικής Ακαδημίας Επιστημών.
Τα διαγνωστικά σφάλματα συγκαταλέγονται στα πιο σοβαρά προβλήματα στην καθημερινή ιατρική πρακτική. Τα συστήματα ΤΝ — ειδικά τα μεγάλα γλωσσικά μοντέλα (LLM) όπως το ChatGPT-4, το Gemini ή το Claude 3 — προσφέρουν νέους τρόπους για την αποτελεσματική υποστήριξη των ιατρικών διαγνώσεων. Ωστόσο, αυτά τα συστήματα ενέχουν επίσης σημαντικούς κινδύνους — για παράδειγμα, μπορούν να «παραισθησιάζουν» και να δημιουργούν ψευδείς πληροφορίες. Επιπλέον, αναπαράγουν υπάρχουσες κοινωνικές ή ιατρικές προκαταλήψεις και κάνουν λάθη που συχνά προκαλούν σύγχυση στους ανθρώπους.
Η διεθνής ερευνητική ομάδα, με επικεφαλής το Ινστιτούτο Max Planck για την Ανθρώπινη Ανάπτυξη και σε συνεργασία με εταίρους από το Πρόγραμμα Ανθρώπινης Διάγνωσης (Σαν Φρανσίσκο) και το Ινστιτούτο Γνωστικών Επιστημών και Τεχνολογιών του Ιταλικού Εθνικού Συμβουλίου Έρευνας (CNR-ISTC Ρώμη), διερεύνησε πώς οι άνθρωποι και η ΤΝ μπορούν να συνεργαστούν καλύτερα.
Το αποτέλεσμα: οι υβριδικές διαγνωστικές συλλογικότητες – ομάδες που αποτελούνται από ανθρώπους εμπειρογνώμονες και συστήματα Τεχνητής Νοημοσύνης – είναι σημαντικά πιο ακριβείς από τις συλλογικότητες που αποτελούνται αποκλειστικά από ανθρώπους ή Τεχνητή Νοημοσύνη. Αυτό ισχύει ιδιαίτερα για σύνθετα, ανοιχτά διαγνωστικά ερωτήματα με πολλές πιθανές λύσεις, αντί για απλές αποφάσεις ναι/όχι.
«Τα αποτελέσματά μας δείχνουν ότι η συνεργασία μεταξύ ανθρώπων και μοντέλων Τεχνητής Νοημοσύνης έχει μεγάλες δυνατότητες να βελτιώσει την ασφάλεια των ασθενών», λέει ο επικεφαλής συγγραφέας Nikolas Zöller, μεταδιδακτορικός ερευνητής στο Κέντρο Προσαρμοστικής Ορθολογικότητας του Ινστιτούτου Max Planck για την Ανθρώπινη Ανάπτυξη.
Οι ερευνητές χρησιμοποίησαν δεδομένα από το Human Diagnosis Project, το οποίο παρέχει κλινικές περιγραφές – σύντομες περιγραφές ιατρικών μελετών περιπτώσεων – μαζί με τις σωστές διαγνώσεις. Χρησιμοποιώντας περισσότερες από 2.100 από αυτές τις περιγραφές, η μελέτη συνέκρινε τις διαγνώσεις που έγιναν από επαγγελματίες υγείας με εκείνες πέντε κορυφαίων μοντέλων Τεχνητής Νοημοσύνης.
Στο κεντρικό πείραμα, προσομοιώθηκαν διάφορες διαγνωστικές συλλογικότητες: άτομα, ανθρώπινες συλλογικότητες, μοντέλα Τεχνητής Νοημοσύνης και μικτές συλλογικότητες ανθρώπου-Τεχνητής Νοημοσύνης. Συνολικά, οι ερευνητές ανέλυσαν περισσότερες από 40.000 διαγνώσεις. Κάθε ένα από αυτά ταξινομήθηκε και αξιολογήθηκε σύμφωνα με τα διεθνή ιατρικά πρότυπα (SNOMED CT).
Οι άνθρωποι και οι μηχανές αλληλοσυμπληρώνονται—ακόμα και στα λάθη τους
Η μελέτη δείχνει ότι ο συνδυασμός πολλαπλών μοντέλων Τεχνητής Νοημοσύνης βελτίωσε την ποιότητα της διάγνωσης. Κατά μέσο όρο, οι ομάδες Τεχνητής Νοημοσύνης ξεπέρασαν το 85% των ανθρώπινων διαγνωστικών. Ωστόσο, υπήρξαν πολλές περιπτώσεις στις οποίες οι άνθρωποι είχαν καλύτερη απόδοση. Είναι ενδιαφέρον ότι, όταν η Τεχνητή Νοημοσύνη απέτυχε, οι άνθρωποι συχνά γνώριζαν τη σωστή διάγνωση.
Η μεγαλύτερη έκπληξη ήταν ότι ο συνδυασμός και των δύο κόσμων οδήγησε σε σημαντική αύξηση της ακρίβειας. Ακόμη και η προσθήκη ενός μόνο μοντέλου Τεχνητής Νοημοσύνης σε μια ομάδα ανθρώπινων διαγνωστικών—ή αντίστροφα—βελτίωσε σημαντικά το αποτέλεσμα. Τα πιο αξιόπιστα αποτελέσματα προήλθαν από συλλογικές αποφάσεις που αφορούσαν πολλαπλούς ανθρώπους και πολλαπλές Τεχνητές Νοημοσύνης.
Η εξήγηση είναι ότι οι άνθρωποι και η Τεχνητή Νοημοσύνη κάνουν συστηματικά διαφορετικά λάθη. Όταν η Τεχνητή Νοημοσύνη απέτυχε, ένας ανθρώπινος επαγγελματίας μπορούσε να αντισταθμίσει το λάθος—και αντίστροφα. Αυτή η λεγόμενη συμπληρωματικότητα σφαλμάτων καθιστά τις υβριδικές ομάδες τόσο ισχυρές. «Δεν πρόκειται για την αντικατάσταση των ανθρώπων με μηχανές. Αντίθετα, θα πρέπει να βλέπουμε την τεχνητή νοημοσύνη ως ένα συμπληρωματικό εργαλείο που ξεδιπλώνει πλήρως τις δυνατότητές της στη συλλογική λήψη αποφάσεων», λέει ο συν-συγγραφέας Stefan Herzog, Ανώτερος Ερευνητής στο Ινστιτούτο Max Planck για την Ανθρώπινη Ανάπτυξη.
Ωστόσο, οι ερευνητές τονίζουν επίσης τους περιορισμούς του έργου τους. Η μελέτη εξέτασε μόνο βινιέτες περιστατικών που βασίζονται σε κείμενο – όχι πραγματικούς ασθενείς σε πραγματικά κλινικά περιβάλλοντα. Το κατά πόσον τα αποτελέσματα μπορούν να μεταφερθούν απευθείας στην πράξη παραμένει ένα ερώτημα που πρέπει να αντιμετωπίσουν μελλοντικές μελέτες. Ομοίως, η μελέτη επικεντρώθηκε αποκλειστικά στη διάγνωση, όχι στη θεραπεία, και μια σωστή διάγνωση δεν εγγυάται απαραίτητα μια βέλτιστη θεραπεία.
Παραμένει επίσης αβέβαιο πώς τα συστήματα υποστήριξης που βασίζονται στην Τεχνητή Νοημοσύνη θα γίνουν αποδεκτά στην πράξη από το ιατρικό προσωπικό και τους ασθενείς. Οι πιθανοί κίνδυνοι προκατάληψης και διακρίσεων τόσο από την Τεχνητή Νοημοσύνη όσο και από τους ανθρώπους, ιδίως σε σχέση με εθνοτικές, κοινωνικές ή έμφυλες διαφορές, απαιτούν επίσης περαιτέρω έρευνα.