“Aucune IA construite jusqu’à présent ne peut égaler la compréhension et la perspicacité d’un médecin humain. Nous n’en sommes pas là” Joshua Bengio — Expert en Intelligence Artificielle, Lauréat du prix Turing 2018.
Essor de l’IA dans le domaine de la santé
Même si l’intelligence artificielle n’est pas prête de remplacer les médecins dans certains domaines de la santé, les professionnels commencent à considérer l’IA comme fiable et utile dans l’exercice de leur métier.
- Robotique chirurgicale
- Radiologie
- Génétique
- Cancérologie
- Support de décisions cliniques
- Automatisation des tâches administratives
- Détection des états dépressifs.
Les “échecs” de l’IA appliqué à la médecine
En 2018, les spécialistes médicaux et les clients d’IBM Watson Health ont identifié “de multiples exemples de recommandations de traitement dangereuses et incorrectes” du super calculateur IBM for oncology. La raison principale de ces erreurs est l’entrainement du modèle “Watson for oncology” avec des données synthétisées et non de vraies données issues de cas réels.
Malgré cette mauvaise publicité, lors de la réunion annuelle de l’ASCO en 2019, IBM Watson Health a présenté une étude randomisée évaluant le rôle de l’IA dans la prise de décision clinique pour 1 000 patients en Inde ayant reçu un diagnostic de cancer du sein, du poumon et colorectal. Les oncologues indiens du Cancer Center de Bangalore ont modifié leurs décisions de traitement dans 13,6 % des cas, sur la base des informations fournies par Watson.
En 2020, une étude de Google Health — la première à examiner l’impact d’un outil d’apprentissage approfondi dans des contextes cliniques réels — a révèlé qu’un modèle fonctionnnant parfaitement en laboratoire était beaucoup moins efficaces dans des conditions réels de soin en Thaïlande.
En laboratoire, ce modèle était capable d’identifier avec 90% de précision et en moins de 10 minutes les signes d’une rétinopathie diabétique (examen du fond d’oeil du diabétique). Entraînés avec des images de haute qualité, ce modèle s’est révélé incapable d’effectuer des prédictions avec des scaners réalisés dans des conditions d’éclairage pauvres: 1/5ème des images a été rejeté.
Sur le terrain, les problèmes de connections Internet ont fortement ralenti l’analyse car le système deployé en production reposait sur Google cloud.
Pour que les médecins et les patients adoptent l’IA sur le terrain avec confiance, les chercheurs doivent concevoir et entraîner les modèles avec des données réelles et prendre en compte dès la conception toutes composantes technologiques et humaines qui pourraient impacter la qualité du modèle sur le terrain.
Réguler pour plus de confiance
La régulation est également un facteur qui augmente l’adoption de l’IA et la confiance des utilisateurs. Aux USA, ce rôle est endossé par la FDA (U.S Food and Drug Daministration). La FDA a mis en place trois niveaux de régulation.
- 510(k) clearance
Une autorisation 510(k) est accordée à un algorithme lorsqu’il a été démontré qu’il est au moins aussi sûr et efficace qu’un autre algorithme déjà commercialisé légalement.
- Premarket approval (PMA)
L’autorisation de pré-commercialisation est délivrée aux algorithmes pour les dispositifs médicaux de classe III qui peuvent avoir un impact important sur
la santé humaine. Leur évaluation fait l’objet de processus scientifiques et réglementaires plus approfondis pour déterminer leur
la sécurité et l’efficacité.
- De novo pathway
La classification de novo est utilisée pour classer les nouveaux dispositifs médicaux pour lesquels il n’existe pas d’autorisation légale. La FDA procède à une évaluation des risques du dispositif en question avant de l’approuver et de permettre sa mise sur le marché.
Fin 2020, la FDA avait délivré 85,9% autorisations de type 510(k), 12,5% de type de novo et 1,6% de type pré-commercialisation (PMA). Ces technologies ont été développées dans les domaines de la radiologie (46,9%) , de la cardiologie (25,0%) et de la médecine interne/générale (15,6%).
Intégrer l’IA à la routine de soin
Les performances du modèle et la régulation ne suffisent pas à déployer et à intégrer l’IA dans une routine de soin.
Un article paru en octobre 2020, “Real-World Integration of a Sepsis Deep Learning Technology Into Routine Clinical Care: Implementation Study”, montre que le succès du déploiement de Sepsis Watch développé par l’Université de Duke n’a pas été seulement un travail technique, mais aussi un travail social et émotionnel. Un vrai projet d’accompagnement au changement.
La création du modèle et de l’application
La septicémie ou sepsis est une infection grave, qui se propage dans l’organisme par voie sanguine à partir d’un foyer infectieux initial. Le plus souvent d’origine bactérienne, elle peut aussi être provoquée par des virus, des champignons ou des parasites. Quel que soit le germe en cause, la septicémie constitue une urgence médicale.
Les checheurs de l’université de Duke ont développé un modèle capable de prédire la probabilité que le patient devienne septique à partir des données de laboratoires, des données vitales, des données de médications, des données cliniques. Ce modèle relie un processus gaussien multitâche à un classificateur de réseau neuronal récurrent (RNN).
Une fois les performances du modèle validées, les chercheurs ont déployé une application “Sepsis Watch” qui permet de visualiser les prédictions du modèle et de répondre rapidement aux risques de septicémie.
Les facteurs de succès du déploiement de Sepsis Watch
Valider le modèle et le déployer en production via une application n’est pas suffisant pour intégrer Sepsis Watch au processus de soins. Lors de son intervention à la conférence de Machine Learning for Healthcare 2019, Will Ratliff, chef de projet de cette intégration, a expliqué comment il avait levé les craintes entourant le projet : l’incapacité à se projeter (failure to see), l’incapacité à changer (failure to move), l’incapacité à transformer l’essai (failure to finish).
Déploiement en mode projet :
Lever l’incapacité à se projeter avec un schéma de processus et la rédaction d’un guide complet sur la solution.
Lever l’incapacité à changer avec des sessions de formation, la création d’un site de formation, la mise en place d’un comité de gouvernance.
Lever l’incapacité à transformer l’essai par le suivi des taux d’adoption avec la dataviz et par l’amélioration de l’interface Sepsis Watch suite aux retours des infirmières.
l’IA capable de déléguer à un expert
La complémentarité entre la technologie et le soignant est une des clés du succès de l’adoption de l’IA.
Des chercheurs du laboratoire d’informatique et d’intelligence artificielle du MIT (CSAIL), Hussein Mozannar et David Sontag, ont développé un modèle qui peut faire une prédiction sur une tâche ou décider de déléguer la décision à un expert.
Le système comporte deux parties : un “classificateur” qui peut prédire la présence ou non d’une pathologie pulmonaire, et un “rejeteur” qui décide si une tâche donnée doit être traitée par son propre classificateur ou par l’expert humain.
Cet article a été rédigé à partir de ces ressources
MLHC 2019 Presentation on Sepsis Watch, Pythia (à partir de 29 min 13')
MIT 6.S897 Machine Learning for Healthcare, Spring 2020- Lesson 9-Translating AI to the Clinic