Prévention et contrôle du cancer du sein
Le cancer du sein est le cancer le plus fréquent chez les femmes dans les pays développés et les pays en développement. Plus de 508 000 femmes dans le monde sont mortes en 2011 des suites du cancer du sein (Estimations mondiales de la santé, OMS 2013).
Une des clés de la lutte contre le cancer du sein est la prévention via la réalisation de mammographies.
Détecter les tumeurs mieux que les experts
Depuis 2018, Google DeepMind, DeepHeath, NYU, Baidu, Stanford ont publié des papiers de recherche sur des CNN qui permettent de déterminer à partir de mammographies, la présence ou non d’une tumeur cancéreuse du sein.
Le modèle AI de Google a surpassé les six experts humains. Le modèle de DeepHealth a quant à lui surpassé les cinq spécialistes de l’imagerie mammaire. Le modèle de l’Université de New York a surpassé 12 radiologues ayant entre 2 et 25 ans d’expérience, un résident et un étudiant en médecine.
Google, NYU, DeepHealth competition
NYU open-source model
DeepMind model
Baidu reasearch
Stanford research
Prédire un cancer du sein à 5 ans
Regina Barzilay , chercheuse et professeur au MIT, a également utilisé un CNN pour détecter si la patiente a un cancer du sein ou non mais son équipe est allée plus loin en utilisant un CNN pour prévoir, à partir des mammographies, si les patientes développeront un cancer dans les 5 années à venir.
Les modèles développés par les équipes du MIT obtiennent des performances supérieures au modèle de référence utilisé par les thérapeutes américains « Tyrer-Cuzick » ou outil IBIS. Ce modèle Tyrer-Cuzick permet de calculer la probabilité qu’une femme développe un cancer du sein dans 10 ans et au cours de sa vie.
- Modèle 1 et modèle 2 du MIT performent mieux que Tyrer-Cuzick
- Le modèle 2 est plus généralisable que Tyrer-Cuzick pour les femmes d’origine africaine
Comment surpasser les limitations de l’IA
Pour Régina Barzilay, l’AI a des supers pouvoirs mais les chercheurs font face à trois problèmes qui sont autant de sujets de recherches dans les années à venir.
- Problème n°1 : pas assez de données
=> la solution est d’effectuer du fine tuning.
- Problème n°2 : difficulté de généraliser avec de nouvelles données
=> la solution est d’avoir recours aux generative adversarial networks (GAN)
- Problème n°3 : modèles de deep learning sont des black box
=> La solution est d’utiliser des “interpretable neural network” (Grad Cam) pour savoir ce que voit les réseaux de neurones pour effectuer leur classification.
Article écrit à partir de cette vidéo : Regina Barzilay, power and limits of Machine Learning
Pour en savoir plus sur Régina Barzilay, Regina Barzilay: Deep Learning for Cancer Diagnosis and Treatment | Lex Fridman Podcast #40