Le Natural Language Processing contribue à la prévention du suicide et au diagnostic du cancer du sein

DiploDoc
3 min readMay 16, 2021

--

L’essor fulgurant du NLP

Le traitement de texte naturel (NLP) repose sur la compréhension, la manipulation et la génération du langage naturel par les machines. Il permet la traduction automatique, l’analyse des sentiments, les chatbots, la classification de textes, la reconnaissance vocale, la reconnaissance optique des caractères (OCR), la correction automatique, la génération de résumés automatiques, le text to speech.

Depuis 2019, sous l’impulsion des départements en Intelligence Artificielle des GAFA, le NLP connaît un essor fulgurant avec la mise à disposition de modèles de plus en plus performants ELmo, Open AI GPT, BERT (Google), LASER (Facebook),T5 (Google).

Le traitement du langage naturel (NLP) est déjà utilisé dans le domaine de la médecine pour la prévention et le diagnostic des maladies.

Le NLP utilisé pour prévenir le suicide

L’organisation mondiale de la santé (OMS) recense 16 million de tentatives de suicide par an dans le monde. Plus de 800 000 personnes par an meurent en se suicidant. Avec environ 9 000 décès par suicide par an, la France présente un des taux de suicide les plus élevés d’Europe.

En France en 2019 , le suicide représente 16 % des décès entre 15 et 24 ans et 20 % chez les 25–34 ans. L’omniprésence des médias sociaux dans la vie des adolescents et des adultes offre de nouveaux types de données qui permettent de comprendre le comportement de ceux qui tentent de s’ôter la vie et suggère de nouvelles possibilités pour la prévention du suicide.

Le NLP permet de créer des algorithmes capables de classer si un texte comporte des allusions suicidaires ou non.

Une fois le modèle entrainé, il peut prédire le caractère dépressif d’un texte

L’application du traitement de langage naturel pour la prévention du suicide a donné lieu à la publication de plusieurs papiers de recherche.

Dès 2017, Facebook a développé un algorithme capable de détecter les pensées suicidaires de ses utilisateurs couplé à un système d’alerte qui prévient les amis des utilisateurs identifiés.

Alerte envoyée lorsqu’un profil suicidaire est identifé

Le NLP pour diagnostiquer un cancer du sein

L’hyperplasie canalaire atypique est une hausse du nombre de cellules anormales qui se développent dans les canaux mammaires. Être atteint d’hyperplasie atypique fait augmenter le risque de cancer du sein.

Des chercheurs ont recueilli 24 881 rapports de pathologies mammaires dans sept hôpitaux différents et les ont annotés manuellement avec neuf attributs clés qui décrivent les types d’atypies et de cancers. Ils ont ensuite transformé le texte de ces rapports en “word embeddings” : chaque mot a été représenté par un vecteur de nombre réel. Ces words embeddings sont les élements utilisés en entrée d’un réseau de neuronal convolutif (CNN) entraîné pour détecter l’absence ou la présence d’une hyperplasie canalaire atypique.

Le modèle entrainé avec les données de quatre hopitaux différents a atteint une précision de 96%. En utilisant pour entrainer ce modèle des données de différents hôpitaux, les chercheurs ont amélioré la généralisation de leur modèle à de nouvelles données.

Cet article a été rédigé à partir de ces ressources

MIT 6.S897 Machine Learning for Healthcare, Spring 2020- Lesson 7 & 8 NLP

--

--

DiploDoc
DiploDoc

Written by DiploDoc

Diplodocus interested in the applications of artificial intelligence to healthcare.

No responses yet