Début

SophIA Summit : des IA encore peu généralisables en raison du manque d’accès aux données (O. Humbert)

Paris - Publié le vendredi 10 novembre 2023 à 12 h 34 - n° 16996 [ENTRETIEN] « Le problème de ces algorithmes, c’est leur capacité à être généralisables : tant qu’on aura des bases de données qui ne sont pas assez grandes ou trop centrées sur un pays, sur un établissement, on aura du mal à faire fonctionner les modèles pour tout le monde. »

Dans le cadre d’un entretien accordé en exclusivité à Health & Tech Intelligence en amont du SophIA Summit (22-24 novembre 2023, Sophia Antipolis) - dont H&TI est partenaire -, Olivier HumbertOlivier HumbertOlivier Humbert, PU-PHPU-PHProfesseur Universitaire Praticien Hospitalier en médecine nucléaire et biophysique à l’université Côte d’AzurUniversité Côte d’Azur et titulaire d’une Chaire 3IA (Institut 3IA Côte d’Azur3IA Côte d’Azur), présente en détail les différents projets sur lesquels il travaille avec son équipe autour de l’intelligence artificielle (IA) en santé. Signalant des avancées notables mais aussi des obstacles, en particulier en termes d’accès aux données.

Des modèles de machine learning aux résultats prometteurs


Olivier Humbert développe notamment un outil permettant de prédire la réussite ou l'échec de l’immunothérapie pour un patient donné, avec l’objectif à terme d’aboutir à une médecine de précision « algorithmique ». Les chercheurs sont parvenus à obtenir un modèle avec 8 marqueurs « qui permettent de prédire avec des performances tout à fait correctes l’efficacité de l’immunothérapie ».

Il s’agit ici de modèles de machine learning (apprentissage automatique) « assez simples mais efficaces », souligne Olivier Humbert.

Il explique s’intéresser aussi au deep learning (apprentissage profond), « qui nécessite des techniques plus poussées ». Les travaux avancent mais restent compliqués. « On a la capacité de prédiction mais l’information est tellement subtile qu’il faudrait avoir de plus grosses bases de données. On est toujours bloqués sur cette problématique d’accès à la donnée », regrette l’expert. « Notre constat actuellement est que sont les modèles plutôt simples de machine learning qui sont les plus efficaces et qui nous apportent le plus. »

Le federated learning, une approche qui rassure les médecins


Autre projet en cours : l'équipe d’Olivier Humbert cherche à déployer une plateforme centrée sur une approche de « federated learning » (apprentissage fédéré), soit « une infrastructure qui relie les hôpitaux ensemble pour qu’ils puissent entraîner des modèles d’intelligence artificielle sur les données de différents hôpitaux mais sans que ces données quittent l’hôpital où elles ont été produites ».

Le projet, qui a démarré en décembre 2022 et qui doit s’achever en décembre 2025, a obtenu un peu plus d'1 million d’euros de financement (nationaux, académiques) et les chercheurs ont réalisé la preuve de concept (PoCPoCProof of concept) sur 3 établissements : l’Institut CurieInstitut CurieInstitut CurieInstitut Curie à Paris, le centre Henri BecquerelCentre Régional de lutte contre le cancer de Haute Normandie - Henri BecquerelCentre Régional de lutte contre le cancer de Haute Normandie - Henri Becquerel à Rouen et le centre Antoine LacassagneCentre Antoine Lacassagnecentre Antoine LacassagneCentre Antoine Lacassagne à Nice. « Nous sommes parvenus à connecter les établissements entre eux et donc à entraîner notre modèle au sein des différents centres. »

La prochaine étape est le développement du modèle à l'échelle nationale, avec notamment un partenariat avec UnicancerUnicancerUnicancer. « Nous travaillons toujours sur le cas du cancer poumon et l’immunothérapie (PoC) mais une fois que l’infrastructure sera établie, il s’agira d’un outil utilisable dans d’autres champs, pour d’autres données médicales… »

Malgré des difficultés pointées sur le plan réglementaire et sur le plan informatique/technique, Olivier Humbert constate que l’engouement de la communauté médicale pour le federated learning est évident. « [Cette approche] évite de séparer la donnée de l’hôpital où elle est produite et des médecins qui la connaissent. C’est extrêmement pertinent, ça rassure tout le monde. (…) Je pense que c’est quelque chose qui va changer la donne en IA. »

IA générative : une méfiance à l'égard des « techno-pushs »


En parallèle de ses activités de recherche, Olivier Humbert est également responsable pédagogique du diplôme universitaire (DUDUdiplôme universitaire) « Intelligence artificielle & santé », une formation lancée en 2021 dont il est à l’initiative et développée dans le cadre de l’Institut 3IA Côte d’Azur. Depuis 2 ans, le programme s’est pérennisé et a évolué, avec un renforcement en termes d’enseignants et la possibilité cette année de personnaliser la formation avec des options à la carte afin de mieux répondre aux attentes spécifiques de chaque métier. Un MOOCMOOCMassive Open Online Courses interactif va aussi être proposé afin de lancer un DU en mode hybride présentiel-distanciel, toute la formation étant actuellement basée à Nice.

Par ailleurs interrogé sur l’essor de l’IA générative, Olivier Humbert se méfie de ce qu’il qualifie de « techno-push » (« on vous donne une technologie et vous voyez ce que vous pouvez en faire »). Il explique préférer la démarche consistant « à partir d’un besoin et à développer la technologie qui va permettre de répondre à ce besoin ». « Les mathématiciens vont vous dire que c’est une technologie incroyable mais du côté des médecins, on est plus prudents et c’est normal, c’est notre métier. On doit vérifier si la technologie est vraiment utile », souligne-t-il.


👉 Pour en savoir plus sur l'édition 2023 du SophIA Summit : [Partenariat H&TI] SophIA Summit 2023 : une journée dédiée à l’IA en recherche médicale (22-24/11).
Olivier Humbert - © D.R.
Olivier Humbert - © D.R.

Adoption de l’AI Act : l’Europe envisage une réglementation à trois niveaux pour l’IA générative

La France, l’Allemagne et l’Italie ont en parallèle décidé de renforcer leur coopération dans le domaine de l’intelligence artificielle pour ouvrir « la voie à l'émergence d’une industrie européenne de l’IA compétitive au niveau mondial ». L’Union européenne envisage une approche à trois…
Actualité n° 17122 • 31/10/23 à 16:56

Que contient le guide de l’OMS pour une utilisation sécurisée et responsable de l’IA en santé ?

Si elle reconnaît que l’intelligence artificielle (IA), dont l’IA générative, va améliorer les soins dans un certain nombre de domaines, l’Organisation mondiale de la santé (OMS) présente une série de considérations et recommandations afin de faciliter la construction de la réglementation à venir…
Actualité n° 17078 • 25/10/23 à 14:16

HIMSS : co-création, interop’ et IA dans les priorités du groupe pour le numérique en santé en Europe

La co-construction avec les professionnels de santé et les patients, une législation adaptée pour favoriser l’interopérabilité des systèmes et données, un positionnement de l’intelligence artificielle (IA) avec un accès aux outils sur l’ensemble de l’Europe font partie des priorités clés…
Actualité n° 16956 • 02/10/23 à 14:26

[Partenariat H&TI] SophIA Summit 2023 : une journée dédiée à l’IA en recherche médicale (22-24/11)

Les dernières avancées mondiales dans le domaine de la recherche en intelligence artificielle (IA) et ses applications, avec une journée dédiée au secteur de la santé, seront présentées lors de la 6e édition du SophIA Summit, qui aura lieu du 22 au 24 novembre 2023 à Sophia Antipolis…
Actualité n° 16871 • 15/09/23 à 12:16

Comité de filière industries & technologies de santé : data et IA parmi les chantiers clés 2023-2025

Le projet de nouveau contrat du comité stratégique - que H&TI a pu consulter - propose notamment de définir un cadre de tarification des usages des données de santé pour les industriels « simple et soutenable » et d'évaluer 5 cas d’usage « IA et Parcours » afin de structurer une filière industrielle…
Actualité n° 16864 • 13/09/23 à 17:21

VivaTech23 : E. Macron annonce 7 Mds € pour Tibi 2 et un challenge sur l’IA générative doté de 40M€

7 milliards d’euros de fonds privés mobilisés pour le développement des entreprises technologiques de demain, avec une priorité donnée à la décarbonation de l'économie, en lien avec le plan « Industrie verte », et aux projets de haute technologie : le lancement de la phase 2 de l’initiative Tibi a…
Sélection n° 16533 • 15/06/23 à 18:12

SophIA Summit 2022 : l’analyse des données textuelles parmi les axes de travail du 3IA Côte d’Azur

« Nous fournissons beaucoup d’efforts sur les approches comme le traitement automatique de la langue naturelle (NLP) et le machine learning pour être en capacité d’exploiter les données textuelles produites par les médecins : des données complexes à analyser parce que déstructurées et de formats…
Entretien n° 15591 • 07/12/22 à 17:21

Données de santé & IA : Inria lance un programme d’apprentissage fédéré, soutenu par La Poste

Améliorer l’accès aux données tout en protégeant leur confidentialité : c’est l’ambition de « Fed-Malin » (pour « FEDerated MAchine Learning over the Internet »), le nouveau programme de recherche d’Inria lancé le 28 novembre 2022 avec le soutien financier du groupe La Poste. Le programme rassemble…
Actualité n° 15586 • 06/12/22 à 14:32

SophIA Summit 2022 : Median vise l’approbation FDA pour son IA de pré-diagnostic du cancer du poumon

La technologie de Median, conçue en collaboration avec des radiologues, permet d’identifier avec précision les nodules bénins et malins et ainsi de faciliter le diagnostic du cancer pour une prise en charge précoce, augmentant les chances de survie des patients. Median Technologies, entreprise…
Sélection n° 15575 • 02/12/22 à 15:23

2023 - © SophIA Summit

Un campus franco-indien labellisé à Nice (AAP)

Un campus franco-indien labellisé à Nice (AAP)

Vous êtes co-responsable de la Chaire AI & Health du SophIA Summit : Quels seront les moments forts à ne pas manquer et les intervenants clés du programme « AI & Health » de l'événement (le 22 novembre) ?

Olivier Humbert : Il y aura des keynotes de haut niveau avec des interventions assez diversifiées et internationales (acteurs européens, nord-américains et asiatiques). Ce côté plus international de l'événement est l’une des grandes évolutions cette année.

Parmi les intervenants clés du programme AI & Health :

Arnaud Droit, professeur dans le département de médecine moléculaire de l’université LavalUniversité Laval (Québec), qui dirige une plateforme de bio-informatique et de protéomique : il travaille sur l’analyse des données « -omiques » et interviendra sur la génomique computationnelle ;
• il y aura aussi des chercheurs spécialisés en imagerie, comme Thomas WalterThomas Walter, directeur de recherche à Mines ParisTech et qui exerce aussi au sein d’un laboratoire à l’Institut Curie : Thomas Walter est un chercheur de très haut niveau expert en analyse des images médicales, plutôt dans le champ de l’anatomopathologie (anapath) et de la biologie en cancérologie ;
Bjorn MenzeBjoern Menze, professeur d’imagerie médicale (scanner, IRMIRMImagerie par Résonnance Magnétique…) à l’université de ZurichUniversité de Zurich (Suisse), interviendra aussi : il est spécialisé dans l’analyse computationnelle dans le champ de l’imagerie au sens scanner et IRM ;
• et nouveauté cette année, les speakers ne seront pas uniquement des techniciens : David GrusonDavid Gruson, enseignant à Sciences PoSciences Po et fondateur d’Ethik-IAEthik-IA, fait aussi partie des intervenants. David Gruson est un référent au niveau national sur la réflexion autour de l’IA médicale et de l'éthique (garantie humaine de l’IA) : il partagera sa vision, davantage sociétale et non centrée sur la bio-informatique mathématique comme les autres intervenants.

L’autre aspect intéressant cette année est qu’il y a eu un appel à projets (AAP) pour des partenariats entre des universités françaises et indiennes, avec notamment le projet d’un campus franco-indien qui a été labellisé à Nice. Dans ce cadre, on reçoit lors du SophIA Summit une délégation de chercheurs de grandes universités indiennes, qui vont présenter leurs travaux, complémentaires et différents des nôtres. Il y aura notamment une intervention de Tavpritesh Sethi de l’université de New Delhi, à la fois médecin et scientifique, professeur agrégé de biologie computationnellebiologie computationnellediscipline à l'interface des sciences de la vie et de l'informatique souvent appliquée à l'étude de milieux biologiques complexes (cellules vivantes, cerveau humain, etc.), qui travaille sur l’IA pour l’aide à la décision médicale, notamment sur des situations critiques : infections chez le nouveau-né, inégalités d’accès aux soins intensifs, résistance microbienne…

Ces grandes universités indiennes sont en plein développement. Elles investissent et sont en expansion exponentielle, en particulier les universités de Bangalore et de New Delhi.

En Europe, on travaille surtout dans le champ du cancer alors que de leur côté, ils se concentrent davantage sur des thématiques de santé publique, d’accès aux soins, d’infectiologie. C’est intéressant d’avoir leur vision.


Un projet sur des modèles de machine learning « assez simples mais efficaces »

Vous aviez présenté à H&TI en 2021, toujours dans le cadre du SophIA Summit, la solution que vous étiez en train de développer avec l’Institut 3IA Côté d’Azur, en partenariat avec Inria : un outil basé sur l’IA permettant de prédire la réussite ou l'échec de l’immunothérapie pour un patient donné, avec l’objectif à terme d’aboutir à une médecine de précision « algorithmique ». Où en est ce projet ?

Olivier Humbert : La recherche en IA, c’est du temps long mais, heureusement, nous avons avancé depuis 2021. Nous avons construit des modèles. Un doctorant va soutenir sa thèse dans 1 mois et présenter ses résultats sur ce projet, résultats qui ont aussi été exposés en congrès.

Nous sommes parvenus à obtenir un modèle avec 8 marqueurs qui proviennent de ces différentes sources d’informations et qui permettent de prédire avec des performances tout à fait correctes l’efficacité de l’immunothérapie : les résultats en termes de prédiction se situent entre 70 % et un peu plus de 80 % de prédiction selon ce que l’on souhaite prédire, la récidive ou l'échec du traitement. Nous avons appris beaucoup de choses. Nous avons surtout développé des modèles prédictifs. Prédire la réponse à l’immunothérapie du cancer du poumon est un gros enjeu parce qu’aujourd’hui, on ne sait pas du tout identifier les patients qui vont répondre positivement au traitement et on manque de précision dans notre décision donc on a besoin de ces aides technologiques.

Le modèle le plus réussi que nous avons développé est un modèle qui intègre des données du patient à la fois cliniques et biologiques, et aussi extraites de son dossier d’imagerie médicale (PETPETPositron Emission Tomography (tomographie par émission de positrons)-Scan). C’est un modèle assez simple puisqu’on a analysé quelques dizaines de caractéristiques de ces données : nous sommes parvenus à obtenir un modèle avec 8 marqueurs qui proviennent de ces différentes sources d’informations et qui permettent de prédire avec des performances tout à fait correctes l’efficacité de l’immunothérapie : les résultats en termes de prédiction se situent entre 70 % et un peu plus de 80 % de prédiction selon ce que l’on souhaite prédire, la récidive ou l'échec du traitement.

Ce sont de bons résultats parce qu’on dépasse largement les biomarqueurs qu’on avait jusqu’à présent, qui étaient individuels : auparavant, on utilisait plutôt un seul biomarqueur et on regardait sa valeur prédictive, qui se situait entre 65 % et 70 %. Ce qu’on a confirmé avec le nouveau modèle, c’est l’intérêt de combiner différents paramètres pour avoir une approche plus globale du patient, parce qu’on regarde son âge, son poids, ses habitudes (Est-ce qu’il fume ?), la biologie de la tumeur, est-ce qu’elle exprime le récepteur cible du traitement ainsi que l’image, quel est le volume global de la maladie, etc. Cela permet d'être beaucoup plus précis afin d’avoir une sorte de signature qui combine ces biomarqueurs pour une prédiction plus fiable.

Il s’agit ici de modèles de machine learning assez simples mais efficaces. La simplicité permet d’avoir des résultats plus robustes.

Deep learning : un problème d’accès aux données pour gagner en performance

Vous travaillez aussi sur des modèles de deep learning…

On s’intéresse aussi au deep learning, qui nécessite des techniques plus poussées. Nous avions réussi à avoir des bases de données de 350 patients mais ça reste compliqué. Avec notre modèle de deep learning sur 350 patients, on obtient des prédictions mais on ne dépasse pas l’efficacité des modèles simples, on est même un peu en dessous. On a par exemple analysé l’image PET-Scan par deep learning : on a la capacité de prédiction mais l’information est tellement subtile qu’il faudrait avoir de plus grosses bases de données. On est toujours bloqués sur cette problématique d’accès à la donnée.

Notre constat actuellement est que sont les modèles plutôt simples de machine learning qui sont les plus efficaces et qui nous apportent le plus.

Ces modèles de deep learning, on les a publiés, on les a évalués dans d’autres centres et on s’est rendu compte qu’ils fonctionnaient bien sur les patients d’autres établissements. Cependant, des limites sont apparues.

On a développé et validé notre algorithme d’IA au sein de notre centre, à Nice (centre Antoine LacassagneCentre Antoine Lacassagne). Souvent, un modèle fonctionne bien uniquement dans l’établissement où il a été développé, c’est pourquoi il est important d’aller le tester en externe sur des données indépendantes. On a dans un premier temps été satisfaits parce qu’il fonctionnait bien aussi à Monaco (centre hospitalier Princesse GraceCentre Hospitalier Princesse Grace) et à Rouen (centre Henri BecquerelCentre Régional de lutte contre le cancer de Haute Normandie - Henri Becquerel) mais lorsqu’on l’a testé à Paris à l’Institut CurieInstitut Curie, ses performances étaient beaucoup plus décevantes.

Comment expliquez-vous ces différences de performance ?

Les centres de Monaco et de Rouen ont des populations de patients à peu près similaires à la nôtre. Ce n’est pas le cas à l’Institut Curie. Le problème de ces algorithmes, c’est leur capacité à être généralisables : tant qu’on aura des bases de données qui ne sont pas assez grandes ou trop centrées sur un pays, sur un établissement, on aura du mal à faire fonctionner les modèles pour tout le monde.

Si on veut faire du deep learning et des choses plus complexes, il faut lever le verrou d’accès à la donnée au sein de plusieurs centres. C’est indispensable sinon on n’aura jamais des algorithmes qui fonctionnent bien. Il faut impérativement les valider sur d’autres centres. On s’est aussi rendu compte qu’il y avait quelques biais, par exemple avec les patients assez âgés, probablement parce qu’on n’avait pas assez de données issues de patients âgés dans notre base d’entraînement.

La recherche, c’est ça : on progresse sur certains points et parfois on identifie des limites. L'étape d’après est d’avancer, de surmonter les problématiques rencontrées.

Comme on ne disposait pas de bases de données assez grandes, nous sommes donc pour l’instant revenus à une certaine simplicité avec un modèle basé sur du machine learning : seulement 8 paramètres mais un modèle assez robuste. Si on veut faire du deep learning et des choses plus complexes, il faut lever le verrou d’accès à la donnée au sein de plusieurs centres. C’est indispensable sinon on n’aura jamais des algorithmes qui fonctionnent bien. Il faut impérativement les valider sur d’autres centres.

Federated learning : une communication réussie entre 3 établissements (PoC)

La prochaine étape est donc de valider sur d’autres centres cet algorithme ?

Oui. Et on va le faire avec le federated learning (apprentissage fédéré).

Vous aviez justement indiqué en 2021 que vous travailliez sur le déploiement d’une plateforme centrée sur une approche de « federated learning ». Où en est ce projet ?

Il reste encore beaucoup à faire mais on a beaucoup avancé. En 2021, c'était vraiment le début des discussions.

Le federated learning, c’est une infrastructure qui relie les hôpitaux ensemble pour qu’ils puissent entraîner des modèles d’intelligence artificielle sur les données de différents hôpitaux mais sans que ces dernières quittent l’hôpital où elles ont été produites. Normalement, dans le système initial « centralisé », on sort les données des hôpitaux, on les met dans un serveur et on entraîne le modèle. Avec le federated learning, on a une infrastructure qui permet de faire communiquer les paramètres des modèles entre les hôpitaux et les données ne bougent pas.

Cette approche est extrêmement intéressante en médecine parce que, du fait de la confidentialité des données, il y a toujours un risque de les sortir des hôpitaux : elles peuvent partir dans la nature et on ne sait jamais ce qui peut arriver. Cela rassure tout le monde d’avoir ce type d’infrastructure puisque les données restent « au chaud » à l’hôpital, de manière très sécurisée. C’est une vraie garantie de sécurité.

En revanche, ça change un peu le paradigme, la manière dont on doit travailler, parce qu’on doit disposer de cette infrastructure de communication entre les hôpitaux et c’est assez complexe. On doit aussi avoir dans les hôpitaux de la puissance de calcul pour entraîner les algorithmes. C’est un enjeu.

Dans le cadre de ce projet, nous avons travaillé avec Marco LorenziMarco Lorenzi, chercheur au sein de l'équipe Epione (pour « E-patient : images, données & modèles pour la médecine numérique ») à InriaInria Sophia Antipolis.

Grâce au financement obtenu, on passe maintenant à l'étape supérieure : une dizaine d'établissements, notamment d’importants centres parisiens comme Gustave Roussy, ont intégré le projet. On est en train d’installer cette infrastructure entre les établissements pour avoir accès aux données de 1 200 patients afin d’entraîner cette fois-ci des modèles d’IA beaucoup plus puissants. Autre élément important : nous avons obtenu des financements (nationaux, académiques), un point essentiel en recherche. Au total, nous avons reçu un peu plus d'1 million d’euros, ce qui a permis de lancer ce projet.

Nous avons aussi réalisé la preuve de concept (PoCPoCProof of concept) sur 3 établissements (l’Institut Curie à Paris, le centre Henri Becquerel à Rouen et le centre Antoine-Lacassagne à Nice) : nous sommes parvenus à connecter les établissements entre eux et donc à entraîner notre modèle au sein des différents centres.

Grâce au financement obtenu, on passe maintenant à l'étape supérieure : une dizaine d'établissements, notamment d’importants centres parisiens comme Gustave RoussyGustave Roussy, ont intégré le projet. On est en train d’installer cette infrastructure entre les établissements pour avoir accès aux données de 1 200 patients afin d’entraîner cette fois-ci des modèles d’IA beaucoup plus puissants. Ce nombre conséquent de données va permettre d’avoir des modèles plus complexes, donc potentiellement plus précis, d’avoir aussi de la diversité parce qu’on a des petits et des gros établissements, des centres très axés sur la recherche, d’autres moins, etc.

C’est un projet assez compliqué, notamment sur le plan réglementaire.

En tout cas, nous sommes bien entourés et on avance. Le projet a démarré en décembre 2022 et va durer 3 ans : il se terminera donc en décembre 2025.

Nous avons obtenu des financements, réalisé la preuve de concept (PoC)… Nous sommes actuellement en train de développer le modèle à l'échelle nationale, avec notamment un partenariat avec Unicancer. Nous travaillons toujours sur le cas du cancer poumon et l’immunothérapie (PoC) mais une fois que l’infrastructure sera établie, il s’agira d’un outil merveilleux, utilisable dans d’autres champs, pour d’autres données médicales… Le modèle pourra être utilisé pour d’autres applications.

« Tout le monde pense que l’avenir de l’IA va passer par le federated learning »

De quel ordre sont les contraintes réglementaires que vous évoquées ?

Nous collaborons avec des laboratoires de recherche et des hôpitaux. La question est de savoir comment on valorise chacun d’entre eux. Les laboratoires sont plutôt attachés à la propriété intellectuelle, les hôpitaux plutôt aux publications scientifiques. Les valorisations attendues ne sont pas forcément les mêmes d’un établissement à l’autre. Nous devons définir ce que l’on apporte aux laboratoires de recherche et ce que l’on apporte aux hôpitaux.

Il y a deux ans, quasiment personne ne connaissait l’apprentissage fédéré. Aujourd’hui, c’est un sujet qui commence à circuler dans les congrès et les gens trouvent que c’est génial, que c’est ce qu’il faut faire. Techniquement, c’est un peu compliqué certes, il y a des choses à résoudre mais j’y crois vraiment pour l’avenir. Ensuite, on doit se procurer du matériel de puissance informatique. C’est nous qui l’achetons parce que c’est nous qui disposons des financements alloués aux projets. On aimerait céder cet argent aux hôpitaux mais il est assez complexe dans un projet de posséder directement du matériel.

Ce sont ce genre de petits aspects techniques qui peuvent poser problème.

Malgré ces difficultés sur le plan réglementaire et sur le plan informatique/technique, l’engouement de la communauté médicale pour le federated learning est évident. Tout le monde pense que l’avenir de l’IA va aussi passer par l’apprentissage fédéré. Parce que les données sont dans les hôpitaux, les médecins les connaissent bien : le federated learning évite de séparer la donnée de l’hôpital où elle est produite et des médecins qui la connaissent. C’est extrêmement pertinent, ça rassure tout le monde. Il y a une vraie confiance des médecins dans ce système. Je pense que c’est quelque chose qui va changer la donne en IA.

Il y a deux ans, quasiment personne ne connaissait l’apprentissage fédéré. Aujourd’hui, c’est un sujet qui commence à circuler dans les congrès et les gens trouvent que c’est génial, que c’est ce qu’il faut faire. Techniquement, c’est un peu compliqué certes, il y a des choses à résoudre mais j’y crois vraiment pour l’avenir.

D’où proviennent les financements dont vous parlez ?

Il y a des financements qui proviennent d’Inria. L’institut finance des ingénieurs : il y a plusieurs chercheurs sur le projet à Inria.

Le problème que l’on rencontrait était plutôt le financement du côté des hôpitaux parce qu’ils ne sont pas là pour financer de la puissance de calcul et des GPUGPUGraphics Processing Unit (processeurs graphique). On a remporté l’appel à projets national « PRT-K » (programme de recherche translationnelle en cancérologie), avec un financement apporté par l’IncaInstitut National du Cancer et par la DGOSDirection générale de l'offre de soins, qui permet justement de financer les hôpitaux.

Il y a donc une partie où Inria finance la recherche, et une autre où l’Inca et la DGOS financent les besoins du côté des hôpitaux pour constituer les bases de données, brancher l’infrastructure au système informatique, etc.

Ce projet de federated learning se termine dans deux ans, une période courte en recherche. Il va falloir carburer parce qu’il y a plusieurs enjeux à adresser. Et une fois que ce sera le cas, il y aura encore beaucoup de travail à effectuer pour faire de ce projet quelque chose de fonctionnel, avec une maintenance dans les hôpitaux pour pouvoir répondre à d’autres questions mais nous avons des soutiens donc nous allons y parvenir.


Un partenariat avec la société Euranova sur la détection des lésions cancéreuses

Travaillez-vous sur d’autres projets d’IA ?

Nous avons un autre projet important avec EuranovaEuranova, une entreprise belge de data science qui s’intéresse au secteur de la santé, et dont la partie R&D est installée à Marseille.

On collabore avec eux sur l’image PETPETPositron Emission Tomography (tomographie par émission de positrons)-Scan. Quand un patient est atteint d’un cancer métastatique, il a plusieurs dizaines de lésions. L’objectif est d’apprendre à l’algorithme que nous développons à détecter ces lésions et à les suivre dans le temps. Actuellement, on fait beaucoup de PET-Scan pour suivre l’efficacité des traitements des patients qui sont par exemple traités par chimiothérapie ou par immunothérapie, et tout le travail est manuel : le médecin mesure les intensités de la lésion avant, puis sur l’image suivante trois mois plus tard et il calcule la différence. Nous souhaitons automatiser ces tâches.

Nous avons un autre projet important avec Euranova, une entreprise belge de data science qui s’intéresse au secteur de la santé, et dont la partie R&D est installée à Marseille. Il y a une partie industrielle avec un outil d’aide au médecin qui lui enlève une tâche fastidieuse, pour qu’il aille un peu plus vite et qu’il se consacre à des tâches plus intéressantes que la mesure de lésions. Il s’agit d’une solution avec un potentiel d’utilisation commerciale intéressant pour l’entreprise. Ce qui m’intéresse le plus c’est que je vois aussi dans cette technologie un gros potentiel pour améliorer le soin du patient. Parce qu’aujourd’hui, comme le médecin n’a pas assez de temps, il effectue ce travail de mesure des lésions très vite, et pas pour toutes les lésions. Disposer d’un outil qui nous accompagne va nous permettre d'être beaucoup plus précis, d’améliorer nos critères pour savoir si un patient répond ou non à un traitement.

On a donc les deux versants : l’aide au médecin pour gagner du temps et l’amélioration du soin au patient pour être beaucoup plus fin dans l’analyse, l'évaluation et le suivi de l’efficacité du traitement.

Ce genre de projets est assez lourd. Le processus de contractualisation avec les hôpitaux pour pouvoir accéder aux données est assez long et ensuite, il faut entraîner les algorithmes. Or, pour ce faire, il faut des médecins qui annotent les images, un travail extrêmement chronophage. Quand le patient a 50 lésions par exemple, il faut toutes les localiser puis les suivre dans le temps, etc. Il est compliqué de trouver des médecins qui vont accepter de prendre du temps pour réaliser cette tâche.

Nous avons réussi à obtenir des financements qui nous ont permis de recruter des médecins annotateurs. Nous avons aujourd’hui une base de données de 1 200 examens annotés. 

La prochaine étape est de développer des modèles mathématiques mais sans cette base de données de qualité, annotées, rien n’aurait été possible.

Zoom - © Geralt from Pixabay

IA générative : « Je me méfie beaucoup de ces  »techno-pushs«  »

IA générative : « Je me méfie beaucoup de ces  »techno-pushs«  »

On parle beaucoup actuellement de l’IA générative, en plein boom, y compris dans le secteur de la santé. Quel est votre point de vue sur cette technologie émergente ?

Olivier Humbert : C’est la « hype » du moment. Son intérêt au niveau médical en est encore à l'état de question.

Beaucoup de chercheurs travaillent par exemple sur la génération de données de faux patients, sur lesquelles on peut entraîner les modèles. Or, la biologie est une mécanique très complexe. Je ne suis pas sûr que les algorithmes prennent en compte toutes les particularités biologiques et physiologiques de l'être humain. Je doute que les résultats soient aussi précis que ceux obtenus avec des modèles basés sur des données issues de vrais patients.

L’IA générative permet aussi de générer des comptes rendus, d’imagerie notamment. C’est assez bluffant. Quand on n’est pas expert, on est impressionné par le résultat mais quand on est expert, scientifique ou médecin, on repère beaucoup d’imprécisions et d’erreurs. Du moins pour l’instant.

L’IA générative, c’est une « techno-push ». C’est-à-dire qu’on vous donne une technologie et vous voyez ce que vous pouvez en faire. Je préfère la démarche consistant à partir d’un besoin et à développer la technologie qui va permettre de répondre à ce besoin. Je me méfie beaucoup de ces « techno-pushs », qui, au final, peuvent ne servir à rien voire nuire. Il y a régulièrement des « hypes » et en ce moment c’est l’IA générative.

Les mathématiciens vont vous dire que c’est une technologie incroyable mais du côté des médecins, on est plus prudents et c’est normal, c’est notre métier. On doit vérifier si la technologie est vraiment utile.


Un DU « IA & Santé » qui s’enrichit pour mieux répondre aux attentes des médecins

Face à cet essor du numérique et de l’IA en santé, le sujet de la formation est au centre des enjeux. Vous êtes responsable pédagogique du diplôme universitaire (DU) « Intelligence artificielle & santé », une formation dont vous êtes à l’initiative et développée dans le cadre de l’Institut 3IA Côte d’Azur. La première promotion (25 étudiants) a débuté la formation en 2021. Quel bilan tirez-vous de ce DU après 2 ans d’existence ?

On en est actuellement aux inscriptions de la 3e promotion, qui commencera en janvier 2024. Il y a une vraie demande. Le DU s’est pérennisé. Il répond à un réel besoin des médecins. Il vient « ouvrir le capot de la voiture » en quelque sorte pour comprendre comment les choses fonctionnent. Et les médecins ont cette curiosité. Du moins ceux qui s’inscrivent au DU veulent comprendre comment fonctionne l’IA.

Nous avons à présent 20-25 étudiants inscrits. On espère augmenter ce nombre petit à petit mais pour l’instant le programme fonctionne bien avec ce nombre-là. Il s’agit d’une minorité de médecins mais on espère que ce sont eux qui seront les leaders de l’IA de demain et qui vont pouvoir conseiller les autres sur ce sujet.

Le programme évolue-t-il chaque année ?

L’idée à l’origine était d’enseigner les bases de l’intelligence artificielle. J’enrichis le programme progressivement au fil des rencontres que j’ai l’occasion de faire avec des experts du sujet qui travaillent sur des domaines très différents de l’IA.

Au départ, la formation (DU « Intelligence artificielle & santé ») était très axée sur les mathématiques, avec des aspects qui pouvaient être compliqués à appréhender pour les médecins. Nous n’avions pas vraiment réalisé cette difficulté à l’origine. Aujourd’hui, nous essayons de mieux accompagner les médecins sur cette partie mathématiques. Le programme se renforce donc en termes d’enseignants et cette année, nous allons proposer un DU qui sera davantage à la carte. Les professionnels de santé qui s’inscrivent à la formation peuvent être médecins cliniciens, dentistes, kinésithérapeutes… Il y a des bases communes mais aussi des questions spécifiques propres à chaque métier. Par exemple, on peut proposer à un médecin anatomopathologiste (anapath) un module complémentaire de 4-5 heures pour mieux saisir les spécificités de l’IA en anapath. Comme les attentes sont très hétérogènes, on essaie de répondre à ce besoin en proposant un tronc commun et en permettant aussi des choix optionnels selon les attentes de chacun.

On a aussi obtenu des financements nationaux avec un projet baptisé « EfelIA », qui se met en place cette année. L’idée est de faire évoluer le DU avec une partie en distanciel, un MOOCMOOCMassive Open Online Courses interactif, parce que pour l’instant, toute la formation est basée à Nice. Grâce aux financements obtenus, nous allons pouvoir lancer le DU en mode hybride présentiel-distanciel pour s’adresser au plus grand nombre.

Nous en sommes seulement à la troisième année mais le programme a déjà beaucoup évolué depuis sa création. Au départ, la formation était très axée sur les mathématiques, avec des aspects qui pouvaient être compliqués à appréhender pour les médecins. Nous n’avions pas vraiment réalisé cette difficulté à l’origine. Aujourd’hui, nous essayons de mieux accompagner les médecins sur cette partie mathématiques.

À chaque fin d’année, les étudiants nous remettent un compte rendu. On s’est enrichis grâce à ces retours et on a enrichi le DU en conséquence. Les étudiants sont globalement très contents de la formation mais ils ont aussi toujours des suggestions à soumettre. Et c’est intéressant pour nous. Cela nous permet de progresser pour mieux répondre aux attentes des professionnels.

Fin
loader mask
1