Etude : un nouvel outil pour tracer l’usage réel de l’IA médicale (arXiv)

Publié le jeudi 16 octobre 2025 à 11h32

IA Recherche

En octobre 2025, une étude* mise en ligne sur arXiv par un collectif international (Harvard Medical School, Université d’Oxford, Google DeepMind, etc.) présente “MedLog”, un protocole qui trace chaque interaction entre une IA et un acteur du soin. Objectif : une “boîte noire” de l’IA médicale, gage de transparence, sécurité et amélioration continue. Un prototype open source est déjà disponible.

Un système qui enregistre chaque “acte” posé par une IA

L’intelligence artificielle s’installe partout dans les hôpitaux : aide au diagnostic, rédaction de comptes rendus, tri des urgences, gestion des assurances… Mais une fois déployées, ces IA fonctionnent souvent sans supervision réelle. Aucune base de données ne permet de savoir comment elles sont utilisées, dans quelles conditions et avec quels résultats. Impossible, donc, de repérer leurs erreurs, d’en corriger les biais ou simplement d’évaluer leur utilité clinique.

Pour combler ce vide, les chercheurs ont conçu MedLog, un système qui enregistre chaque “acte” posé par une IA médicale. Chaque fois qu’un modèle est utilisé — pour recommander un traitement, interpréter un examen ou rédiger un texte médical —, neuf informations clés sont automatiquement consignées. Parmi les principales, on trouve : qui l’a utilisé, dans quel contexte, quelles données ont été fournies, quel résultat a été produit et, quand c’est possible, ce qui s’est passé ensuite (décision médicale, retour du patient, correction par le clinicien).

Ces “traces d’usage” formeraient une mémoire collective des IA hospitalières, utile pour comprendre leurs comportements et leurs effets réels sur la prise en charge. Un système de traçabilité complète, comparable à ce qu’est la boîte noire dans un avion. Ce prototype opérationnel a déjà été mis en ligne sur GitHub pour être testé par les hôpitaux.

Des utilisations et des enseignements multiples

L’équipe illustre le fonctionnement de MedLog à travers plusieurs situations concrètes. Dans un service d’oncologie, par exemple, chaque étape du recours à une IA — question du médecin, suggestion de traitement, décision finale et effets observés — est enregistrée. Ces données permettent, a posteriori, d’évaluer la pertinence des recommandations et d’identifier les contextes où le modèle est le plus fiable. Autre cas : un patient demande à une IA de lui résumer un formulaire de consentement pour une étude clinique. MedLog conserve à la fois la version résumée et la réaction du patient, ce qui aide les équipes à vérifier la clarté des outils numériques utilisés dans le parcours de soin. Autres exemples : une IA administrative estime la probabilité qu’un remboursement soit refusé par une assurance, tandis qu’en réanimation, une autre surveille les constantes vitales pour détecter précocement un risque de sepsis.

Enfin, un exemple réel démontre tout l’intérêt de ce type de suivi. En Israël, le réseau de santé Clalit utilisait un modèle d’IA pour prédire le risque d’hospitalisation de ses patients. Au printemps 2023, l’équipe a remarqué que les résultats du modèle devenaient étrangement moins fiables. En cause ? Un simple changement de kit de test sanguin dans les laboratoires, qui modifiait légèrement la valeur d’un enzyme utilisé dans les calculs du LDH. Ces écarts, invisibles à l’œil nu, ont été détectés grâce à un système de surveillance automatique similaire à ce que propose MedLog. Les ingénieurs ont ainsi pu corriger le modèle avant que les erreurs ne se répercutent sur les décisions médicales.

Le futur « standard mondial » ?

Pour les auteurs, MedLog pourrait devenir un standard mondial de suivi des IA médicales, à la fois outil de contrôle, de comparaison et d’apprentissage.
À terme, ce protocole permettrait de :

  • Détecter les dérives ou les biais avant qu’ils n’affectent les patients.
  • Mesurer la performance réelle des modèles selon les contextes et les populations.
  • Et rendre plus transparentes les décisions des algorithmes, vis-à-vis des soignants comme des patients.

Les chercheurs appellent régulateurs, hôpitaux et industriels à s’emparer du projet pour éviter que l’intelligence artificielle ne devienne une “boîte noire médicale” impossible à auditer. « Sans un suivi systématique, l’intelligence artificielle médicale ne peut être sûre, équitable ni efficace. Avec un tel suivi, la médecine peut être refondée sur la transparence et la responsabilité », estiment les auteurs.

*A global log for medical AI

arXiv:2510.04033v1 [cs.AI] 5 Oct 2025

 

FermerPlease login

No account yet? Register

membres-icon

Derniers membres

Jennifer inscrit il y a 1 semaine et 3 jours
morgane inscrit il y a 3 semaines et 5 jours
Benjamin inscrit il y a 1 mois et 1 semaine
François inscrit il y a 1 mois et 3 semaines
Charles inscrit il y a 1 mois et 3 semaines
Aicha inscrit il y a 2 mois et 3 semaines
Nozha inscrit il y a 4 mois
Fiona inscrit il y a 4 mois
confiance-icon

Ils nous font confiance

Jean François Pomerol
CEO

« Tribun Health est l’un des leaders en matière de solutions de pathologie numérique pour les établissements de santé publics et privés et l’environnement / organisations pharmaceutiques. Le décryptage de l’actualité numérique santé au sein de l’écosystème est un relais majeur pour comprendre, accompagner et développer nos activités tant au niveau institutionnel qu’au niveau des établissements (réseau des DG / DSI / CME

Dr Charlotte Garret
Directrice Médicale

« L'hebdo Health&Tech est un excellent support d'informations en termes d'actualités dans le domaine de la santé numérique, de l'IA, de la veille réglementaire... L'hebdo s'intéresse aux actualités françaises mais aussi internationales, ce qui permet d'avoir une vision globale des innovations en santé dans les domaines du digital et du numérique. Cela nous permet, au sein du LAB innovation chez Santéclair, d'être toujours informés des nouveaux acteurs du marché et des actualités dans ce domaine en perpétuel évolution ».

Aurélien Pécoul
Acting Director & open innovation manager

« En tant qu'acteur clé de l'industrie pharmaceutique, nous avons eu le privilège de collaborer avec Care Insight pour nos besoins en veille stratégique et en conseil dans le domaine de la santé numérique. Leur expertise, leur engagement et leur intégration au sein de l'écosystème de la santé numérique sont des atouts essentiels pour nous permettre d'accéder à une information de qualité. Leur capacité à fournir des panoramas détaillés, des benchmarks précis des solutions numériques et à définir des axes d'opportunités nous permet de mieux comprendre le paysage numérique de la santé en constante évolution et de formuler des stratégies de développement pertinentes. »

Arnaud Houette
CEO

« Extens est en France l’un des fonds majeurs d'investissement dédié aux éditeurs de logiciels de santé. A ce titre, Care Insight nous permet, par le service de veille HealthTech Intelligence, de comprendre les segments en évolution et accompagner nos stratégies d’investissement ciblées. Une très bonne source d’information fiable et pertinente ».

Pascal Dussert
Directeur Europe sale

“Care Insight est fédérateur d’innovations permettant d’accélérer l’émergence de projets d’envergure en s’appuyant sur son vaste réseau d’experts cliniques, institutionnels et industriels »

events-icon

Événements

Revivez les meilleurs moments !

Retrouver en image le Health&Tech Summit 2023 consacré aux cas d’usages concrets de l’IA et de la Data en Santé.