Recherche clinique : comment le projet CAIR met en place une nouvelle génération d’essais cliniques augmentés par les données de vie réelle ?
Publié le mardi 22 juillet 2025 à 09h48
Data RechercheFaire des données de vie réelle le chaînon manquant entre rigueur scientifique et efficacité opérationnelle dans la recherche clinique : c'est l'objectif du projet CAIR, retenu dans le cadre de l'AAP "Inserm Messidor 2024". Son objectif est d'intégrer les données de santé aux essais cliniques, pour réduire le nombre de patients inclus sans compromettre la robustesse scientifique des résultats.
Utiliser les données de vie réelle et créer des patients virtuels pour les essais cliniques
Alors que l’essai clinique randomisé (RCT) reste l’étalon-or pour démontrer l’effet causal d’un traitement, il reste long, coûteux, contraignant, et parfois inadapté aux réalités cliniques, notamment dans le cas des maladies rares, des traitements personnalisés ou des populations difficiles à recruter. C’est dans ce contexte que les données de vie réelle viennent bousculer les approches classiques, en offrant des opportunités pour réduire les contraintes logistiques sans sacrifier la rigueur scientifique. Mais pour cela, encore faut-il que ces données puissent être intégrées de façon méthodologiquement robuste.
Le projet CAIR (pour “causalité, algorithmes, innovation, réduction’), porté par le professeur Yohann Foucher au CHU de Poitiers, récemment choisit comme lauréat de l’AAP “Inserm Messidor 2024” s’attaque à cette rigidité en explorant une voie hybride : enrichir les bras contrôles des essais cliniques par des données réelles, sélectionnées et modélisées pour en faire des “patients virtuels”. Ces patients, extraits ou simulés à partir de bases existantes comme les entrepôts de données de santé (EDS), permettraient de réduire la taille des groupes témoins tout en conservant la comparabilité requise pour une analyse causale solide.
Utiliser des données externes, mais sous conditions :
La promesse est séduisante, mais techniquement ardue. Les données issues des soins courants ne bénéficient pas du tirage au sort comme dans un essai clinique, qui garantit que les groupes de patients sont comparables dès le départ, en répartissant au hasard les profils selon des critères comme l’âge, la gravité de la maladie ou les antécédents médicaux. Ces données sont souvent marquées par des biais. Par exemple, certains traitements sont prescrits à des patients plus graves, ou dans certains hôpitaux seulement. Ces biais de sélection, d’indication ou de pratique peuvent rendre les comparaisons trompeuses. Le projet CAIR vise justement à corriger ces écarts, pour intégrer ces données de manière rigoureuse dans les essais cliniques.
Concrètement, l’équipe développe des algorithmes de prédiction de l’évolution des patients sous traitement standard, afin de générer des bras témoins “virtuels” robustes. Ces modèles sont d’abord testés sur des jeux de données simulées : une stratégie classique mais efficace pour valider des outils lorsque l’effet réel du traitement est connu. Ensuite, ces méthodes seront appliquées à un cas concret : la réanalyse de l’essai Prophyloxitin, portant sur la prévention des infections post-opératoires en chirurgie colorectale, en mobilisant les données issues de l’EDS du CHU de Poitiers.
Une approche pluridisciplinaire et distribuée
L’originalité de CAIR réside aussi dans sa gouvernance scientifique. Trois pôles académiques sont mobilisés autour de méthodologies distinctes mais complémentaires :
-
Poitiers, avec l’expertise du professeur Foucher en statistique causale et modélisation prédictive ;
-
Toulouse, qui explore les apports de l’apprentissage par renforcement ;
-
Bordeaux, qui mobilise les modèles mécanistiques pour prédire la réponse thérapeutique à partir de biomarqueurs.
Cette convergence entre statistique, intelligence artificielle et modélisation biomédicale marque une évolution stratégique dans la manière dont la France articule ses compétences en santé numérique. Elle témoigne aussi d’un mouvement de fond : les données de santé, une fois rendues interopérables, tracées et exploitables, ne sont plus seulement un outil de pilotage hospitalier ou de veille épidémiologique. Elles deviennent un levier scientifique.
Vers une recherche plus rapide, plus éthique, plus pertinente :
Ce que propose CAIR n’est pas une simple optimisation logistique des essais cliniques. C’est un véritable changement de paradigme, qui pourrait transformer en profondeur la relation entre la recherche et le soin courant. En intégrant les données de vie réelle au cœur même de l’évaluation thérapeutique, le projet répond à plusieurs impératifs croissants : il vise à accélérer l’accès aux traitements innovants, à réduire les coûts et la durée des essais, tout en limitant l’exposition des patients à des traitements potentiellement moins efficaces imposés par tirage au sort. À terme, ce type d’approche pourrait devenir structurant pour les essais dits adaptatifs, les études menées en situation de crise sanitaire — comme lors de la pandémie de Covid-19 — ou encore pour les évaluations post-AMM, dans une logique de réévaluation continue du rapport bénéfice-risque.
Le projet CAIR confirme une tendance de fond : les entrepôts de données hospitaliers (EDS) ne sont plus de simples réservoirs de dossiers patients. Ils deviennent des acteurs actifs de la production de preuves cliniques, à condition d’être correctement gouvernés, enrichis, et articulés à la recherche académique. Le soutien explicite de la direction et de la CME du CHU de Poitiers à ce projet illustre une prise de conscience stratégique : la donnée de santé est désormais un actif scientifique.