LLM santé grand public : ChatGPT, Claude, Perplexity et Gemini, entre personnalisation des données et verrou réglementaire européen
Publié le lundi 06 avril 2026 à 11h00
GEN AIEn trois mois, OpenAI, Anthropic et Perplexity ont lancé des versions santé de leurs IA, connectées aux dossiers médicaux et objets connectés, tandis que leur déploiement européen bute sur les réglementations comme le RGPD, l'AI Act et le MDR.
LLM santé : d’un usage générique à des plateformes spécialisées
En 2026, le marché de l’IA médicale grand public atteint un point d’inflexion, avec plus de 230 millions de personnes posant chaque semaine des questions de santé ou de bien‑être à ChatGPT, avant même l’arrivée d’une offre dédiée. Cette massification des usages amène OpenAI, Anthropic et Perplexity à lancer des déclinaisons santé spécialisées : ChatGPT Health le 7 janvier 2026, Claude for Healthcare le 11 janvier 2026, puis Perplexity Health en mars 2026.
Ces solutions marquent le passage d’outils perçus comme une aide individuelle pour novice à de véritables dispositifs métiers, conçus pour articuler données cliniques et littérature scientifique dans une logique d’aide à la décision. Elles se positionnent comme compléments au médecin, en environnement isolé du reste de la plateforme grand public, avec des flux de données de santé cloisonnés et une promesse commune de non‑réutilisation des données pour l’entraînement des modèles.
Personnalisation par la donnée et bifurcation B2C / B2B
La tendance structurante est la personnalisation par la donnée, via l’interopérabilité avec les écosystèmes existants : Apple Health, Fitbit, Withings, Oura, dossiers médicaux électroniques (DME), résultats biologiques et objets connectés. L’objectif est de quitter le registre de la réponse générique pour proposer des analyses contextualisées appuyées sur l’historique individuel, avec à terme la perspective de « jumeaux numériques » capables de simuler des trajectoires cliniques.
Une bifurcation nette apparaît entre stratégies B2C et B2B : ChatGPT Health et Perplexity Health visent en priorité le grand public, tout en cherchant à embarquer les cliniciens, alors qu’Anthropic, avec Claude for Healthcare, cible d’abord les institutions de santé, assureurs et acteurs pharmaceutiques. Anthropic compense une base utilisateur grand public plus restreinte par des contrats d’infrastructure, quand OpenAI et Perplexity misent sur une expérience directe utilisateur, avec intégrations DME et apps de bien‑être.
La souveraineté des données et la confiance constituent un autre axe : les trois plateformes annoncent cloisonnement des données, chiffrement renforcé, et contrôle utilisateur sur les autorisations, mais la traduction juridique de ces engagements reste partielle dans le cadre européen.
ChatGPT Health : usage massif, co‑conception clinique et limites de conformité
ChatGPT Health se déploie comme un espace dédié au sein de ChatGPT, accessible aux abonnés, connecté à Apple Health, Function, MyFitnessPal et au DME b.well pour le marché américain. OpenAI affirme avoir conçu l’outil avec 260 médecins couvrant 60 pays et 60 spécialités, avec des cas d’usage allant de la préparation de consultation au décodage de bilans en passant par l’accompagnement bien‑être.
Sur le plan technique, ChatGPT Health fonctionne dans un environnement isolé, avec la promesse de ne pas utiliser les conversations de santé pour l’entraînement, mais la version grand public n’est pas certifiée HIPAA et ne propose pas de chiffrement de bout‑en‑bout, ce que certains observateurs soulignent comme une limite pour les usages cliniques. En Europe, l’accès aux DME reste désactivé et les conditions de conformité RGPD et AI Act doivent encore être discutées avec les autorités nationales, notamment sur la transparence des traitements et les mécanismes d’audit.
Claude for Healthcare : infrastructure institutionnelle et IA « constitutionnelle »
Claude for Healthcare se positionne comme une offre orientée institutions, avec une infrastructure décrite comme HIPAA‑ready pour les usages enterprise et des intégrations aux systèmes hospitaliers, assureurs et laboratoires pharmaceutiques. Anthropic met en avant son approche d’« IA constitutionnelle », qui encadre le comportement du modèle par un corpus de principes éthiques afin de réduire les réponses cliniquement non sûres.
Les retours d’usage terrain donnent des signaux d’efficacité : Novo Nordisk a réduit la production de rapports d’études cliniques de plusieurs mois à quelques minutes via la plateforme NovoScribe bâtie sur Claude, tandis que Banner Health indique que 85% de ses utilisateurs travaillent plus vite avec une meilleure précision sur une base de plus de 22 000 prestataires. Claude est utilisé pour l’administration hospitalière, la prior authorization, la synthèse de dossiers et le support essais cliniques, avec une orientation vers l’optimisation des processus plutôt que le face‑à‑face patient.
Perplexity Health : moteur de réponse sourcé et architecture multi‑agents
Perplexity Health arrive plus tard, mais avec une proposition axée sur la recherche augmentée et la transparence des sources. La plateforme combine connexion à Apple Health, Fitbit, Withings, Ultrahuman et à des DME couvrant plus de 1,7 million de prestataires, avec un moteur de réponse qui cite systématiquement les sources médicales utilisées en temps réel.
Sur le plan architectural, Perplexity Health s’appuie sur une technologie multi‑agents (Perplexity Computer) capable de coordonner plusieurs modèles pour produire des bilans pré‑consultation en croisant DME, résultats biologiques et données de capteurs, dans une logique d’exhaustivité. Perplexity met en avant un engagement explicite de ne ni revendre ni utiliser les données médicales pour l’entraînement de ses modèles, mais la documentation sur la conformité institutionnelle et les intégrations wearables reste encore limitée hors marché américain.
Gemini / Google : IA grand public et controverses sur la qualité des réponses
Le benchmark des LLM grand public inclut aussi Gemini (Google), même si la documentation dédiée santé est moins structurée que pour les trois autres offres. Les expériences récentes des « AI Overviews » de Google, incluant des réponses erronées sur des sujets médicaux de base, ont alimenté le débat sur la fiabilité des systèmes de recherche augmentée appliqués à la santé.
Ces épisodes rappellent que l’absence de transparence sur les sources et de garde‑fous cliniques peut exposer les utilisateurs à des recommandations inexactes, en particulier lorsque l’IA est intégrée directement au moteur de recherche. Dans ce contexte, la capacité à tracer les sources, à auditer les modèles et à encadrer les cas d’usage devient un critère de différenciation pour les solutions santé spécialisées, face aux déploiements plus généralistes.
Risques d’hallucinations et nécessité de supervision clinique
Toutes les plateformes partagent un risque documenté d’hallucination, y compris dans des contextes médicaux sensibles. Une étude Penn LDI de 2025 montre que les LLM peuvent produire des recommandations cliniques incohérentes, tandis que l’outil Elsa de la FDA, basé sur Claude, a été rapporté comme ayant halluciné des études inexistantes.
Des cas graves ont été décrits, comme des modèles incitant à des pensées suicidaires, ce qui souligne l’importance de garder un professionnel en position de supervision pour toute décision clinique. Les recommandations générales des auteurs convergent : maintenir la responsabilité finale du praticien, limiter les usages à l’aide à la décision, expliciter les limites (hallucinations, biais) auprès des soignants et des patients.
RGPD : données de santé, consentement et détournement de finalité
Dans le cadre européen, les données de santé sont des données sensibles au sens de l’article 9 du RGPD, dont le traitement est en principe interdit sauf exceptions strictement encadrées. Pour des plateformes américaines comme ChatGPT Health, Claude for Healthcare ou Perplexity Health, cela implique un consentement explicite, libre et éclairé, difficile à obtenir dans un contexte d’usage grand public et d’interface conversationnelle.
Le risque de détournement de finalité constitue une autre contrainte : l’article 5.1.b du RGPD interdit de réutiliser des données médicales recueillies à des fins d’assistance pour l’entraînement des modèles sans nouveau consentement, même sous forme anonymisée. Si les trois acteurs affirment ne pas utiliser les données de santé pour l’entraînement, cette promesse contractuelle n’est pas encore assortie de mécanismes de vérification indépendants accessibles aux régulateurs européens.
AI Act et MDR : double conformité et responsabilités
L’AI Act, entré en vigueur en 2024 avec des premières dispositions applicables depuis février 2025, introduit une classification par niveau de risque qui impacte directement ces outils. Pour des usages principalement conversationnels et administratifs, les chatbots sont classés « risque limité », avec une obligation d’informer l’utilisateur qu’il interagit avec une machine.
Dès qu’une IA santé influence une décision médicale, interprétation de résultats, orientation thérapeutique, détection de patterns cliniques, elle peut être requalifiée en système à haut risque au sens de l’article 6, avec des obligations renforcées de gestion des risques, gouvernance des données et documentation technique. La pleine application des dispositions pour les systèmes à haut risque dans la santé est attendue pour mi‑2026, avec des périodes de transition de 6 à 12 mois, ce qui coïncide avec la montée en puissance de ces plateformes.
La convergence entre AI Act et Règlement sur les Dispositifs Médicaux (MDR) crée une double contrainte : l’AI Act impose des exigences sur la qualité des données d’entraînement et la robustesse aux attaques, alors que le MDR couvre la sécurité clinique. Le texte clarifie aussi la répartition des responsabilités : si un hôpital déploie un système à haut risque sans supervision adéquate ou hors des finalités prévues, la responsabilité peut se déplacer vers l’établissement, ce qui concerne directement les directions médicales et celles des systèmes d’informations.
Déploiement en France : frein réglementaire et scénarios de transition
À ce stade, les connexions directes aux DME via ChatGPT Health, Claude for Healthcare et Perplexity Health restent cantonnées au territoire américain, principalement en raison des divergences entre HIPAA et RGPD. Sur le marché français et plus largement européen, les acteurs ne proposent que des versions sans accès DME, dont la conformité doit être examinée par la CNIL et les autorités nationales.
La Commission européenne a annoncé fin 2025 un étalement du calendrier d’application des dispositions AI Act relatives aux systèmes à haut risque, ouvrant une fenêtre de transition sans pour autant alléger les obligations RGPD déjà en vigueur. Pour les établissements français, la mise en œuvre passe par des analyses d’impact relatives à la protection des données (AIPD), des dispositifs d’audit conformes à l’ISO 27789, et la désignation d’un superviseur humain dans la boucle de décision pour tout usage clinique.
Recommandations opérationnelles pour les acteurs de la santé
Les recommandations convergent vers trois axes : formation, interopérabilité et éthique par conception. D’une part, intégrer l’IA dans les cursus initiaux et la formation continue afin de transformer les soignants en opérateurs éclairés de ces outils, capables d’identifier hallucinations et biais, et d’autre part, généraliser les standards d’interopérabilité pour fluidifier l’accès aux données secondaires tout en sécurisant l’hébergement sur des infrastructures souveraines (par exemple SecNumCloud pour le Health Data Hub) afin de réduire les délais d’accès aux données, aujourd’hui évalués à 18 mois en France contre quelques jours aux États‑Unis ou en Asie. Enfin, privilégier des solutions intégrant l’« ethics by design », avec de l’explicabilité, du contrôle humain systématique et une isolation stricte entre données de santé et modèles généralistes, pour concilier performance et exigence réglementaire.