IA : les LLM les plus confiants sont aussi ceux qui se trompent le plus sur les tâches difficiles

Publié le mardi 02 juin 2026 à 11h59

IA Recherche

Un preprint de l’USC et de l’UC Berkeley montre que GPT-4o, ChatGPT et GPT-o3 surestiment davantage leurs performances lorsque les tâches deviennent plus complexes. Ce biais de calibration soulève des questions pour la supervision humaine prévue par l’AI Act européen.

Accès réservé aux abonnés

Ce contenu est uniquement accessible sur abonnement.

Vous êtes déjà abonné, cliquer ici pour vous connecter, ou bien découvrez ci-dessous les avantages de nos offres.

Nos offres

Découvrez notre sélection complète de produits et services pour répondre aux besoins de votre entreprise, avec des solutions innovantes et des tarifs compétitifs.

M’abonner à Health&Tech Intelligence

3 offres disponibles

Découvrez nos offres

Essentiel, premium et sur mesure

Etre mis en relation avec un expert

Votre question est traitée sous 36h ouvrées,2 offres disponibles.

M’inscrire à une conférence

6 rendez-vous thématiques et exclusifs, voir le calendrier détaillé.

IA : les LLM les plus confiants sont aussi ceux qui se trompent le plus sur les tâches difficiles

Publié le 02/06/2026

Derniers membres

Bernard inscrit il y a 3 semaines et 4 jours

Clélie inscrit il y a 3 semaines et 4 jours

Luna inscrit il y a 2 mois

Sixte inscrit il y a 2 mois et 3 semaines

Adam inscrit il y a 4 mois et 1 semaine

Julien inscrit il y a 4 mois et 2 semaines

Matthieu inscrit il y a 4 mois et 3 semaines

Welha inscrit il y a 5 mois et 3 semaines

Tous les membres

Ils nous font confiance

Jean François Pomerol
CEO

« Tribun Health est l’un des leaders en matière de solutions de pathologie numérique pour les établissements de santé publics et privés et l’environnement / organisations pharmaceutiques. Le décryptage de l’actualité numérique santé au sein de l’écosystème est un relais majeur pour comprendre, accompagner et développer nos activités tant au niveau institutionnel qu’au niveau des établissements (réseau des DG / DSI / CME

Dr Charlotte Garret
Directrice Médicale

« L'hebdo Health&Tech est un excellent support d'informations en termes d'actualités dans le domaine de la santé numérique, de l'IA, de la veille réglementaire... L'hebdo s'intéresse aux actualités françaises mais aussi internationales, ce qui permet d'avoir une vision globale des innovations en santé dans les domaines du digital et du numérique. Cela nous permet, au sein du LAB innovation chez Santéclair, d'être toujours informés des nouveaux acteurs du marché et des actualités dans ce domaine en perpétuel évolution ».

Aurélien Pécoul
Acting Director & open innovation manager

« En tant qu'acteur clé de l'industrie pharmaceutique, nous avons eu le privilège de collaborer avec Care Insight pour nos besoins en veille stratégique et en conseil dans le domaine de la santé numérique. Leur expertise, leur engagement et leur intégration au sein de l'écosystème de la santé numérique sont des atouts essentiels pour nous permettre d'accéder à une information de qualité. Leur capacité à fournir des panoramas détaillés, des benchmarks précis des solutions numériques et à définir des axes d'opportunités nous permet de mieux comprendre le paysage numérique de la santé en constante évolution et de formuler des stratégies de développement pertinentes. »

Arnaud Houette
CEO

« Extens est en France l’un des fonds majeurs d'investissement dédié aux éditeurs de logiciels de santé. A ce titre, Care Insight nous permet, par le service de veille HealthTech Intelligence, de comprendre les segments en évolution et accompagner nos stratégies d’investissement ciblées. Une très bonne source d’information fiable et pertinente ».

Pascal Dussert
Directeur Europe sale

“Care Insight est fédérateur d’innovations permettant d’accélérer l’émergence de projets d’envergure en s’appuyant sur son vaste réseau d’experts cliniques, institutionnels et industriels »