IA : les LLM les plus confiants sont aussi ceux qui se trompent le plus sur les tâches difficiles
Publié le mardi 02 juin 2026 à 11h59
Recherche IAUn preprint de l’USC et de l’UC Berkeley montre que GPT-4o, ChatGPT et GPT-o3 surestiment davantage leurs performances lorsque les tâches deviennent plus complexes. Ce biais de calibration soulève des questions pour la supervision humaine prévue par l’AI Act européen.