Etude : l’évaluation humaine des LLM manque de fiabilité (Nature Digital Medicine)

Publié le vendredi 25 octobre 2024 à 17h08

Recherche GEN AI

Des chercheurs américains de l’université de Pittsburgh ont passé en revue 142 études afin de mesurer la pertinence des méthodes d’évaluation humaine des grands modèles de langage (LLM). Leurs résultats*, publiés dans Nature Digital Medicine, mettent en évidence de vraies lacunes. Les évaluations apparaissent incohérentes et peu fiables, ce qui pourrait compromettre la sécurité des patients.

Accès réservé aux abonnés

Ce contenu est uniquement accessible sur abonnement.

Vous êtes déjà abonné, cliquer ici pour vous connecter, ou bien découvrez ci-dessous les avantages de nos offres.

Nos offres

Découvrez notre sélection complète de produits et services pour répondre aux besoins de votre entreprise, avec des solutions innovantes et des tarifs compétitifs.

M’abonner à Health&Tech Intelligence

3 offres disponibles

Découvrez nos offres

Essentiel, premium et sur mesure

Etre mis en relation avec un expert

Votre question est traitée sous 36h ouvrées,2 offres disponibles.

M’inscrire à une conférence

6 rendez-vous thématiques et exclusifs, voir le calendrier détaillé.

Etude : l’évaluation humaine des LLM manque de fiabilité (Nature Digital Medicine)

Publié le 25/10/2024

Derniers membres

timote inscrit il y a 2 semaines et 6 jours

Jennifer inscrit il y a 1 mois et 3 semaines

morgane inscrit il y a 2 mois et 1 semaine

Benjamin inscrit il y a 2 mois et 3 semaines

François inscrit il y a 3 mois et 1 semaine

Charles inscrit il y a 3 mois et 1 semaine

Aicha inscrit il y a 4 mois et 1 semaine

Nozha inscrit il y a 5 mois et 2 semaines

Tous les membres

Ils nous font confiance

Jean François Pomerol
CEO

« Tribun Health est l’un des leaders en matière de solutions de pathologie numérique pour les établissements de santé publics et privés et l’environnement / organisations pharmaceutiques. Le décryptage de l’actualité numérique santé au sein de l’écosystème est un relais majeur pour comprendre, accompagner et développer nos activités tant au niveau institutionnel qu’au niveau des établissements (réseau des DG / DSI / CME

Dr Charlotte Garret
Directrice Médicale

« L'hebdo Health&Tech est un excellent support d'informations en termes d'actualités dans le domaine de la santé numérique, de l'IA, de la veille réglementaire... L'hebdo s'intéresse aux actualités françaises mais aussi internationales, ce qui permet d'avoir une vision globale des innovations en santé dans les domaines du digital et du numérique. Cela nous permet, au sein du LAB innovation chez Santéclair, d'être toujours informés des nouveaux acteurs du marché et des actualités dans ce domaine en perpétuel évolution ».

Aurélien Pécoul
Acting Director & open innovation manager

« En tant qu'acteur clé de l'industrie pharmaceutique, nous avons eu le privilège de collaborer avec Care Insight pour nos besoins en veille stratégique et en conseil dans le domaine de la santé numérique. Leur expertise, leur engagement et leur intégration au sein de l'écosystème de la santé numérique sont des atouts essentiels pour nous permettre d'accéder à une information de qualité. Leur capacité à fournir des panoramas détaillés, des benchmarks précis des solutions numériques et à définir des axes d'opportunités nous permet de mieux comprendre le paysage numérique de la santé en constante évolution et de formuler des stratégies de développement pertinentes. »

Arnaud Houette
CEO

« Extens est en France l’un des fonds majeurs d'investissement dédié aux éditeurs de logiciels de santé. A ce titre, Care Insight nous permet, par le service de veille HealthTech Intelligence, de comprendre les segments en évolution et accompagner nos stratégies d’investissement ciblées. Une très bonne source d’information fiable et pertinente ».

Pascal Dussert
Directeur Europe sale

“Care Insight est fédérateur d’innovations permettant d’accélérer l’émergence de projets d’envergure en s’appuyant sur son vaste réseau d’experts cliniques, institutionnels et industriels »