Ce résultat ne me surprend pas du tout. Voici une partie du résumé :

Les LLM Frontier ont surpassé les outils d’IA clinique dans les trois évaluations. Les outils d'IA clinique ont démontré des performances comparables à celles de l'aperçu automatique de l'IA de recherche Google dans le RCQ. Ces résultats mettent en évidence la nécessité d’une évaluation indépendante et réelle des outils d’IA avant qu’ils n’entrent dans les milieux cliniques.

Par Krithik Viswanath, et.al. En passant, ceci (et la version plus générale du point) est l’une des principales raisons pour lesquelles un certain nombre de propositions d’Emergent Ventures sont rejetées assez rapidement.


#Les #modèles #usage #général #pour #les #grands #langages #surpassent #les #outils #d39IA #clinique #spécialisés #sur #les #références #médicales