Medicina del futuro: GPT-4.1 supera le performance dei medici reali

OpenAI ha lanciato HealthBench, un benchmark rivoluzionario pensato per mettere alla prova la competenza medica dei modelli linguistici di intelligenza artificiale. E i risultati sono sorprendenti: l’ultima generazione di GPT ha superato persino i medici umani.
Il test, sviluppato con la collaborazione di 262 medici provenienti da 60 Paesi, ha incluso 5.000 scenari clinici realistici, spaziando su 26 discipline mediche e tradotto in 49 lingue. Le valutazioni si sono concentrate su sette aree mediche e si sono basate su cinque criteri fondamentali, come accuratezza, comunicazione e comprensione del contesto, utilizzando 48.000 parametri clinici validati.

Il verdetto? I nuovi modelli GPT-4.1 e o3 hanno ottenuto punteggi superiori ai medici umani in tutte e cinque le categorie. Solo sei mesi fa, nel settembre 2024, i professionisti riuscivano ancora a migliorare le risposte delle IA. Ma nell’aprile 2025 le nuove versioni si sono dimostrate più precise e autonome, segnando una svolta. Il modello o3 ha raggiunto un punteggio di 0,60, contro gli 0,32 del GPT-4o uscito solo pochi mesi prima, superando rivali come Grok 3 e Gemini 2.5.
Leggi anche:
Un altro dato notevole arriva dal modello nano GPT-4.1, che mantiene un’elevata accuratezza pur essendo 25 volte più efficiente rispetto alle versioni precedenti, aprendo la strada a strumenti più leggeri ma sempre più intelligenti.

Va precisato che il benchmark valuta la qualità della comunicazione medica scritta, e non la pratica clinica vera e propria. Tuttavia, GPT-4.1 ha ridotto sensibilmente gli errori nei casi complessi, dimostrando capacità che avvicinano sempre di più l’IA al supporto reale nelle decisioni mediche.
L’intero dataset di HealthBench è stato rilasciato pubblicamente su GitHub, con l’obiettivo di stimolare l’innovazione e il confronto aperto nella comunità scientifica.
Ti potrebbe interessare:
Segui guruhitech su:
- Google News: bit.ly/gurugooglenews
- Telegram: t.me/guruhitech
- X (Twitter): x.com/guruhitech1
- Bluesky: bsky.app/profile/guruhitech.bsky.social
- GETTR: gettr.com/user/guruhitech
- Rumble: rumble.com/user/guruhitech
- VKontakte: vk.com/guruhitech
- MeWe: mewe.com/i/guruhitech
- Skype: live:.cid.d4cf3836b772da8a
- WhatsApp: bit.ly/whatsappguruhitech
Esprimi il tuo parere!
Che ne pensi di questa notizia? Lascia un commento nell’apposita sezione che trovi più in basso e se ti va, iscriviti alla newsletter.
Per qualsiasi domanda, informazione o assistenza nel mondo della tecnologia, puoi inviare una email all’indirizzo guruhitech@yahoo.com.
Scopri di più da GuruHiTech
Abbonati per ricevere gli ultimi articoli inviati alla tua e-mail.