Medicina del futuro: GPT-4.1 supera le performance dei medici reali

OpenAI ha lanciato HealthBench, un benchmark rivoluzionario pensato per mettere alla prova la competenza medica dei modelli linguistici di intelligenza artificiale. E i risultati sono sorprendenti: lโultima generazione di GPT ha superato persino i medici umani.
Il test, sviluppato con la collaborazione di 262 medici provenienti da 60 Paesi, ha incluso 5.000 scenari clinici realistici, spaziando su 26 discipline mediche e tradotto in 49 lingue. Le valutazioni si sono concentrate su sette aree mediche e si sono basate su cinque criteri fondamentali, come accuratezza, comunicazione e comprensione del contesto, utilizzando 48.000 parametri clinici validati.

Il verdetto? I nuovi modelli GPT-4.1 e o3 hanno ottenuto punteggi superiori ai medici umani in tutte e cinque le categorie. Solo sei mesi fa, nel settembre 2024, i professionisti riuscivano ancora a migliorare le risposte delle IA. Ma nellโaprile 2025 le nuove versioni si sono dimostrate piรน precise e autonome, segnando una svolta. Il modello o3 ha raggiunto un punteggio di 0,60, contro gli 0,32 del GPT-4o uscito solo pochi mesi prima, superando rivali come Grok 3 e Gemini 2.5.
Leggi anche:
Un altro dato notevole arriva dal modello nano GPT-4.1, che mantiene unโelevata accuratezza pur essendo 25 volte piรน efficiente rispetto alle versioni precedenti, aprendo la strada a strumenti piรน leggeri ma sempre piรน intelligenti.

Va precisato che il benchmark valuta la qualitร della comunicazione medica scritta, e non la pratica clinica vera e propria. Tuttavia, GPT-4.1 ha ridotto sensibilmente gli errori nei casi complessi, dimostrando capacitร che avvicinano sempre di piรน lโIA al supporto reale nelle decisioni mediche.
Lโintero dataset di HealthBench รจ stato rilasciato pubblicamente su GitHub, con lโobiettivo di stimolare lโinnovazione e il confronto aperto nella comunitร scientifica.
Ti potrebbe interessare:
Segui guruhitech su:
- Google News:ย bit.ly/gurugooglenews
- Telegram:ย t.me/guruhitech
- X (Twitter):ย x.com/guruhitech1
- Bluesky: bsky.app/profile/guruhitech.bsky.social
- GETTR: gettr.com/user/guruhitech
- Rumble: rumble.com/user/guruhitech
- VKontakte: vk.com/guruhitech
- MeWe: mewe.com/i/guruhitech
- Skype: live:.cid.d4cf3836b772da8a
- WhatsApp: bit.ly/whatsappguruhitech
Esprimi il tuo parere!
Che ne pensi di questa notizia? Lascia un commento nellโapposita sezione che trovi piรน in basso e se ti va, iscriviti alla newsletter.
Per qualsiasi domanda, informazione o assistenza nel mondo della tecnologia, puoi inviare una email allโindirizzo [email protected].
Scopri di piรน da GuruHiTech
Abbonati per ricevere gli ultimi articoli inviati alla tua e-mail.
