L’intelligenza artificiale è inaffidabile per la matematica
Recenti scoperte da parte di matematici di fama internazionale hanno dimostrato che le nuove equazioni sviluppate sono superiori a quelle elaborate dai più avanzati modelli di linguaggio di grandi dimensioni (LLM). Questo evidenzia ancora una volta i limiti attuali dell’intelligenza artificiale, che spesso interpreta erroneamente i compiti, portando a risultati imprecisi.
L’Epoch AI Research Institute ha lanciato una nuova suite di test chiamata FrontierMath, che richiede competenze a livello di dottorato. Per la creazione di questi problemi complessi, sono stati coinvolti matematici di spicco, tra cui vincitori della medaglia Fields. La risoluzione di questi problemi può richiedere agli esperti da alcune ore a diversi giorni.
Leggi anche:
Mentre nei precedenti test MMLU l’intelligenza artificiale aveva raggiunto il 98% di successo nella risoluzione di problemi a livello scolastico e universitario, i nuovi problemi si sono rivelati notevolmente più impegnativi. Sono stati testati sei modelli principali di intelligenza artificiale.
I risultati sono stati deludenti: Gemini 1.5 Pro di Google e Claude 3.5 Sonnet di Anthropic hanno risolto solo il 2% dei problemi. I modelli GPT-o1-preview, GPT-o1-mini e GPT-4o di OpenAI hanno ottenuto solo l’1%, mentre Grok-2 Beta di xAI non ha risolto alcun problema. Questo è dovuto al fatto che i compiti sono stati progettati in modo unico e non si trovano nei materiali di addestramento utilizzati per l’intelligenza artificiale.
Inoltre, i ricercatori hanno osservato che, anche quando un modello forniva una risposta corretta, ciò non garantiva necessariamente che il ragionamento sottostante fosse valido. In alcuni casi, le risposte potevano essere ottenute attraverso semplici simulazioni, senza richiedere un’analisi matematica approfondita.
Ti potrebbe interessare:
Segui guruhitech su:
- Google News: bit.ly/gurugooglenews
- Instagram: instagram.com/guruhitech_official
- Telegram: t.me/guruhitech
- Facebook: facebook.com/guruhitechweb
- Twitter: twitter.com/guruhitech1
- Threads: threads.net/@guruhitech_official
- Bluesky: bsky.app/profile/guruhitech.bsky.social
- GETTR: gettr.com/user/guruhitech
- Rumble: rumble.com/user/guruhitech
- VKontakte: vk.com/guruhitech
- MeWe: mewe.com/i/guruhitech
- Skype: live:.cid.d4cf3836b772da8a
- WhatsApp: bit.ly/whatsappguruhitech
Esprimi il tuo parere!
Che ne pensi di questa notizia? Lascia un commento nell’apposita sezione che trovi più in basso e se ti va, iscriviti alla newsletter.
Per qualsiasi domanda, informazione o assistenza nel mondo della tecnologia, puoi inviare una email all’indirizzo [email protected].