Quantcast
News

Gioco al rialzo: l’IA statunitense sorpassa la cinese DeepSeek V3

Condividi l'articolo

AI2 (Allen Institute for Artificial Intelligence), un istituto di ricerca no-profit con sede a Seattle, ha lanciato Tulu 3 405B, un innovativo modello di intelligenza artificiale che promette di rivoluzionare il panorama dell’AI. Secondo i ricercatori, questo modello ha superato in prestazioni alcuni dei più avanzati sistemi attualmente disponibili, tra cui DeepSeek V3, GPT-4o di OpenAI e Llama 3.1 405B.

Prestazioni record nei benchmark

Tulu 3 405B si è distinto in una serie di test di valutazione. Nel benchmark PopQA, che comprende 14.000 domande basate su conoscenze tratte da Wikipedia, il modello ha ottenuto risultati superiori rispetto ai suoi concorrenti. Inoltre, nel test GSM8K, che valuta la capacità di risolvere problemi matematici di livello elementare, Tulu 3 405B ha dimostrato di essere il modello più performante nella sua categoria.

Secondo i test interni condotti da AI2, Tulu 3 405B supera anche GPT-4o di OpenAI in alcune metriche specifiche, pur essendo completamente open source. Questo aspetto lo rende accessibile a ricercatori e sviluppatori di tutto il mondo, promuovendo la trasparenza e la collaborazione nel campo dell’intelligenza artificiale.

Leggi anche:

Architettura e tecnologia avanzata

Con 405 miliardi di parametri, Tulu 3 405B è uno dei modelli di AI più complessi mai realizzati. Per il suo addestramento sono state impiegate 256 GPU in esecuzione parallela, un’operazione che richiede risorse computazionali significative.

Una delle caratteristiche distintive del modello è l’utilizzo della tecnologia RLVR (Reinforcement Learning with Verifiable Rewards, ovvero apprendimento per rinforzo con ricompense verificabili). Questa metodologia consente al sistema di essere addestrato su compiti con risultati oggettivamente misurabili, come la risoluzione di problemi matematici o il rispetto preciso di istruzioni complesse.

Accessibilità e collaborazione

AI2 ha reso Tulu 3 405B disponibile per il testing pubblico attraverso la propria app web, mentre il codice di addestramento è accessibile su piattaforme come GitHub e Hugging Face. Questo approccio open source non solo favorisce la diffusione della tecnologia, ma permette anche alla comunità globale di contribuire al suo miglioramento e sviluppo.

Con Tulu 3 405B, AI2 conferma il suo impegno nel promuovere un’intelligenza artificiale avanzata, trasparente e accessibile, ponendosi come un punto di riferimento nel settore della ricerca AI no-profit.

Fonte

Ti potrebbe interessare:
Segui guruhitech su:

Esprimi il tuo parere!

Che ne pensi di questa notizia? Lascia un commento nell’apposita sezione che trovi più in basso e se ti va, iscriviti alla newsletter.

Per qualsiasi domanda, informazione o assistenza nel mondo della tecnologia, puoi inviare una email all’indirizzo guruhitech@yahoo.com.


Scopri di più da GuruHiTech

Abbonati per ricevere gli ultimi articoli inviati alla tua e-mail.

0 0 votes
Article Rating
Subscribe
Notificami
guest


0 Commenti
Newest
Oldest Most Voted
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x