Quantcast
News

Un chatbot batte gli umani nei test di intelligenza

Condividi l'articolo

Un recente studio condotto da Maximum Truth ha confrontato dodici chatbot basati su modelli linguistici avanzati. I risultati hanno dimostrato che, nonostante ChatGPT non sia il più intelligente tra i partecipanti, il chatbot leader ha superato la media delle capacità umane in termini di QI.

Per valutare le capacità dei chatbot, i ricercatori hanno utilizzato il test del QI del Mensa norvegese, che consiste in 35 domande, alcune delle quali accompagnate da illustrazioni. Inizialmente, nessuno dei chatbot è riuscito a superare il test a causa della difficoltà nel comprendere correttamente le immagini. Tuttavia, quando è stato richiesto loro di affrontare il test “come se fossero una persona cieca ma intelligente”, sono stati in grado di completare con successo le domande.

Leggi anche:

Secondo i risultati ottenuti, ChatGPT-4 si è classificato al secondo posto con 85 punti, rispondendo correttamente a 13 domande su 35. Il modello AI Claude-3 è stato il leader della classifica con un punteggio di 101 punti, leggermente superiore alla media umana. Il giornalista stesso ha ottenuto solo 85 punti in un test simile.

Il terzo posto è stato occupato dalla versione precedente di Claude con 82 punti. Al quarto posto si è posizionato il chatbot Microsoft Copilot con 79 punti, seguito dalla versione base di Google Gemini con 77,5 punti, mentre la versione avanzata di Gemini ha ottenuto solo 76 punti. Grok, il chatbot sviluppato da Elon Musk, si è classificato solo al settimo posto nella classifica.

Fonte

Ti potrebbe interessare:
Segui guruhitech su:

Esprimi il tuo parere!

Ti è piaciuta questa notizia? Lascia un commento nell’apposita sezione che trovi più in basso e se ti va, iscriviti alla newsletter.

Per qualsiasi domanda, informazione o assistenza nel mondo della tecnologia, puoi inviare una email all’indirizzo [email protected].

+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
0 0 votes
Article Rating

Rispondi

0 Commenti
Newest
Oldest Most Voted
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
kk miner