nof1, una plataforma d’investigació d’intel·ligència artificial (IA) centrada en els mercats financers, va llançar el 18 d’octubre una prova de comerç de gran model d’aprenentatge d’idiomes (LLM) anomenada Alpha Arena.
La prova va comptar amb sis models d’IA convencionals (GPT-5, Gemini 2.5 Pro, Grok-4, Claude Sonnet 4.5, DeepSeek V3.1 i Qwen3 Max) que utilitzaven 10.000 dòlars en fons reals cadascun a l’intercanvi criptogràfic Hyperliquid, amb indicacions i dades d’entrada idèntiques. a
Al final de l’experiment, DeepSeek i Grok havien obtingut rendiments de més del 14%, situant-se entre els dos primers. A l’altre extrem de l’espectre, Gemini 2.5 Pro havia perdut un 42,57%.

Prova comercial Alpha Arena AI
A diferència de les proves posteriors simulades o el comerç de paper, Alpha Arena va funcionar de manera totalment autònoma i en temps real, mesurant els guanys i pèrdues bruts (P&L) de cada model.
Tots els “concursants” van comerciar amb alguns dels actius més populars, inclosos Bitcoin (BTC), Ethereum (ETH) i XRP. Les indicacions uniformes van assegurar que tots els models partien de la mateixa línia de base, biaix basat en instruccions.
Els primers líders, DeepSeek i Grok, van prendre posicions llargues agressives i van aprofitar la recuperació del mercat en curs. En canvi, ChatGPT i Gemini, que barrejaven posicions llargues i curtes, van tenir un rendiment inferior.
En general, l’Alpha Arena representa la primera prova pública a gran escala de si els sistemes d’IA poden interpretar i reaccionar realment als mercats financers vius. Una observació notable va ser que durant els forts canvis de preu de Bitcoin, diversos models van identificar i actuar amb èxit en oportunitats de rebot a curt termini.
Així, l’experiment ofereix informació valuosa sobre com els grans models lingüístics gestionen entorns financers d’alta incertesa. Tanmateix, cal assenyalar que una cartera de 10.000 dòlars i una finestra de 48 hores no poden demostrar completament el rendiment a llarg termini.
De la mateixa manera, els models no estaven realment exposats a escenaris de mercat extrems, deixant sense provar la seva capacitat de resposta a la crisi. Tot i així, els resultats han donat molt a pensar als desenvolupadors sobre com les eines d’IA poden millorar l’eficiència comercial i abordar problemes de supervisió humana.
Imatge destacada a través de Shutterstock
