-
Els diferents models d’IA van violar el 51% dels contractes exposats.
-
En un entorn simulat, van utilitzar contractes reals de xarxes com Ethereum i BNB Chain.
La intersecció entre la intel·ligència artificial (IA) i les criptomonedes s’està expandint significativament.
Per exemple, CriptoNoticias va informar a l’octubre d’un projecte en què agents d’IA es van posar a comerciar bitcoins (BTC) i criptomonedes.
En aquest cas, un nou experiment publicat l’1 de desembre per Anthropic, l’empresa que va crear el model Claude, va demostrar que un agent d’IA era capaç de fer molt més que analitzar dades.
Els investigadors antròpics ho van revelar Els algorismes d’IA van poder explotar les vulnerabilitats dels contractes intel·ligents l’escala.
Mitjançant la prova de 405 contractes reals, desplegats entre el 2020 i el 2025 en xarxes com Ethereum, BNB Chain i Base, Els models generats guions dispositius d’atac funcionals per a 207 d’ellsque representa un 51,1% d'”èxit”.
En executar aquests atacs en un entorn controlat que replicava les condicions de la xarxa cridades SCONE-bancles Les pèrdues simulades van ascendir a uns 550 milions de dòlars.
La troballa posa de manifest una amenaça per a les plataformes descentralitzades (DeFi) i els contractes intel·ligents, i planteja la necessitat de incorporar defenses automatitzades.
Detalls de l’experiment amb IA i xarxes de criptomoneda
La metodologia experimental incorporava models d’IA, com ara Claude Opus 4.5 i GPT-5, i van ser encarregats de generar explotacions (codis que exploten una vulnerabilitat) dins de contenidors aïllats (Docker), utilitzant un límit de temps de 60 minuts per intent.
A més de provar contractes piratejats històricament, es van incloure nous contractes sense defectes coneguts per buscar vulnerabilitats “dia zero” (desconegut).
El gràfic següent il·lustra la millora vertiginosa de l’eficàcia dels models més avançats. Traça el benefici total simulat (a escala logarítmica) que cada model principal va poder generar aprofitant totes les vulnerabilitats de la suite de proves utilitzada per avaluar el rendiment dels diferents models d’IA.
Aquesta imatge mostra una tendència exponencial: models més recents, com ara GPT-5 i Claude Opus 4.5, van aconseguir centenars de milions de dòlars en beneficis simulats, molt per sobre dels models anteriors com el GPT-4o.
A més, l’experiment va comprovar que aquests “ingressos” potencials es duplica aproximadament cada 0,8 mesossubratllant el ritme accelerat de progrés en les capacitats ofensives.
D’altra banda, un segon gràfic detalla el rendiment en un subconjunt més desafiant: les vulnerabilitats descobertes el 2025.
Aquí, la mètrica anomenada “Pass@N” mesura l’èxit en la generació de múltiples intents de passada. explotar (N intents) per contracte. Descriu com els ingressos simulats totals creixen de manera constant a mesura que es permeten més intents (de Pass@1 a Pass@8), arribant als 4,6 milions de dòlars.
El segon gràfic ho confirma Claude Opus 4.5 va ser el model més eficaç en aquest entorn controlataconseguint la major part d’aquests beneficis.
Finalment, l’estudi indica que la probabilitat d’explotació no es correlaciona amb la complexitat del codi, sinó amb l’import dels fons demanats pel contracte. Els models tendeixen a centrar-se i trobar atacs més fàcilment en contractes amb un valor bloquejat més alt.
