OpenAI Puts AI Agents in Competition to Test the Security of Smart Contracts

OpenAI a lansat un nou benchmark care evaluează cât de bine diferite modele AI detectează, corectează și chiar exploatează vulnerabilitățile de securitate găsite în contractele inteligente cripto.

OpenAI a publicat miercuri lucrarea "EVMbench: Evaluating AI Agents on Smart Contract Security", în colaborare cu firma de investiții cripto Paradigm și firma de securitate cripto OtterSec, pentru a evalua cât de mult ar putea exploata teoretic agenții AI din 120 de vulnerabilități ale contractelor inteligente.

Claude Opus 4.6 de la Anthropic a ieșit pe primul loc cu un "detect award" mediu de 37.824 de dolari, urmat de OC-GPT-5.2 de la OpenAI și Gemini 3 Pro de la Google cu 31.623 de dolari, respectiv 25.112 dolari.

În timp ce agenții AI devin din ce în ce mai eficienți în gestionarea sarcinilor de bază, OpenAI a declarat că devine din ce în ce mai important să se evalueze performanța lor în "medii semnificative din punct de vedere economic".

"Contractele inteligente securizează miliarde de dolari în active, iar agenții AI sunt susceptibili de a fi transformatori atât pentru atacatori, cât și pentru apărători."

"Ne așteptăm ca plățile agentice cu stablecoin să crească și să contribuie la ancorarea acesteia într-un domeniu de importanță practică emergentă", a adăugat OpenAI.

CEO-ul Circle, Jeremy Allaire, a prezis pe 22 ianuarie că miliarde de agenți AI vor efectua tranzacții cu stablecoin pentru plăți zilnice în numele utilizatorilor în următorii cinci ani, în timp ce fostul șef Binance, Changpeng "CZ" Zhao, a sugerat recent că cripto va ajunge să fie "moneda nativă pentru agenții AI".

Nevoia de a testa performanța AI agentică în identificarea vulnerabilităților de securitate vine în contextul în care atacatorii au furat fonduri cripto în valoare de 3,4 miliarde de dolari în 2025, o creștere marginală față de 2024.

EVMbench s-a bazat pe 120 de vulnerabilități selectate din 40 de audituri ale contractelor inteligente, majoritatea provenind din competiții de audit open-source.

OpenAI a declarat că speră că benchmark-ul va ajuta la urmărirea progresului AI în identificarea și atenuarea vulnerabilităților contractelor inteligente la scară largă.

Într-o postare pe X de miercuri, partenerul managing al Dragonfly, Haseeb Qureshi, a declarat că promisiunea cripto de a înlocui drepturile de proprietate și contractele legale nu s-a materializat niciodată, nu pentru că tehnologia a eșuat, ci pentru că nu a fost niciodată concepută pentru intuiția umană.

Qureshi a spus că încă se simte "înfricoșător" să semnezi tranzacții mari, în special cu portofelele de drenare și alte amenințări întotdeauna prezente, în timp ce transferurile bancare rareori provoacă aceeași frică.

În schimb, Qureshi crede că viitorul tranzacțiilor cripto va fi facilitat de portofele autonome, intermediate de AI, care se vor ocupa de aceste amenințări și vor gestiona operațiuni complexe în numele utilizatorilor: "O tehnologie se fixează adesea odată ce complementul său ajunge în cele din urmă. GPS a trebuit să aștepte smartphone-ul, TCP/IP a trebuit să aștepte browser-ul. Pentru cripto, s-ar putea să-l fi găsit în agenții AI."

OpenAI pune agenți AI să concureze pentru a testa securitatea contractelor inteligente

Criptomonede

Bitcoin înregistrează cea mai lungă serie de pierderi din 2022, pe fondul tensiunilor geopolitice

WLFI crește cu 10% după acordul Apex stablecoin, depășind BTC și ETH

Recapitulare LONGITUDE: Planul Bitcoin în 2 pași pentru era cuantică și politica cripto din SUA

Hanwha din Coreea de Sud investește 13 milioane USD în portofele cripto 'seedless'

Datele privind Contractele Futures Solana Arată Taurii Panicați: Va Rezista SOL la 80 de Dolari?