Cash News Logo

OpenAI pune agenți AI să concureze pentru a testa securitatea contractelor inteligente

Criptomonede19 februarie 2026, 03:20
OpenAI pune agenți AI să concureze pentru a testa securitatea contractelor inteligente

OpenAI a lansat un nou benchmark care evaluează cât de bine diferite modele AI detectează, corectează și chiar exploatează vulnerabilitățile de securitate găsite în contractele inteligente cripto.

OpenAI a publicat miercuri lucrarea "EVMbench: Evaluating AI Agents on Smart Contract Security", în colaborare cu firma de investiții cripto Paradigm și firma de securitate cripto OtterSec, pentru a evalua cât de mult ar putea exploata teoretic agenții AI din 120 de vulnerabilități ale contractelor inteligente.

Claude Opus 4.6 de la Anthropic a ieșit pe primul loc cu un "detect award" mediu de 37.824 de dolari, urmat de OC-GPT-5.2 de la OpenAI și Gemini 3 Pro de la Google cu 31.623 de dolari, respectiv 25.112 dolari.

În timp ce agenții AI devin din ce în ce mai eficienți în gestionarea sarcinilor de bază, OpenAI a declarat că devine din ce în ce mai important să se evalueze performanța lor în "medii semnificative din punct de vedere economic".

"Contractele inteligente securizează miliarde de dolari în active, iar agenții AI sunt susceptibili de a fi transformatori atât pentru atacatori, cât și pentru apărători."

"Ne așteptăm ca plățile agentice cu stablecoin să crească și să contribuie la ancorarea acesteia într-un domeniu de importanță practică emergentă", a adăugat OpenAI.

CEO-ul Circle, Jeremy Allaire, a prezis pe 22 ianuarie că miliarde de agenți AI vor efectua tranzacții cu stablecoin pentru plăți zilnice în numele utilizatorilor în următorii cinci ani, în timp ce fostul șef Binance, Changpeng "CZ" Zhao, a sugerat recent că cripto va ajunge să fie "moneda nativă pentru agenții AI".

Nevoia de a testa performanța AI agentică în identificarea vulnerabilităților de securitate vine în contextul în care atacatorii au furat fonduri cripto în valoare de 3,4 miliarde de dolari în 2025, o creștere marginală față de 2024.

EVMbench s-a bazat pe 120 de vulnerabilități selectate din 40 de audituri ale contractelor inteligente, majoritatea provenind din competiții de audit open-source.

OpenAI a declarat că speră că benchmark-ul va ajuta la urmărirea progresului AI în identificarea și atenuarea vulnerabilităților contractelor inteligente la scară largă.

Într-o postare pe X de miercuri, partenerul managing al Dragonfly, Haseeb Qureshi, a declarat că promisiunea cripto de a înlocui drepturile de proprietate și contractele legale nu s-a materializat niciodată, nu pentru că tehnologia a eșuat, ci pentru că nu a fost niciodată concepută pentru intuiția umană.

Qureshi a spus că încă se simte "înfricoșător" să semnezi tranzacții mari, în special cu portofelele de drenare și alte amenințări întotdeauna prezente, în timp ce transferurile bancare rareori provoacă aceeași frică.

În schimb, Qureshi crede că viitorul tranzacțiilor cripto va fi facilitat de portofele autonome, intermediate de AI, care se vor ocupa de aceste amenințări și vor gestiona operațiuni complexe în numele utilizatorilor: "O tehnologie se fixează adesea odată ce complementul său ajunge în cele din urmă. GPS a trebuit să aștepte smartphone-ul, TCP/IP a trebuit să aștepte browser-ul. Pentru cripto, s-ar putea să-l fi găsit în agenții AI."