Anthropic anunță că va dezactiva două modele AI lansate recent, Claude Fable 5 și Mythos 5, pentru a se conforma unei directive de control al exporturilor primite vineri după-amiază de la guvernul Statelor Unite, invocând motive de securitate națională. Acest incident fără precedent marchează un nou punct de tensiune între Anthropic și administrația americană.
Deși compania afirmă că ordinul cerea suspendarea accesului "oricărui cetățean străin, fie în interiorul, fie în afara Statelor Unite, inclusiv angajații străini ai Anthropic", aceasta a eliminat accesul pentru toți clienții săi pentru a asigura conformitatea. Mai devreme anul acesta, Departamentul Apărării al administrației Trump a etichetat Anthropic drept "risc pentru lanțul de aprovizionare", după ce producătorul Claude a încercat să stabilească linii roșii privind modul în care armata SUA ar putea utiliza tehnologia sa. Această desemnare a interzis efectiv agențiilor guvernamentale și contractanților să folosească tehnologia Anthropic. Compania a răspuns prin intentarea de procese împotriva administrației Trump.
Marți, Anthropic a lansat public Claude Fable 5, o versiune a modelului AI Mythos al companiei, dotată cu mecanisme de siguranță care o împiedică să răspundă la întrebări despre securitate cibernetică, biologie și chimie. Înainte de lansarea publică, pe care Anthropic a declarat că a realizat-o în colaborare cu guvernul SUA, modelul AI Mythos Preview a avut o implementare limitată în aprilie. Scopul era de a oferi companiilor și organizațiilor oportunitatea de a-și utiliza capabilitățile puternice de securitate cibernetică pentru a-și îmbunătăți apărările și a diminua temerile că tehnologia ar putea fi exploatată de actori rău intenționați pentru a dezvolta instrumente de hacking puternice.
Într-o postare pe blog de vineri, Anthropic menționează că a primit o scrisoare de la guvernul SUA la ora 17:21 ET. "Scrisoarea nu a oferit detalii specifice despre preocuparea de securitate națională", a scris Anthropic. "Înțelegerea noastră este că guvernul consideră că a descoperit o metodă de ocolire sau de "jailbreaking" a Fable 5", a adăugat compania. "Am revizuit o demonstrație a acestei tehnici specifice utilizată pentru a identifica un număr mic de vulnerabilități cunoscute anterior și minore. Toate aceste vulnerabilități par relativ simple și am constatat că și alte modele disponibile public le pot descoperi fără a necesita ocolire."
În postarea de pe blog, compania a argumentat că a implementat mecanisme de siguranță puternice pentru a reduce probabilitatea utilizării abuzive a Claude Fable 5. Anthropic a susținut, de asemenea, că jailbreak-ul descoperit de guvernul SUA pentru Claude Fable 5 a fost îngust și nu ar fi făcut un atacator semnificativ mai periculos decât ar fi fost cu un alt model AI. "Până în prezent, guvernul ne-a oferit doar dovezi verbale despre un potențial jailbreak îngust, non-universal, care constă, în esență, în a cere modelului să citească un anumit codebase și să corecteze eventuale defecte software", a declarat compania în postarea de pe blog. "Înțelegerea noastră este că un potențial jailbreak a fost împărtășit cu guvernul."
Directorul executiv al Anthropic, Dario Amodei, a declarat într-un eseu despre politici la începutul acestei săptămâni că el și compania susțin un proces guvernamental corect, structurat și transparent care ar bloca lansarea de modele AI nesigure. În postarea pe blog de vineri, Anthropic a argumentat că "această acțiune nu respectă aceste principii."

