Anthropic Collaborates with Rivals to Protect Artificial Intelligence Systems from Hackers

Anthropic Colaborează cu Rivalii Pentru a Proteja Sistemele de Inteligență Artificială de Hackeri

Laboratorul de inteligență artificială reunește Apple, Google și peste 45 de alte organizații în cadrul Proiectului Glasswing. Aceștia vor folosi noul model Claude Mythos Preview pentru a testa capacitățile avansate ale AI în domeniul securității cibernetice.

În urma dezvăluirilor de la sfârșitul lunii martie conform cărora Anthropic a dezvoltat un nou model Claude puternic, compania a anunțat oficial marți Mythos Preview, alături de vestea unui consorțiu industrial pe care l-a convocat, cunoscut sub numele de Proiectul Glasswing, pentru a aborda implicațiile de securitate cibernetică ale noului model și ale capacităților avansate în general în domeniul AI. Grupul include Microsoft, Apple și Google, precum și Amazon Web Services, Linux Foundation, Cisco, Nvidia, Broadcom și peste 40 de alte organizații tehnologice, de securitate cibernetică, de infrastructură critică și financiare care vor avea acces privat la model, care nu este încă lansat publicului larg.

Ideea, în parte, este pur și simplu de a oferi dezvoltatorilor platformelor tehnologice fundamentale ale lumii timp să utilizeze Mythos Preview pe propriile sisteme, astfel încât să poată atenua vulnerabilitățile și lanțurile de exploatare pe care modelul le dezvoltă în atacuri simulate. Mai larg, Anthropic subliniază că scopul convocării acestei inițiative este de a demara o explorare urgentă a modului în care capacitățile AI din întreaga industrie sunt pe punctul, spune compania, de a răsturna practicile actuale de securitate software și de apărare digitală din întreaga lume.

„Mesajul real este că nu este vorba despre model sau despre Anthropic”, spune Logan Graham, liderul echipei de securitate frontieră a companiei, pentru WIRED. „Trebuie să ne pregătim acum pentru o lume în care aceste capacități vor fi disponibile pe scară largă în 6, 12, 24 de luni. Multe lucruri ar fi diferite în ceea ce privește securitatea. Multe dintre ipotezele pe care am construit paradigmele moderne de securitate s-ar putea prăbuși.”

Modelele dezvoltate și antrenate de mai multe companii au fost din ce în ce mai capabile să găsească vulnerabilități în cod și să propună măsuri de atenuare - sau strategii de exploatare. Aceasta creează o nouă generație a clasicului joc de-a șoarecele și pisica din domeniul securității, în care un instrument poate ajuta apărătorii, dar poate, de asemenea, alimenta actorii rău intenționați și poate face mai ușoară efectuarea unor atacuri care odată erau prea costisitoare sau complexe pentru a fi practice.

„Claude Mythos preview este un salt deosebit de mare”, a declarat marți CEO-ul Anthropic, Dario Amodei, într-un videoclip de lansare a Proiectului Glasswing. „Nu l-am antrenat în mod specific pentru a fi bun la cibernetică. L-am antrenat să fie bun la cod, dar ca un efect secundar al faptului că este bun la cod, este bun și la cibernetică.” El adaugă în videoclip că „modele mai puternice vor veni de la noi și de la alții. Și, prin urmare, avem nevoie de un plan pentru a răspunde la acest lucru.”

Graham de la Anthropic notează că, pe lângă descoperirea vulnerabilităților - inclusiv producerea de lanțuri potențiale de atac și dovezi de concept - Mythos Preview este capabil de dezvoltare de exploit mai avansată, testare de penetrare, evaluare a securității endpointurilor, căutarea de configurații greșite ale sistemului și evaluarea binarilor software fără acces la codul său sursă.

În efectuarea unei lansări eșalonate a Mythos Preview, începând cu o fază de colaborare industrială, Graham spune că Anthropic a încercat să se bazeze pe principiile dezvăluirii coordonate a vulnerabilităților, procesul de a oferi dezvoltatorilor timp pentru a corecta o eroare înainte ca aceasta să fie discutată public.

„Am văzut Mythos Preview realizând lucruri pe care un cercetător senior în domeniul securității ar fi capabil să le realizeze”, spune Graham. „Acest lucru are implicații foarte mari pentru modul în care ar trebui lansate capacități ca aceasta. Făcută fără atenție, aceasta ar putea fi un accelerator semnificativ pentru atacatori.”

Partenerii Proiectului Glasswing, inclusiv unii dintre concurenții Anthropic, au adoptat un ton colaborativ în declarațiile făcute ca parte a lansării. „Google este încântat să vadă această inițiativă inter-industrială de securitate cibernetică adunându-se”, spune Heather Adkins, vicepreședintele Google pentru ingineria securității, într-o declarație. „Am crezut întotdeauna că AI prezintă noi provocări și deschide noi oportunități în domeniul apărării cibernetice.”

Cei care mențin componente ale infrastructurii internetului și firmele care dezvoltă platforme tehnologice fundamentale par, de asemenea, entuziasmați de colaborare, mai ales având în vedere că Anthropic spune că utilizarea Mythos Preview a început deja să descopere mii de vulnerabilități critice, inclusiv unele erori vechi de zeci de ani care au fost ratate sau trecute cu vederea în mod repetat chiar și în codul cel mai analizat.

„Pe măsură ce intrăm într-o fază în care securitatea cibernetică nu mai este legată doar de capacitatea umană, oportunitatea de a utiliza AI în mod responsabil pentru a îmbunătăți securitatea și a reduce riscul la scară este fără precedent”, spune directorul global de securitate al Microsoft, Igor Tsyganskiy, într-o declarație. „Alăturarea la Proiectul Glasswing, cu acces la Claude Mythos Preview, ne permite să identificăm și să atenuăm riscul timpuriu și să ne augmentăm soluțiile de securitate și dezvoltare, astfel încât să putem proteja mai bine clienții și Microsoft.”

Graham spune că echipa sa de la Anthropic, un grup de cercetare de frontieră, simte urgența și nevoia de colaborare globală. „Probabil că cel mai important lucru pe care trebuie să-l facă grupul este să-și dea seama de toate întrebările care necesită răspunsuri și apoi să găsească răspunsurile”, spune Graham. „Proiectul Glasswing este punctul de plecare. Va eșua dacă este doar o mână de companii care utilizează un model. Trebuie să crească într-ceva și mai mare.”

Anthropic Colaborează cu Rivalii Pentru a Proteja Sistemele de Inteligență Artificială de Hackeri

Tech & AI

iPhone primește nota D pentru reparabilitate, fiind cel mai greu de reparat

iPhone Foldabil Apple: Lansare Programată pentru Septembrie - Bloomberg

Intel Colaborează cu Elon Musk pentru Proiectul Său Terafab

Firmus, Dezvoltatorul de Centre de Date AI Sprijinit de Nvidia, Atinge o Valoare de 5,5 Miliarde de Dolari

Actualizare Android Aprilie 2026: Pixel, Remedieri Aplicații și UI