La începutul acestei săptămâni, cinci persoane implicate în toate straturile lanțului de aprovizionare al AI s-au așezat la Milken Global Conference din Beverly Hills, unde au discutat cu acest editor despre totul, de la penuria de cipuri la centrele de date orbitale și posibilitatea ca întreaga arhitectură care stă la baza tehnologiei să fie greșită.
Pe scenă cu TechCrunch: Christophe Fouquet, CEO al ASML, compania olandeză care deține un monopol asupra mașinilor de litografie ultravioletă extremă, fără de care cipurile moderne nu ar exista; Francis deSouza, COO al Google Cloud, care supraveghează una dintre cele mai mari pariuri de infrastructură din istoria corporațiilor; Qasar Younis, co-fondator și CEO al Applied Intuition, o companie AI fizică de 15 miliarde de dolari care a început în simulare și de atunci s-a mutat în apărare; Dimitry Shevelenko, directorul comercial al Perplexity, compania de căutare-la-agenți nativă AI; și Eve Bodnia, un fizician cuantic care a părăsit mediul academic pentru a contesta arhitectura fundamentală pe care majoritatea industriei AI o consideră de la sine înțeles la startup-ul ei, Logical Intelligence. (Fostul om de știință șef AI al Meta, Yan LeCun, s-a alăturat ca președinte fondator al consiliului său de cercetare tehnică la începutul acestui an.)
Iată ce au avut de spus cei cinci:
**Blocajele sunt reale**
Boom-ul AI se confruntă cu limite fizice dure, iar constrângerile încep mai jos în stivă decât mulți își pot da seama. Fouquet a fost primul care a spus-o, descriind o „accelerare uriașă a producției de cipuri”, exprimându-și în același timp „convingerea puternică” că, în ciuda tuturor eforturilor, „pentru următorii doi, trei, poate cinci ani, piața va fi limitată de ofertă”, ceea ce înseamnă că hyperscalers - Google, Microsoft, Amazon, Meta - nu vor primi toate cipurile pentru care plătesc, punct.
DeSouza a subliniat cât de mare - și cât de rapid în creștere - este această problemă, amintind audienței că veniturile Google Cloud au depășit 20 de miliarde de dolari în ultimul trimestru, crescând cu 63%, în timp ce portofoliul său - veniturile angajate, dar încă nelivrate - aproape s-a dublat într-un singur trimestru, de la 250 de miliarde de dolari la 460 de miliarde de dolari. „Cererea este reală”, a spus el cu un calm impresionant.
Pentru Younis, constrângerea vine în principal din altă parte. Applied Intuition construiește sisteme de autonomie pentru mașini, camioane, drone, echipamente miniere și vehicule de apărare, iar blocajul său nu este siliciul - sunt datele care pot fi adunate doar trimițând mașini în lumea reală și urmărind ce se întâmplă. „Trebuie să-l găsiți din lumea reală”, a spus el, și nicio cantitate de simulare sintetică nu acoperă pe deplin această lacună. „Va mai trece mult timp până să puteți antrena complet modele care rulează sintetic pe lumea fizică.”
**Problema energiei este, de asemenea, reală**
Dacă cipurile sunt primul blocaj, energia este cea care se profilează în spatele lor. DeSouza a confirmat că Google explorează centrele de date în spațiu ca un răspuns serios la constrângerile energetice. „Aveți acces la energie mai abundentă”, a remarcat el.
Desigur, chiar și pe orbită, nu este simplu. DeSouza a observat că spațiul este un vid, astfel încât elimină convecția, lăsând radiația ca singura modalitate de a pierde căldură în mediul înconjurător (un proces mult mai lent și mai dificil de proiectat decât sistemele de răcire cu aer și lichid pe care se bazează centrele de date astăzi). Dar compania încă îl tratează ca pe o cale legitimă.
Argumentul mai profund pe care l-a prezentat de Souza, oarecum surprinzător, a fost despre eficiența prin integrare. Strategia Google de co-proiectare a întregii sale stive AI - de la cipuri TPU personalizate până la modele și agenți - aduce dividende în flops per watt (mai multe calcule per unitate de energie) pe care o companie care cumpără componente de pe piață pur și simplu nu le poate reproduce, a sugerat el. „Rulearea Gemini pe TPU-uri este mult mai eficientă energetic decât orice altă configurație”, deoarece proiectanții de cipuri știu ce urmează în model înainte de a-l livra, a spus el.
Fouquet a făcut un punct similar mai târziu în discuție. „Nimic nu poate fi neprețuit”, a spus el. Industria se află într-un moment ciudat în acest moment, investind sume extraordinare de capital, condusă de necesitatea strategică. Dar mai multă putere de calcul înseamnă mai multă energie, iar mai multă energie are un preț.
**Un alt fel de inteligență**
În timp ce restul industriei dezbate scara, arhitectura și eficiența inferenței în paradigma modelelor lingvistice mari, Bodnia construiește ceva foarte diferit. Compania ei, Logical Intelligence, este construită pe așa-numitele modele bazate pe energie (EBM-uri), o clasă de AI care nu prezice următorul token dintr-o secvență, ci mai degrabă încearcă să înțeleagă regulile care stau la baza datelor, într-un mod care, susține ea, este mai apropiat de modul în care funcționează de fapt creierul uman.
„Limbajul este o interfață de utilizator între creierul meu și al tău”, a spus ea. „Raționamentul în sine nu este atașat de niciun limbaj.” Cel mai mare model al ei rulează la 200 de milioane de parametri - comparativ cu sutele de miliarde din LLM-urile de top - și susține că rulează de mii de ori mai repede. Mai important, este conceput pentru a-și actualiza cunoștințele pe măsură ce datele se schimbă, mai degrabă decât să necesite reantrenare de la zero.
Pentru proiectarea de cipuri, robotică și alte domenii în care un sistem trebuie să înțeleagă regulile fizice, mai degrabă decât modelele lingvistice, ea susține că EBM-urile sunt o potrivire mai naturală. „Când conduci o mașină, nu cauți modele în niciun limbaj. Te uiți în jur, înțelegi regulile despre lumea din jurul tău și iei o decizie.”
Este un argument interesant și unul care este probabil să atragă mai multă atenție în lunile următoare, având în vedere că domeniul AI începe să se întrebe dacă scara singură este suficientă.
**Agenți, garduri de protecție și încredere**
Shevelenko a petrecut o mare parte din conversație explicând modul în care Perplexity a evoluat de la un produs de căutare la ceva pe care acum îl numește „muncitor digital”. Perplexity Computer, cea mai nouă ofertă a sa, este conceput nu ca un instrument pe care îl folosește un lucrător cu cunoștințe, ci ca un personal pe care îl direcționează un lucrător cu cunoștințe. „În fiecare zi te trezești și ai o sută de angajați în echipa ta”, a spus el despre oportunitate. „Ce vei face pentru a profita la maximum de asta?”
Este o prezentare convingătoare; ridică, de asemenea, întrebări evidente despre control, așa că i-am întrebat. Răspunsul său a fost: granularitate. Administratorii de întreprindere pot specifica nu doar la ce conectori și instrumente poate accesa un agent, ci și dacă aceste permisiuni sunt doar de citire sau de citire-scriere - o distincție care contează enorm atunci când agenții acționează în interiorul sistemelor corporative. Când Comet, agentul de utilizare a computerului Perplexity, întreprinde acțiuni în numele unui utilizator, acesta prezintă un plan și solicită mai întâi aprobarea. Unii utilizatori consideră că frecarea este enervantă, a spus Shevelenko, dar a spus că o consideră esențială, mai ales după ce s-a alăturat consiliului de administrație al Lazard, unde a spus că s-a trezit în mod neașteptat simpatic cu instinctele conservatoare ale unui CISO care protejează un brand vechi de 180 de ani construit în întregime pe încrederea clienților. „Granularitatea este baza unei bune igiene de securitate”, a spus el.
**Suveranitate, nu doar siguranță**
Younis a oferit ceea ce ar fi putut fi observația cea mai încărcată geopolitic a panelului, și anume că AI fizică și suveranitatea națională sunt împletite în moduri în care AI pur digitală nu a fost niciodată. Internetul s-a răspândit inițial ca tehnologie americană și s-a confruntat cu respingere doar la nivelul aplicației - Ubers și DoorDashes - când consecințele offline au devenit vizibile.
AI fizică este diferită. Vehicule autonome, drone de apărare, echipamente miniere, mașini agricole - acestea se manifestă în lumea reală în moduri pe care guvernele nu le pot ignora, ridicând întrebări despre siguranță, colectarea datelor și cine controlează în cele din urmă sistemele care funcționează în interiorul granițelor unei națiuni. „Aproape în mod constant, fiecare țară spune: nu vrem această inteligență sub o formă fizică în interiorul granițelor noastre, controlată de o altă țară.”
Puține națiuni, a spus el mulțimii, pot în prezent să pună în funcțiune un robotaxi decât posedă arme nucleare.
Fouquet a încadrat-o puțin diferit. Progresul AI al Chinei este real - lansarea DeepSeek la începutul acestui an a trimis ceva apropiat de panică prin părți ale industriei - dar acest progres este limitat sub stratul modelului. Fără acces la litografia EUV, producătorii de cipuri chinezi nu pot fabrica cele mai avansate semiconductori, iar modelele construite pe hardware mai vechi funcționează cu un dezavantaj compus, indiferent cât de bun devine software-ul. „Astăzi, în Statele Unite, aveți datele, aveți acces la calcul, aveți cipurile, aveți talentul. China face o treabă foarte bună în partea de sus a stivei, dar îi lipsesc unele elemente dedesubt”, a spus Fouquet.
**Întrebarea generației**
Spre sfârșitul panelului nostru, cineva din public a pus întrebarea evidentă incomodă: toate acestea vor afecta capacitatea de gândire critică a următoarei generații? Răspunsurile au fost optimiste, așa cum v-ați aștepta de la persoanele care și-au pariat cariera pe această tehnologie.
DeSouza a arătat imediat către amploarea problemelor pe care instrumentele mai puternice ar putea permite în cele din urmă omenirii să le abordeze. Gândiți-vă la boli neurologice ale căror mecanisme biologice nu le înțelegem încă, la eliminarea gazelor cu efect de seră și la infrastructura de rețea care a fost amânată de zeci de ani. „Acest lucru ar trebui să ne dezlănțuie la următorul nivel de creativitate”, a spus el.
Shevelenko a făcut un punct mai pragmatic: postul de nivel de intrare poate dispărea, dar capacitatea de a lansa ceva independent nu a fost niciodată mai accesibilă. „[Pentru] oricine are Perplexity Computer. . . constrângerea este propria ta curiozitate și agenție.”
Younis a făcut o distincție clară între munca intelectuală și munca fizică. El a subliniat faptul că fermierul american mediu are 58 de ani și că penuria de forță de muncă în minerit, transport pe distanțe lungi și agricultură este cronică și în creștere - nu pentru că salariile sunt prea mici, ci pentru că oamenii nu doresc aceste locuri de muncă. În acele domenii, AI fizică nu dislocă lucrătorii dispuși. Umple un gol care există deja și pare doar să se adâncească de aici.

