Cash News Logo

OpenAI lansează GPT-5.4 cu versiunile Pro și Thinking

Tech & AI5 martie 2026, 20:00
OpenAI lansează GPT-5.4 cu versiunile Pro și Thinking

OpenAI lansează GPT-5.4 cu versiunile Pro și Thinking

Joi, OpenAI a lansat GPT-5.4, un nou model de bază prezentat ca fiind „cel mai capabil și eficient model de frontieră pentru munca profesională”. Pe lângă versiunea standard, GPT-5.4 este disponibil și ca model de raționament (GPT-5.4 Thinking) sau optimizat pentru performanțe ridicate (GPT-5.4 Pro).

Versiunea API a modelului va fi disponibilă cu ferestre de context de până la 1 milion de token-uri, de departe cea mai mare fereastră de context disponibilă de la OpenAI. OpenAI a subliniat, de asemenea, îmbunătățirea eficienței token-urilor, spunând că GPT-5.4 a reușit să rezolve aceleași probleme cu semnificativ mai puține token-uri decât predecesorul său.

Noul model vine cu rezultate de referință semnificativ îmbunătățite, inclusiv scoruri record în testele de utilizare a computerului OSWorld-Verified și WebArena Verified. Noul model a obținut, de asemenea, un scor record de 83% la testul GDPval al OpenAI pentru sarcinile de muncă intelectuală.

GPT-5.4 a preluat, de asemenea, conducerea în testul APEX-Agents al Mercor, conceput pentru a testa abilitățile profesionale în drept și finanțe, potrivit unei declarații a CEO-ului Mercor, Brendan Foody. „[GPT-5.4] excelează în crearea de produse livrabile pe termen lung, cum ar fi seturi de diapozitive, modele financiare și analize juridice”, a spus Foody în declarație, „oferind performanțe de top, funcționând mai rapid și la un cost mai mic decât modelele de frontieră concurente.”

GPT-5.4 continuă eforturile companiei de a limita halucinațiile și erorile factuale. OpenAI a declarat că noul model are cu 33% mai puține șanse de a face erori în afirmațiile individuale în comparație cu GPT 5.2, iar răspunsurile generale au fost cu 18% mai puțin susceptibile de a conține erori.

Ca parte a lansării, OpenAI a remaniat modul în care versiunea API a GPT-5.4 gestionează apelarea instrumentelor, introducând un nou sistem numit Tool Search. Anterior, solicitările de sistem stabileau definiții pentru toate instrumentele disponibile atunci când se apela modelul - un proces care putea consuma o mulțime de token-uri pe măsură ce numărul de instrumente disponibile creștea. Noul sistem permite modelelor să caute definițiile instrumentelor după cum este necesar, rezultând solicitări mai rapide și mai ieftine în sistemele cu multe instrumente disponibile.

OpenAI a inclus, de asemenea, o nouă evaluare de siguranță pentru a testa lanțul de gândire al modelelor sale, comentariul curent oferit de model pentru a-și arăta procesul de gândire prin sarcini cu mai mulți pași. Cercetătorii în siguranța AI s-au îngrijorat mult timp de faptul că modelele de raționament ar putea denatura lanțul lor de gândire, iar testarea arată că se poate întâmpla în circumstanțe corecte. Noua evaluare a OpenAI arată că înșelăciunea este mai puțin probabil să se întâmple în versiunea Thinking a GPT-5.4, „sugerând că modelul nu are capacitatea de a-și ascunde raționamentul și că monitorizarea CoT rămâne un instrument eficient de siguranță”.