OpenAI Launches GPT-5.4 with Pro and Thinking Versions

OpenAI lansează GPT-5.4 cu versiunile Pro și Thinking

Joi, OpenAI a lansat GPT-5.4, un nou model de bază prezentat ca fiind „cel mai capabil și eficient model de frontieră pentru munca profesională”. Pe lângă versiunea standard, GPT-5.4 este disponibil și ca model de raționament (GPT-5.4 Thinking) sau optimizat pentru performanțe ridicate (GPT-5.4 Pro).

Versiunea API a modelului va fi disponibilă cu ferestre de context de până la 1 milion de token-uri, de departe cea mai mare fereastră de context disponibilă de la OpenAI. OpenAI a subliniat, de asemenea, îmbunătățirea eficienței token-urilor, spunând că GPT-5.4 a reușit să rezolve aceleași probleme cu semnificativ mai puține token-uri decât predecesorul său.

Noul model vine cu rezultate de referință semnificativ îmbunătățite, inclusiv scoruri record în testele de utilizare a computerului OSWorld-Verified și WebArena Verified. Noul model a obținut, de asemenea, un scor record de 83% la testul GDPval al OpenAI pentru sarcinile de muncă intelectuală.

GPT-5.4 a preluat, de asemenea, conducerea în testul APEX-Agents al Mercor, conceput pentru a testa abilitățile profesionale în drept și finanțe, potrivit unei declarații a CEO-ului Mercor, Brendan Foody. „[GPT-5.4] excelează în crearea de produse livrabile pe termen lung, cum ar fi seturi de diapozitive, modele financiare și analize juridice”, a spus Foody în declarație, „oferind performanțe de top, funcționând mai rapid și la un cost mai mic decât modelele de frontieră concurente.”

GPT-5.4 continuă eforturile companiei de a limita halucinațiile și erorile factuale. OpenAI a declarat că noul model are cu 33% mai puține șanse de a face erori în afirmațiile individuale în comparație cu GPT 5.2, iar răspunsurile generale au fost cu 18% mai puțin susceptibile de a conține erori.

Ca parte a lansării, OpenAI a remaniat modul în care versiunea API a GPT-5.4 gestionează apelarea instrumentelor, introducând un nou sistem numit Tool Search. Anterior, solicitările de sistem stabileau definiții pentru toate instrumentele disponibile atunci când se apela modelul - un proces care putea consuma o mulțime de token-uri pe măsură ce numărul de instrumente disponibile creștea. Noul sistem permite modelelor să caute definițiile instrumentelor după cum este necesar, rezultând solicitări mai rapide și mai ieftine în sistemele cu multe instrumente disponibile.

OpenAI a inclus, de asemenea, o nouă evaluare de siguranță pentru a testa lanțul de gândire al modelelor sale, comentariul curent oferit de model pentru a-și arăta procesul de gândire prin sarcini cu mai mulți pași. Cercetătorii în siguranța AI s-au îngrijorat mult timp de faptul că modelele de raționament ar putea denatura lanțul lor de gândire, iar testarea arată că se poate întâmpla în circumstanțe corecte. Noua evaluare a OpenAI arată că înșelăciunea este mai puțin probabil să se întâmple în versiunea Thinking a GPT-5.4, „sugerând că modelul nu are capacitatea de a-și ascunde raționamentul și că monitorizarea CoT rămâne un instrument eficient de siguranță”.

OpenAI lansează GPT-5.4 cu versiunile Pro și Thinking

Tech & AI

MacBook Neo - Oferta anului? Comparativ cu prețul exagerat al Apple Watch Ultra 3

Codelco și Microsoft colaborează în proiecte de Inteligență Artificială și Analiză Avansată

WhatsApp Plus, abonamentul plătit se apropie: ce funcții noi aduce?

Zeno Strânge 25 Milioane USD Pentru a Accelera Producția de Motociclete Electrice cu Baterii Interșanjabile

Science Corp Strânge 230 de Milioane de Dolari în Cursa pentru Implantul Cerebral