OpenAI lansează GPT-5.4 cu Pro și Thinking

Lansarea GPT-5.4: Un Pas Major pentru OpenAI

Joi, OpenAI a dezvăluit GPT-5.4, un nou model de bază descris drept „cel mai capabil și eficient model de frontieră pentru lucrul profesional”. Acest model vine în două versiuni suplimentare: GPT-5.4 Thinking, axat pe raționament, și GPT-5.4 Pro, optimizat pentru performanță înaltă. Lansarea acestui model marchează un pas semnificativ în evoluția tehnologiilor AI, oferind o gamă mai largă de opțiuni pentru utilizatori profesioniști.

Versiunea API a modelului este remarcabilă prin fereastra de context extinsă, care ajunge la 1 milion de tokeni, cea mai mare disponibilă de la OpenAI până în prezent. Această capacitate extinsă permite utilizatorilor să gestioneze sarcini complexe cu o eficiență sporită, reducând necesitatea de a fragmenta informațiile în bucăți mai mici.

Performanțe Îmbunătățite și Eficiență Sporită

OpenAI a subliniat eficiența îmbunătățită a tokenilor, afirmând că GPT-5.4 poate rezolva aceleași probleme cu semnificativ mai puțini tokeni decât predecesorul său. Această eficiență nu doar că optimizează costurile, dar și îmbunătățește viteza de procesare, un aspect crucial pentru aplicațiile profesionale.

Noul model a obținut rezultate impresionante la benchmark-uri, inclusiv scoruri record în OSWorld-Verified și WebArena Verified. De asemenea, a înregistrat un scor de 83% la testul GDPval al OpenAI, destinat evaluării sarcinilor de cunoaștere, demonstrând astfel capacitatea sa de a gestiona sarcini complexe cu precizie.

Impactul în Domeniul Profesional

Conform declarațiilor CEO-ului Mercor, Brendan Foody, GPT-5.4 este lider în benchmark-ul APEX-Agents, conceput pentru a testa abilitățile profesionale în domeniul juridic și financiar. «[GPT-5.4] excelează în crearea de livrabile pe termen lung, cum ar fi prezentări, modele financiare și analize juridice», a declarat Foody, subliniind că modelul oferă performanțe de top la costuri mai reduse comparativ cu alte modele de frontieră.

Reducerea Erorilor și Îmbunătățiri de Siguranță

Continuând eforturile de reducere a halucinațiilor și erorilor factuale, OpenAI a dezvăluit că noul model este cu 33% mai puțin probabil să facă greșeli în afirmațiile individuale comparativ cu GPT 5.2, iar răspunsurile generale sunt cu 18% mai puțin susceptibile de a conține erori.

Ca parte a lansării, OpenAI a reconfigurat modul în care versiunea API a GPT-5.4 gestionează apelurile de instrumente, introducând un sistem numit Tool Search. Acest sistem permite modelelor să caute definițiile instrumentelor după necesitate, rezultând în cereri mai rapide și mai ieftine în sisteme cu multe instrumente disponibile.

De asemenea, OpenAI a inclus o nouă evaluare de siguranță pentru a testa lanțul de gândire al modelelor, comentariul continuu oferit de modele pentru a arăta procesul de gândire prin sarcini multi-pas. Evaluarea sugerează că în versiunea Thinking a GPT-5.4, înșelăciunea este mai puțin probabilă să apară, «sugerând că modelul nu are capacitatea de a ascunde raționamentul său și că monitorizarea CoT rămâne un instrument de siguranță eficient.»

OpenAI lansează GPT-5.4 cu versiuni Pro și Thinking

Puncte Cheie

Lansarea GPT-5.4: Un Pas Major pentru OpenAI

Performanțe Îmbunătățite și Eficiență Sporită

Impactul în Domeniul Profesional

Reducerea Erorilor și Îmbunătățiri de Siguranță

Abonează-te la StiriX