OpenAI lansează GPT-5.4 cu versiuni Pro și Thinking
GPT-5.4: model avansat pentru profesioniști, cu eficiență sporită
OpenAI a lansat GPT-5.4, un model avansat pentru profesioniști, disponibil în versiuni Thinking și Pro. Modelul îmbunătățește eficiența și reduce erorile factuale.
Puncte Cheie
- OpenAI a lansat GPT-5.4, un model de bază avansat pentru lucrul profesional.
- Disponibil în versiuni Thinking și Pro, optimizate pentru raționament și performanță.
- Fereastra de context a modelului API ajunge la 1 milion de tokeni.
- GPT-5.4 îmbunătățește eficiența tokenilor și reduce erorile factuale cu 33%.
- Modelul a obținut un scor record de 83% la testul GDPval pentru sarcini de cunoaștere.
- Mercor CEO, Brendan Foody, a subliniat performanța sa în domenii juridice și financiare.
Lansarea GPT-5.4: Un Pas Major pentru OpenAI
Joi, OpenAI a dezvăluit GPT-5.4, un nou model de bază descris drept „cel mai capabil și eficient model de frontieră pentru lucrul profesional”. Acest model vine în două versiuni suplimentare: GPT-5.4 Thinking, axat pe raționament, și GPT-5.4 Pro, optimizat pentru performanță înaltă. Lansarea acestui model marchează un pas semnificativ în evoluția tehnologiilor AI, oferind o gamă mai largă de opțiuni pentru utilizatori profesioniști.
Versiunea API a modelului este remarcabilă prin fereastra de context extinsă, care ajunge la 1 milion de tokeni, cea mai mare disponibilă de la OpenAI până în prezent. Această capacitate extinsă permite utilizatorilor să gestioneze sarcini complexe cu o eficiență sporită, reducând necesitatea de a fragmenta informațiile în bucăți mai mici.
Performanțe Îmbunătățite și Eficiență Sporită
OpenAI a subliniat eficiența îmbunătățită a tokenilor, afirmând că GPT-5.4 poate rezolva aceleași probleme cu semnificativ mai puțini tokeni decât predecesorul său. Această eficiență nu doar că optimizează costurile, dar și îmbunătățește viteza de procesare, un aspect crucial pentru aplicațiile profesionale.
Noul model a obținut rezultate impresionante la benchmark-uri, inclusiv scoruri record în OSWorld-Verified și WebArena Verified. De asemenea, a înregistrat un scor de 83% la testul GDPval al OpenAI, destinat evaluării sarcinilor de cunoaștere, demonstrând astfel capacitatea sa de a gestiona sarcini complexe cu precizie.
Impactul în Domeniul Profesional
Conform declarațiilor CEO-ului Mercor, Brendan Foody, GPT-5.4 este lider în benchmark-ul APEX-Agents, conceput pentru a testa abilitățile profesionale în domeniul juridic și financiar. «[GPT-5.4] excelează în crearea de livrabile pe termen lung, cum ar fi prezentări, modele financiare și analize juridice», a declarat Foody, subliniind că modelul oferă performanțe de top la costuri mai reduse comparativ cu alte modele de frontieră.
Reducerea Erorilor și Îmbunătățiri de Siguranță
Continuând eforturile de reducere a halucinațiilor și erorilor factuale, OpenAI a dezvăluit că noul model este cu 33% mai puțin probabil să facă greșeli în afirmațiile individuale comparativ cu GPT 5.2, iar răspunsurile generale sunt cu 18% mai puțin susceptibile de a conține erori.
Ca parte a lansării, OpenAI a reconfigurat modul în care versiunea API a GPT-5.4 gestionează apelurile de instrumente, introducând un sistem numit Tool Search. Acest sistem permite modelelor să caute definițiile instrumentelor după necesitate, rezultând în cereri mai rapide și mai ieftine în sisteme cu multe instrumente disponibile.
De asemenea, OpenAI a inclus o nouă evaluare de siguranță pentru a testa lanțul de gândire al modelelor, comentariul continuu oferit de modele pentru a arăta procesul de gândire prin sarcini multi-pas. Evaluarea sugerează că în versiunea Thinking a GPT-5.4, înșelăciunea este mai puțin probabilă să apară, «sugerând că modelul nu are capacitatea de a ascunde raționamentul său și că monitorizarea CoT rămâne un instrument de siguranță eficient.»
Abonează-te la StiriX
Primește cele mai noi știri tech direct pe email.
