Acasă TEHNOLOGIE Noua generație AI de la Anthropic, Claude Sonnet 4.5, depășește Google și...

Noua generație AI de la Anthropic, Claude Sonnet 4.5, depășește Google și OpenAI în teste de programare

Scris de

30/09/2025

Luni, compania Anthropic a lansat Claude Sonnet 4.5, cel mai recent model de limbaj AI despre care afirmă că este “cel mai capabil model până în prezent”, având îmbunătățiri semnificative în programare și utilizarea computerelor. În același timp, Anthropic a prezentat Claude Code 2.0, un agent AI de tip linie de comandă destinat dezvoltatorilor, și Claude Agent SDK, un instrument ce permite dezvoltatorilor să creeze proprii agenți de codare AI.

Anagații companiei au observat că Sonnet 4.5 a lucrat continuu la același proiect “pentru mai mult de 30 de ore pe sarcini complexe, cu mai mulți pași”, deși compania nu a oferit detalii specifice despre aceste sarcini. În trecut, modelele agentice erau cunoscute pentru pierderea coerenței pe durate lungi de timp pe măsură ce erorile se acumulau și ferestrele de context (o formă de memorie pe termen scurt pentru model) se umpleau. Anterior, Anthropic a menționat că modelele precedente Claude 4.0 au jucat Pokémon pentru peste 24 de ore sau au refactorizat cod pentru șapte ore.

Pentru a înțelege de ce există Sonnet, este util să știm cum funcționează modelele de limbaj AI. Tradițional, Anthropic a produs trei modele AI de diferite dimensiuni în familia Claude: Haiku (cel mai mic), Sonnet (medie) și Opus (cel mai mare). Ultima actualizare a modelului Haiku a fost în noiembrie 2024 (la versiunea 3.5), Sonnet în mai trecut (la versiunea 4.0) și Opus în august (la versiunea 4.1). Dimensiunea modelului în parametri, care sunt valori stocate în rețeaua sa neuronală, este aproximativ proporțională cu adâncimea contextuală (numărul de conexiuni multidimensionale între concepte, ceea ce ai putea numi “cunoaștere”) și capacitatea de a rezolva probleme, dar modelele mai mari sunt de asemenea mai lente și mai costisitoare de operat. Astfel, companiile de AI caută întotdeauna un echilibru optim între performanță și costuri. Claude Sonnet a îndeplinit acest rol pentru Anthropic de câțiva ani buni.

Claude este popular printre unii dezvoltatori de software datorită Claude Code, iar Anthropic este încrezător în privința ultimei versiuni a capacității de codare a Sonnet: “Claude Sonnet 4.5 este cel mai bun model de codare din lume,” se laudă compania pe site-ul său. “Este cel mai puternic model pentru construirea de agenți complexi. Este cel mai bun model la utilizarea computerelor. Și arată progrese substanțiale în raționament și matematică.”

Anthropic își susține aceste afirmații cu performanțe impresionante în benchmark-uri. Modelul Sonnet 4.5 a atins un scor de 77.2% în SWE-bench Verified, un benchmark care încearcă să măsoare abilitățile reale de codare software, și conduce în prezent benchmark-ul OSWorld cu 61.4%, care testează modelele AI pe sarcini informatice din lumea reală. Acest lucru îl depășește pe GPT-5 Codex de la OpenAI (care a atins 74.5%) și pe Gemini 2.5 Pro de la Google (67.2%).

În alte teste, Claude Sonnet 4.5 a arătat progrese în multiple alte evaluări, cum ar fi AIME 2024, un benchmark de competiție matematică, și MMMLU, care testează cunoștințele subiective în 14 limbi non-engleze. În sarcinile specifice finanțelor măsurate de benchmark-ul Vals AI’s Finance Agent, care este o relativ

Poll: Care este cel mai important aspect pentru tine atunci când alegi un model de limbaj AI pentru dezvoltarea de software?

Formular 230 Asociatia Science&Technology

Cât de util a fost acest articol pentru tine?

Dă click pe o steluță să votezi!

Medie 5 / 5. Câte voturi s-au strâns din 1 ianuarie 2024: 1

Nu sunt voturi până acum! Fii primul care își spune părerea.

Știință&Tehnică

Revista “Ştiinţă şi Tehnică“, cea mai cunoscută şi longevivă publicaţie de popularizare a ştiintelor din România

Ceremonia Premiilor Ig Nobel se Mută în Europa din Cauza Preocupărilor…

Misterul Agilității Pisicilor în Cădere: Descoperiri Noi despre Flexibilitatea Coloanei Vertebrale

Descifrarea dezastrelor antice chinezești: O legătură surprinzătoare între oasele oracol și…

Modelul revoluționar de inteligență artificială în genomica extinsă: Evo 2, deschizător…

Companii de tehnologie promit să finanțeze generarea de energie pentru centrele…

Amazon întâmpină probleme tehnice, cu peste 20.000 de raportări

Autoritățile Federale Intervin în Cazul Vulnerabilităților iOS Explotate în Condiții Misterioase

Accenture Achiziționează Ookla într-o Tranzacție de 1,2 Miliarde de Dolari pentru…

Inteligența Artificială în Mammografii Poate Detecta Riscul de Boli Cardiace la…

Detectarea Alzheimerului Printr-un Nou Test de Sânge Bazat pe Aptameri de…

“Materie Genetică Obscură” Deschide Calea Către O Nouă Clasă de Terapeutice

Cercetătorii au Reușit să Congeleze și să Reîncălzească Secțiuni de Creier…

Ziua Internațională a Rotației Pământului

Obiectiv ambițios pentru Europa – mai puține gaze care încălzesc planeta…

Oamenii de știință au localizat 27 de milioane de tone de…

Această specie de dinozaur nou descoperită nu răcnea – ci ciripea…

Ziua Internațională a Rotației Pământului

Vârtejurile de praf dezvăluie vânturi surprinzător de puternice pe Marte

NASA Space Apps Challenge, cel mai mare hackathon din lume, anunță…

40% din materia lipsă a Universului, descoperită în sfârșit: „Simulările au…

Noua generație AI de la Anthropic, Claude Sonnet 4.5, depășește Google și OpenAI în teste de programare

Poll: Care este cel mai important aspect pentru tine atunci când alegi un model de limbaj AI pentru dezvoltarea de software?

Leave a Reply Cancel reply

Cele mai noi subiecte

Inteligența Artificială în Mammografii Poate Detecta Riscul de Boli Cardiace la...

Detectarea Alzheimerului Printr-un Nou Test de Sânge Bazat pe Aptameri de...

“Materie Genetică Obscură” Deschide Calea Către O Nouă Clasă de Terapeutice

Bloguri S&T

Dilema personala apropo de invatat eficient

Lenovo ThinkPad X1 – subțire și puternic, dar scump

Arta trece de pe hârtie în hard disk-ul PC-ului

Să îmbinăm utilul cu plăcutul – maşina de spălat-joc Arcade

Poll: Care este cel mai important aspect pentru tine atunci când alegi un model de limbaj AI pentru dezvoltarea de software?

Share this:

Leave a Reply Cancel reply

Cele mai noi subiecte