Marți, startup-ul francez Mistral AI a lansat Devstral 2, un model de codificare open-source, dotat cu 123 de miliarde de parametri, conceput pentru a funcționa ca parte a unui agent de inginerie software autonom. Modelul a obținut un scor impresionant de 72,2% la SWE-bench Verified, un standard de evaluare ce testează capacitatea sistemelor AI de a rezolva probleme reale extrase de pe GitHub, clasându-se astfel printre cele mai performante modele cu cod deschis.
Pe lângă lansarea modelului AI, Mistral a introdus și o nouă aplicație de dezvoltare numită Mistral Vibe. Aceasta este o interfață de linie de comandă (CLI), asemănătoare cu Claude Code, OpenAI Codex și Gemini CLI, care permite dezvoltatorilor să interacționeze direct cu modelele Devstral din terminalul lor. Instrumentul poate scana structurile de fișiere și starea Git pentru a menține contextul unui întreg proiect, poate efectua modificări în mai multe fișiere și poate executa comenzi shell în mod autonom. Mistral a lansat CLI-ul sub licența Apache 2.0.
Deși este prudent să privim cu scepticism benchmark-urile AI, am aflat de la angajații marilor companii AI că aceștia monitorizează îndeaproape performanțele modelelor la SWE-bench Verified. Acesta prezintă modelelor AI 500 de probleme reale de inginerie software, extrase din problemele GitHub din repozițiile populare Python. AI-ul trebuie să citească descrierea problemei, să navigheze prin baza de coduri și să genereze un patch funcțional care să treacă testele unitare. Deși unii cercetători AI au observat că aproximativ 90% din sarcinile testului implică corectări de erori relativ simple, pe care inginerii experimentați le-ar putea rezolva în mai puțin de o oră, acesta rămâne una dintre puținele metode standardizate de comparare a modelelor de codificare.
În același timp cu modelul AI de codare mai mare, Mistral a lansat și Devstral Small 2, o versiune cu 24 de miliarde de parametri care obține un scor de 68% la același benchmark și poate rula local pe hardware-ul consumatorilor, cum ar fi un laptop, fără a necesita conexiune la internet. Ambele modele suportă o fereastră de context de 256.000 de tokeni, permițându-le să proceseze baze de coduri moderat de mari. Compania a lansat Devstral 2 sub o licență MIT modificată și Devstral Small 2 sub licența mai permisivă Apache 2.0.
Devstral 2 este în prezent gratuit prin API-ul Mistral. După încheierea perioadei gratuite, prețurile vor fi de 0,40 USD per milion de tokeni de intrare și 2,00 USD per milion de tokeni de ieșire. Devstral Small 2 va costa 0,10 USD per milion de tokeni de intrare și 0,30 USD per milion de tokeni de ieșire. Mistral afirmă că este „de 7 ori mai eficient din punct de vedere al costurilor decât Claude Sonnet la sarcinile din lumea reală.”
Numele „Mistral Vibe” face referire la „vibe coding”, un termen inventat de cercetătorul AI Andrej Karpathy în februarie 2025 pentru a descrie un stil de programare în care dezvoltatorii descri
Poll: Care dintre modelele AI lansate de Mistral preferi pentru codificare?


Revista “Ştiinţă şi Tehnică“, cea mai cunoscută şi longevivă publicaţie de popularizare a ştiintelor din România





























Leave a Reply