Recent, Nicholas Carlini, cercetător la Anthropic și membru al echipei de Siguranță, a publicat pe blogul companiei o descriere detaliată a experimentului său. Utilizând 16 instanțe ale modelului AI Claude Opus 4.6, Carlini le-a lăsat să colaboreze cu o supraveghere minimă pe un cod sursă comun, cu misiunea de a construi de la zero un compilator C.
Pe parcursul a două săptămâni și aproape 2.000 de sesiuni ale codului Claude, costând aproximativ 20.000 de dolari în taxe API, agenții modelului AI au reușit să producă un compilator bazat pe Rust, capabil să compileze un kernel Linux 6.9 bootabil pe arhitecturile x86, ARM și RISC-V. Acest compilator a fost apoi publicat pe GitHub de Anthropic, demonstrând capacitatea sa de a compila o gamă largă de proiecte open source majore, inclusiv PostgreSQL, SQLite, Redis, FFmpeg și QEMU. De asemenea, a obținut un procentaj de succes de 99% în suitele de teste de tortură GCC și a compilat și rulat jocul Doom, considerat un test decisiv pentru dezvoltatori.
Compilatorul C este o sarcină aproape ideală pentru codarea AI semi-autonomă, având în vedere că specificația este veche de decenii și bine definită, există suite de teste cuprinzătoare și un compilator de referință bine cunoscut pentru verificări. Majoritatea proiectelor software din lumea reală nu beneficiază de aceste avantaje. Partea cea mai dificilă a dezvoltării software nu este scrierea codului care trece testele, ci stabilirea testelor care ar trebui să fie efectuate în primul rând.
Cu toate acestea, compilatorul are limite clare, despre care Carlini a vorbit deschis. Acesta lipsește de un backend x86 de 16 biți necesar pentru a încărca Linux din modul real, așa că apelează la GCC pentru această etapă. De asemenea, propriul său assembler și linker sunt încă pline de bug-uri. Chiar și cu toate optimizările activate, produce un cod mai puțin eficient decât GCC cu toate optimizările dezactivate. Și calitatea codului Rust, deși funcțional, nu se compară cu ce ar produce un programator Rust expert. “Compilatorul rezultat a atins aproape limitele abilităților lui Opus”, a scris Carlini. “Am încercat (cu insistență!) să remediez mai multe dintre limitările menționate, dar nu am reușit pe deplin. Noile funcții și corecțiile de erori au rupt frecvent funcționalitățile existente.”
Sursa: Ars Tehnica Technology
Poll: Care este opinia dumneavoastră cu privire la utilizarea inteligenței artificiale pentru dezvoltarea unui compilator C semi-autonom?


Revista “Ştiinţă şi Tehnică“, cea mai cunoscută şi longevivă publicaţie de popularizare a ştiintelor din România



























Leave a Reply