0
(0)

Cel mai bun ghid de pe internet pentru detectarea textelor scrise de inteligența artificială (IA) a devenit acum un manual pentru camuflarea acestora.

Sâmbătă, antreprenorul în tehnologie Siqi Chen a lansat un plugin open source pentru asistentul IA Claude Code de la Anthropic, care instruiește modelul de IA să nu mai scrie ca o IA. Denumit „Humanizer”, acest plugin simplu îi furnizează lui Claude o listă de 24 de modele de limbaj și formatare identificate de editorii Wikipedia ca semne ale scrierii automate. Chen a publicat pluginul pe GitHub, unde a acumulat peste 1.600 de aprecieri până luni.

„Este extrem de util că Wikipedia a compilat o listă detaliată cu ‘semne ale scrierii de către IA’”, a scris Chen pe X. „Atât de util, încât poți pur și simplu să-i spui modelului tău LLM să nu facă asta.”

Materialul sursă este un ghid de la WikiProject AI Cleanup, un grup de editori Wikipedia care au început să identifice articole generate de IA încă de la sfârșitul anului 2023. Proiectul a fost fondat de editorul francez de pe Wikipedia, Ilyas Lebleu. Voluntarii au etichetat pentru revizuire peste 500 de articole și, în august 2025, au publicat o listă formală a modelelor pe care le observau frecvent.

Instrumentul lui Chen este un „fișier de abilități” pentru Claude Code, asistentul de codare bazat pe terminal al Anthropic, care implică un fișier formatat în Markdown ce adaugă o listă de instrucțiuni scrise (le poți vedea aici) la promptul introdus în modelul de limbaj mare (LLM) care alimentează asistentul. Spre deosebire de un prompt de sistem normal, informațiile despre abilități sunt formate într-un mod standardizat pe care modelele Claude sunt ajustate să le interpreteze cu mai multă precizie decât un prompt de sistem obișnuit. (Abilitățile personalizate necesită un abonament Claude plătit, cu execuție de cod activată.)

Dar, ca în cazul tuturor prompturilor pentru IA, modelele de limbaj nu urmează întotdeauna perfect fișierele de abilități, așa că funcționează cu adevărat Humanizer? În testele noastre limitate, fișierul de abilități al lui Chen a făcut ca răspunsurile agentului IA să sune mai puțin precise și mai informale, dar ar putea avea unele dezavantaje: acesta nu îmbunătățește factualitatea și ar putea afecta capacitatea de codare.

În particular, unele instrucțiuni din Humanizer ar putea induce în eroare, în funcție de sarcină. De exemplu, abilitatea Humanizer include linia: „Ai opinii. Nu doar raporta fapte – reacționează la ele. ‘Sincer, nu știu ce să cred despre asta’ este mai uman decât să listezi avantaje și dezavantaje în mod neutru.” Deși a fi imperfect pare uman, acest tip de sfat probabil că nu ar fi de ajutor dacă ai folosi Claude pentru a scrie documentație tehnică.

Chiar și cu dezavantajele sale, este ironic că unul dintre cele mai referite seturi de reguli pentru detectarea scrierii asistate de IA ar putea ajuta pe unii să o submineze.

Deci, cum arată scrierea AI? Ghidul Wikipedia este specific și oferă multe exemple, dar vă vom oferi doar unul aici, din motive de concizie.

Unele chatbot-uri adoră să își laude subiectele cu fraze precum „marchează un moment pivotal” sau „stă ca mărturie a”, conform ghidului. Acestea scriu ca broșurile turistice, numind priveliștile „uluitoare” și descriind orașele ca fiind „așezate în” scenarii pitorești.

Sursa: Ars Tehnica Technology

Poll: Care este cel mai important aspect atunci când detectați textele scrise de inteligența artificială (IA)?





Formular 230 Asociatia Science&Technology

Cât de util a fost acest articol pentru tine?

Dă click pe o steluță să votezi!

Medie 0 / 5. Câte voturi s-au strâns din 1 ianuarie 2024: 0

Nu sunt voturi până acum! Fii primul care își spune părerea.

Întrucât ai considerat acest articol folositor ...

Urmărește-ne pe Social Media!

Ne pare rău că acest articol nu a fost util pentru tine!

Ajută-ne să ne îmbunătățim!

Ne poți spune cum ne putem îmbunătăți?

Revista “Ştiinţă şi Tehnică“, cea mai cunoscută şi longevivă publicaţie de popularizare a ştiintelor din România

Leave a Reply

Your email address will not be published. Required fields are marked *

  • Rating