OpenAI a anunțat joi dezvoltarea unui model avansat de procesare a limbajului, special antrenat pentru a gestiona fluxuri de lucru comune în biologie. Denumit GPT-Rosalind, în onoarea lui Rosalind Franklin, acest model se distinge de alte modele orientate către știință dezvoltate de mari companii tehnologice, care tind să adopte o abordare mai generală.
Yunyun Wang, liderul departamentului de Științe ale Vieții de la OpenAI, a explicat într-o conferință de presă că sistemul a fost creat pentru a aborda două probleme majore cu care se confruntă cercetătorii din domeniul biologiei. Prima este reprezentată de seturi masive de date generate de decenii de secvențiere a genomului și biochimie proteică, care sunt dificil de gestionat de un singur cercetător. A doua problemă derivă din faptul că biologia include multe subdomenii extrem de specializate, fiecare cu propriile tehnici și terminologie. De exemplu, un genetician care lucrează la un gen activ în celulele cerebrale ar putea avea dificultăți în a înțelege literatura vastă din neurobiologie.
Modelul a fost antrenat pe 50 dintre cele mai comune proceduri biologice și pe modalități de accesare a principalelor baze de date publice de informații biologice. Antrenamentul suplimentar a permis sistemului să sugereze căi biologice probabile și să prioritizeze potențialele ținte pentru medicamente. „Facem legătura între genotip și fenotip prin intermediul căilor și mecanismelor de reglementare cunoscute, deducem proprietăți structurale sau funcționale probabile ale proteinelor și valorificăm această înțelegere mecanistică,” a spus Wang.
Pentru a contracara tendințele modelelor de limbaj de a fi prea complacente sau prea entuziaste, OpenAI a ajustat modelul pentru a fi mai sceptic, astfel încât este mai probabil să indice când o țintă pentru medicamente este neadecvată. S-a discutat mult despre „raționamentul” și „abilitățile de nivel expert” ale GPT-Rosalind, capacitatea de a procesa proceduri complexe, multi-pașe fiind un punct forte.
Nu este clar dacă OpenAI a rezolvat problema „halucinațiilor” care afectează diverse modele de limbaj și care poate apărea când sistemelor li se solicită să explice pașii urmați pentru a ajunge la concluzii. Pe baza experiențelor anterioare, este probabil să vedem atât rapoarte entuziaste despre conexiuni neașteptate identificate de AI, cât și situații în care produce sugestii evident eronate.
Pentru moment, accesul este limitat din cauza preocupărilor legate de potențialul modelului de a produce rezultate dăunătoare, cum ar fi optimizarea infectivității unui virus. Numai entitățile din SUA pot aplica pentru accesul structurat și de încredere oferit de OpenAI, iar utilizarea va fi restricționată. Un plugin de cercetare în științele vieții, mai limitat, va fi disponibil pe scară largă.
Sursa: Ars Technica
Poll: Care este principala problemă abordată de modelul GPT-Rosalind dezvoltat de OpenAI în domeniul biologiei?


Revista “Ştiinţă şi Tehnică“, cea mai cunoscută şi longevivă publicaţie de popularizare a ştiintelor din România



























Leave a Reply