Cele 154 de sonete ale lui Shakespeare, un discurs audio al lui Martin Luther King, faimosul articol al lui James Watson și Francis Crick, despre structura ADN-ului plus o fotografie a institututului în care s-a reușit această performanță, au fost transcrise pe secvențe ADN.

 

Avem nevoie de spații de stocare a informațiilor din ce în ce mai mari. Și mai avem nevoie ca aceste informații să rămână nealterate pe durate lungi de timp. Actualele mijloace de stocare au mari limitări: au nevoie de energie electrică și (sau) informația stocată se degradează în timp. O soluție pentru a rezolva aceste probleme a fost găsită, cu miliarde de ani în urmă, de către mama natură. Este vorba despre macromolecula de ADN.

Cercetătorii de la Institutul European de Bioinformatică, din apropierea orașului Cambridge, Marea Britanie, au realizat o metodă prin care fișiere digitale să poată fi stocate pe macromolecule de ADN. În felul acesta se pot obține densități de stocare de 2,2 petabiți pe gram.

Citirea informațiilor stocate în ADN, cu tehnologiile moderne, este relativ simplă. Probleme apar atunci când trebuie să creezi o succesiune specifică de baze aminice. Să ne aducem aminte că ”literele” din care este compusă o macromoleculă de ADN sunt în număr de patru: adenină (A), citozină (G), guanină (G) și timină (T). În prezent, nu se pot ”scrie” decît secvențe relativ scurte de ADN. De asemenea, atunci când o literă apare de mai multe ori într-o secvență (de exemplu, atunci când avem AA, GGG etc.) crește probabilitatea apariției de erori în transcrierea informațiilor. Ewan Bierny, unul dintre cercetătorii care a participat la proiectul despre care vă povestim acum, explica aceste probleme: ”Noi știam ca va trebui să realizăm un cod, numai prin folosirea de secvențe scurte de ADN, în care repetarea în serie a unei singure litere ar fi fost imposibilă. De aceea am decis să scurtăm codul în mai multe fragmente, care se suprapun la ambele capete, pe care le-am indexat astfel încât să indicăm poziția unui anumit fragment în ansamblul [final]. Am realizat și o schemă prin care am evitat apariția repetițiilor. Astfel, pentru a apare o eroare de transcriere, ar fi nevoie ca aceasta eroare să se se repete pe patru fragmente diferite, ceea ce este practic imposibil.”

Practic, fiecare fragment în care a fost codificată informația avea o lungime de numai 117 ”litere”. Pentru a se evita repetarea aceleiași litere s-au folosit pentru transcriere numai trei dintre bazele aminice, cea de a patra fiind folosită ca separator între ”litere”. În plus, 75% din fiecare fragment a fost copiat pe fragmentul următor.

După scrierea codului, acesta a fost transmis către Agilent Technologies Inc., care a realizat transcriera sa sub formă de fragmente de ADN. Rezultatul semăna cu o mică grămăjoară de praf, care a fost introdusă într-un flacon, după care a fost trimis prin poștă (fără nici o precauție suplimentară) către cercetătorii din Marea Britanie. Aceștia au putut reface fără probleme fișierele codate în cele 150.000 de fragmente ADN în care au fost transcrise fișierele despre care vorbeam la începutul acestui text.

În plus, informația stocată poate fi conservată pentru perioade foarte lungi de timp. Să nu uităm că în prezent se studiază ADN-ul omului de Neanderthal, un ADN vechi de mai bine de 35.000 de ani… Nick Goldman, unul dintre cercetătorii care au contribuit la această performanță spunea că: ”Natura a descoperit că această moleculă [cea de ADN], care este extrem de stabilă. Noi nu am făcut altceva decât să imităm natura.” Mai este ceva de remarcat. Dacă civilizația umană ar dispărea în urma unui cataclism, cercetătorii din viitor, dacă ar descoperi macromolecule de ADN în care au fost stocate fieșiere digitale ar putea descifra informațiile stocate. Nick Goldman: ”Ei [,cercetătorii din viitor,] și-ar da seama că au de-a face cu un ADN pe care nu l-au întâlnit niciodată. Nu apar repetări și fiecare secvență are aceași lungime. Va fi evident pentru ei că acest ADN nu provine de la bacterii sau de la oameni. Probabil că asta îi va convinge să cerceteze mai amănunțit [ADN-ul în care noi stocăm acum fișierele].”

Rezultatele obținute au fost publicate în ediția online a revistei Nature în 23 ianuarie.

Surse: PhysicsWorld, Nature, European Bioinformatics Institute, Rezumatul lucrării ” Towards practical, high-capacity, low-maintenance information storage in synthesized DNA”, publicate în revista Nature

Upgrade