ADN-ul ca depozit biologic durabil și eficient pentru datele digitale 169; Fundația Assmann
Știri din știință
ADN-ul ca mediu de stocare biologic de lungă durată și eficient pentru datele digitale [169]
Conceptul de medicină personalizată promite să adapteze cât mai mult posibil recomandările pentru prevenirea și tratamentul bolilor pentru fiecare pacient (1). Pentru ca acest lucru să aibă succes, trebuie colectate, evaluate și, mai presus de toate, salvate, cantități mari de date.

Mediile convenționale de stocare a datelor, cum ar fi hard disk-urile, sunt relativ de scurtă durată. Pentru a păstra aceste colecții de date, acestea trebuie copiate în mod regulat. Doi oameni de știință de la Columbia University și New York Genome Center (NYGC) valorifică acum potențialul materialului ADN ca depozit biologic pentru informații digitale (2). Folosind un algoritm conceput pentru streaming video pe un telefon mobil, au reușit să comprime un sistem de operare complet al computerului, să filmeze și alte fișiere în oligonucleotide ADN și să le recupereze intacte.
Detalii științifice
Purtătorii genetici sunt un mediu de stocare aproape perfect. ADN-ul primește informații extrem de comprimate de-a lungul mileniilor și nu devine din punct de vedere tehnic depășit.
Profesorul de informatică, Yaniv Erlich de la Columbia’s Data Science Institute, și colega sa Dina Zielinski au demonstrat acum, în cooperare cu Centrul Genomului din New York, că ADN-ul este, de asemenea, potrivit pentru păstrarea intactă a datelor digitale. Au selectat șase fișiere reprezentative pentru a le codifica în ADN; un sistem de operare complet al computerului, scurtmetrajul francez Sosirea unui tren la La Ciotat din 1895, un card cadou Amazon în valoare de 50 USD, un virus pentru computer, o insignă de pionier și o publicație din 1948 a teoreticianului informației Claude Shannon.
Combinate într-un fișier master, cele șase suporturi au fost traduse în șiruri scurte de cod binar alcătuit din unu și zerouri. Algoritmul de corecție Fountain Code a ajutat la atribuirea aleatorie a acestor șiruri celor patru baze nucleotidice din ADN: A, G, C și T și la ștergerea combinațiilor de erori. Picăturile de informații rezultate au primit coduri de bare pentru decriptare.
Startul sintezei ADN-ului, Twist Bioscience de la San Francisco, a transformat cele 72.000 de fire ADN descrise în acest mod în molecule de ADN. În cele din urmă, informațiile digitale ar putea fi extrase din aceste biomolecule fără erori. Cu tehnologia lor de codificare, oamenii de știință au reușit, de asemenea, să dubleze firele de ADN și astfel să producă copii fără erori ale fișierelor originale.
Performanța de compresie a fost, de asemenea, remarcabilă. O medie de 1,6 biți a fost ambalată în fiecare nucleotidă de bază, cu cel puțin 60% mai multe date decât cu tehnicile convenționale. Este nevoie de un singur gram de material ADN pentru a stoca 215 petabytes (= 1.000.000.000.000 de octeți) de date. Prin urmare, biomoleculele sunt considerate a fi cel mai dens dispozitiv de stocare a datelor care a fost folosit vreodată. Arhivarea datelor digitale în stocarea biologică este încă prea costisitoare pentru a fi utilizate pe scară largă. A fost nevoie de 7.000 de dolari pentru a face firele de ADN și alți 2.000 de dolari pentru a le descifra.