Successivo

News

Microsoft compra DNA per archiviare dati

Michele Braga | 28 Aprile 2016

Microsoft

In un futuro non troppo lontano i dati digitali potrebbero essere immagazzinati in speciali catene di DNA (acido deossiribonucleico) create in laboratorio. Twist […]

In un futuro non troppo lontano i dati digitali potrebbero essere immagazzinati in speciali catene di DNA (acido deossiribonucleico) create in laboratorio. Twist Bioscience, una startup con sede a San Francisco e specializzata nella sintesi e nella manipolazione genetica, ha annunciato che Microsoft ha acquistato i diritti per dieci milioni di catene di DNA di sintesi per studiare e valutare la possibilità  di archiviare le informazioni digitali nel materiale genetico. In pratica Microsoft fornirà  a Twist Bioscience le sequenze da trascrivere all’interno delle catene di DNA e poi le prenderà  in carico per verificare l’affidabilità  dei dati immagazzinati nel corso del tempo.

L’idea di utilizzare il DNA come supporto di archiviazione dati è tutt’altro che una novità , in effetti la Natura utilizza questo stesso sistema da miliardi di anni sulla Terra; gli scienziati studiano questo campo già  da diversi anni, ma solo grazie al crollo dei costi legati alle tecnologie genetiche la possibilità  di creare DNA sulla base di informazioni esterne sembra assumere concretezza. Di recente un gruppo di scienziati dell’Università  di Washington ha mostrato di essere riuscito a immagazzinare immagini all’interno delle catene di DNA per poi estrarle senza errori.

La densità  di informazioni che possono essere archiviate con le catene di acido deossiribonucleico è estremamente più alta di qualunque supporto digitale utilizzato oggi: un solo grammo di DNA è in grado di contenere fino a un miliardo di Tbyte e a rendere ancora più interessante questo sistema di archiviazione è anche la resistenza al tempo di questo supporto (l’idea alla base del romanzo Jurassic Park che prevedeva l’utilizzo di DNA estratto da fossili preistorici vi dice qualcosa?).

Le basi per l’archiviazione dati nel DNA

Il DNA è un lungo polimero costituito da unità  ripetute di nucleotidi che sono unità  ripetitive degli acidi nucleici costituite da tre gruppi: una base azotata (purina o pirimidina), uno zucchero a cinque atomi di carbonio (zucchero pentoso che insieme alla base azotata costituisce un nucleoside) e un gruppo fosfato che insieme al nucleoside costituisce un nucleotide.
La catena del DNA è larga tra i 22 ed i 26 Angstrom (da 2,2 a 2,6 nanometri) ed ogni unità  nucleotidica è lunga 3,3 Angstrom (0,33 nanometri). Sebbene ogni unità  occupi uno spazio decisamente ridotto, la lunghezza dei polimeri di DNA può essere sorprendentemente elevata, dal momento che ogni filamento può contenere diversi milioni di nucleotidi: il più grande cromosoma umano (il cromosoma 1), ad esempio, contiene quasi 250 milioni di paia di basi.
Negli organismi viventi, il DNA non è quasi mai presente sotto forma di singolo filamento, ma come una coppia di filamenti saldamente associati tra loro in una struttura definita a doppia elica che conferisce maggiore stabilità  alla struttura e alle informazioni in essa contenute.
La metodologia più semplice, attraverso la quale gli scienziati sono in grado già  da anni di memorizzare dati sul DNA, prevede di sostituire i valori 0 e 1 del sistema binario usato dai computer con le quattro basi azotate alla base della chimica del DNA; questi elementi sono identificati con quattro lettere: A (adenina), T (timina), C (citosina) e G (guanina).

La scrittura di DNA di sintesi ha oggi un costo pari a circa 10 centesimi di dollaro per base azotata, ma Twist Bioscience stima di poter portare il costo di produzione a 2 centesimi di dollaro nel prossimo futuro. Per la lettura del DNA si utilizzano invece le tecniche di sequenziazione genetica; il costo per sequenziare il DNA è sceso in modo vertiginoso negli ultimi 20 anni: basti pensare che il progetto Genoma Umano è costato circa 3 miliardi di dollari tra il 1990 e il 2003. Oggi un simile progetto avrebbe un costo di circa 1.000 dollari. Sebbene i costi siano decisamente inferiori, oggi questa soluzione di archiviazione è ancora troppo costosa per essere utilizzata in qualunque ambito. Tuttavia, viste le potenzialità  di questa ipotesi, vista la crescente quantità  di informazioni che generiamo a livello globale e vista la necessità  di archiviarne la maggior parte, l’idea di raccogliere in pochi grammi di materia miliardi di Tbyte di dati è estremamente allettante in prospettiva futura.

Restano ovviamente da valutare gli effetti derivati da mutazione dovute all’intervento di agenti esterni, anche se gli scienziati sono da tempo al lavoro su algoritmi in grado di integrare nelle sequenze di DNA codici per la correzione degli errori, in modo simile a quanto già  si fa con i dati archiviati nei datacenter di tipo standard.