Sommario:
- Un campo che avanza rapidamente
- Ridondanza integrata e necessità di correzione degli errori
- Incassare — Ogni giorno adesso
Video: La prova del DNA nel processo penale (Novembre 2024)
Gli ingegneri spingono con successo più spazio di archiviazione in spazi più piccoli per decenni, ma ciò non può andare avanti per sempre. Il prossimo grande salto nella memorizzazione dei dati potrebbe assumere la forma del DNA all'interno di tutta la materia organica: gli scienziati nei laboratori di tutto il paese stanno sperimentando il DNA sintetico come mezzo di archiviazione.
"Se guardi dove sta andando l'elettronica, la tecnologia al silicio, molta della tecnologia di base che usiamo oggi per costruire computer, ci stiamo avvicinando al limite in quasi tutti loro", afferma Luis Henrique Ceze, professore associato di informatica e ingegneria all'università di Washington. "Il DNA è molto denso, molto resistente e richiede pochissima potenza per essere mantenuto, quindi c'è un grande vantaggio nell'utilizzare il DNA per l'archiviazione dei dati."
Ceze ha lavorato con Karin Strauss, un ricercatore di architettura informatica con Microsoft Research, su una collaborazione tra le due istituzioni, un progetto che collega l'informatica e la biologia. Per un team di circa 20 persone, l'università fornisce i biologi molecolari e Microsoft fornisce gli informatici.
Per capire come il DNA potrebbe essere usato per l'archiviazione, considera che tutti i dati del computer sono binari o base-2. Il DNA è base-4, composto da adenina, citosina, guanina e timina (abbreviato in A, C, G e T). Il primo passo è convertire le informazioni di base-2 in base-4, quindi A corrisponde a 00, da C a 01, da G a 10 e da T a 11 (che semplifica un po 'ma supera l'idea).
Quindi gli scienziati usano una macchina chiamata sintetizzatore di DNA per combinare le quattro sostanze chimiche nell'ordine giusto. Il risultato memorizza le informazioni più volte come un ammasso simile al sale più piccolo della punta di una matita. La lettura di tali informazioni richiede un sequencer del DNA.
Mentre questo può sembrare fragile, come qualcosa che potrebbe esplodere quando una porta si apre improvvisamente, il DNA è il più potente mezzo di archiviazione dei dati che abbiamo visto. Gli scienziati hanno letto con successo il DNA che ha centinaia di migliaia di anni.
Il sequenziamento del DNA comporta la rimozione di una piccola parte del materiale immagazzinato e il processo esaurisce quel campione. Di conseguenza, una registrazione del DNA può essere letta un numero finito di volte. Questo non è un problema, tuttavia, dal momento che il materiale memorizzato ha così tanti dati ridondanti; può essere campionato più volte. I supporti di archiviazione odierni hanno anche un numero limitato di cicli di scrittura e lettura prima che falliscano, quindi questa non è una novità.
Come sottolinea Ceze, il DNA non sarà mai obsoleto. Mentre molti di noi hanno dischi floppy nel retro di un cassetto che non possiamo più leggere, non sarà il destino del DNA. "Ci occuperemo sempre del DNA per le scienze della vita e per motivi di salute, quindi avrai sempre modo di leggere le informazioni memorizzate nel DNA", afferma Ceze.
Nel luglio 2016, Microsoft e l'Università di Washington hanno codificato con successo 200 MB di dati in forma di DNA, superando il record precedente di 22 MB. Utilizzando il DNA, afferma Strauss, sarà possibile archiviare 1 exabyte di dati, ovvero 1 miliardo di GB, in un cubo da 1 pollice.
"Abbiamo fatto una stima della quantità di dati che è possibile inserire in un determinato volume", afferma Strauss. "Abbiamo cercato di stimare quale sarebbe il volume se oggi decidessimo di archiviare l'intera Internet accessibile, ovvero tutto ciò che non è dietro una password o qualsiasi tipo di muro elettronico, e abbiamo trovato le dimensioni di una grande scatola da scarpe".
Sembra una proposta lontana, ma Ceze crede che vedremo sul mercato sistemi di stoccaggio del DNA commerciali tra un decennio. Non funzioneranno esattamente come lo stoccaggio di microprocessori, poiché il DNA richiede un ambiente chimico umido per la creazione, ma forniranno un'enorme capacità e un accesso casuale alle stesse velocità che i sistemi a nastro aziendali offrono ora.
Un campo che avanza rapidamente
Il DNA esiste da miliardi di anni, ma le dimostrazioni del DNA come tecnologia di archiviazione utilizzabile sono iniziate nel 1986 quando il ricercatore del MIT Joe Davis ha codificato una semplice immagine binaria in 28 coppie di basi di DNA.
Un altro pioniere in questo campo è George Church, un professore di genetica che lavora alla Harvard Medical School dal 1977 e gestisce il suo laboratorio dal 1986. Church è stata interessata a ridurre i costi di lettura e scrittura del DNA dagli anni '70, credendo che un giorno si sarebbero riuniti per creare una pratica memorizzazione dei dati. Si è interessato a lavorare sulla ricerca sul DNA intorno al 2000 ed ha eseguito sequenze critiche e test di sintesi nel 2003 e 2004. Nel 2012, è stato in grado di mettere insieme entrambe le aree e creare un sistema per la codifica dei dati. Ha scritto quel lavoro in un influente articolo del 2012 su Science .
"Prima del 2003 e del '04, il sequenziamento e la sintesi venivano eseguiti essenzialmente nei capillari - o piccoli tubi - dove avresti avuto un tubo per sequenza", spiega Church. "Era piuttosto manuale e non scalabile. La lezione che avevamo imparato dall'industria dei semiconduttori di microfabbricazione era che dovevi trovare un modo per metterli essenzialmente su un piano bidimensionale e poi ridimensionare le dimensioni delle caratteristiche. i metodi basati su colonne erano compatibili con quello, e così nel 2003, abbiamo mostrato come distribuire sequenze su un piano bidimensionale e poi immaginarle con immagini fluorescenti che ora è il modo dominante di sequenziamento. Poi, nel 2004, abbiamo dimostrato che potresti fabbricare il DNA su un piano e poi farlo scivolare via, e quindi potrebbe essere ancora più compatto; quindi l'aereo era solo un posto temporaneo per sintetizzarli. Quindi potresti compattarli in un oggetto tridimensionale che era milioni di volte più compatto della normale memorizzazione dei dati.
"Quelli erano prove di esercizi concettuali nel 2003 e nel 2004. Nel 2012, noi e altri abbiamo perfezionato i metodi di lettura e scrittura per il DNA e li ho riuniti in un esperimento in cui ho codificato un libro che avevo appena scritto nel DNA, comprese le immagini, dimostrando che praticamente tutto ciò che è digitale potrebbe essere codificato con il DNA ".
Sebbene il costo sia un ostacolo significativo per lo stoccaggio del DNA, Church nota che il prezzo è sceso drasticamente nel breve periodo in cui sono state condotte ricerche. Il costo della lettura del DNA è migliorato di circa 3 milioni di volte, mentre il costo della scrittura è migliorato di un miliardo di volte. Riesce a vedere entrambi migliorare di un altro milione di volte in meno tempo. Sottolinea inoltre che il costo della copia del materiale del DNA è quasi gratuito, così come il costo della conservazione a lungo termine. Per l'archiviazione degli archivi, il costo della lettura dei dati non è un grosso ostacolo, dal momento che molto materiale archiviato non viene mai letto e alcuni articoli vengono letti in modo selettivo. Guarda i costi di tutto il sistema, consiglia. I metodi di archiviazione tradizionali si muovono alla velocità della Legge di Moore e presto raggiungeranno il plateau. Ma la tecnologia di stoccaggio del DNA si sta muovendo più velocemente della legge di Moore e non mostra segni di plateau.
L'archiviazione e l'archiviazione su cloud è dove Church vede l'archiviazione dei dati sul DNA adottata per prima. Le aziende tra cui IBM, Microsoft e Technicolor hanno i propri team di ricerca e sviluppo che studiano l'area, osserva. Ha collaborato con Technicolor nel 2015 per conservare A Trip to the Moon , un classico film del 1902 che una volta si credeva perduto, nel DNA. Ora Technicolor ha molte copie del DNA che, combinate, non sono più grandi di un granello di polvere.
Church ha un laboratorio di 93 persone che lavorano allo stoccaggio del DNA e attualmente si stanno concentrando su due obiettivi. Il primo è migliorare radicalmente la velocità per ciclo. Le informazioni sono memorizzate in centinaia di strati, ciascuno denso come una molecola. Ogni aggiunta richiede attualmente tre minuti, ma Church ritiene che possa essere ridotto a meno di un millisecondo. È 200.000 volte più veloce, osserva, e significa un passaggio dalla chimica organica alla biochimica. Vuole anche cambiare il modo in cui gli strumenti utilizzati per la lettura e la scrittura sono fabbricati per renderli molto più piccoli. Attualmente, hanno le dimensioni di grandi frigoriferi. Vuole che sia ridotto.
Ridondanza integrata e necessità di correzione degli errori
Un ricercatore influenzato dall'articolo di Church Science del 2012 è la professoressa Olgica Milenkovic dell'Università dell'Illinois, Urbana-Champaign. L'articolo menzionava la necessità di scrivere codice, che ha immediatamente suscitato il suo interesse. La codifica nella ricerca sull'archiviazione è una tecnica per aggiungere ridondanza ai dati, ridondanza che può essere successivamente utilizzata per correggere errori che si verificano durante il processo di lettura e scrittura. Per un esempio del perché questo è importante, guarda qui le due foto di Citizen Kane. Entrambi sono stati codificati nel DNA dal team di Milenkovic e poi letti. Indovina quale ha usato la ridondanza.
Hai ragione: l'immagine della mano sinistra è stata codificata con ridondanza e l'immagine della mano destra no.
Un modo semplice per aggiungere ridondanza è ripetere ogni personaggio un determinato numero di volte. Invece di scrivere uno 0, scriverlo quattro volte. Questo è l'approccio della forza bruta, semplice ma terribilmente inefficiente. Il lavoro di Milenkovic riguarda il raggiungimento della stessa correzione degli errori in un modo più sofisticato. Implica tecniche chiamate controlli di parità o controlli di congruenza lineari per fornire modi di verificare i dati.
"L'intero campo consiste essenzialmente nell'aiutarti a correggere gli errori se compaiono o, ancora meglio, evitare errori che sai che molto probabilmente appariranno", afferma Milenkovic. "Introduciamo la ridondanza controllata per eliminare gli errori e quella ridondanza controllata non si presenta sotto forma di semplice ripetizione, perché è molto inefficace".
Questo è ciò che ha portato Milenkovic sul campo, ma la sua ricerca ora riguarda l'abbattimento dell'enorme costo della sintesi del DNA.
"Il mio studente, H. Tabatabae Yazdi, che è stato molto attivo su questo argomento, e ho cercato molto duramente di trovare un modo intelligente per evitare di sintetizzare il DNA. Sintetizzare il DNA è assolutamente un collo di bottiglia per questa tecnologia a causa del costo elevato ", Dice Milenkovic.
Sebbene Milenkovic sia diffidente nel rivelare troppo la ricerca inedita, la sua soluzione prevede "astuti approcci matematici" e si basa sul tempismo, in cui la dimensione dell'intervallo tra bit di informazione è significativa.
"Se si rinuncia alla formalità che si desidera utilizzare gli ATGC per codificare realmente i simboli binari in una determinata posizione, è possibile trovare mezzi molto più intelligenti ed efficienti per archiviare le informazioni, perché non è necessario sintetizzare più e più volte i fili di nuovo ", spiega Milenkovic. "Puoi sintetizzarli una volta in un certo modo e poi riutilizzare quel DNA sintetizzato in un modo combinatorio intelligente."
Attraverso il suo lavoro, Milenkovic spera di ridurre i costi della sintesi del DNA di almeno tre ordini di grandezza. Non è ancora abbastanza, osserva, ma è un progresso. Inoltre sta contribuendo a una linea di ricerca che trova affascinante.
"Ad essere sincero, è molto eccitante interpretare Dio e codificare le tue informazioni nel DNA", afferma Milenkovic. "Dà a una persona una sensazione di eccitazione sapere che stai giocando con una molecola scelta della natura e facendole fare ciò che vuoi conservare, codificare e trasmettere informazioni al futuro."
Incassare - Ogni giorno adesso
Non è tutta una ricerca accademica polverosa e secca con lo stoccaggio del DNA. Helixworks, una società con sede in Irlanda, sta già cercando di guadagnare denaro. Ha un prodotto su Amazon, una specie di.
"Abbiamo lanciato su Amazon in modo da poter ottenere 512 KB di dati digitali codificati nel DNA", spiega Nimesh Pinnamaneni, cofondatore dell'azienda. "È qualcosa di molto piccolo. Forse una foto o forse una poesia, qualcosa del genere."
È un acquisto insolito, ma potrebbe essere il segno d'amore perfetto per la persona che ha tutto, soprattutto se quella persona è uno scienziato:
"Ricordo che un cliente ci chiamava. Voleva regalare a sua moglie - entrambi sono biotecnologi - voleva regalare a sua moglie per il loro anniversario di matrimonio. Voleva mettere un messaggio nel DNA e regalarle un DNA", ricorda Pinnamaneni. "Dovrebbe sequenziare il DNA per leggere il messaggio. È un modo abbastanza complicato per inviare un messaggio d'amore, ma forse è carino per i biotecnologi, sai?"
Ma Helixworks ha anticipato di sé pubblicando il suo prodotto su Amazon nell'agosto 2016, prima che fosse pronto per evadere gli ordini. Due persone hanno acquistato il DNADrive da $ 199 della società, una capsula d'oro da 14 carati con all'interno un grappolo di DNA, prima che Helixworks fosse costretto a consegnare il suo prodotto. DNADrive è ancora su Amazon, ma non è acquistabile.
Ciò non significa che Helixworks sia finita, solo entusiasta. È arrivato troppo lontano per fermarsi ora. La società ha iniziato all'Università di Borås in Svezia, dove Pinnamaneni (nella foto sopra, a sinistra) e Sachin Chalapati (a destra), l'altro cofondatore dell'azienda, stavano ottenendo un master in biotecnologia. Hanno raccolto fondi per la ricerca sullo stoccaggio del DNA, hanno continuato il loro lavoro una volta tornati a casa a Bangalore, in India, e hanno sviluppato una prova del concetto.
La ricerca di fondi aggiuntivi li ha portati al programma di accelerazione IndieBio gestito da SOSV, una società di venture capital a San Francisco, in California. Helixworks è stato selezionato dal programma e ha vinto $ 50.000 in contanti e la possibilità di lavorare da un laboratorio nella contea di Cork, dove è stato negli ultimi sei mesi. Il programma include il tutoraggio sulla presentazione di un prodotto, che Helixworks metterà in uso al festival South by Southwest di quest'anno, dove si sfiderà in un evento di lancio.
Mentre sfornare capsule d'oro di DNA potrebbe alla fine essere un redditizio margine, Pinnamaneni afferma che il futuro della sua azienda è nelle compatte stampanti per DNA per casa e ufficio che si sta sviluppando ora. Vuole rendere la conservazione del DNA abbastanza semplice e conveniente per essere utilizzata da chiunque.
"Abbiamo capito che devi avere qualcosa che funzioni come una cartuccia in una stampante", spiega Pinnamaneni. "Hai solo quattro colori e questi quattro colori possono combinarsi per formare qualsiasi colore possibile, giusto? Ecco come funziona la tua stampante a inchiostro. Abbiamo capito che dobbiamo avere qualcosa del genere nel nostro sistema. Abbiamo progettato una cartuccia di 32 reagenti che può essere combinato per formare qualsiasi sequenza di DNA possibile ".
Mentre altri laboratori pagano circa $ 30.000 ogni volta che devono sintetizzare il DNA, un'operazione che richiede settimane per essere realizzata, Pinnamaneni afferma che la sua invenzione può ridurre drasticamente i costi e i tempi. Helixworks collabora con Opentrons, un'azienda che produce apparecchiature di laboratorio automatizzate per creare la stampante. Questo è ciò che lancerà a SXSW.
"Ciò che dimostreremo al padiglione dell'esposizione è la scrittura del DNA proprio davanti ai tuoi occhi", afferma Pinnamaneni.
La società non prenderà ancora alcun ordine. E va bene, perché quel romantico biotecnologo sta ancora aspettando il suo regalo di anniversario.