Forskere arbeider for å lagre digital informasjon i DNA

Anonim

Hennes datamaskin, sier Karin Strauss, inneholder hennes "digitale loftet" -sted der hun lagrer den publiserte mattepapiren hun skrev i videregående skole og datavitenskapsskolearbeid fra college.

Hun vil gjerne beholde tingene "så lenge jeg lever, i hvert fall", sier Strauss, 37. Men datamaskiner må byttes ut noen få år, og hver gang må hun kopiere informasjonen over, "som er en liten bit av en hodepine."

Det ville være mye bedre, sier hun, om hun kunne lagre den i DNA-de tingene våre gener er laget av.

Strauss, som jobber ved Microsoft Research i Redmond, Washington, jobber for å gjøre den sci-fi-fantasien til virkelighet.

Hun og andre forskere er ikke fokusert på å finne måter å studere videregående prosjekter eller øyeblikksbilder eller andre ting som en gjennomsnittlig person kan akkumulere, i hvert fall for nå. Snarere har de som mål å hjelpe bedrifter og institusjoner til å arkivere store mengder data i flere tiår eller århundrer, på et tidspunkt da verden genererer digitale data raskere enn det kan lagre det.

For å forstå søket, hjelper det å vite hvordan bedrifter, regjeringer og andre institusjoner lagrer data nå: For langtidsoppbevaring er det typisk disker eller spesialisert slags kassett, oppløst i kassetter omtrent tre tommer på en side og mindre enn en tomme tykk. En enkelt patron som inneholder omtrent en halv mil med tape, kan holde omtrent 46 millioner bøker på 200 sider, og tre ganger så mye hvis dataene gir seg mulighet til å bli komprimert.

En kassettpatron kan lagre data i ca. 30 år under ideelle forhold, sier Matt Starr, sjefsteknologofficer i Spectra Logic, som selger datalagringsenheter. Men en mer praktisk grense er 10 til 15 år, sier han.

Det er ikke slik at dataene forsvinner fra båndet. Et større problem er kjent for alle som har kommet over et gammelt åttesporingsbånd eller en diskett og forstått at han ikke lenger har en maskin til å spille den. Teknologi går videre, og data kan ikke hentes hvis måten å lese den ikke lenger er tilgjengelig, sier Starr.

Derfor og av andre grunner krever langvarig arkivering gjentatte ganger kopiering av data til ny teknologi.

I denne verden kommer begrepet DNA lagring. DNA er ved sin essens et informasjonslagringsmolekyl; generene vi overgår fra generasjon til generasjon overfører tegningene for å skape menneskekroppen. Denne informasjonen lagres i strenge av det som ofte kalles den fire bokstaver DNA-koden. Det refererer egentlig til sekvenser av fire byggeblokker, forkortet som A, C, T og G-funnet i DNA-molekylet. Spesifikke sekvenser gir kroppens retninger for å lage bestemte proteiner.

Digitale enheter, derimot, lagrer informasjon i en to-bokstavskode som produserer strenger av seg og nuller. En kapital "A", for eksempel, er 01000001.

Konvertering av digital informasjon til DNA innebærer å oversette mellom de to kodene. I et laboratorium kan for eksempel hovedstaden A bli ATATG. Tanken er en gang at transformasjonen er laget, DNA-strengene kan være skreddersydde for å bære den nye koden, og dermed informasjonen som inneholder koden.

Et salgsargument er holdbarhet. Forskere kan gjenopprette og lese DNA-sekvenser fra fossiler av Neanderthals og til og med eldre livsformer. Så som et lagringsmedium, "det kan vare tusenvis og tusen år, " sier Luis Ceze fra University of Washington, som jobber med Microsoft om DNA-datalagring.

Advokater understreker også at DNA crams informasjon til svært lite plass. Nesten hver celle i kroppen din bærer rundt seks meter av den; som legger opp til milliarder mil i en enkelt person. Når det gjelder lagring av informasjon, kan denne kompaktheten innebære å lagre alle offentlig tilgjengelige data på internett i et rom på størrelse med en skoboks, sier Ceze.

Faktisk kan all den digitale informasjonen i verden bli lagret i en belastning av hvitt, pulveraktig DNA som passer i rommet på størrelse med en stor varebil, sier Nick Goldman fra European Bioinformatics Institute i Hinxton, England.

Dessuten sier advokater at DNA-lagring vil unngå problemet med å gjentatte ganger kopiere lagret informasjon til nye formater, ettersom teknologien for å lese den blir utmattet.

"Det kommer alltid til å være noen i bransjen for å lage en DNA-leser på grunn av helseprogrammer, sier Goldman. "Det er alltid noe vi skal ønske å gjøre raskt og billig."

Å få informasjonen i DNA tar litt å gjøre. Når forskere har konvertert den digitale koden til 4-letter DNA-koden, må de skreddersy DNA. For noen nyere undersøkelser arbeidet Strauss og Ceze med, som involverte å skape om lag 10 millioner korte DNA-strenger.

Twist Bioscience of San Francisco brukte en maskin til å lage strenge brev til brev, som å knuse sammen Lego-stykker for å bygge et tårn. Maskinen kan bygge opptil 1, 6 millioner strenger av gangen.

Hver streng hadde bare et fragment av informasjon fra en digital fil, pluss en kjemisk kode for å angi hvilken fil informasjonen kom fra.

For å lese en fil, bruker forskerne kodene for å samle de relevante strengene. En standard laboratoriemaskin kan da avsløre sekvensen av DNA-bokstaver i hver streng.

Ingen snakker om å bytte ut harddisker i forbruker datamaskiner med DNA. For det første tar det for lang tid å lese den lagrede informasjonen. Det kommer aldri til å bli oppnådd om noen sekunder, sier Ewan Birney, som jobber med DNA-lagring med Goldman ved bioinformatikk instituttet.

Men for verdifullt materiale som bedriftsrekord i langsiktig lagring, "hvis det er verdt det, vil du vente", sier Goldman, som med Birney snakker med investorer om å sette opp et selskap som tilbyr DNA-lagring.

Sri Kosuri ved University of California Los Angeles, som har jobbet med DNA-informasjon lagring, men nå i stor grad flyttet til andre sysler, sier en utfordring for å gjøre teknologien praktisk gjør det mye billigere.

Forskere tilpasser seg ganske korte snorer DNA nå for forskning, men oppskalering av nok til å håndtere informasjonslagring i bulk vil kreve et "skremmende" sprang i produksjon, sier Kosuri. Med dagens teknologi, ville det være enormt dyrt, sier han.

George Church, en fremtredende Harvard genetikkekspert, er enig i at kostnaden er et stort problem. Men "Jeg er ganske optimistisk, det kan bli brakt ned" dramatisk om et tiår eller mindre, sier Kirken, som er i ferd med å starte et selskap for å tilby DNA-lagringsmetoder.

For all interesse i emnet, er det verdt å merke seg at så langt mengden informasjon som forskere har lagret i DNA, er relativt liten.

Tidligere i måneden annonserte Microsoft at et lag, inkludert Strauss og Ceze, hadde lagret en rekord på 200 megabyte. Informasjonen inkluderte 100 bøker - en, passende, var "store forventninger" - sammen med en kort video og mange dokumenter. Men det var fortsatt mindre enn 5 prosent kapasiteten til en vanlig DVD.

Likevel er det omtrent ni ganger merket som ble rapportert forrige måned av Kirken, som sier at kunngjøringen viser "hvor fort feltet går."

I mellomtiden sier folk som er involvert i arkivering av digitale data at deres felt viser DNA som en mulighet for fremtiden, men ikke en kur-alt.

"Det er en veldig interessant og lovende tilnærming til lagringsproblemet, men lagringsproblemet er egentlig bare en svært liten del av digital bevaring, sier Cal Lee, professor ved University of North Carolina School of Information and Library Science.

Det er sant at samfunnet sannsynligvis alltid vil ha enheter til å lese DNA, slik at det kommer rundt problemet med foreldede lesere, sier han. Men det er ikke nok.

"Hvis du bare leser de og nullene, vet du ikke hvordan du skal tolke det, " sier Lee.

For eksempel er strengen et bilde, en tekst, et lydklipp eller en video? Har du fortsatt programvaren for å gjøre det fornuftig?

Dessuten vil de som har ansvaret for å holde digital informasjon, regelmessig sjekke det for å sikre at det fortsatt er intakt, og "Jeg vet ikke hvor levedyktig det er med DNA, " sier Euan Cochrane, digital bevaringsleder ved Yale University Bibliotek. Det kan bety færre slike kontroller, sier han.

Cochrane, som beskriver sin jobb som å holde informasjonen tilgjengelig "10 år for alltid", sier DNA ser interessant ut om kostnadene kan reduseres og forskere finner måter å raskere lagre og gjenopprette informasjon.

Starr sier at data-lagringsenhetsselskapet ikke har tatt et detaljert titt på DNA-teknologi fordi det er for langt i fremtiden.

Det er "alltid ting ute i horisonten som kan lagre data i svært lang tid, " sier han. Men utfordringen med å gjøre disse ideene til et praktisk produkt "trimmer virkelig feltet ganske raskt."

menu
menu