DNK pohranjuje podatke o osobinama živih biće preko tripleta heterocikličnih baza koji su, zapravo, šifre za aminokiseline. Šta ako bismo mogli iskoristiti DNK za pohranjivanje digitalnih podataka?
DNK je dobar medij: kompaktna je i u svega 1gram DNK može stati 215 petabajta informacija. To je 215 miliona GB podataka, ako vam je tako lakše zamisliti. Peta je red veličina 10e15. Mogli bi ste gotovo cjelokupno znanje koje čovječanstvo posjeduje posložiti u jednu sobicu. DNK ne degradira baš tako lako i podaci bi se mogli čuvati hiljadama godina u mračnoj i hladnoj prostoriji. Vrijeme poluraspada DNK iznosi 521 godinu, a nakon 1.5 miliona godina sekvenca postaje nečitljiva. Tačno je da nije neuništiva, ali traje duže od CD-ova, stickova i drugih nosača informacija. DNK je možda ultimativni hard-disk.
Ideja i pokušaj pohranjivanja podataka na DNK datira iz 60-tih godina prošlog vijeka kada je sovjetski fizičar Mihail Samoilovič Neiman predložio teoretski model pohranjivanja na DNK koji je nazvao MNeimONics. Međutim, tek je 2012. ova ideja prvi put ostvarena – kada je George Church, genetičar sa Harvarda kojeg sam ovdje već nekoliko puta spominjala, u saradnji sa Sri Kosurijem i nizom drugih naučnika, uspio pohraniti podatke iz knjige koja je sadržavala oko 53 400 riječi (5.25 megabita) na DNK.
I da se ne pitate o kojoj je knjizi bilo riječ: radilo se o priručniku genetike, koji je pohranjen na oko 1 pikogram DNK. Podaci se ovdje ne pretvaraju u nule i jedinice, nego se prevode u adenine, timine, gvanine i citozine. Odnosno nule i jedinice se prevode u A,T,G i C-ove. Za čitanje šifre se koriste tehnike sekvencioniranja, a sekvence koje pohranjuju podatke imaju i neku vrstu svog bar-koda koji je šifra mjesta gdje se podatak nalazi. Greška pristupa koji su koristili Church i Kosuri iznosila je 2 greške na milion bita podataka, što i nije malo.
Međutim, jedan nedavni eksperiment, čiji su rezultati objavljeni 3. marta ove godine, pokazao je kako skladištenje digitalnih podataka na DNK može biti još preciznije. Nova metoda, koju su razvili Yaniv Erlich i Dina Zielinski, nazvana je “DNA Fountain” i približava se teoretskom maksimumu količine podataka koji se mogu pohraniti po nukleotidu. U ovom radu je dostignuto 85% Shannonovog kapacita pohrane. Podaci se iščitavaju metodom PCR-a i to nakon nekoliko ciklusa amplifikacije, pri čemu upravo veći broj dobijenih kopija DNK smanjuje mogućnost greške.
DNK pohranjuje podatke o osobinama živih biće preko tripleta heterocikličnih baza koji su, zapravo, šifre za aminokiseline. Šta ako bismo mogli iskoristiti DNK za pohranjivanje digitalnih podataka?
DNK je dobar medij: kompaktna je i u svega 1gram DNK može stati 215 petabajta informacija. To je 215 miliona GB podataka, ako vam je tako lakše zamisliti. Peta je red veličina 10e15. Mogli bi ste gotovo cjelokupno znanje koje čovječanstvo posjeduje posložiti u jednu sobicu. DNK ne degradira baš tako lako i podaci bi se mogli čuvati hiljadama godina u mračnoj i hladnoj prostoriji. Vrijeme poluraspada DNK iznosi 521 godinu, a nakon 1.5 miliona godina sekvenca postaje nečitljiva. Tačno je da nije neuništiva, ali traje duže od CD-ova, stickova i drugih nosača informacija. DNK je možda ultimativni hard-disk.
Ideja i pokušaj pohranjivanja podataka na DNK datira iz 60-tih godina prošlog vijeka kada je sovjetski fizičar Mihail Samoilovič Neiman predložio teoretski model pohranjivanja na DNK koji je nazvao MNeimONics. Međutim, tek je 2012. ova ideja prvi put ostvarena – kada je George Church, genetičar sa Harvarda kojeg sam ovdje već nekoliko puta spominjala, u saradnji sa Sri Kosurijem i nizom drugih naučnika, uspio pohraniti podatke iz knjige koja je sadržavala oko 53 400 riječi (5.25 megabita) na DNK. I da se ne pitate o kojoj je knjizi bilo riječ: radilo se o priručniku genetike, koji je pohranjen na oko 1 pikogram DNK. Podaci se ovdje ne pretvaraju u nule i jedinice, nego se prevode u adenine, timine, gvanine i citozine. Odnosno nule i jedinice se prevode u A,T,G i C-ove. Za čitanje šifre se koriste tehnike sekvencioniranja, a sekvence koje pohranjuju podatke imaju i neku vrstu svog bar-koda koji je šifra mjesta gdje se podatak nalazi. Greška pristupa koji su koristili Church i Kosuri iznosila je 2 greške na milion bita podataka, što i nije malo.
Međutim, jedan nedavni eksperiment, čiji su rezultati objavljeni 3. marta ove godine, pokazao je kako skladištenje digitalnih podataka na DNK može biti još preciznije. Nova metoda, koju su razvili Yaniv Erlich i Dina Zielinski, nazvana je “DNA Fountain” i približava se teoretskom maksimumu količine podataka koji se mogu pohraniti po nukleotidu. U ovom radu je dostignuto 85% Shannonovog kapacita pohrane. Podaci se iščitavaju metodom PCR-a i to nakon nekoliko ciklusa amplifikacije, pri čemu upravo veći broj dobijenih kopija DNK smanjuje mogućnost greške.
Za ovo se, naravno, ne koristi DNK izolovana iz živih organizama, već lanci sintetičke DNK. Ipak, ova metoda još nije komercijalno dostupna, s obzirom da je cijena sintetiziranja 2 MB podataka oko 7000$, a potrebno je još oko 2000$ da se podaci pročitaju.