Sekvencirani do sada zanemareni dijelovi ljudskog genoma: mapiran i „tamni" dio genoma

Projekt Ljudski genom iščitao je samo 92% DNK – sada su naučnici konačno popunili preostalih 8%, i očekuje se objava radova o tome u mjesecima koji dolaze.

Međunarodni konzorcij sekvencirao je najcjelovitiju verziju ljudskog genoma ikada, više od 20 godina nakon što su naučnici objavili prvu verziju iščitanog ljudskog genoma. Vijest je objavljena 31. marta 2022.

Još oko 200 miliona baza sada popunjava praznine – uključujući zaštitne krajnje kape hromosoma, poznate kao telomere, i središnje guste centre hromosoma zvane centromere koje pomažu u odvijanju replikacije tokom ćelijske diobe.

Tih 200 miliona baza i dijelovi na Y hromosomu su bili netaknuti u prvoj verziji iščitanog genoma iz 2001. godine, Human genome project, na kojem je učestvovao niz sjajnih naučnika uključujući i Georga Churcha i Ewana Birneya.

Malte Mueller/fStop via Getty Images

U šest radova, Konzorcij Telomere-to-Telomere (T2T) – nazvan po završnim kapicama hromosoma – popunio je većinu nedostajućih dijelova genoma. Ostalo je još samo 5 od stotina problematičnih tačaka. Ostalo je još ,,samo” 10 miliona baza i Y kromosom koji su samo površno poznati. Grupa je na Twitteru objavila da je sekvencirala još jedan dio koji je prethodno nedostajao – Y hromosom i da će radovi o tome biti objavljeni uskoro.

Šta znači sekvencirati genom, iščitati hromosome? To znači odrediti slijed onih baza adenin, timin, gvanin, citozin (A,T,G,C) linearno na hromosomima. A redoslijed tih baza, odnosno ,,slova” kada se pročita kroz grupe od po tri, govori o redoslijedu aminokiselina u proteinima koje ti sljedovi kodiraju tj. za koje su poruke kako se sintetišu.

I ne samo to – neki dijelovi ljudskog genoma nisu upute za sintezu proteina – neki su regulatorni dijelovi ili imaju neke druge funkcije. Pogrešno je misliti da su sve sekvence šifre za proteine. Ljudski genom ima nešto preko 3 milijarde parova baza, „slova” i sadrži nešto manje od 20 000 gena. Ako vas zanima kako može postojati oko 100 000 proteina od ovako ,,malog” broja gena, pročitajte tekst ovdje.

Na ovoj verziji su radili Karen Miga, genetičarka s Univerziteta Kalifornija Santa Kruz i Adam Phillippy, bioinformatičar National Human Genome Research Institute i njihovi saradnici. Philippy je 2019. izvijestio o sekvenciranju ,,od-do” X hromosoma. Otkriveno je oko 1900 „novih gena”, a zapravo su većina kopije već otkrivenih gena.

Grupa T2T kombinovala je tehnologije sekvenciranja, uključujući uređaj s nanoporama koji je mogao očitati 100 000 baza odjednom i drugi sekvencer koji je bio tačniji, ali radi samo oko 10 000 baza odjednom.

Ono što je jako zanimljivo, naučnici na ovom projektu su odlučili su koristiti staničnu liniju koja je izvedena prije više od 20 godina iz neobične izrasline izrezane iz maternice žene – neuspjele trudnoće nastale kada je spermij ušao u jajnu stanicu kojoj je nedostajao vlastiti skup hromosoma. Ovo ujedino znači da takva oplođena jajna stanica sadrži samo hromosome oca i to ne sve. Samo s genetičkim materijalom spermija, takva se jajašca ne mogu razviti u embrij, ali se još uvijek mogu replicirati, pogotovo ako spermij isporučuje X umjesto Y hromosoma. Koristeći ovu ćelijsku liniju, zvanu CHM13, sekvenceri nisu morali rješavati razlike između hromosoma roditelja, što im je malo pojednostavilo slaganje puzzle ljudskog genoma.

Više na: Most complete human genome yet reveals previously indecipherable DNA gdje možete pročitati i zanimljivu priču o porijeklu ćelijske linije koja je korištena za sekvenciranje.

Još:

It's finally finished!

Science special issue “Completing the human genome”

T2T companion papers u Science, Nature Methods, and Genome Research

UCSC Genome Browser (chm13)

NCBI GenBank Record (GCA_009914755.4)

Ancillary data (GitHub)