Odhalování našeho genetického programu Understand article
Přeložila Jana Hájková. Co dělá většina naší DNA? Stovky vědců strávily mnoho let zkoumáním tzv. odpadních sekvencí („junk“), které by mohly posloužit jako klíč k závažným chorobám.
Projekt lidského genomu – sekvenování lidského genomu – představuje hlavní úspěch uplynulého desetiletí. Projekt odhalil, jak vypadají ony tři miliardy bází lidského genetického programu. Tím to celé ale nekončí. Abychom pochopili, jak genom funguje, je naproto zásadní rozluštit, jak buňky sekvence DNA interpretují. Pak by se snad dalo toto poznání využít v biochemickém výzkumu a ve zdravotnictví.
Jedním z velkých překvapení, které výzkum lidského genomu přinesl, bylo zjištění, že geny chápané jako instrukce k tvorbě proteinů jsou neseny pouhými 2% našeho genomu. Pokud jsme vzali v úvahu dodatečné kusy genomu, jako jsou například nekódující RNA, oblasti podílející se na kontrole genové aktivity a introny (úseky genové sekvence, které se odstraňují ještě před tím, než se mRNA uplatní při translaci), zdálo se, že zbytek genomu postrádá biologickou funkci. Proto se o těchto částech genomu často hovořilo jako o „odpadní“ DNA (česky též smetištní nebo zbytečná, anglicky „junk“ DNA).
Pronikání za sekvenci
Ve chvíli, kdy byl lidský genom osekvenován, nastal čas zjistit, zda jsou tyto sekvence skutečně zbytečné. V roce 2003 bylo vytvořeno konsorcium ENCODE, které mělo za úkol charakterizovat nekódující, nicméně funkční elementy lidského genomu. Sdružení mělo podporu amerického Národního institutu pro výzkum lidského genomu, vedl ho britský Evropský bioinformatický institut (EBI; viz rámeček). Pilotní fáze ENCODE probíhala v letech 2003 až 2007 a umožnila výzkumníkům z celého světa vyzkoušet, porovnat a optimalizovat experimentální a výpočetní metody sloužící k identifikaci aktivních částí 1% genomu – v zásadě tedy pečlivě projít část genomového „odpadu“.
První výsledky zveřejněné v červnu 2007 (The ENCODE Project Consortium, 2007), gkteré ukázaly fungování genomu, byly vskutku dráždivé. Například údaje získané kombinací metody microarray (viz Koutsos et al., 2009) a pokusů se sekvenováním ukázaly, že se přepisuje většina genomu, a to včetně těch oblastí, o nichž se soudilo, že se netranskribují (obrázek 2). Ačkoli byly role většiny transkriptů stále neznámé, ukázalo se, že některé významně ovlivňují genovou expresi. Ve výsledku se tedy ukázalo, že je souhra mezi geny, oblastmi regulujícími genovou aktivitu a dalšími úseky DNA mnohem složitější, než si kdokoliv myslel. Data naznačovala, že genom obsahuje nejrůznější formy aktivních elementů, a tedy méně nepoužívaných sekvencí, než se dříve myslelo.
Po úspěšném otestování metod začali vědci v projektu ENCODE prozkoumávat celý lidský genom. Tento úkol jim usnadnily nové technologie na sekvenování DNA a také dostupnost přesnějších biochemických analýz.
Systematicky zmapovali charakteristické prvky genomu právě tak, jako zeměpisná mapa zaznamenává geografické prvky krajiny, tedy lesy, řeky a hory. Výzkumníci ENCODE v genomu hledali mj. takové oblasti, které byly uvozené značkami „pst“ (specifické methylové skupiny), které svědčí o umlčování genů, nebo značkami „zde se navaž“ pro příslušné transkripční faktory. Dále hledali oblasti zesilující transkripci a také modifikace DNA kontrolující, jak je DNA sbalená (obrázek 3).
Záplava dat
V září roku 2012 zveřejnil projekt ENCODE po pěti letech pokusů a analýz, které prováděly výzkumné ústavy ve Velké Británii, Spojených státech, Španělsku, Singapuru a Japonsku, výsledky dosud nejpodrobnější analýzy celého genomu. Studie v přepočtu zabrala zhruba 300 let práce na počítači, během kterých bylo zanalyzováno 15 terabytů dat (15 x 1012 bytů). Veškerá data byla zpřístupněna veřejnosti. Pokud by se tyto údaje natiskly hustotou 1000 párů bází na cm2, vznikl by štos 16 m vysoký a přes 30 m dlouhý. Objemem by to odpovídalo 12 patrovým autobusům.
Program ENCODE dokládá, čeho se dá dosáhnout díky rozsáhlým projektům, do kterých přispívají stovky výzkumníků, z nichž každý doplní jeden kousek do skládačky, až se vytvoří úplný obrázek genomu. To by se žádné samostatně pracující organizaci nepovedlo.
Oživení sekvence
Jednou z nejvíce vzrušujících věcí, které pokusy ENCODE ukázaly, je zjištění, že náš genom překypuje aktivitou, že jej netvoří převážně nefunkční sekvence. Zhruba 80% genomu něco aktivně dělá. Ale co přesně dělá, to musíme teprve odhalit. S jistotou se však dá říct, že 9% (a možná i víc) se zapojuje do regulace genové exprese a kontroluje, kdy a kde se budou tvořit proteiny. Aktivní část genomu (80%) obsahuje přes 70 000 promotorů – míst, kde se napojují transkripční faktory – a téměř 40 000 oblastí enhancerů – zesilujících oblastí, které kontrolují expresi vzdálených genů.
Obrovský kontrolní panel ve 3D
Celkově projekt ENCODE identifikoval přes 4 miliony genových spínačů rozptýlených v celém genomu. Genom si můžete představit jako obrovský kontrolní panel, třeba jako mixážní pult zvukaře, s mnoha spínači, které zapínají a vypínají geny. Tento poznatek prohlubuje naše porozumění genové expresi a otevírá nové možnosti pro léčbu nejrůznějších chorob. Například ukazuje, že malá změna v genovém spínači zvaném CARD9 je spojena s 20% zvýšením rizika rozvoje Crohnovy choroby, zánětlivého onemocnění střev. Co kdyby se dal genový spínač vrátit zpátky do normálu, a tím se efektivně odstranila příčina této choroby?
Výsledky ENCODE také pomohly objasnit, jak je genom uspořádán a k jakým fyzikálním interakcím v něm dochází. Badatelé zjistili, že jsou genové spínače ve fyzickém kontaktu s jimi kontrolovanými geny, přestože mohou být lineárně vzdáleny stovky kilobází. Máme sklon představovat si genom jako dlouhou, přímou sekvenci. Ve skutečnosti je ale všechno těsně nacpané v buněčném jádru, přičemž různé části genomu jsou v úzkém kontaktu s ostatními.
Stavíme na datech
ENCODE poskytl podrobnou mapu genomu a otevřel vědě zcela nové oblasti. Jak říká Ian Dunham z EBI, hlavní autor článku ENCODE: „Mnohdy docela dobře víte, které geny se uplatňují v určité chorobě, ale nevíte, které spínače jsou v ní zapojeny. Někdy vás tyto spínače překvapí – jejich umístění nás svádí k tomu, abychom je spojily spíš s jinou chorobou. ENCODE poskytuje množství cenných vodítek, s jejichž pomocí bychom mohli odhalit klíčové mechanismy ovlivňující rozvoj chorob. Ty by se daly využít k vytvoření zcela nových léčiv nebo k úpravě stávajících léčebných postupů.“
Kromě toho, že víme, které geny jsou zapojeny do určité choroby, znají vědci i některé spínače podílející se na regulaci zapínání a vypínání genů. Toto zjištění bude obzvlášť cenné při interpretaci výsledků populačních studií, které se snaží určit spojitost mezi nějakým genem a chorobou. Zkombinováním funkční analýzy genomu ENCODE s údaji z genomových asociačních studií mohou badatelé zmapovat souvislosti mezi genetickými odchylkami spojovanými s nějakým onemocněním a oblastmi s regulační funkcí, včetně genových spínačů identifikovaných v rámci ENCODE. Údaje z ENCODE umožní lépe pochopit genetické pozadí chorob a budou oporou ve vědecké práci v mnoha nadcházejících letech.
Více o EBI
Evropská molekulárněbiologická laboratoř (European Molecular Biology Laboratory, EMBL)w1 patří mezi špičkové výzkumné ústavy, věnuje se základnímu výzkumu ve vědách o živém. EMBL je mezinárodní, inovativní a interdisciplinární pracoviště. Jeho zaměstnanci, kteří se hlásí k 60 různým národnostem, získali vědecké vzdělání v biologii, fyzice, chemii a počítačových vědách a společně pracují na výzkumech pokrývajících celou šíři molekulární biologie.
EBIw2, se sídlem poblíž Cambridge ve Velké Británii, je součástí EMBL. Světové vědecké veřejnosti poskytuje zdarma data z pokusů z oblasti věd o živém a provádí základní výzkum ve výpočetní biologii. EBI školí výzkumníky z akademické obce i průmyslu, aby co nejvíc vytěžila z onoho neuvěřitelného množství dat, která se v pokusech ve vědách o živém každodenně nashromáždí.
EMBL je členem EIROforumw3, vydavatele Science in School.
References
- The ENCODE Project Consortium (2007) Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project. Nature 447: 799-816. doi: 10.1038/nature05874
-
Stáhnout článek zdarma zde, nebo předplatit u Nature.
-
- The ENCODE Project Consortium (2012) An integrated encyclopedia of elements in the human genome. Nature 489: 57–74. doi: 10.1038/nature11247
-
Stáhnout článek zdarma zde, nebo předplatit u Nature.
-
- Koutsos A, Manaia A, Willingale-Theune J (2009) Fishing for genes: DNA microarrays in the classroom. Science in School 12: 44-49.
Web References
- w1 – Více o EMBL.
- w2 – Více o EBI.
- w3 – EIROforum představuje spolupráci osmi největších evropských mezivládních výzkumných organizací, které sdílejí svoje prostředky, vybavení a odborné znalosti, aby pomohly evropské vědě naplnit její potenciál. V rámci svých vzdělávacích a přesahových aktivit vydává EIROforum Science in School.
Resources
- ENCODE Explorer, umístěný na webových stránkách Nature, umožní procházet údaji ENCODE. Můžete tam také stáhnout zdarma poster (20 MB) který zachycuje část dat z ENCODE.
- Na videu, které je dostupné online, hovoří šéfredaktor Nature Magdalena Skipper a Ewan Birney z EBI o projektu ENCODE.
- The Story of You: ENCODE and the Human Genome představuje ENCODE formou komiksu.
- Ewan Birney z EBI, Tim Hubbard z Wellcome Trust Sanger Institute a Roderic Guigo z CRG představují ENCODE na videu (španělské titulky).
- Proč nevyzkoušet jednu z níže uvedených aktivit a nezačlenit do výuky bioinformatiku?
-
Kozlowski C (2010) Bioinformatics with pen and paper: building a phylogenetic tree. Science in School 17: 28-33.
-
Communication and Public Engagement team (2010) Can you spot a cancer mutation? Science in School 16: 39-44.
-
- Pro více informací týkajících se bioinformatiky viz:
-
Hayes E (2011) An archaeologist of the genome: Svante Pääbo. Science in School 20: 6-12.
-
Pathmanathan S, Hayes E (2007) Nicky Mulder, bioinformatician. Science in School 6: 75-77.
-
Institutions
Review
Článek přibližuje jeden z posledních pokroků humánní genetiky, výzkum v rámci projektu ENCODE.
Když se studenti seznamují s genetickým kódem, obvykle je ohromí skutečnost, že pouhá 2% lidské DNA kódují proteiny, přičemž zbytek představuje odpadní DNA. Projekt ENCODE zkoumal funkci některých úseků nekódující DNA a zjistil, že rozhodně nejde o pouhý odpad.
Budete-li se studenty probírat Projekt lidského genomu, můžete také zmínit ENCODE. Je dobré, když studentům poskytnete základní informace o genové regulaci, genetických chorobách a jejich léčbě a technikách užívaných v genetickém výzkumu. Článek může ve studentech vyvolat zájem o bioinformatiku a podnítit je, aby si vyhledali a pročetli literaturu o projektu ENCODE.
Namrata Garware, India