Projekt 1000 genomů je mezinárodní výzkumné konsorcium, které bylo založeno v roce 2007 s cílem sekvenovat genomy nejméně 1 000 dobrovolníků z různých populací po celém světě, aby se zlepšilo naše chápání genetického podílu na lidském zdraví a nemocech. Na celosvětové podpoře se podílely významné instituce, včetně Wellcome Trust Sanger Institute (Velká Británie), Beijing Genomics Institute (Čína) a amerického National Human Genome Research Institute. Cílem projektu bylo vytvořit katalog lidských variací až na varianty, které se v genomu vyskytují s 1% nebo nižší frekvencí, a usnadnit tak genetické studie běžných lidských onemocnění (1).
Významný článek, publikovaný 1. října 2015 v časopise Nature, představuje dokončení závěrečné fáze tohoto kolosálního projektu: komplexní, volně přístupnou databázi genetických variací 2 504 jedinců z 26 populací z celého světa (2). Genotypy byly získány kombinací celogenomového sekvenování, hloubkového exomového sekvenování a mikročipů s vysokou hustotou jednonukleotidových polymorfů (SNP). Charakterizace variant byla založena na souboru 24 nástrojů sekvenční analýzy. Celkově bylo v rámci projektu objeveno a charakterizováno více než 88 milionů variant, včetně 84,7 milionů SNP, 2,6 milionů krátkých inzercí/delecí (indelů) a 60 000 strukturních variant, které byly integrovány do vysoce kvalitního haplotypového skeletu.
Několik významných zjištění: Ve srovnání s referenčním lidským genomem se typický genom liší na ~ 4 až 5 milionech míst, přičemž 99,9 % těchto variant tvoří SNP a krátké indely. Počet variantních míst je největší u jedinců s africkým původem, jak se očekává z modelu mimoafrické expanze člověka. Analýzy variant, které s největší pravděpodobností ovlivňují funkci genů, ukázaly, že typický genom obsahuje ~ 150 míst s variantami zkracujícími proteiny, ~ 10 000 míst s variantami měnícími peptidovou sekvenci a ~ 500 000 míst s variantami překrývajícími regulační oblasti, jako jsou promotory, enhancery nebo vazebná místa transkripčních faktorů. Důležité je, že ~2 000 variant na genom bylo spojeno s komplexními znaky prostřednictvím celogenomových asociačních studií (GWAS) a 24-30 variant na genom se podílelo na vzácných onemocněních prostřednictvím ClinVar (databáze vztahů mezi lidskými variantami a fenotypy). Další analýzy poskytly informace o populační historii, demografii populací předků a rozlišení genetických asociačních studií (2).
Výsledky projektu 1000 genomů, které dokládají výhody „vědy založené na konsorciu“, doplňují soubor genomických informací, který se již několik let používá. Tyto informace jsou užitečné zejména pro návrh genotypovacích polí, populační genetiku (např. imputace genotypů v GWAS, definování variant v oblastech zájmu, filtrování pravděpodobně neutrálních variant) a výzkum přirozeného výběru, populační struktury a příměsí. Mezi hlavní výhody souboru dat projektu 1000 genomů patří široké zastoupení lidské genetické variability (s mnohem lepším pokrytím jihoasijských a afrických populací); použití více strategií analýzy, což zvyšuje kvalitu filtrování a mapování a umožňuje zachytit rozmanitější typy genetických variant; a široká dostupnost vzorků a dat, které jsou výsledkem projektu. Celkově tyto prvky přispějí k dalšímu poznání genetického základu onemocnění. Budou využity například v probíhajícím úsilí o rozluštění genetického základu peritoneálního transportu a výsledků peritoneální dialýzy.
„Nyní to není konec… Ale je to možná konec začátku“, jak řekl Winston Churchill. Rozsáhlé projekty sekvenování budou pokračovat u dalších regionálních nebo etnických skupin, aby se rozšířilo celosvětové pokrytí. Velké úsilí se zaměří na lepší pochopení vztahu mezi genetickou variabilitou a běžnými poruchami. Pro převedení těchto masivních genetických informací do oblasti lidského zdraví bude přínosem vývoj komplexních databází shromažďujících genetické, klinické a biologické údaje, jako jsou multiomické profily, při zachování ochrany potenciálně citlivých osobních údajů (3). Rovněž probíhají snahy o zvýšení genetického povědomí veřejnosti a vzdělávání zdravotnických pracovníků (http://www.1000genomes.org/about).
.