Det 1000 Genomes Project er et internationalt forskningskonsortium, der blev oprettet i 2007 med det formål at sekventere genomerne af mindst 1.000 frivillige fra forskellige befolkningsgrupper verden over for at forbedre vores forståelse af det genetiske bidrag til menneskers sundhed og sygdom. Der er ydet global støtte fra store institutioner, herunder Wellcome Trust Sanger Institute (UK), Beijing Genomics Institute (Kina) og US National Human Genome Research Institute. Projektets mål var at udarbejde et katalog over menneskelig variation ned til varianter, der forekommer med en frekvens på 1 % eller mindre over genomet, for at lette genetiske undersøgelser af almindelige menneskelige sygdomme (1).
Et vigtigt dokument, der blev offentliggjort i Nature den 1. oktober 2015, markerer afslutningen af den sidste fase af det kolossale projekt: en omfattende database med fri adgang over genetisk variation fra 2 504 personer fra 26 befolkninger over hele verden (2). Genotyperne blev opnået ved hjælp af en kombination af sekventering af hele genomet, dyb exomsekventering og mikroarrays med høj tæthed af enkeltnukleotidpolymorfim (SNP’er) med høj tæthed. Karakteriseringen af varianterne var baseret på et sæt af 24 sekvensanalyseværktøjer. Samlet set opdagede og karakteriserede projektet mere end 88 millioner varianter, herunder 84,7 millioner SNP’er, 2,6 millioner korte insertioner/deletioner (indels) og 60.000 strukturelle varianter, som blev integreret i et haplotypestillads af høj kvalitet.
Et par fremtrædende resultater: Sammenlignet med det menneskelige referencegenom adskiller et typisk genom sig på ~ 4 til 5 millioner steder, og 99,9 % af disse varianter er SNP’er og korte indels. Antallet af variantsteder er størst hos personer af afrikansk afstamning, som forventet ud fra den ud-af-Afrika-model for menneskelig ekspansion. Analyser af de varianter, der mest sandsynligt påvirker genfunktionen, viste, at et typisk genom indeholder ~150 steder med proteinafkortningsvarianter, ~10 000 steder med varianter, der ændrer peptidsekvenser, og ~500 000 variantsteder, der overlapper reguleringsområder som f.eks. promotorer, forstærkere eller transkriptionsfaktorbindingssteder. Det er vigtigt at bemærke, at ~ 2 000 varianter pr. genom var forbundet med komplekse egenskaber gennem genomviddeassocieringsundersøgelser (GWAS) og 24-30 varianter pr. genom var impliceret i sjældne sygdomme gennem ClinVar (en database over sammenhængen mellem menneskelige variationer og fænotyper). Andre analyser gav oplysninger om befolkningshistorie, demografi af forfaderpopulationer og opløsning af genetiske associationsundersøgelser (2).
Resultaterne af 1000 Genomes-projektet, som vidner om fordelene ved “konsortiebaseret videnskab”, supplerer et sæt genomiske oplysninger, som allerede har været i brug i flere år. Sådanne oplysninger er især nyttige til udformning af genotyping arrays, populationsgenetik (f.eks. genotypeimputering i GWAS, definition af varianter i regioner af interesse, filtrering af sandsynlige neutrale varianter) og undersøgelser af naturlig selektion, populationsstruktur og sammenblanding. De største fordele ved 1000-genom-projektets datasæt er bl.a. den brede repræsentation af den menneskelige genetiske variation (med en langt bedre dækning af sydasiatiske og afrikanske befolkninger), brugen af flere analysestrategier, hvilket øger kvaliteten af filtrering og kortlægning og gør det muligt at indfange flere forskellige typer genetiske varianter, og den brede tilgængelighed af prøver og data, der er et resultat af projektet. Tilsammen vil disse elementer bidrage til at give yderligere indsigt i det genetiske grundlag for sygdomme. De vil f.eks. blive anvendt i de igangværende bestræbelser på at afkode det genetiske grundlag for peritoneal transport og resultatet af peritonealdialyse.
“Nu er dette ikke slutningen … Men det er måske slutningen på begyndelsen”, som Winston Churchill sagde. Storstilede sekventeringsprojekter vil fortsætte for flere regionale eller etniske grupper med henblik på at udvide den globale dækning. Der vil blive gjort en stor indsats for at opnå en bedre forståelse af forholdet mellem genetisk variation og almindelige sygdomme. Anvendelsen af disse massive genetiske oplysninger på menneskers sundhed vil drage fordel af udviklingen af komplekse databaser, der samler genetiske, kliniske og biologiske data, f.eks. multiomiske profiler, samtidig med at beskyttelsen af potentielt følsomme personoplysninger opretholdes (3). Der er også en indsats i gang for at øge den genetiske bevidsthed i offentligheden og for at uddanne sundhedspersoner (http://www.1000genomes.org/about).