Het 1000-genoomproject is een internationaal onderzoeksconsortium dat in 2007 is opgezet met als doel de genomen van ten minste 1000 vrijwilligers uit verschillende populaties wereldwijd te sequencen om ons begrip van de genetische bijdrage aan de menselijke gezondheid en ziekte te verbeteren. Wereldwijde steun werd verleend door belangrijke instellingen, waaronder het Wellcome Trust Sanger Institute (VK), het Beijing Genomics Institute (China), en het US National Human Genome Research Institute. Het doel van het project was om een catalogus van menselijke variatie te produceren tot aan varianten die met een frequentie van 1% of minder in het genoom voorkomen, om genetische studies naar veel voorkomende menselijke ziekten te vergemakkelijken (1).
Een belangrijke paper, gepubliceerd in het nummer van 1 oktober 2015 van Nature, markeert de voltooiing van de laatste fase van het kolossale project: een uitgebreide, open-access database van genetische variatie van 2.504 individuen uit 26 populaties over de hele wereld (2). De genotypes werden verkregen met behulp van een combinatie van sequencing van het volledige genoom, deep exome sequencing en high-density single nucleotide polymorphims (SNP’s) microarrays. De karakterisering van de varianten was gebaseerd op een set van 24 sequentieanalyse-instrumenten. In totaal werden in het project meer dan 88 miljoen varianten ontdekt en gekarakteriseerd, waaronder 84,7 miljoen SNP’s, 2,6 miljoen korte invoegingen/deleties (indels), en 60.000 structurele varianten, die werden geïntegreerd in een haplotype scaffold van hoge kwaliteit.
Een paar opvallende bevindingen: Vergeleken met het menselijke referentiegenoom, verschilt een typisch genoom op ~ 4 tot 5 miljoen plaatsen, waarbij 99,9% van deze varianten SNPs en korte indels zijn. Het aantal variante plaatsen is het grootst bij individuen van Afrikaanse afkomst, zoals verwacht wordt van het out-of-Africa model van menselijke expansie. Analyses van de varianten die het meest waarschijnlijk de genfunctie beïnvloeden, toonden aan dat een typisch genoom ~150 sites bevat met eiwit-afknottende varianten, ~10.000 sites met peptide-sequentie veranderende varianten en ~500.000 variant sites die regulatorische regio’s zoals promotors, enhancers, of transcriptie factor bindingsplaatsen overlappen. Belangrijk is dat ~2,000 varianten per genoom geassocieerd werden met complexe eigenschappen via genoomwijde associatiestudies (GWAS) en dat 24 – 30 varianten per genoom betrokken waren bij zeldzame ziekten via ClinVar (een database van de relaties tussen menselijke variaties en fenotypes). Andere analyses leverden informatie op over de geschiedenis van de bevolking, de demografie van de voorouderpopulaties en de resolutie van genetische associatiestudies (2).
De resultaten van het 1000-genoomproject, die getuigen van de voordelen van “consortiumgebaseerde wetenschap”, completeren een reeks genomische gegevens die al enkele jaren in gebruik is. Dergelijke informatie is bijzonder nuttig voor het ontwerp van genotyperingsarrays, populatiegenetica (b.v. imputatie van genotypen in GWAS, definitie van varianten in regio’s van belang, filtering van waarschijnlijk neutrale varianten), en onderzoek naar natuurlijke selectie, populatiestructuur, en vermenging. De belangrijkste voordelen van de dataset van het 1000-genoomproject zijn de brede vertegenwoordiging van de menselijke genetische variatie (met een veel betere dekking van Zuid-Aziatische en Afrikaanse populaties); het gebruik van meervoudige analysestrategieën, waardoor de kwaliteit van het filteren en in kaart brengen wordt verhoogd en meer verschillende soorten genetische varianten kunnen worden vastgelegd; en de ruime beschikbaarheid van monsters en gegevens die uit het project voortvloeien. Al deze elementen tezamen zullen bijdragen tot het verkrijgen van meer inzicht in de genetische basis van ziekten. Zij zullen bijvoorbeeld worden gebruikt bij de lopende inspanningen om de genetische basis van peritoneaal transport en het resultaat van peritoneale dialyse te ontcijferen.
“Nu is dit niet het einde… Maar het is misschien wel het einde van het begin”, zoals Winston Churchill zei. Grootschalige sequentieprojecten zullen worden voortgezet voor meer regionale of etnische groepen, om de wereldwijde dekking uit te breiden. Veel inspanningen zullen worden gericht op een beter begrip van het verband tussen genetische variatie en veel voorkomende aandoeningen. De vertaling van deze massale genetische informatie naar de menselijke gezondheid zal baat hebben bij de ontwikkeling van complexe databanken waarin genetische, klinische en biologische gegevens worden verzameld, zoals multi-omics-profielen, terwijl de bescherming van potentieel gevoelige persoonlijke informatie gehandhaafd blijft (3). Er worden ook inspanningen geleverd om het genetisch bewustzijn bij het publiek te vergroten en gezondheidswerkers op te leiden (http://www.1000genomes.org/about).