Das 1000-Genome-Projekt ist ein internationales Forschungskonsortium, das 2007 mit dem Ziel gegründet wurde, die Genome von mindestens 1 000 Freiwilligen aus verschiedenen Populationen weltweit zu sequenzieren, um unser Verständnis des genetischen Beitrags zur menschlichen Gesundheit und Krankheit zu verbessern. Globale Unterstützung kam von bedeutenden Institutionen, darunter das Wellcome Trust Sanger Institute (Vereinigtes Königreich), das Beijing Genomics Institute (China) und das US National Human Genome Research Institute. Ziel des Projekts war die Erstellung eines Katalogs menschlicher Variationen bis hin zu Varianten, die mit einer Häufigkeit von 1 % oder weniger im gesamten Genom auftreten, um genetische Studien zu häufigen menschlichen Krankheiten zu erleichtern (1).
Eine wichtige Arbeit, die in der Ausgabe vom 1. Oktober 2015 von Nature veröffentlicht wurde, markiert den Abschluss der letzten Phase des kolossalen Projekts: eine umfassende, frei zugängliche Datenbank der genetischen Variation von 2 504 Personen aus 26 Populationen weltweit (2). Die Genotypen wurden durch eine Kombination aus Ganzgenomsequenzierung, Deep-Exome-Sequenzierung und hochdichten Single Nucleotide Polymorphims (SNPs) Microarrays gewonnen. Die Charakterisierung der Varianten basierte auf einem Satz von 24 Sequenzanalysetools. Insgesamt wurden im Rahmen des Projekts mehr als 88 Millionen Varianten entdeckt und charakterisiert, darunter 84,7 Millionen SNPs, 2,6 Millionen kurze Insertionen/Deletionen (Indels) und 60 000 strukturelle Varianten, die in ein hochwertiges Haplotyp-Gerüst integriert wurden.
Ein paar wichtige Ergebnisse: Im Vergleich zum menschlichen Referenzgenom unterscheidet sich ein typisches Genom an etwa 4 bis 5 Millionen Stellen, wobei 99,9 % dieser Varianten SNPs und kurze Indels sind. Die Zahl der Varianten ist bei Personen afrikanischer Abstammung am größten, wie es das Modell der menschlichen Expansion außerhalb Afrikas erwarten lässt. Analysen der Varianten, die sich am ehesten auf die Genfunktion auswirken, ergaben, dass ein typisches Genom ~150 Stellen mit proteinabschneidenden Varianten, ~10.000 Stellen mit peptidsequenzverändernden Varianten und ~ 500.000 Variantenstellen enthält, die sich mit regulatorischen Regionen wie Promotoren, Enhancern oder Bindungsstellen für Transkriptionsfaktoren überschneiden. Wichtig ist, dass ~ 2 000 Varianten pro Genom durch genomweite Assoziationsstudien (GWAS) mit komplexen Merkmalen in Verbindung gebracht wurden und 24 bis 30 Varianten pro Genom durch ClinVar (eine Datenbank über die Beziehungen zwischen menschlichen Variationen und Phänotypen) mit seltenen Krankheiten in Verbindung gebracht wurden. Andere Analysen lieferten Informationen über die Bevölkerungsgeschichte, die Demographie der Vorfahrenpopulationen und die Auflösung genetischer Assoziationsstudien (2).
Die Ergebnisse des 1000 Genomes Project, die die Vorteile der „konsortialbasierten Wissenschaft“ belegen, vervollständigen eine Reihe von genomischen Informationen, die bereits seit mehreren Jahren genutzt werden. Diese Informationen sind besonders nützlich für das Design von Genotypisierungs-Arrays, für die Populationsgenetik (z. B. Genotyp-Imputation in GWAS, Definition von Varianten in Regionen von Interesse, Herausfiltern von wahrscheinlich neutralen Varianten) und für Untersuchungen über natürliche Selektion, Bevölkerungsstruktur und Vermischung. Zu den wichtigsten Vorteilen des 1000 Genomes Project-Datensatzes gehören die breite Repräsentation der menschlichen genetischen Variation (mit einer deutlich verbesserten Abdeckung südasiatischer und afrikanischer Populationen), die Verwendung mehrerer Analysestrategien, die die Qualität der Filterung und Kartierung erhöhen und die Erfassung vielfältigerer Arten genetischer Varianten ermöglichen, sowie die breite Verfügbarkeit von Proben und Daten aus dem Projekt. Insgesamt werden diese Elemente dazu beitragen, weitere Erkenntnisse über die genetischen Grundlagen von Krankheiten zu gewinnen. Sie werden beispielsweise bei den laufenden Bemühungen um die Entschlüsselung der genetischen Grundlagen des Peritonealtransports und der Ergebnisse der Peritonealdialyse zum Einsatz kommen.
„Dies ist nicht das Ende… Aber es ist vielleicht das Ende des Anfangs“, wie Winston Churchill sagte. Groß angelegte Sequenzierungsprojekte werden für weitere regionale oder ethnische Gruppen fortgesetzt, um die globale Abdeckung zu erweitern. Ein Großteil der Anstrengungen wird sich auf ein besseres Verständnis der Beziehung zwischen genetischer Variation und häufigen Erkrankungen konzentrieren. Die Übertragung dieser umfangreichen genetischen Informationen auf die menschliche Gesundheit wird von der Entwicklung komplexer Datenbanken profitieren, in denen genetische, klinische und biologische Daten gesammelt werden, wie z. B. Multi-omics-Profile, wobei der Schutz potenziell sensibler persönlicher Daten gewahrt bleibt (3). Es werden auch Anstrengungen unternommen, um das genetische Bewusstsein der Öffentlichkeit zu schärfen und die Angehörigen der Gesundheitsberufe zu schulen (http://www.1000genomes.org/about).