1000人ゲノムプロジェクトは、2007年に設立された国際研究コンソーシアムで、人間の健康や病気に対する遺伝子の貢献についての理解を深めるために、世界中の複数の集団から少なくとも1000人のボランティアのゲノムを解読することを目的としています。 ウェルカム・トラスト・サンガー研究所(英国)、北京ゲノム研究所(中国)、米国国立ヒトゲノム研究所などの主要機関から世界的な支援を受けました。 プロジェクトの目標は、一般的なヒトの病気に関する遺伝学的研究を促進するために、ゲノム上に1%以下の頻度で生じる変異まで、ヒトの変異のカタログを作成することでした(1)。
2015年10月1日号のNatureに掲載された主要論文は、巨大プロジェクトの最終段階の完成を意味します:世界中の26集団から得られた2504人の遺伝子変異の総合データベースがオープンアクセスで提供されます(2)。 遺伝子型は、全ゲノム配列決定、ディープエクソーム配列決定、高密度一塩基多型(SNPs)マイクロアレイを組み合わせて取得されました。 変異体の特性は、24種類の配列解析ツールに基づき解析された。 全体として、このプロジェクトは、8470万のSNP、260万の短い挿入/欠失(indel)、および6万の構造的変異を含む8800万以上の変異を発見し特性化し、高品質のハプロタイプスカフォールドに統合された
いくつかの顕著な発見。 参照ゲノムと比較すると、典型的なゲノムは400万から500万の部位で異なっており、これらの変異の99.9%はSNPsと短いindelである。 アフリカの祖先の個体で変異部位が最も多いことは、アフリカ外への人類拡大モデルから予想される通りである。 遺伝子機能に影響を及ぼす可能性の高いバリアントを解析した結果、典型的なゲノムには、タンパク質切断バリアントが約150部位、ペプチド配列変更バリアントが約1万部位、プロモーター、エンハンサー、転写因子結合部位などの制御領域に重なるバリアント部位が約50万部位あることが判明した。 重要なことは、ゲノムワイド関連研究(GWAS)により、1ゲノムあたり約2,000のバリアントが複合形質と関連し、ClinVar(ヒトの変異と表現型の関係を示すデータベース)により1ゲノムあたり24~30のバリアントが希少疾患と関連することが示されたことである。 その他の解析では、集団史、祖先集団の人口動態、遺伝的関連研究の解像度に関する情報が得られた(2)。
「コンソーシアムベースの科学」の利点を証明する1000ゲノムプロジェクトの結果は、すでに数年間使用されてきたゲノム情報一式を完成させるものである。 このような情報は、ジェノタイピングアレイの設計、集団遺伝学(例えば、GWASにおける遺伝子型のインピュテーション、関心領域におけるバリアントの定義、中立と思われるバリアントのフィルタリング)、自然選択、集団構造、混血に関する調査などに特に有効である。 1000ゲノムプロジェクトのデータセットの主な利点は、ヒトの遺伝的変異を幅広く表現していること(南アジアやアフリカの集団のカバー率が大幅に向上)、複数の解析戦略を用いることでフィルタリングやマッピングの質を高め、より多様なタイプの遺伝的変異を捉えることができること、プロジェクトから得られたサンプルやデータを広く利用できることなどが挙げられます。 これらの要素を総合して、疾病の遺伝的基盤に関するさらなる洞察を得ることができます。 例えば、腹膜輸送の遺伝的基盤や腹膜透析の転帰を解読するための進行中の取り組みに利用されるでしょう。
Winston Churchillが言ったように「これで終わりではありません…しかし、おそらく始まりの終わりなのでしょう」。 大規模な配列決定プロジェクトは、世界的な範囲を拡大するために、より多くの地域や民族のグループに対して継続される。 また、遺伝子の変異と一般的な疾患との関係をより深く理解することに、多くの努力が払われることでしょう。 この膨大な遺伝情報を人々の健康に役立てるには、潜在的に繊細な個人情報の保護を維持しつつ、マルチオミックスプロファイルのような、遺伝、臨床、生物学的データを集めた複雑なデータベースを開発することが有益である(3)。 また、一般の人々の遺伝子に対する意識を高め、医療従事者を教育する取り組みも進められている(http://www.1000genomes.org/about)
。