2013年、Yaniv Erlichという若い計算生物学者が、インターネット接続だけで匿名の遺伝子データベースに記載された人々の身元を明らかにすることが可能であることを示し、研究界に衝撃を与えました。 政策立案者は、匿名化された生物医学的遺伝子データのプールへのアクセスを制限することで対応した。 NIH の担当者は当時、「ほとんどの人にとって、このようなことが起こる可能性は低いですが、ゼロではありません」と述べています。
それから早 5 年、デジタル データ ストアに格納される DNA 情報の量は爆発的に増加し、その勢いはとどまることを知りません。 23andMeやAncestryなどの消費者向け企業は、最近の業界の推定によると、これまでに1200万人以上の遺伝子プロファイルを作成しました。 自分の情報をダウンロードした顧客は、それを GEDmatch のような公開系図ウェブサイトに追加することができます。GEDmatch は今年初め、ゴールデンステートキラー事件の容疑者を警察に突き止める役割を果たし、全国的に有名になりました。 実際、Science に本日掲載された Erlich 氏率いる新しい研究によると、ヨーロッパ系の祖先を持つアメリカ人の 60% 以上が、唾液キットを送ったことがあるかどうかにかかわらず、公開遺伝子系図データベースを使用して、DNA によって特定することができるそうです。 「この推定を行うために、コロンビア大学とエルサレム・ヘブライ大学のアーリックと彼の共同研究者たちは、128万人の匿名の個人からなるMyHeritageのデータセットを分析しました。 これらの個人を「ターゲット」として、DNAの大きな塊が一致する親族の数を数えたところ、検索結果の60パーセントが3番目のいとこか、それに近い人であることがわかった。 ゴールデン・ステート・キラーをはじめ、この方法で解決された17の事件は、法執行機関では「長距離家族捜査」と呼ばれ、このレベルの血縁関係があれば、捜査官は捜査を進めることができた。 その結果を検証するために、Erlich のチームは 30 の遺伝的プロファイルを GEDmatch に入力し、同様の結果を得ました。 しかしそこから、基本的な人口統計学的情報により、かなり迅速にラインナップを絞り込むことができます。 年齢が5歳以内と分かれば、残りの候補者のうち10人中9人は除外される。 遺伝子から推測される性別は、16人程度に絞られる。
いかに簡単かを示すために、研究者たちは、オープンアクセスの配列決定プロジェクトである1000ゲノム・プロジェクトから、匿名の女性被験者を選びました。 研究者たちは、彼女のDNAデータを一般的な消費者の遺伝子プロファイルに似せて再フォーマットし、GEDmatchにアップロードした。 すると、ノースダコタ州とワイオミング州にそれぞれ1人ずつ、計2人の親族が浮かび上がった。 その結果、彼らは4~6世代前にあたる遠縁であることがわかった。 その後、1時間かけて公文書を調べ、夫と妻を発見した。 そこから、何百人もの子孫の血統をたどって、ターゲットの身元を突き止めたのである。
Erlich によれば、DNA を少し残している人なら誰でも、そのような検索が可能になる日はそう遠くはないでしょう。 この研究では、遺伝子データベースがある民族集団の成人のおよそ 2 パーセントをカバーすれば、関心のある人物のほとんどについて、3 番目のいとこかそれに近い人物の一致が期待できることがわかりました。 ヨーロッパ系のアメリカ人は、遺伝子データベースや家系図データベースへの登録率が高いので、このペースでレクリエーション的なDNA検査が進めば、今後数年でその限界に達する可能性がある。 2 パーセントといえば、最新の米国国勢調査データに基づくと、わずか約 400 万人です。
このようなリソースがあれば、法執行機関が手がかりを追う際にアクセスできる人数と種類が大幅に拡大されます。 犯罪者データベースには、警察が 1700 万人近い人々、すなわち有罪判決を受けた犯罪者や、州によっては逮捕者の DNA を保管していますが、アフリカ系アメリカ人やヒスパニック系住民に大きく偏っています。 DNA鑑定の初期段階から、技術的な互換性がないため、犯罪者データベースと娯楽や研究目的の遺伝子データベースとの間には、実質的なファイアウォールが存在していた。 法執行機関は、ゲノムの非常に多様な非コード化部分を収集・分析し、これらの「ジャンク」配列の繰り返し回数をカウントするだけである。 これは基本的に単なる数字の羅列であり、それ自体では個人を特定できるようなことは何もない。 しかし、バーコードや指紋のように個人を特定することは可能だ。 しかも、安価で高速。
対照的に、ほとんどの医療および娯楽のためのDNA検査では、完全な配列または遺伝子型配列(遺伝子の1つの場所で発生する変化の集合)が行われます。 このような場合、「痒いところに手が届く」ような感覚を味わうことができます。 また、家族構成を調べるのにも便利です。 この2種類のデータベースは通信できないため、ゴールデンステートキラー事件の捜査官は、古い犯罪現場サンプルからDNAを抽出し、SNPプロファイルを作成し、GEDmatchにアップロードしなければならなかったのである。 5707>
本日、Cell誌に掲載された2番目の論文は、犯罪者データベースからのデータで長距離家族検索が可能であることを初めて示しています。 スタンフォード大学の Noah Rosenberg のグループは、以前、近くの SNP を非コード反復配列にマッピングすることにより、2 種類のデータベース間で記録をリンクさせることができることを示しました。 この研究は昨年発表されたが、あまり注目されなかった。 「コオロギのようなものです」とローゼンバーグは言う。 しかし、親族を見つけるための2つのデータベースの相互互換性を探るこの最新の研究は、ゴールデンステート・キラー事件をきっかけに、新たな深い関連性を持つようになったのです。 「しかし同時に、これらのデータベースの参加者が、予期していなかった法医学的検索にさらされる可能性もあります」
法律専門家によれば、より大きな問題は、ローゼンバーグの研究により、法医学 DNA プロファイルに、これまで考えられていたよりもはるかに多くの情報が含まれていることが明らかになったということです。 それは、ゲノムのコーディング領域(緑色の目、巻き毛、心臓病の部分)を正確に予測するために使用することができるからです。 カリフォルニア大学バークレー校の法と技術センターのディレクターであるアンドレア・ロス氏は、「既存の犯罪者データベースが憲法修正第4条の権利を侵害しない理由についての最高裁判決はすべて、このジャンクDNAから個人情報は得られないという前提に立っている」と言う。 「そのため、この計算を実行するためには、まだいくつかの作業が必要です。 しかし、複数のデータベースにアクセスできる人であれば、この技術を使い始めるために必要な情報はすべて持っていると、彼は言っています。 つまり、内蔵されたプライバシー保護機能は、あっという間に崩れてしまう可能性があるということだ。 この論文は、政策立案者に今日の技術で何が可能かを示す警告として意図されており、Rosenbergは、遺伝情報が今後どのように保存され使用されるかについて、必要な会話を促すことを期待しています。
Erlichと彼の共著者たちは、さらに踏み込んで、長く行方不明の親族を探している人や実家族を探している養子にとって必須のサービスを提供しているGEDmatchなどのリソースが安全にオンラインであり続けるためには、どんな変更が必要であるかを提言しています。 彼らは、米国福祉省に対し、個人を特定できる健康情報の範囲を修正し、匿名化されたゲノムデータを含めるよう要請しました。 そして、第三者のデータベースが、自分のものではない遺伝子データを分析しようとするユーザーに警告を発することができるよう、保管のチェーンを構築する暗号化戦略について概説した。 しかし、すべての消費者ゲノムプロバイダーがこのシステムに参加したとしても、まだ十分ではないかもしれません。
「要するに、政府が家系図を検索する能力を規制しない限り、誰もが何らかの形で遺伝子監視下に置かれようとしているのではないでしょうか」と、Roth は言います。 彼女は、カリフォルニア州が犯罪者データベースの従来の家族検索を規制しているのと同様のシステムを提案します。 このシステムは、殺人や性的暴行などの凶悪犯罪の捜査にのみ使用され、何百人もの無実の人々が捜査の対象とならないように、捜査範囲も限定されている。 また、監視委員会があり、ある人の父親が本当の父親ではないというような、機密情報の不用意な開示を防ぐことができるのです。 「これは皮肉なことです」とロスは言う。 「もし、あなたがCODISに登録されている人の親族なら、GEDMatchに登録されている人の親族より、遺伝的プライバシーに対する権利があるのです」。 十分なDNAがあれば、発見されたいかどうかは関係ない。 オプトアウトは、もはや選択肢ではありません。
More Great WIRED Stories
- So much genetic testing,
- ハイテクは、あなたが自分自身を知るよりも、あなたをよく知っている
- この魔法のサングラスは、あなたの周りのすべての画面をブロックする
- オンライン陰謀論について知っておくべきこと
- ポリグラフ就職審査のブラックミラー世界内部
- もっと知りたいですか?
日刊ニュースレターに登録し、最新ニュースを見逃さない。