O Projeto 1000 Genomas é um consórcio internacional de pesquisa que foi criado em 2007 com o objetivo de sequenciar os genomas de pelo menos 1.000 voluntários de múltiplas populações em todo o mundo, a fim de melhorar a nossa compreensão da contribuição genética para a saúde humana e doenças. O apoio global foi prestado pelas principais instituições, incluindo o Wellcome Trust Sanger Institute (Reino Unido), o Beijing Genomics Institute (China) e o US National Human Genome Research Institute. O objetivo do projeto era produzir um catálogo de variação humana até variantes que ocorrem com 1% de freqüência ou menos sobre o genoma, a fim de facilitar estudos genéticos sobre doenças humanas comuns (1).
Um grande trabalho, publicado na edição de 1 de outubro de 2015 da Nature, marca a conclusão da fase final do colossal projeto: um banco de dados abrangente e de acesso aberto de variação genética de 2.504 indivíduos de 26 populações em todo o mundo (2). Os genótipos foram obtidos usando uma combinação de sequenciamento de genoma inteiro, sequenciamento de exoma profundo e microarrays de polimorfismos de nucleotídeos (SNPs) de alta densidade. A caracterização das variantes foi baseada em um conjunto de 24 ferramentas de análise de seqüências. No total, o projeto descobriu e caracterizou mais de 88 milhões de variantes, incluindo 84,7 milhões de SNPs, 2,6 milhões de inserções/deleções curtas (indels), e 60.000 variantes estruturais, que foram integradas em um andaime haplótipo de alta qualidade.
A poucas descobertas salientes: Em comparação com o genoma humano de referência, um genoma típico difere em ~ 4 a 5 milhões de locais, sendo 99,9% dessas variantes SNPs e indels curtos. O número de sítios variantes é maior em indivíduos de ascendência africana, como se espera do modelo de expansão humana fora de África. A análise das variantes mais susceptíveis de afectar a função genética revelou que um genoma típico continha ~150 sítios com variantes truncantes de proteínas, ~10.000 sítios com variantes alteradoras de sequência de peptídeo e ~500.000 sítios variantes que se sobrepõem a regiões reguladoras, tais como promotores, melhoradores, ou sítios de ligação ao factor de transcrição. É importante notar que ~2.000 variantes por genoma foram associadas a traços complexos através de estudos de associação de genomas (GWAS) e 24 – 30 variantes por genoma implicados em doenças raras através do ClinVar (uma base de dados das relações entre variações humanas e fenótipos). Outras análises forneceram informações sobre a história da população, demografia de populações ancestrais e resolução de estudos de associação genética (2).
Os resultados do Projeto 1000 Genomas, que atestam os benefícios da “ciência baseada em consórcio”, completam um conjunto de informações genômicas que já estão em uso há vários anos. Tais informações são particularmente úteis para o desenho de matrizes de genotipagem, genética populacional (por exemplo, imputação de genótipo em GWAS, definição de variantes em regiões de interesse, filtragem de variantes provavelmente neutras), e investigações sobre seleção natural, estrutura populacional e mistura. As principais vantagens do conjunto de dados do Projeto 1000 Genomes incluem a ampla representação da variação genética humana (com uma cobertura muito melhorada das populações do Sul da Ásia e África); o uso de múltiplas estratégias de análise, aumentando a qualidade da filtragem e mapeamento e permitindo a captura de tipos mais diversos de variantes genéticas; e a ampla disponibilidade de amostras e dados resultantes do projeto. No conjunto, estes elementos ajudarão a fornecer mais informações sobre a base genética da doença. Eles serão usados, por exemplo, nos esforços em curso para decifrar a base genética do transporte peritoneal e o resultado da diálise peritoneal.
“Agora isto não é o fim… Mas talvez seja o fim do começo”, como disse Winston Churchill. Os projetos de seqüenciamento em grande escala continuarão para mais grupos regionais ou étnicos, a fim de ampliar a cobertura global. Muito esforço se concentrará numa melhor compreensão da relação entre variação genética e distúrbios comuns. A tradução dessa informação genética maciça para a saúde humana se beneficiará do desenvolvimento de bancos de dados complexos que reúnem dados genéticos, clínicos e biológicos, tais como perfis multi-mecânicos, enquanto mantém a proteção de informações pessoais potencialmente sensíveis (3). Também estão em curso esforços para aumentar a consciência genética do público e educar os profissionais de saúde (http://www.1000genomes.org/about).