Proiectul 1000 de genomuri este un consorțiu internațional de cercetare înființat în 2007 cu scopul de a secvenția genomurile a cel puțin 1.000 de voluntari din mai multe populații din întreaga lume pentru a ne îmbunătăți înțelegerea contribuției genetice la sănătatea și bolile umane. La acest proiect au contribuit la nivel mondial instituții importante, printre care Wellcome Trust Sanger Institute (Regatul Unit), Beijing Genomics Institute (China) și US National Human Genome Research Institute. Scopul proiectului a fost de a produce un catalog al variației umane până la variantele care apar cu o frecvență de 1% sau mai puțin pe genom, pentru a facilita studiile genetice privind bolile umane comune (1).
Un articol important, publicat în numărul din 1 octombrie 2015 al revistei Nature, marchează finalizarea fazei finale a proiectului colosal: o bază de date cuprinzătoare, cu acces liber, a variației genetice de la 2.504 persoane din 26 de populații din întreaga lume (2). Genotipurile au fost obținute cu ajutorul unei combinații de secvențiere a întregului genom, de secvențiere profundă a exomului și de microplăci de polimorfims de nucleotide unice (SNP) de mare densitate. Caracterizarea variantelor s-a bazat pe un set de 24 de instrumente de analiză a secvențelor. În total, proiectul a descoperit și caracterizat peste 88 de milioane de variante, inclusiv 84,7 milioane de SNP-uri, 2,6 milioane de inserții/deleții scurte (indels) și 60.000 de variante structurale, care au fost integrate într-o schemă de haplotipuri de înaltă calitate.
Câteva constatări importante: În comparație cu genomul uman de referință, un genom tipic diferă la ~ 4 până la 5 milioane de situsuri, 99,9% din aceste variante fiind SNP-uri și indels scurte. Numărul de site-uri de variante este cel mai mare la indivizii cu ascendență africană, așa cum era de așteptat din modelul de expansiune umană în afara Africii. Analizele variantelor care au cea mai mare probabilitate de a afecta funcția genetică au arătat că un genom tipic conține ~ 150 de situri cu variante de trunchiere a proteinelor, ~ 10 000 de situri cu variante de modificare a secvenței peptidice și ~ 500 000 de situri de variante care se suprapun peste regiuni de reglementare, cum ar fi promotori, intensificatori sau situri de legare a factorilor de transcripție. Este important faptul că ~2 000 de variante per genom au fost asociate cu trăsături complexe prin studii de asociere la nivel de genom (GWAS) și 24 – 30 de variante per genom implicate în boli rare prin ClinVar (o bază de date a relațiilor dintre variațiile umane și fenotipuri). Alte analize au furnizat informații despre istoria populației, demografia populațiilor strămoșești și rezoluția studiilor de asociere genetică (2).
Rezultatele proiectului 1000 Genomes, care atestă beneficiile „științei bazate pe consorțiu”, completează un set de informații genomice care este deja utilizat de mai mulți ani. Astfel de informații sunt deosebit de utile pentru proiectarea matricelor de genotipare, genetica populațiilor (de exemplu, imputarea genotipurilor în GWAS, definirea variantelor în regiunile de interes, filtrarea variantelor probabil neutre) și investigațiile privind selecția naturală, structura populației și amestecul. Avantajele majore ale setului de date din cadrul proiectului 1000 Genomes Project includ reprezentarea largă a variației genetice umane (cu o acoperire mult mai bună a populațiilor din Asia de Sud și Africa); utilizarea strategiilor de analiză multiple, ceea ce sporește calitatea filtrării și cartografierii și permite captarea unor tipuri mai diverse de variante genetice; precum și disponibilitatea largă a eșantioanelor și a datelor rezultate în urma proiectului. Împreună, aceste elemente vor contribui la furnizarea de informații suplimentare privind bazele genetice ale bolilor. Ele vor fi utilizate, de exemplu, în cadrul eforturilor în curs de descifrare a bazei genetice a transportului peritoneal și a rezultatelor dializei peritoneale.
„Acum, acesta nu este sfârșitul… Dar este, poate, sfârșitul începutului”, după cum spunea Winston Churchill. Proiectele de secvențiere la scară largă vor continua pentru mai multe grupuri regionale sau etnice, pentru a extinde acoperirea globală. Multe eforturi se vor concentra asupra unei mai bune înțelegeri a relației dintre variațiile genetice și tulburările comune. Transpunerea acestor informații genetice masive în sănătatea umană va beneficia de dezvoltarea unor baze de date complexe care să reunească date genetice, clinice și biologice, cum ar fi profilurile multi-omice, menținând în același timp protecția informațiilor personale potențial sensibile (3). De asemenea, sunt în curs de desfășurare eforturi pentru a crește gradul de conștientizare genetică în rândul publicului și pentru a educa profesioniștii din domeniul sănătății (http://www.1000genomes.org/about).
.