Podwójna rola 5-hydroksymetylocytozyny jako stabilnej zasady DNA i jako pośredniej w demetylacji DNA
Wiemy obecnie, że poziomy 5hmC różnią się znacznie pomiędzy różnymi typami komórek i tkanek i są najwyższe w mózgu, w szczególności w neuronach. Ponieważ 5hmC jest produktem utleniania 5mC, jasne jest, że tworzenie 5hmC z 5mC automatycznie obniża poziom 5mC w każdej danej pozycji nukleotydu, a nawet w całym genomie. Dlatego od razu stało się jasne, że przekształcenie 5mC w 5hmC może być pierwszym krokiem w ścieżce prowadzącej do demetylacji DNA. Istnieją dowody z różnych systemów eksperymentalnych, że tak właśnie może być. Efektem końcowym tego szlaku demetylacji jest pasywne lub aktywne usunięcie zmodyfikowanej zasady i/lub zanik grupy metylowej z cytozyny w DNA (Rysunek 1). W pasywnej ścieżce demetylacji, 5hmC nie może być kopiowana przez konserwującą metylotransferazę DNA, DNMT1, enzym, który propaguje wcześniej istniejące wzorce metylacji i działa na hemimetylowane miejsca CpG . Aktywny proces demetylacji, w którym pośredniczy 5hmC, jest znacznie bardziej skomplikowany. Jedno z doniesień sugeruje, że 5hmC może być przekształcany do cytozyny przez metylotransferazy DNA. W wyniku deaminacji 5hmC powstaje 5-hydroksymetylouracyl, który może być usunięty przez enzymy naprawcze wycinania zasad, w tym glikozylazę tyminową DNA (TDG) i jednoniciową selektywną monofunkcyjną glikozylazę uracylową DNA (SMUG1). Nie wiadomo jednak, jak efektywnie szlak ten funkcjonuje in vivo. W wyniku stopniowego utleniania 5hmC przez białka TET powstaje 5-formylocytozyna (5fC), a następnie 5-karboksylocytozyna (5caC). Ta 5caC, która jest wykrywalna na niskim poziomie w DNA, może być następnie usunięta albo przez naprawę przez wycięcie zasad katalizowaną przez aktywność glikozylazy DNA białka TDG , albo przez dekarboksylację. Teoretycznie, ścieżka dekarboksylacji powinna być korzystna, ponieważ nie wymaga zerwania wiązań fosfodiestrowych DNA, co ma miejsce podczas naprawy przez wycięcie zasady inicjowanej przez TDG. Jednakże, do tej pory nie zidentyfikowano aktywności enzymatycznej dla etapu dekarboksylacji, chociaż dekarboksylacja wydaje się zachodzić.
W wielu tkankach gromadzą się dość znaczne poziomy 5hmC, znacznie większe niż można by się spodziewać, gdyby ta baza była po prostu przejściowym pośrednikiem w sekwencyjnej ścieżce utleniania prowadzącej w kierunku demetylacji DNA. Dlatego 5hmC może być modułem epigenetycznym, który ma swoje unikalne biochemiczne właściwości kodujące. Funkcja ta może być negatywna lub odpychająca, ponieważ utlenianie grupy metylowej podczas produkcji 5hmC blokuje wiązanie białek, które w przeciwnym razie oddziaływałyby z 5mC. Alternatywnie, jej funkcja może być pozytywna lub instruktywna, jeśli istnieją białka, które specyficznie wiążą się z 5hmC. Jak dotąd, kilka różnych białek wykazało zdolność do rozpoznawania 5hmC, przynajmniej in vitro, w tym UHRF1 , MBD3 , MeCP2 i kilka innych zidentyfikowanych przez podejście proteomiczne . Jednak biologiczna rola ich wiązania z 5hmC nadal nie jest do końca jasna. Większość z tych białek ma również inne funkcje, a zatem mogą nie być unikalnie zaprojektowane do interakcji z 5hmC.
Rola 5-hydroksymetylocytozyny w rozwoju i różnicowaniu ssaków
Funkcjonalna rola 5hmC w genomach ssaków jest nadal niejasna. Na początku cyklu życiowego ssaków, po zapłodnieniu oocytów przez plemniki, większość 5mC w genomie ojcowskim (pochodzącym od plemników) ulega utlenieniu do postaci 5hmC. Ten etap utleniania, który wcześniej uważano za odzwierciedlenie prawdziwej „demetylacji” DNA, jest specyficzny dla genomu ojcowskiego, podczas gdy genom matczyny (pochodzący z oocytu) pozostaje chroniony przed katalizowanym przez Tet utlenianiem. Utlenianie genomu ojcowskiego jest katalizowane przez Tet3, kodowany przez jedyny gen Tet wyrażany na znacznym poziomie w oocytach i zygotach. Genetyczny nokaut Tet3 u myszy powoduje nieudaną oksydację genomu ojcowskiego, upośledzony rozwój i okołoporodową śmiertelność.
Inne ważne przejście rozwojowe obejmuje globalną demetylację DNA w pierwotnych komórkach zarodkowych (PGCs), która rozpoczyna się około dnia zarodkowego 8,5 do 9,5 i jest zakończona w pobliżu dnia zarodkowego 13,5. Mechanizmy wymazywania metylacji w PGCs pozostaj± w dużej mierze niejasne i kontrowersyjne. Przez długi czas zakładano, że niezależna od replikacji aktywna demetylacja DNA jest kluczowym szlakiem, który prawdopodobnie bierze udział w tym etapie. Jednakże nowsze dane przemawiają za pasywną utratą metylacji spowodowaną brakiem utrzymania metylacji podczas replikacji DNA. Ta bierna utrata 5mC może być skutecznie inicjowana przez konwersję 5mC w 5hmC. Tet1 i Tet2 są oksydazami 5mC ulegającymi największej ekspresji w PGC na tym etapie. Potomstwo myszy z niedoborem Tet1 i Tet2 wykazuje braki w demetylacji DNA w genach imprintowanych. Jednakże zwierzęta obu płci z niedoborem Tet1/2 były płodne, przy czym samice miały mniejsze jajniki i obniżoną płodność. Delecja Tet1 i Tet2 może produkować zdolne do życia osobniki dorosłe, chociaż większość takich myszy umiera podczas embriogenezy lub około narodzin i wykazuje różne wady rozwojowe. Dane te sugerują, że indukowana przez Tet1/2 oksydacja 5mC w PGCs nie jest bezwzględnie wymagana do uzyskania zdolnego do życia potomstwa. Wśród obecnie dostępnych informacji na temat demetylacji DNA w zygotach i PGCs nadal brakuje bardziej szczegółowej analizy 5hmC na poziomie sekwencji DNA, co może być osiągnięte, na przykład, przez sekwencjonowanie TAB. Oczekuje się, że takie informacje wyjaśnią globalny lub specyficzny dla danego miejsca udział formacji 5hmC w inicjacji pasywnej (lub aktywnej) demetylacji DNA. Wcześniejsza implikacja procesów naprawy przez wycinanie zasad w przeprogramowaniu linii zarodkowej, która sama w sobie stanowiłaby ogromne zagrożenie dla zachowania integralności genomu, gdyby działała na poziomie globalnym, może mieć różne inne wytłumaczenia. W jednym ze scenariuszy występowanie aktywności naprawczej polegającej na wycinaniu zasad może być tłumaczone wymogiem przeciwdziałania niepożądanym reakcjom utleniania katalizowanym przez aktywność oksydazy Teta na guaninach w metylowanych miejscach CpG (guanina jest zasadą DNA najbardziej podatną na utlenianie). W innym ustawieniu, 5hmC może być dalej utleniane, być może w specyficznych sekwencjach, przez białka Tet, aby utworzyć 5caC, który jest następnie usuwany przez naprawę przez wycięcie bazy zainicjowaną przez TDG .
Ponieważ 5hmC jest najbardziej obfity w tkance mózgowej, priorytetem stało się zrozumienie funkcji tej zmodyfikowanej bazy w mózgu. Na przykład w DNA z ludzkiej kory mózgowej poziom 5hmC wynosi około 1% wszystkich cytozyn lub 20 do 25% wszystkich baz 5mC . Odpowiada to około 6,000,000 zasad 5hmC na haploidalny genom. Poziomy te wyraźnie sugerują, że 5hmC pełni ważną rolę funkcjonalną w mózgu ssaków. Dotychczasowe badania wykazały, że 5hmC w tkankach mózgu występuje bardzo obficie w regionach genów, zarówno w promotorach, jak i w jeszcze większym stopniu w regionach wewnątrzgenowych, tzw. ciałach genowych. Można sobie wyobrazić, że tworzenie się 5hmC w promotorach, wyspach CpG lub brzegach (krawędziach) wysp CpG funkcjonuje analogicznie do procesu naprawczego, polegającego na utlenianiu i ostatecznie usuwaniu niewłaściwie wprowadzonych 5hmC w tych regionach. Odkładanie się 5hmC w promotorach lub ciałach genów często koreluje pozytywnie z aktywnością genów. Mechanizm, w jaki sposób 5hmC związana z ciałami genów zwiększa poziom transkryptu jest obecnie nieznany. Jedną z możliwości jest to, że utlenianie 5mC wyzwala efekt represyjny na transkrypcję, być może poprzez przeciwdziałanie fałszywej wewnątrzgenowej transkrypcji antysensownej. Inne wyjaśnienia mogą obejmować fakt, że 5hmC ma destabilizujący wpływ na strukturę DNA, który potencjalnie sprzyja otwieraniu podwójnej helisy przez aparat transkrypcyjny.
5hmC, chociaż nie jest rozpoznawany przez kilka białek wiążących metylo-CpG, w tym MBD1, MBD2 i MBD4 , jest w stanie związać MeCP2 , białko wiążące metylo-CpG, które jest obfite w mózgu i jest zmutowane w zaburzeniu neurologicznym zespół Retta . Wcześniejsze badania, wykorzystujące domenę wiążącą metylo-CpG (MBD) MeCP2, a nie białko o pełnej długości, nie wykazały, że MeCP2 wiąże się z 5hmC. Przyczyny tych rozbieżności nie są jasne. Związek między MeCP2 i 5hmC w mózgu jest szczególnie interesujący, ponieważ poziomy 5hmC są najwyższe w mózgu, a MeCP2 jest białkiem obficie występującym w mózgu, osiągającym poziomy podobne do histonu H1. Z tych powodów w mózgu można przewidzieć raczej genomową niż sekwencyjną mechanistyczną rolę wiązania 5hmC przez MeCP2.
Jak wykazano ostatnio, tworzenie 5hmC jest krytyczne dla rozwoju mózgu. Baza ta jest obfita w rozwijających się neuronach, w których jej poziom wzrasta w stosunku do neuronalnych komórek progenitorowych i gdzie specyficznie lokalizuje się do ciał genów ważnych dla różnicowania neuronów. Tet3 ulega największej ekspresji w rozwijającej się korze mózgowej myszy, następnie Tet2, a poziom Tet1 jest bardzo niski w tej tkance. Wzrost poziomu Tet2, Tet3 i 5hmC w różnicujących się neuronach zbiega się z obniżeniem poziomu metylotransferazy Polycomb H3K27 Ezh2 i utratą H3K27me3 w krytycznych genach. Zmniejszenie poziomów Tet2 i Tet3 lub zwiększenie ekspresji Ezh2 skutkuje niekompletnym lub zablokowanym różnicowaniem neuronów. Tak więc, tworzenie 5hmC promuje różnicowanie neuronów poprzez modulowanie ekspresji genów najbardziej krytycznych w tym ważnym przejściu rozwojowym.
Utrata 5-hydroksymetylocytozyny w raku
Poziomy 5hmC w raku są silnie obniżone w stosunku do odpowiedniej normalnej tkanki otaczającej guz. Wykorzystując chromatografię cieczową ze spektrometrią masową, immuno-dot-bloty oparte na przeciwciałach anty-5hmC i immunohistochemię, wykazaliśmy związaną z guzem utratę 5hmC w przypadku nowotworów płuc, mózgu, piersi, wątroby, nerek, prostaty, jelita, macicy i czerniaka. Inni badacze potwierdzili tę obserwację, wykazując utratę 5hmC w różnych typach guzów litych . Ponadto wykazano, że reintrodukcja TET2 przywraca poziom 5hmC i zmniejsza potencjał przerzutowy komórek czerniaka. Co uderzające, kiedy współbarwiliśmy sekcje tkanek przeciwciałami przeciwko 5hmC i przeciwko antygenowi Ki67, który jest markerem występującym tylko w proliferujących komórkach, zaobserwowaliśmy, że 5hmC i Ki67 prawie nigdy nie są obecne jednocześnie w pojedynczej komórce. Na poziomie diagnostyki klinicznej, połączona analiza immunohistochemiczna utraty 5hmC i obecności komórek Ki67-pozytywnych mogłaby zostać przekształcona w biomarker do diagnostyki nowotworów. Brak lub silna redukcja 5hmC w guzach sugeruje, że proliferujące komórki tracą 5hmC. W większości przypadków masa guza jest pozbawiona 5hmC, nawet jeśli komórki Ki67-pozytywne są rzadkie, co sugeruje, że te komórki nowotworowe miały w przeszłości historię proliferacji prowadzącą do utraty 5hmC, która następnie nie jest przywrócona. Zależna od replikacji utrata 5hmC odzwierciedla sytuację przypominającą tę w embrionach preimplantacyjnych, w której początkowe tworzenie 5hmC w ojcowskim DNA następuje po zależnej od replikacji utracie lub rozcieńczeniu tego znaku. Podobnie, globalna zawartość 5hmC zmniejsza się gwałtownie, gdy komórki z normalnej tkanki przystosowują się do hodowli komórkowej. Najprostszym wyjaśnieniem jest to, że utlenianie 5mC wytwarza hemi-hydroksymetylowane miejsce CpG w DNA, które nie jest rozpoznawane przez DNMT1 podczas replikacji DNA. Takie wyjaśnienie jest zgodne z badaniami in vitro pokazującymi, że DNMT1 nie jest w stanie działać na miejscach CpG, które zawierają 5hmC. Możliwe są jednak również inne wyjaśnienia zmniejszenia ilości 5hmC w nowotworach. Poziom białek TET może być niższy w tkance nowotworowej niż w odpowiadającej jej prawidłowej tkance. Chociaż nie zaobserwowaliśmy spójnych różnic na poziomie RNA dla TET1, TET2, lub TET3 w guzach płuc i mózgu w stosunku do normalnej tkanki, inni zgłosili niższe poziomy ekspresji genów TET w raku. Dodatkową możliwością jest to, że komórki nowotworowe zawierają uszkodzone szlaki metaboliczne, które są zaangażowane w produkcję kofaktora dla aktywności TET, 2-oksoglutaranu (patrz poniżej).
Mutacja TET2 w ludzkim raku
TET1 należy do rodziny białek charakteryzujących się promowaniem konwersji 5mC do 5hmC w DNA ssaków. Istnieją trzy zidentyfikowane rodziny należące do rodziny TET: TET1, TET2, oraz TET3. TET1 zlokalizowana jest na ludzkim chromosomie 10q21.3, podczas gdy TET2 na chromosomie 4q24, a TET3 na chromosomie 2p13.1. Enzym TET1 składa się z domeny wiążącej DNA z palcem cynkowym CXXC, regionu bogatego w cysteinę oraz domeny dioksygenazy zależnej od 2-oksoglutaranu i żelaza (II) (2OGFeDO). TET3 zawiera również N-końcową domenę CXXC. Jednakże gen TET2 uległ w toku ewolucji chromosomalnej inwersji genowej, co spowodowało oddzielenie jego domeny CXXC od domeny katalitycznej i utworzenie nowego genu z domeną CXXC o nazwie IDAX/CXXC4, który koduje negatywny regulator TET2. Na podstawie profili EST i tablic ekspresyjnych, TET1 wykazuje największą ekspresję podczas embriogenezy i nie wykazuje istotnej ekspresji w dorosłych tkankach. TET2 ulega ekspresji głównie w komórkach krwiotwórczych, a TET3 wydaje się ulegać wszechobecnej ekspresji w dorosłych tkankach ludzkich.
Białaczka jest chorobą, w której podczas normalnego różnicowania krwiotwórczych komórek macierzystych, ekspansja klonalna krwiotwórczych komórek prekursorowych w szpiku kostnym jest zaburzona na pewnym etapie różnicowania, powodując brak równowagi pomiędzy różnicowaniem a samoodnawianiem. Niewłaściwa ekspansja krwiotwórczych komórek progenitorowych jest spowodowana przede wszystkim blokadą dojrzewania komórek. Zespół mielodysplastyczny (MDS) zaburzenia hematopoezy charakteryzują się cytopenią (niska liczba krwinek), nieefektywną hematopoezą w jednej lub drugiej linii komórkowej oraz zwiększonym ryzykiem transformacji do ostrej białaczki szpikowej (AML). W AML, szybki wzrost nieprawidłowych białych krwinek w szpiku kostnym prowadzi do zablokowania produkcji różnych komórek z innych linii komórkowych.
TET2 został znaleziony zmutowany u pacjentów z nowotworami mieloproliferacyjnymi (MPN), MDS, AML i przewlekłą białaczką mielomonocytową (CMML), i jest najczęściej zmutowanym genem w MDS . Mutacje TET1 lub TET3 nie są obserwowane w MDS, ani mutacja TET2 nie koreluje z kilkoma innymi znanymi powszechnymi mutacjami. Co ciekawe, mutacje dehydrogenazy izocytrynianowej 1/2 (IDH1/2) są rzadko spotykane razem z mutacjami TET2, ale mają podobny wpływ jak mutacje TET2 na krwiotwórcze komórki macierzyste (HSCs) . Podczas gdy mutacje TET2 są związane ze zmniejszonym całkowitym przeżyciem w AML w porównaniu do pacjentów z dzikim typem TET2, mutacje TET2 u pacjentów z MDS i MPN promują progresję do AML . Gen TET2 składa się w sumie z jedenastu eksonów, które przekładają się na produkt białkowy o długości 2002 aminokwasów. Mutacje TET2 w nowotworach mieloidalnych są najczęściej obserwowane w eksonach 3a i 10, które są najdłuższymi eksonami. Zarówno multipotencjalne, jak i zaangażowane komórki progenitorowe linii krwiotwórczej są celem mutacji TET2 w MPN, co sugeruje, że TET2 odgrywa ważną rolę w mielopoezie. Delecje TET2 i utratę heterozygotyczności lub disomię jednoparentalną zaobserwowano u (9%) pacjentów z MDS/AML ze zmutowaną TET2, gdzie prawdopodobnie allel typu dzikiego został utracony podczas rekombinacji, pozwalając zmutowanej TET2 na promowanie fenotypu utraty funkcji. Kosmider i wsp. zaobserwowali, że 50% pacjentów ze zmutowanym TET2 miało defekty genetyczne, które dotyczyły dwóch kopii TET2. Mutacje w TET2 wydają się prowadzić do utraty funkcji, sugerując, że może ona odgrywać rolę supresyjną w nowotworach.
Zrozumienie podstawowych implikacji braku funkcji zmutowanej TET2 i jej roli w nowotworach mieloidalnych jest aktualnym priorytetem badawczym. Kilka laboratoriów wygenerowało warunkowe modele myszy z nokautem Tet2, w których krytyczne eksony Tet2 zostały ukierunkowane. Moran-Crusio i wsp. zaobserwowali, że myszy Tet 2-/- rozwinęły splenomegalię w wieku 20 tygodni, wykazując fenotypy podobne do tych obserwowanych u pacjentów z CMML ze zmutowanym TET2. Dane z różnych modeli mysich prowadziły do podobnych obserwacji. Delecja Tet2 nie jest letalna w okresie embrionalnym. Główną obserwacją poczynioną przez Moran-Crusio i wsp. oraz przez Ko i wsp. jest to, że krwiotwórcze komórki macierzyste z myszy Tet2-/- mają zwiększoną zdolność do repopulacji przedziału krwiotwórczego in vivo podczas konkurencyjnych testów rekonstytucyjnych z konkurencją HSCs z komórek Tet2+/+. Analiza różnych narządów myszy Tet2-/- wykazała, że utrata Tet2 nie jest kompensowana przez wzrost ekspresji Tet1 lub Tet3. Poziomy 5hmC są znacząco obniżone w szpiku kostnym i śledzionie myszy Tet2-/-. Myszy Tet2-/- wykazują wzrost HSCs z niewielkim wzrostem progenitorów mieloidalnych, przechylając hematopoezę w kierunku monocytów/makrofagów. Sugeruje się, że aktywny Tet2 reguluje prawidłową hematopoezę, zapewniając właściwą dystrybucję linii i kontrolowane różnicowanie HSC. Szczególnie interesuj±cy jest wpływ mutacji TET2 na poziom i wzorce 5mC w genomie. Jednakże obecne dane są dalekie od jednoznaczności. Podczas gdy jedno z doniesień wskazuje, że mutacja TET2 w AML jest związana z fenotypem hipermetylacji DNA, inne dane sugerują, że próbki szpiku kostnego od pacjentów z mutacją TET2 mają niski poziom 5hmC i hipometylację DNA. Sytuację komplikuje fakt, że nowotwory złośliwe układu krwiotwórczego często charakteryzują się mutacjami w kilku modyfikatorach epigenetycznych, w tym EZH2, IDH1, IDH2, MLL, DNMT3A i ASXL1, co potencjalnie zaciemnia wszelkie bezpośrednie skojarzenia. Na przykład, w jednym z badań, ośmiu z jedenastu pacjentów z mutacjami DNMT3A (73%) w chłoniaku T-komórkowym miało również mutacje TET2 .
Mutacje w szlakach kofaktorowych
Oksydazy 5mC są enzymami zależnymi od 2-oksoglutaranu (rysunek 2). Kofaktor ten jest wytwarzany w cyklu kwasu trójkarboksylowego z izocytrynianu przez enzym IDH. Co ciekawe, kilka typów ludzkich nowotworów zawiera mutacje w genie IDH1. Mutacje IDH1 są szczególnie częste w glejakach II i III stopnia, gdzie stwierdza się je nawet u 70% pacjentów. Mutacje w IDH1 i IDH2 są również obserwowane w białaczkach szpikowych i kilku innych nowotworach złośliwych, ale z mniejszą częstotliwością. Te mutacje IDH1 nie są rozproszone w całym genie, ale występują prawie wyłącznie w pozycji aminokwasowej 132. To odkrycie sugeruje, że to konkretne zmutowane białko IDH1 ma właściwość gain of function. Zaskakującym odkryciem było to, że mutant IDH1 w kodonie 132 arginina do histydyny produkuje onkometabolit 2-hydroksyglutaran (2HG) jako produkt reakcji zamiast 2-oksoglutaranu. Wydaje się, że reakcja utleniania izocytrynianu przeprowadzana przez tego mutanta jest niekompletna i powstaje tylko 2HG. Ponadto, 2HG jest kompetycyjnym inhibitorem wielu, jeśli nie wszystkich, aktywności enzymatycznych zależnych od 2-oksoglutaranu. Białka TET reprezentują jedną klasę takich enzymów i wykazano, że 2HG jest inhibitorem TET1 i TET2 .
Jednym z interesujących korelatów posiadania zmutowanej IDH1 w guzach glejaka jest to, że guzy zmutowane IDH1 są prawie zawsze związane z obfitymi zmianami w metylacji DNA w całym genomie, na co wskazuje powszechna hipermetylacja wysp CpG. Ten fenotyp został określony jako fenotyp metylatora wysp CpG (lub CIMP). Kuszące jest przypuszczenie, że CIMP w glejakach IDH1-mutant jest związany z niepowodzeniem produkcji 5hmC w tych guzach, ponieważ aktywność TET jest upośledzona przez 2HG. W rzeczywistości, eksperymentalne wprowadzenie zmutowanej konstrukcji IDH1 do ludzkich astrocytów doprowadziło do pojawienia się fenotypu podobnego do CIMP. Co więcej, u myszy z warunkowym knock-in, u których najczęstsza mutacja Idh1 R132H została wstawiona do endogennego locus Idh1 i uległa ekspresji w komórkach hematopoetycznych, zaobserwowano hipermetylację DNA. Jednak w bezpośrednim porównaniu poziomów 5hmC w DNA pomiędzy glejakami IDH1 mutant i IDH1 wild-type, nie zaobserwowaliśmy żadnych istotnych różnic pomiędzy tymi dwoma kategoriami guzów mózgu. Dlatego należy pamiętać, że zmutowana IDH1 i jej metabolit 2HG nie tylko wpływają na enzymy TET, ale także hamują wiele demetylaz lizyny, które zależą od 2-oksoglutaranu i innych enzymów zależnych od 2-oksoglutaranu. Dysfunkcja tych demetylaz lizynowych może mieć wtórny wpływ na wzorce metylacji DNA na wyspach CpG.