- Rôle double de la 5-hydroxyméthylcytosine comme base stable de l’ADN et comme intermédiaire dans la déméthylation de l’ADN
- Le rôle de la 5-hydroxyméthylcytosine dans le développement et la différenciation des mammifères
- La perte de 5-hydroxyméthylcytosine dans le cancer
- Mutation de TET2 dans le cancer humain
- Mutations dans les voies des cofacteurs
Rôle double de la 5-hydroxyméthylcytosine comme base stable de l’ADN et comme intermédiaire dans la déméthylation de l’ADN
Nous savons maintenant que les niveaux de 5hmC varient considérablement entre les différents types de cellules et de tissus et qu’ils sont les plus élevés dans le cerveau, en particulier dans les neurones . Le 5hmC étant un produit d’oxydation du 5mC, il est clair que la formation de 5hmC à partir de 5mC diminue automatiquement les niveaux de 5mC à n’importe quelle position nucléotidique donnée, voire à l’échelle du génome. Il est donc apparu immédiatement que la conversion du 5mC en 5hmC pouvait être la première étape d’une voie menant à la déméthylation de l’ADN. Des preuves provenant de divers systèmes expérimentaux indiquent que cela pourrait effectivement être le cas. Le résultat final de cette voie de déméthylation est l’élimination passive ou active de la base modifiée et/ou la disparition du groupe méthyle de la cytosine dans l’ADN (Figure 1). Dans la voie de déméthylation passive, le 5hmC ne peut pas être copié par l’ADN méthyltransférase de maintenance, la DNMT1, une enzyme qui propage les schémas de méthylation préexistants et opère sur les sites CpG hémiméthylés. Le processus de déméthylation active qui utilise le 5hmC comme intermédiaire est considérablement plus compliqué. Un rapport suggère que le 5hmC peut être converti en cytosine par des ADN méthyltransférases. La désamination du 5hmC produit du 5-hydroxyméthyluracile, qui peut être éliminé par des enzymes de réparation par excision de bases, notamment la thymine ADN glycosylase (TDG) et l’uracile ADN glycosylase monofonctionnelle sélective simple brin (SMUG1). Cependant, l’efficacité d’une telle voie in vivo est actuellement inconnue. L’oxydation par étapes du 5hmC par les protéines TET produit la 5-formylcytosine (5fC) puis la 5-carboxylcytosine (5caC) . Cette 5caC, qui est détectable à de faibles niveaux dans l’ADN, peut ensuite être éliminée soit par réparation par excision de bases catalysée par l’activité ADN glycosylase de la protéine TDG , soit par décarboxylation. Théoriquement, la voie de la décarboxylation devrait être favorable car elle ne nécessite pas la rupture des liaisons phosphodiesters de l’ADN, ce qui se produit pendant la réparation par excision des bases initiée par la TDG. Cependant, à ce jour, aucune activité enzymatique pour l’étape de décarboxylation n’a été identifiée bien que la décarboxylation semble se produire .
De nombreux tissus accumulent des niveaux assez importants de 5hmC, bien plus importants que ce qui serait attendu si cette base était simplement un intermédiaire transitoire dans une voie d’oxydation séquentielle menant à la déméthylation de l’ADN. Par conséquent, le 5hmC peut être un module épigénétique qui possède ses propres propriétés de codage biochimique uniques. Cette fonction peut être négative ou répulsive puisque l’oxydation du groupe méthyle pendant la production du 5hmC bloque la liaison des protéines qui interagiraient autrement avec le 5mC . En revanche, sa fonction peut être positive ou instructive s’il existe des protéines qui se lient spécifiquement au 5hmC. Jusqu’à présent, plusieurs protéines différentes ont montré leur capacité à reconnaître le 5hmC, au moins in vitro, notamment UHRF1 , MBD3 , MeCP2 , et plusieurs autres identifiées par une approche protéomique . Cependant, le rôle biologique de leur liaison au 5hmC n’est pas encore tout à fait clair. La plupart de ces protéines ont également d’autres fonctions, et peuvent donc ne pas être conçues de manière unique pour interagir avec le 5hmC.
Le rôle de la 5-hydroxyméthylcytosine dans le développement et la différenciation des mammifères
Le rôle fonctionnel du 5hmC dans les génomes des mammifères n’est toujours pas clair. Au début du cycle de vie des mammifères, lors de la fécondation des ovocytes par les spermatozoïdes, la plupart du 5mC dans le génome paternel (issu des spermatozoïdes) est oxydé pour former du 5hmC . Cette étape d’oxydation, dont on pensait auparavant qu’elle reflétait une véritable « déméthylation » de l’ADN, est spécifique au génome paternel, tandis que le génome maternel (dérivé des ovocytes) reste protégé de l’oxydation catalysée par le Tet. L’oxydation du génome paternel est catalysée par Tet3, codé par le seul gène Tet exprimé à des niveaux substantiels dans les ovocytes et les zygotes. Le knockout génétique de Tet3 chez les souris entraîne un échec de l’oxydation du génome paternel, un développement compromis et une létalité périnatale .
Une autre transition importante du développement implique une déméthylation globale de l’ADN dans les cellules germinales primordiales (PGC) qui commence vers le jour embryonnaire 8,5 à 9,5 et s’achève vers le jour embryonnaire 13,5. Les mécanismes de l’effacement de la méthylation dans les cellules germinales primordiales sont restés très peu clairs et controversés. On a longtemps supposé que la déméthylation active de l’ADN, indépendante de la réplication, était une voie clé probablement impliquée dans cette étape. Cependant, des données plus récentes favorisent une perte passive de méthylation causée par l’absence de maintien de la méthylation pendant la réplication de l’ADN. Cette perte passive de 5mC peut être efficacement initiée par la conversion de 5mC en 5hmC . Tet1 et Tet2 sont les 5mC oxydases les plus fortement exprimées dans les PGC à ce stade. La progéniture des souris déficientes en Tet1 et Tet2 présente des déficiences dans la déméthylation de l’ADN au niveau des gènes imprimés. Cependant, les animaux des deux sexes déficients en Tet1/2 sont fertiles, les femelles ayant des ovaires plus petits et une fertilité réduite. La délétion de Tet1 et Tet2 peut produire des adultes viables, bien que la majorité de ces souris meurent pendant l’embryogenèse ou autour de la naissance et présentent divers défauts de développement . Ces données suggèrent que l’oxydation de la 5mC induite par Tet1/2 dans les PGC n’est pas absolument nécessaire pour produire une descendance viable. Les informations actuellement disponibles sur la déméthylation de l’ADN dans les zygotes et les PGCs manquent encore d’une analyse plus spécifique de la 5hmC au niveau de la séquence d’ADN, comme cela peut être accompli, par exemple, par le séquençage TAB. Ces informations devraient permettre de clarifier l’implication globale ou spécifique à un locus de la formation de 5hmC dans l’initiation de la déméthylation passive (ou active) de l’ADN. L’implication antérieure des processus de réparation par excision de bases dans la reprogrammation de la lignée germinale, qui en soi poserait un risque énorme pour le maintien de l’intégrité du génome s’il opérait à un niveau global, peut avoir diverses autres explications. Dans un scénario, l’apparition d’une activité de réparation par excision de bases pourrait s’expliquer par la nécessité de contrecarrer les réactions d’oxydation parasites non ciblées catalysées par l’activité oxydase de Tet sur les guanines des sites CpG méthylés (la guanine étant la base de l’ADN la plus sensible à l’oxydation). Dans un autre contexte, le 5hmC peut être oxydé davantage, peut-être au niveau de séquences spécifiques, par les protéines Tet pour former du 5caC, qui est ensuite éliminé par la réparation par excision de bases initiée par le TDG .
Parce que le 5hmC est le plus abondant dans le tissu cérébral, il est devenu prioritaire de comprendre la fonction de cette base modifiée dans le cerveau. Par exemple, dans l’ADN du cortex cérébral humain, le niveau de 5hmC est d’environ 1% de toutes les cytosines ou 20 à 25% de toutes les bases 5mC . Cela correspond à environ 6 000 000 de bases 5hmC par génome haploïde. Ces niveaux suggèrent clairement que le 5hmC a un rôle fonctionnel important dans le cerveau des mammifères. Les études rapportées jusqu’à présent ont montré que le 5hmC dans les tissus cérébraux est très abondant dans les régions génétiques, que ce soit au niveau des promoteurs ou, plus encore, dans les régions intragéniques, les « corps géniques ». Il est concevable que la formation de 5hmC au niveau des promoteurs, des îlots CpG ou des bords d’îlots CpG fonctionne de manière analogue à un processus de réparation pour oxyder et éventuellement éliminer les 5mC introduits de manière inappropriée dans ces régions. Le dépôt de 5hmC dans les promoteurs ou les corps de gènes est souvent en corrélation positive avec l’activité des gènes. Le mécanisme par lequel le 5hmC associé au corps du gène augmente les niveaux de transcription est actuellement inconnu. Une possibilité est que l’oxydation du 5mC libère un effet répressif sur la transcription, peut-être en contrecarrant la transcription antisens intragénique parasite. D’autres explications peuvent inclure le fait que le 5hmC a un effet déstabilisant sur la structure de l’ADN qui favorise potentiellement l’ouverture de la double hélice par l’appareil de transcription.
Le 5hmC, bien que non reconnu par plusieurs protéines de liaison méthyl-CpG, y compris MBD1, MBD2 et MBD4 , est capable de se lier à MeCP2 , une protéine de liaison méthyl-CpG qui est abondante dans le cerveau et qui est mutée dans le trouble neurologique du syndrome de Rett . Des études antérieures, utilisant le domaine de liaison méthyl-CpG (MBD) de MeCP2 plutôt que la protéine complète, n’ont pas conclu que MeCP2 se lie au 5hmC. Les raisons de ces divergences ne sont pas claires. Le lien entre MeCP2 et 5hmC dans le cerveau est particulièrement intéressant puisque les niveaux de 5hmC sont les plus élevés dans le cerveau et que MeCP2 est une protéine abondante dans le cerveau atteignant des niveaux similaires à ceux de l’histone H1. Pour ces raisons, on peut anticiper un rôle mécanistique de la liaison du 5hmC par MeCP2 à l’échelle du génome plutôt que de la séquence dans le cerveau.
Comme cela a été montré récemment, la formation du 5hmC est critique pour le développement du cerveau. La base est abondante dans les neurones en développement dans lesquels son niveau augmente par rapport aux cellules progénitrices neurales et où elle se localise spécifiquement aux corps génétiques des gènes importants pour la différenciation neuronale . Tet3 est le plus fortement exprimé dans le cortex cérébral en développement de la souris, suivi de Tet2, et les niveaux de Tet1 sont très faibles dans ce tissu. Une augmentation des niveaux de Tet2, Tet3 et 5hmC dans les neurones en différenciation coïncide avec une réduction de la méthyltransférase H3K27 de Polycomb Ezh2 et une perte de H3K27me3 au niveau des gènes critiques. La réduction des niveaux de Tet2 et Tet3 ou l’augmentation de l’expression d’Ezh2 entraîne une différenciation neuronale incomplète ou bloquée. Ainsi, la formation de 5hmC favorise la différenciation neuronale en modulant l’expression des gènes les plus critiques dans cette importante transition développementale.
La perte de 5-hydroxyméthylcytosine dans le cancer
Les niveaux de 5hmC dans le cancer sont fortement réduits par rapport au tissu normal correspondant entourant la tumeur . En utilisant la chromatographie en phase liquide-spectrométrie de masse, des immunotransferts à base d’anticorps anti-5hmC et l’immunohistochimie, nous avons démontré une perte de 5hmC associée à la tumeur pour les cancers du poumon, du cerveau, du sein, du foie, du rein, de la prostate, de l’intestin, de l’utérus et du mélanome . D’autres chercheurs ont confirmé cette observation en montrant une perte de 5hmC dans différents types de tumeurs solides. De plus, il a été démontré que la réintroduction de TET2 restaure les niveaux de 5hmC et diminue le potentiel métastatique des cellules de mélanome. Il est frappant de constater que, lors de la coloration de coupes de tissus avec des anticorps contre le 5hmC et contre l’antigène Ki67, qui est un marqueur présent uniquement dans les cellules en prolifération, nous avons observé que le 5hmC et le Ki67 ne sont presque jamais présents simultanément dans une seule cellule. Au niveau du diagnostic clinique, l’analyse immunohistochimique combinée de la perte de 5hmC et de la présence de cellules Ki67-positives pourrait être développée en un biomarqueur pour le diagnostic du cancer. L’absence ou la forte réduction de 5hmC dans les tumeurs suggère que les cellules en prolifération perdent du 5hmC. Dans la plupart des cas, la masse tumorale est appauvrie en 5hmC même si les cellules Ki67-positives sont rares, ce qui suggère que ces cellules tumorales ont eu un passé de prolifération conduisant à une perte de 5hmC, qui n’est ensuite pas rétablie. La perte de 5hmC dépendante de la réplication reflète une situation qui rappelle celle des embryons préimplantatoires dans laquelle la formation initiale de 5hmC dans l’ADN paternel est suivie d’une perte ou d’une dilution dépendante de la réplication de cette marque. De même, la teneur globale en 5hmC diminue rapidement lorsque les cellules d’un tissu normal s’adaptent à la culture cellulaire. L’explication la plus simple est que l’oxydation du 5mC produit un site CpG hémi-hydroxyméthylé dans l’ADN qui n’est pas reconnu par la DNMT1 pendant la réplication de l’ADN. Une telle explication est cohérente avec les études in vitro montrant que la DNMT1 est incapable d’agir sur les sites CpG qui contiennent du 5hmC . Cependant, d’autres explications de la réduction du 5hmC dans le cancer sont également possibles. Les niveaux de protéines TET peuvent être plus faibles dans le tissu tumoral que dans son homologue de tissu normal. Bien que nous n’ayons pas observé de différences cohérentes au niveau de l’ARN pour TET1, TET2 ou TET3 dans les tumeurs du poumon et du cerveau par rapport au tissu normal, d’autres ont rapporté des niveaux plus faibles d’expression du gène TET dans le cancer. Une possibilité supplémentaire est que les cellules cancéreuses contiennent des voies métaboliques compromises qui sont impliquées dans la production du cofacteur pour l’activité TET, 2-oxoglutarate (voir ci-dessous).
Mutation de TET2 dans le cancer humain
TET1 appartient à une famille de protéines caractérisées comme favorisant la conversion de 5mC en 5hmC dans l’ADN des mammifères . Il existe trois membres identifiés appartenant à la famille TET : TET1, TET2, et TET3. TET1 est situé sur le chromosome humain 10q21.3, tandis que TET2 est situé sur le chromosome 4q24 et TET3 sur le chromosome 2p13.1. L’enzyme TET1 est constituée d’un domaine de liaison à l’ADN à doigt de zinc CXXC, d’une région riche en cystéine et d’un domaine dioxygénase dépendant du 2-oxoglutarate et du fer (II) (2OGFeDO). TET3 contient également un domaine CXXC N-terminal. Cependant, le gène TET2 a subi une inversion génique chromosomique au cours de l’évolution, séparant ainsi son domaine CXXC du domaine catalytique et créant un nouveau gène à domaine CXXC nommé IDAX/CXXC4, qui code pour un régulateur négatif de TET2. D’après les profils EST et les réseaux d’expression, TET1 présente une expression maximale pendant l’embryogenèse et ne présente pas d’expression pertinente dans les tissus adultes. TET2 est principalement exprimé dans les cellules hématopoïétiques et TET3 semble exprimé de manière ubiquitaire dans les tissus humains adultes.
La leucémie est une maladie où, au cours de la différenciation normale des cellules souches hématopoïétiques, l’expansion clonale des cellules précurseurs hématopoïétiques dans la moelle osseuse est affectée à un certain stade de différenciation, provoquant un déséquilibre entre la différenciation et l’auto-renouvellement. L’expansion inappropriée des cellules progénitrices hématopoïétiques est principalement due à un blocage de la maturation cellulaire. Les troubles de l’hématopoïèse liés au syndrome myélodysplasique (SMD) se caractérisent par une cytopénie (faible nombre de cellules sanguines), une hématopoïèse inefficace dans l’une ou l’autre lignée cellulaire et un risque accru de transformation en leucémie myéloïde aiguë (LMA) . Dans la LAM, la croissance rapide de globules blancs anormaux dans la moelle osseuse entraîne un blocage de la production de diverses cellules d’autres lignées cellulaires.
TET2 a été trouvé muté chez les patients atteints de néoplasmes myéloprolifératifs (MPN), de SMD, de LAM et de leucémie myélomonocytaire chronique (LMC), et est le gène le plus fréquemment muté dans les SMD . Les mutations de TET1 ou TET3 ne sont pas observées dans les SMD et la mutation de TET2 n’est pas non plus en corrélation avec plusieurs autres mutations communes connues. Il est intéressant de noter que les mutations de l’isocitrate déshydrogénase 1/2 (IDH1/2) sont rarement associées aux mutations de TET2, mais qu’elles ont des effets similaires à ceux des mutations de TET2 sur les cellules souches hématopoïétiques (CSH). Alors que les mutations de TET2 sont associées à une survie globale réduite dans la LAM par rapport aux patients présentant un TET2 de type sauvage, les mutations de TET2 chez les patients atteints de SMD et de NPP favorisent la progression vers la LAM. Le gène TET2 est composé d’un total de onze exons, se traduisant par un produit protéique de 2002 acides aminés. Les mutations de TET2 dans les cancers myéloïdes ont été le plus souvent observées dans les exons 3a et 10, qui sont les exons les plus longs. Les mutations de TET2 dans le NPP ciblent à la fois les cellules progénitrices multipotentes et engagées dans la lignée hématopoïétique, ce qui implique que TET2 joue un rôle important dans la myélopoïèse. Des délétions de TET2 et une perte d’hétérozygotie ou une disomie uni-parentale ont été observées chez (9 %) des patients atteints de SMD/AML avec TET2 muté, où il est probable que l’allèle de type sauvage soit perdu lors de la recombinaison, permettant à TET2 muté de promouvoir un phénotype de perte de fonction. Kosmider et al. ont observé que 50 % des patients présentant une TET2 mutée avaient des défauts génétiques qui ciblaient les deux copies de TET2. Les mutations de TET2 semblent conduire à une perte de fonction, ce qui suggère qu’il pourrait jouer un rôle de suppression de tumeur.
Comprendre les implications sous-jacentes du TET2 mutant manquant de fonction et son rôle dans les malignités myéloïdes est une priorité de recherche actuelle. Plusieurs laboratoires ont généré des modèles de souris knockout Tet2 conditionnels dans lesquels les exons critiques de Tet2 ont été ciblés. Moran-Crusio et al. ont observé que les souris Tet 2-/- développaient une splénomégalie à l’âge de 20 semaines, présentant des phénotypes similaires à ceux observés chez les patients humains atteints de LMC avec TET2 mutant. Les données des différents modèles de souris ont conduit à des observations similaires. La suppression de Tet2 n’est pas létale sur le plan embryonnaire. Une observation majeure faite par Moran-Crusio et al. et par Ko et al. est que les cellules souches hématopoïétiques provenant de souris Tet2-/- ont une capacité accrue à repeupler le compartiment hématopoïétique in vivo lors d’essais de reconstitution compétitive avec compétition des CSH provenant de cellules Tet2+/+. L’analyse de divers organes de souris Tet2-/- a montré que la perte de Tet2 n’est pas compensée par une augmentation de l’expression de Tet1 ou Tet3 . Les niveaux de 5hmC sont significativement diminués dans la moelle osseuse et la rate des souris Tet2-/-. Les souris Tet2-/- présentent une augmentation des CSH et une légère augmentation des progéniteurs myéloïdes, ce qui oriente l’hématopoïèse vers les cellules de type monocyte/macrophage. Il est suggéré qu’un Tet2 actif régulerait l’hématopoïèse normale pour assurer une distribution correcte des lignées et une différenciation contrôlée des CSH. L’effet des mutations de TET2 sur les niveaux et les profils de 5mC dans le génome est particulièrement intéressant. Cependant, les données actuelles sont loin d’être claires. Alors qu’un rapport indique que la mutation TET2 dans la LAM est associée à un phénotype d’hyperméthylation de l’ADN, d’autres données suggèrent que les échantillons de moelle osseuse des patients présentant des mutations TET2 ont de faibles niveaux de 5hmC et une hypométhylation de l’ADN. La situation est compliquée par le fait que les hémopathies malignes sont souvent caractérisées par des mutations dans plusieurs modificateurs épigénétiques, notamment EZH2, IDH1, IDH2, MLL, DNMT3A et ASXL1, ce qui risque d’obscurcir toute association directe. Par exemple, dans une étude, huit des onze patients présentant des mutations DNMT3A (73%) dans un lymphome à cellules T présentaient également des mutations TET2 .
Mutations dans les voies des cofacteurs
Les oxydases 5mC sont des enzymes dépendantes du 2-oxoglutarate (figure 2). Ce cofacteur est produit dans le cycle de l’acide tricarboxylique à partir de l’isocitrate par l’enzyme IDH. Il est intéressant de noter que plusieurs types de tumeurs humaines contiennent des mutations dans le gène IDH1. Les mutations de l’IDH1 sont particulièrement fréquentes dans les gliomes de grade II et III, où l’on en trouve jusqu’à 70 % des patients. Les mutations d’IDH1 et d’IDH2 sont également observées dans les leucémies myéloïdes et quelques autres tumeurs malignes, mais à une fréquence moindre. Ces mutations de l’IDH1 ne sont pas dispersées dans tout le gène, mais se trouvent presque exclusivement à la position de l’acide aminé 132. Cette découverte suggère que cette protéine mutante IDH1 particulière possède une propriété de gain de fonction. Une découverte surprenante a été que le mutant IDH1 codon 132 arginine à histidine produit l’oncométabolite 2-hydroxyglutarate (2HG) comme produit de réaction au lieu du 2-oxoglutarate. Il semble que la réaction d’oxydation de l’isocitrate effectuée par ce mutant soit incomplète et ne produise que du 2HG. De plus, le 2HG est un inhibiteur compétitif de nombreuses activités enzymatiques dépendant du 2-oxoglutarate, sinon de toutes. Les protéines TET représentent une classe de telles enzymes, et il a été montré que le 2HG est un inhibiteur de TET1 et TET2 .
Un corrélat intéressant de la présence d’une IDH1 mutée dans les tumeurs de gliome est que les tumeurs mutantes IDH1 sont presque toujours associées à des changements abondants de la méthylation de l’ADN à l’échelle du génome, comme indiqué par une hyperméthylation généralisée des îlots CpG . Ce phénotype a été appelé phénotype méthylateur des îlots CpG (ou CIMP). Il est tentant de supposer que le CIMP dans les gliomes mutants IDH1 est lié à un défaut de production de 5hmC dans ces tumeurs car l’activité de TET est compromise par le 2HG. En fait, l’introduction expérimentale d’une construction mutante IDH1 dans des astrocytes humains a conduit à l’émergence d’un phénotype de type CIMP . De plus, chez des souris knock-in conditionnelles dans lesquelles le mutant Idh1 le plus courant R132H a été inséré dans le locus Idh1 endogène et a été exprimé dans des cellules hématopoïétiques, une hyperméthylation de l’ADN a été observée. Cependant, dans une comparaison directe des niveaux de 5hmC dans l’ADN entre les gliomes mutants IDH1 et les gliomes sauvages IDH1, nous n’avons pas observé de différences substantielles entre ces deux catégories de tumeurs cérébrales. Il faut donc garder à l’esprit que l’IDH1 mutant et son produit métabolique 2HG n’affectent pas seulement les enzymes TET mais inhibent également de nombreuses lysines déméthylases qui dépendent du 2-oxoglutarate et d’autres enzymes dépendantes du 2-oxoglutarate. Le dysfonctionnement de ces lysines déméthylases peut avoir un impact secondaire sur les schémas de méthylation de l’ADN au niveau des îlots CpG.