Le processus de réduction du génome qui s’est produit au sein de la radiation de Prochlorococcus n’a à notre connaissance jamais été observé jusqu’à présent chez aucun autre procaryote vivant librement. Puisque Prochlorococcus sp. MIT9313 a une taille de génome très similaire à celle de Synechococcus sp. WH8102 (2,4 mégabase-paire (Mbp)), ainsi que plusieurs autres Synechococcus spp. marins (M. Ostrowski et D. Scanlan, communication personnelle), il est raisonnable de supposer que l’ancêtre commun de toutes les espèces de Prochlorococcus avait également une taille de génome autour de 2,4 Mbp. Dans cette hypothèse, la réduction du génome qui s’est produite dans MED4 correspondrait à environ 31%. Par comparaison, l’ampleur de la réduction du génome chez l’endosymbiont Buchnera, un insecte, par rapport à un génome ancestral reconstitué, est d’environ 77% . Le génome de P. marinus SS120 – et a fortiori le génome de MED4 – est considéré comme presque minimal pour un organisme oxyphotrophique vivant librement. Il semblerait que la réduction du génome de ces organismes ne puisse probablement pas se faire en dessous d’une certaine limite, correspondant à un pool de gènes contenant tous les gènes essentiels des voies de biosynthèse et des fonctions ménagères (incluant probablement la plupart des 1 306 gènes orthologues quadripartites identifiés dans cette étude) plus un certain nombre d’autres gènes, y compris des gènes spécifiques du genre et de la niche. Par exemple, MED4 code pour un certain nombre de protéines liées à la photolyase, quelques transporteurs ABC spécifiques (pour le cyanate, par exemple ; et données non présentées). Ces composés spécifiques pourraient être critiques pour la survie dans la couche d’eau supérieure, qui reçoit des flux de photons élevés, de la lumière UV et qui est appauvrie en nutriments, mais moins pour la vie plus profonde dans la colonne d’eau.
Si les lignées de Prochlorococcus et les organismes dépendant de l’hôte ont tous deux subi une réduction du génome associée à des taux de substitution accélérés, ces phénomènes doivent être issus de causes très différentes car les répertoires de gènes résultants des deux types d’organismes diffèrent énormément. En effet, l’évolution du génome des endosymbiontes et des pathogènes obligatoires est déterminée par deux processus principaux qui ont des effets mutuellement renforcés sur la taille du génome et les taux d’évolution. Étant confinées à l’intérieur de leur hôte, ces bactéries ont des populations de taille minuscule et subissent régulièrement un goulot d’étranglement à chaque génération d’hôte ou à chaque nouvelle infection de l’hôte. Par conséquent, elles subissent une forte dérive génétique impliquant une augmentation du taux de substitution. Cette accélération se traduit par l’accumulation au hasard de mutations légèrement délétères dans les gènes codant pour les protéines ainsi que dans les gènes de l’ARNr . Cette dérive génétique favorise la réduction de la taille du génome par l’inactivation puis l’élimination de gènes potentiellement bénéfiques mais inutiles. Parmi ceux-ci, il y a eu un certain nombre de gènes de réparation de l’ADN, dont la disparition aurait pu augmenter encore le taux de mutation . Par ailleurs, un certain nombre de gènes peuvent être soumis à un relâchement de la sélection purificatrice qui est donc rendue moins efficace pour maintenir la fonction du gène. Ce relâchement touche particulièrement les gènes devenus inutiles car redondants dans leur génome hôte, comme les gènes impliqués dans la biosynthèse des acides aminés, des nucléotides, des acides gras et même de l’ATP . La pression de sélection est également réduite pour les gènes impliqués dans les systèmes de détection et de régulation de l’environnement, tels que les systèmes à deux composants, en raison de l’environnement beaucoup plus tamponné offert par l’hôte .
Dans le genre Prochlorococcus vivant librement, la très grande taille des populations de terrain signifie que ces populations sont soumises à une dérive génétique beaucoup plus faible et que leurs génomes sont soumis à une sélection purificatrice beaucoup plus forte que ceux des endosymbiontes et des pathogènes . Par conséquent, l’accélération de l’évolution observée résulte probablement simplement de l’augmentation du taux de mutation, qui à son tour est probablement due à la perte de gènes de réparation de l’ADN, même si l’on doit noter que, chez P. marinus SS120, seuls deux de ces gènes sont manquants (Tableau 3). Nous avons observé une accélération similaire des substitutions d’acides aminés pour toutes les catégories fonctionnelles (Figure 4). Cette constatation est plus cohérente avec une augmentation globale du taux de mutation qu’avec une sélection relâchée, cette dernière étant peu susceptible de se produire dans la même mesure à tous les loci. Nous supposons également que la plupart des substitutions d’acides aminés qui se sont produites dans les protéines de Prochlorococcus sont neutres, c’est-à-dire qu’elles n’ont pas modifié la fonction des protéines. En effet, les populations du clade HL qui, comme MED4, ont les séquences protéiques les plus dérivées de toutes les espèces de Prochlorococcus, semblent être les organismes photosynthétiques les plus abondants dans la couche supérieure des océans tempérés et intertropicaux . Un tel succès écologique serait difficilement envisageable pour des organismes handicapés par un grand nombre de mutations légèrement délétères, d’autant plus que la plupart des gènes sont à copie unique, et que la compensation de la fonction des gènes n’est donc généralement pas possible. L’effet du maintien d’un niveau élevé de sélection purificatrice sur la neutralisation des substitutions délétères est particulièrement évident dans les gènes de l’ARNr. Contrairement aux gènes codant pour les protéines, les tests de taux relatifs n’ont pas montré de différences significatives dans les taux d’évolution des gènes de l’ARNr 16S dans les quatre génomes de picocyanobactéries marines, et il n’y a donc aucune preuve que SS120 ou MED4 aient pu accumuler des mutations déstabilisant la structure secondaire de leur molécule d’ARNr 16S. Une conséquence notable de l’accélération des taux d’évolution des gènes codant pour les protéines chez Prochlorococcus est que les reconstructions phylogénétiques basées sur les séquences protéiques sont biaisées. En effet, cela conduit à des branches beaucoup plus longues pour ces deux souches que pour MIT9313. Le plus souvent, la topologie de l’arbre qui en résulte ne soutient pas celle obtenue avec le gène de l’ARNr 16S, pour lequel l’hypothèse de l’horloge moléculaire se vérifie selon nos analyses. Ainsi, les gènes de l’ARNr sont probablement parmi les rares gènes qui donneront des estimations fiables des distances phylogénétiques entre les souches de Prochlorococcus.
Si ce n’est ni le relâchement de la sélection purificatrice ni l’augmentation de la dérive génétique qui ont été le principal facteur à l’origine de la réduction du génome de Prochlorococcus, une autre possibilité est que cette dernière pourrait être le résultat d’un processus sélectif favorisant l’adaptation de Prochlorococcus à son environnement. Le succès écologique apparemment meilleur dans les zones oligotrophes des espèces de Prochlorococcus par rapport à leur proche parent Synechococcus, suggère fortement que la réduction de la taille du génome de Prochlorococcus pourrait fournir un avantage compétitif aux premières. En effet, des comparaisons approfondies des compléments génétiques de ces deux organismes montrent très peu d’exemples – du moins parmi les gènes dont la fonction est connue – de l’occurrence de gènes spécifiques dans MED4 qui pourraient expliquer sa meilleure adaptation (données non montrées). Une exception notable est la présence chez Prochlorococcus, mais pas chez Synechococcus, de flavodoxine et de ferritine, deux protéines qui pourraient conférer à Prochlorococcus une meilleure résistance au stress ferrique. En dehors de cela, Synechococcus apparaît plus comme un généraliste, notamment en ce qui concerne l’absorption et l’assimilation de l’azote ou du phosphore, et devrait a priori être plus apte à soutenir la compétition. Dès lors, nous supposons que la clé du succès de Prochlorococcus réside moins dans le développement d’un complexe ou d’une voie spécifique pour mieux faire face à des conditions défavorables que dans la simplification de son génome et de son organisation cellulaire, qui peut permettre à cet organisme de réaliser des économies substantielles d’énergie et de matière pour la maintenance cellulaire.
La simple réduction de la taille du génome en soi est une source potentielle d’économies substantielles pour la cellule, car elle réduit la quantité d’azote et de phosphore, deux éléments particulièrement limitants dans la partie supérieure de l’océan, qui sont nécessaires, par exemple, à la synthèse de l’ADN. Un autre avantage est qu’elle permet une réduction concomitante du volume de la cellule. Il a été suggéré précédemment (voir par exemple ) que, pour un organisme phytoplanctonique, un petit volume cellulaire confère deux avantages sélectifs en réduisant l’auto-ombrage (effet paquet) et en augmentant le rapport surface/volume cellulaire, ce qui peut améliorer l’absorption des nutriments. Le premier avantage améliorerait l’aptitude des souches LL, tandis que le second offrirait un avantage aux souches HL vivant dans des eaux de surface appauvries en nutriments. Enfin, la division cellulaire est moins coûteuse pour une petite cellule que pour une grande. Sur la base de ces observations, nous supposons que la principale force motrice pour la réduction du génome au sein de la radiation Prochlorococcus a été la sélection pour un mode de vie plus économique. Le biais vers un génome riche en A+T chez MED4 et SS120 est également cohérent avec cette hypothèse, car il peut être considéré comme un moyen d’économiser l’azote. En effet, une paire de bases AT contient sept atomes d’azote, un de moins qu’une paire de bases GC.
Avec cette hypothèse en tête, nous proposons un scénario possible pour l’évolution des génomes de Prochlorococcus. En utilisant un taux de divergence de l’ARNr 16S de 1% par 50 millions d’années , on peut estimer que la différenciation de ces deux genres est aussi récente que 150 millions d’années, car l’hypothèse de l’horloge moléculaire tient pour ce gène chez Prochlorococcus et Synechococcus. Les cellules ancestrales de Prochlorococcus ont dû se développer dans la niche LL, une niche probablement laissée libre par les autres picocyanobactéries. Etant donné la différence considérable de taille du génome entre les souches LL MIT9313 et SS120, il semble que la réduction du génome elle-même ait dû commencer dans une (ou peut-être plusieurs) lignée(s) au sein de la niche LL quelque temps après la différenciation de Prochlorococcus de son ancêtre commun avec les espèces marines Synechococcus. La raison pour laquelle la sélection n’a affecté qu’une (ou quelques ?) lignée(s) de Prochlorococcus et non toutes les autres reste incertaine. L’examen du répertoire de gènes de P. marinus SS120 suggère que cette réduction du génome a dû concerner la perte aléatoire de gènes inutiles provenant de nombreuses voies différentes. À un moment donné au cours de l’évolution, certains gènes impliqués dans la réparation de l’ADN ont été affectés ; il s’agirait notamment du gène ada, qui pourrait être responsable du changement de la composition des bases, mais aussi éventuellement de plusieurs autres, qui ne sont pas nécessairement impliqués dans la réparation des mutations GC vers AT (voir tableau 3). La perte de ces gènes peut avoir entraîné une augmentation du taux de mutation et donc du taux d’évolution des gènes codant pour des protéines, accompagnée d’un rétrécissement plus rapide du génome et d’un déplacement de la composition des bases vers l’AT. Il est intéressant de noter que l’une des conséquences probables de ce changement de composition à l’échelle du génome est l’absence du biais adaptatif des codons dans les génomes des espèces MED4 et SS120 de Prochlorococcus. Les codons riches en AT sont préférentiellement utilisés quel que soit l’acide aminé (Figure 3a). Ainsi, l’utilisation des codons dans ces génomes semble refléter davantage le biais local de composition des bases que la sélection d’une traduction plus efficace par l’utilisation de codons optimaux. La même conclusion a été tirée pour d’autres petits génomes à haute teneur en A+T.
Plus tard au cours de l’évolution (il y a environ 80 millions d’années, selon le degré de divergence des séquences d’ARNr 16S entre MED4 et SS120), une population de LL, qui avait probablement déjà une taille de cellule et de génome considérablement réduite, a dû s’adapter progressivement à la niche HL et finalement recoloniser la couche supérieure. Il est encore difficile de définir comment ce changement de niche écologique a été possible. La comparaison du jeu de gènes qui diffère entre la SS120 adaptée au LL et la MED4 adaptée au HL montre que très peu de gènes pourraient être suffisants pour passer d’une niche à l’autre, y compris une multiplication des gènes hli et la rétention différentielle de gènes qui étaient présents dans l’ancêtre commun de Prochlorococcus et Synechococcus, (comme les photolyases et les transporteurs de cyanate mentionnés ci-dessus) et qui ont été perdus secondairement dans les lignées adaptées au LL.