El proceso de reducción del genoma que ha ocurrido dentro de la radiación de Prochlorococcus no se ha observado hasta ahora en ningún otro procariota de vida libre. Dado que Prochlorococcus sp. MIT9313 tiene un tamaño de genoma muy similar al de Synechococcus sp. WH8102 (2,4 megabase-par (Mbp)), así como a otros Synechococcus spp. marinos (M. Ostrowski y D. Scanlan, comunicación personal), es razonable suponer que el ancestro común de todas las especies de Prochlorococcus también tenía un tamaño de genoma alrededor de 2,4 Mbp. Según esta hipótesis, la reducción del genoma que se ha producido en MED4 correspondería a alrededor del 31%. En comparación, el grado de reducción del genoma en el endosimbionte de los insectos Buchnera, en comparación con un genoma ancestral reconstruido, es de alrededor del 77% . El genoma de P. marinus SS120 -y a fortiori el genoma de MED4- se considera casi mínimo para un organismo oxifotrófico de vida libre . Parece que la reducción del genoma en estos organismos probablemente no puede proceder por debajo de un cierto límite, correspondiente a un conjunto de genes que contiene todos los genes esenciales de las vías biosintéticas y de las funciones de mantenimiento de la casa (incluyendo probablemente la mayor parte de los 1.306 genes cuádruples ortólogos identificados en este estudio) más una serie de otros genes, incluyendo genes específicos del género así como del nicho. Por ejemplo, MED4 codifica una serie de proteínas relacionadas con la fotoliasa, unos pocos transportadores ABC específicos (para el cianato, por ejemplo; y datos no mostrados). Estos compuestos específicos podrían ser críticos para la supervivencia en la capa de agua superior, que recibe altos flujos de fotones, luz ultravioleta y está agotada de nutrientes, pero menos para la vida más profunda en la columna de agua.
Si tanto los linajes de Prochlorococcus como los organismos dependientes del huésped han sufrido una reducción del genoma asociada con tasas de sustitución aceleradas, estos fenómenos deben haber surgido de causas muy diferentes ya que los repertorios de genes resultantes de los dos tipos de organismos difieren enormemente. De hecho, la evolución del genoma de los endosimbiontes y de los patógenos obligatorios está impulsada por dos procesos principales que tienen efectos que se refuerzan mutuamente en el tamaño del genoma y en las tasas de evolución. Al estar confinadas en el interior de su hospedador, estas bacterias tienen tamaños de población minúsculos y sufren regularmente un cuello de botella en cada generación del hospedador o en cada nueva infección del mismo. En consecuencia, experimentan una fuerte deriva genética que implica un aumento de la tasa de sustitución. Esta aceleración da lugar a la acumulación al azar de mutaciones ligeramente deletéreas en los genes que codifican las proteínas, así como en los genes del ARNr. Esta deriva genética favorece la reducción del tamaño del genoma mediante la inactivación y posterior eliminación de genes potencialmente beneficiosos pero prescindibles. Entre ellos, ha habido una serie de genes reparadores del ADN, cuya desaparición podría haber aumentado aún más la tasa de mutación . Además, una serie de genes puede estar sometida a una relajación de la selección purificadora que, por lo tanto, se vuelve menos eficaz para mantener la función del gen. Esta relajación afecta especialmente a los genes que se han vuelto inútiles por ser redundantes en su genoma huésped, como los genes implicados en la biosíntesis de aminoácidos, nucleótidos, ácidos grasos e incluso ATP . La presión de selección también se reduce para los genes implicados en los sistemas de detección y regulación del medio ambiente, como los sistemas de dos componentes, debido al entorno mucho más amortiguado que ofrece el huésped .
En el género de vida libre Prochlorococcus, el gran tamaño de las poblaciones de campo significa que estas poblaciones están sujetas a una deriva genética mucho menor y sus genomas están sujetos a una selección purificadora mucho más fuerte que los de los endosimbiontes y patógenos . En consecuencia, el ritmo acelerado de evolución observado probablemente se deba únicamente al aumento de la tasa de mutación, que a su vez se debe probablemente a la pérdida de genes reparadores del ADN, aunque hay que señalar que en P. marinus SS120 sólo faltan dos de estos genes (Tabla 3). Observamos una aceleración similar de las sustituciones de aminoácidos para todas las categorías funcionales (Figura 4). Este hallazgo es más consistente con un aumento global de la tasa de mutación que con una selección relajada, ya que es poco probable que esta última ocurra en la misma medida en todos los loci. También asumimos que la mayoría de las sustituciones de aminoácidos que se han producido en las proteínas de Prochlorococcus son neutrales; es decir, no han alterado la función de la proteína. De hecho, las poblaciones del clado HL que, como MED4, tienen las secuencias proteicas más derivadas de todas las especies de Prochlorococcus, parecen ser los organismos fotosintéticos más abundantes en la capa superior de los océanos templados e intertropicales . Tal éxito ecológico difícilmente sería posible para organismos perjudicados por un gran número de mutaciones ligeramente deletéreas, sobre todo teniendo en cuenta que la mayoría de los genes son de una sola copia, por lo que la compensación de la función génica no suele ser posible. El efecto del mantenimiento de un alto nivel de selección purificadora para contrarrestar las sustituciones deletéreas es particularmente obvio en los genes del ARNr. A diferencia de los genes codificadores de proteínas, las pruebas de tasa relativa no mostraron diferencias significativas en las tasas de evolución de los genes 16S rRNA en los cuatro genomas de picocyanobacterias marinas, y por lo tanto no hay evidencia de que ni SS120 ni MED4 pudieran haber acumulado mutaciones que desestabilizaran la estructura secundaria de su molécula 16S rRNA. Una consecuencia notable de la aceleración de las tasas de evolución de los genes codificadores de proteínas en Prochlorococcus es que las reconstrucciones filogenéticas basadas en las secuencias de proteínas están sesgadas. De hecho, esto conduce a ramas mucho más largas para estas dos cepas que para MIT9313. La topología del árbol resultante no suele apoyar la obtenida con el gen 16S rRNA, para el que la hipótesis del reloj molecular se mantiene según nuestros análisis. Así, es probable que los genes de ARNr estén entre los pocos genes que den estimaciones fiables de las distancias filogenéticas entre las cepas de Prochlorococcus.
Si no es ni la relajación de la selección purificadora ni un aumento de la deriva genética lo que ha sido el principal factor causante de la reducción del genoma de Prochlorococcus, una posibilidad alternativa es que esto último sea el resultado de un proceso selectivo que favorezca la adaptación de Prochlorococcus a su entorno. El aparentemente mejor éxito ecológico en zonas oligotróficas de las especies de Prochlorococcus en comparación con su pariente cercano Synechococcus , sugiere fuertemente que la reducción del tamaño del genoma de Prochlorococcus podría proporcionar una ventaja competitiva al primero. De hecho, las extensas comparaciones de los complementos génicos de estos dos organismos muestran muy pocos ejemplos -al menos entre los genes cuya función se conoce- de la aparición de genes específicos en MED4 que podrían explicar su mejor adaptación (datos no mostrados). Una excepción digna de mención es la presencia en Prochlorococcus, pero no en Synechococcus, de flavodoxina y ferritina, dos proteínas que posiblemente confieren a Prochlorococcus una mayor resistencia al estrés por hierro. Aparte de eso, Synechococcus parece más bien un generalista, en particular en lo que se refiere a la captación y asimilación de nitrógeno o fósforo , y a priori debería ser más apto para mantener la competencia. Por lo tanto, suponemos que la clave del éxito de Prochlorococcus reside menos en el desarrollo de un complejo o de una vía específica para hacer frente mejor a las condiciones desfavorables que en la simplificación de su genoma y de su organización celular, que puede permitir a este organismo realizar economías sustanciales de energía y de material para el mantenimiento de la célula.
La mera reducción del tamaño del genoma per se es una fuente potencial de economías sustanciales para la célula, ya que reduce la cantidad de nitrógeno y fósforo, dos elementos especialmente limitantes en la parte superior del océano, que son necesarios, por ejemplo, en la síntesis del ADN. Otra ventaja es que permite una reducción concomitante del volumen celular. Se ha sugerido anteriormente (véase, por ejemplo) que, para un organismo fitoplanctónico, un volumen celular pequeño confiere dos ventajas selectivas al reducir el autosombreado (el efecto paquete) y al aumentar la relación superficie/volumen celular, lo que puede mejorar la captación de nutrientes. La primera ventaja mejoraría la aptitud de las cepas LL, mientras que la segunda ofrecería una ventaja a las cepas HL que viven en aguas superficiales con escasez de nutrientes. Por último, la división celular es menos costosa para una célula pequeña que para una grande. Sobre la base de estas observaciones, suponemos que la principal fuerza impulsora de la reducción del genoma dentro de la radiación de Prochlorococcus ha sido la selección de un estilo de vida más económico. El sesgo hacia un genoma rico en A+T en MED4 y SS120 también es consistente con esta hipótesis, ya que puede verse como una forma de economizar el nitrógeno. En efecto, un par de bases AT contiene siete átomos de nitrógeno, uno menos que un par de bases GC.
Con esta hipótesis en mente, proponemos un posible escenario para la evolución de los genomas de Prochlorococcus. Usando una tasa de divergencia de 16S rRNA de 1% por 50 millones de años , uno puede estimar que la diferenciación de estos dos géneros es tan reciente como 150 millones de años, como la hipótesis de reloj molecular sostiene para este gen en Prochlorococcus y Synechococcus. Las células ancestrales de Prochlorococcus debieron desarrollarse en el nicho LL, un nicho probablemente dejado libre por otras picocyanobacterias. Dada la considerable diferencia en el tamaño del genoma entre las cepas LL MIT9313 y SS120, parece que la reducción del genoma en sí debe haber comenzado en uno (o posiblemente varios) linaje(s) dentro del nicho LL algún tiempo después de la diferenciación de Prochlorococcus de su ancestro común con las especies marinas de Synechococcus. No está claro por qué la selección ha afectado sólo a uno (¿o a algunos?) y no a todos los linajes de Prochlorococcus. El examen del repertorio de genes de P. marinus SS120 sugiere que esta reducción del genoma debe haber tenido que ver con la pérdida aleatoria de genes prescindibles de muchas vías diferentes. En algún momento de la evolución, algunos genes implicados en la reparación del ADN se han visto afectados; entre ellos estaría el gen ada, que puede ser responsable del cambio en la composición de las bases, pero también posiblemente varios otros, no necesariamente implicados en la reparación de mutaciones de GC a AT (véase la Tabla 3). La pérdida de estos genes puede haber provocado un aumento de la tasa de mutación y, por tanto, de la tasa de evolución de los genes codificadores de proteínas, acompañada de una contracción más rápida del genoma y un cambio de la composición de bases hacia AT. Cabe destacar que una consecuencia probable de este cambio de composición en todo el genoma es la ausencia del sesgo adaptativo de los codones en los genomas de las especies de Prochlorococcus MED4 y SS120. Los codones ricos en AT se utilizan preferentemente sea cual sea el aminoácido (Figura 3a). Así, el uso de codones en estos genomas parece reflejar más el sesgo local de composición de bases que la selección para una traducción más eficiente mediante el uso de codones óptimos. La misma conclusión se ha sacado para otros genomas pequeños con alto contenido de A+T.
Más tarde durante la evolución (hace unos 80 millones de años, según el grado de divergencia de la secuencia del ARNr 16S entre MED4 y SS120) una población de LL que probablemente ya tenía un tamaño celular y de genoma significativamente reducido debió adaptarse progresivamente al nicho de HL y finalmente recolonizó la capa superior. Todavía es difícil definir cómo fue posible este cambio de nicho ecológico. La comparación del conjunto de genes que difiere entre el SS120 adaptado a la LL y el MED4 adaptado a la HL muestra que muy pocos genes podrían ser suficientes para cambiar de uno a otro nicho, incluyendo una multiplicación de genes hli y la retención diferencial de genes que estaban presentes en el ancestro común de Prochlorococcus y Synechococcus, (como las fotoliasas y los transportadores de cianato mencionados anteriormente) y que se perdieron secundariamente en los linajes adaptados a la LL.