O processo de redução do genoma que ocorreu dentro da radiação de Prochlorococcus nunca foi observado até agora em nenhum outro procariote de vida livre. Como Prochlorococcus sp. MIT9313 tem um tamanho de genoma muito similar ao de Synechococcus sp. WH8102 (2.4 megabase-par (Mbp)), assim como vários outros Synechococcus spp. marinhos (M. Ostrowski e D. Scanlan, comunicação pessoal), é razoável supor que o ancestral comum de todas as espécies de Prochlorococcus também tinha um tamanho de genoma em torno de 2.4 Mbp. Sob esta hipótese, a redução do genoma que ocorreu em MED4 corresponderia a cerca de 31%. Em comparação, a extensão da redução do genoma no endosímbulo do inseto Buchnera, em comparação com um genoma ancestral reconstruído, é de cerca de 77%. O genoma de P. marinus SS120 – e a fortiori o genoma MED4 – é considerado próximo do mínimo para um organismo oxifototrófico de vida livre. Parece que a redução do genoma nestes organismos provavelmente não pode proceder abaixo de um certo limite, correspondendo a um pool genético contendo todos os genes essenciais de vias biossintéticas e funções domésticas (provavelmente incluindo a maioria dos 1.306 genes ortológicos de quatro vias identificados neste estudo) mais um número de outros genes, incluindo genes específicos do gênero, bem como genes específicos de nicho. Por exemplo, o MED4 codifica um número de proteínas relacionadas à fotolise, alguns transportadores de ABC específicos (para cianato, por exemplo; e dados não mostrados). Esses compostos específicos podem ser críticos para a sobrevivência na camada superior da água, que recebe alto fluxo de fótons, luz UV e está esgotada em nutrientes, mas menos para a vida mais profunda na coluna d’água.
Se tanto as linhagens de Prochlorococcus quanto os organismos dependentes do hospedeiro sofreram redução do genoma associada a taxas de substituição aceleradas, esses fenômenos devem ter surgido de causas muito diferentes, já que os repertórios gênicos resultantes dos dois tipos de organismos diferem tremendamente. De fato, a evolução genômica dos endossimbiontes e patógenos obrigatórios é impulsionada por dois processos principais que têm efeitos de reforço mútuo no tamanho do genoma e nas taxas evolutivas. Estando confinadas dentro do seu hospedeiro, estas bactérias têm populações minúsculas e são regularmente engarrafadas em cada geração de hospedeiro ou em cada nova infecção do hospedeiro. Consequentemente, elas experimentam uma forte deriva genética envolvendo um aumento na taxa de substituição. Esta aceleração resulta na acumulação aleatória de mutações ligeiramente deletérias em genes codificadores de proteínas, bem como em genes rRNA. Esta deriva genética aumenta a redução do tamanho do genoma através da inactivação e depois a eliminação de genes potencialmente benéficos mas dispensáveis. Entre estes, houve um número de genes reparadores de DNA, cujo desaparecimento poderia ter aumentado ainda mais a taxa de mutação . Além disso, um número de genes pode estar sujeito a um relaxamento da seleção purificadora que, portanto, se torna menos eficaz na manutenção da função do gene. Esse relaxamento afeta particularmente os genes que se tornaram inúteis por serem redundantes no genoma hospedeiro, tais como genes envolvidos na biossíntese de aminoácidos, nucleotídeos, ácidos graxos e até mesmo ATP . A pressão de selecção também é reduzida para genes envolvidos em sistemas de detecção e regulação ambiental, tais como sistemas de dois componentes, devido ao ambiente muito tamponado oferecido pelo hospedeiro .
No género Prochlorococcus de vida livre, o tamanho muito grande das populações de campo significa que estas populações estão sujeitas a uma deriva genética muito menor e os seus genomas estão sujeitos a uma selecção de purificação muito mais forte do que os dos endossimbiontes e patogéneos . Consequentemente, a taxa acelerada de evolução observada provavelmente resulta apenas do aumento da taxa de mutação, que por sua vez é provavelmente devido à perda de genes reparadores de DNA, mesmo que se deva notar que, em P. marinus SS120 faltam apenas dois desses genes (Tabela 3). Observamos uma aceleração semelhante das substituições amino-ácidas para todas as categorias funcionais (Figura 4). Este achado é mais consistente com um aumento global na taxa de mutação do que com uma seleção relaxada, sendo improvável que esta última ocorra na mesma medida em todos os loci. Também assumimos que a maioria das substituições amino-ácidas que ocorreram nas proteínas de Prochlorococcus são neutras, ou seja, não alteraram a função protéica. De facto, as populações do clade HL que, tal como a MED4, têm as sequências proteicas mais derivadas de todas as espécies de Prochlorococcus, parecem ser os organismos fotossintéticos mais abundantes na camada superior dos oceanos temperados e inter-tropicais. Tal sucesso ecológico dificilmente seria possível para organismos prejudicados por um grande número de mutações ligeiramente deletérias, especialmente dado o fato de que a maioria dos genes são cópias únicas, e assim a compensação da função gênica geralmente não é possível. O efeito da manutenção de um alto nível de seleção purificadora na contraposição de substituições deletérias é particularmente óbvio nos genes rRNA. Ao contrário dos genes codificadores de proteínas, os testes de taxa relativa não mostraram diferenças significativas nas taxas de evolução dos genes 16S rRNA nos quatro genomas picocyanobacterianos marinhos, e assim não há evidência de que tanto o SS120 quanto o MED4 possam ter acumulado mutações desestabilizando a estrutura secundária de sua molécula 16S rRNA. Uma consequência notável da aceleração nas taxas de evolução dos genes codificadores de proteína em Prochlorococcus é que as reconstruções filogenéticas baseadas em seqüências proteicas são tendenciosas. De facto, isto leva a ramificações muito mais longas para estas duas estirpes do que para o MIT9313. A topologia arbórea resultante na maioria das vezes não suporta a obtida com o gene 16S rRNA, para o qual a hipótese do relógio molecular se mantém de acordo com nossas análises. Assim, os genes rRNA estão provavelmente entre os poucos genes que darão estimativas confiáveis das distâncias filogenéticas entre as linhagens de Prochlorococcus.
Se não é o relaxamento da seleção purificadora nem o aumento da deriva genética que tem sido o principal fator causador da redução do genoma de Prochlorococcus, uma possibilidade alternativa é que esta última possa ser o resultado de um processo seletivo que favoreça a adaptação do Prochlorococcus ao seu ambiente. O aparentemente melhor sucesso ecológico em áreas oligotróficas das espécies de Prochlorococcus em comparação com os seus parentes próximos Synechococcus , sugere fortemente que a redução do tamanho do genoma de Prochlorococcus poderia proporcionar uma vantagem competitiva para os primeiros. De facto, comparações extensivas dos complementos genéticos destes dois organismos mostram muito poucos exemplos – pelo menos entre genes cuja função é conhecida – da ocorrência de genes específicos em MED4 que poderiam explicar a sua melhor adaptação (dados não mostrados). Uma exceção notável é a presença em Prochlorococcus, mas não em Synechococcus, de flavodoxina e ferritina, duas proteínas que possivelmente dão a Prochlorococcus uma melhor resistência ao estresse do ferro. Além disso, Synechococcus parece mais um generalista, em particular no que diz respeito à absorção e assimilação de nitrogênio ou fósforo, e deve, a priori, ser mais adequado para sustentar a competição. Assim, assumimos que a chave do sucesso do Prochlorococcus reside menos no desenvolvimento de um complexo ou caminho específico para lidar melhor com condições desfavoráveis do que na simplificação do seu genoma e organização celular, o que pode permitir a este organismo fazer economias substanciais em energia e material para a manutenção celular.
A mera redução do tamanho do genoma em si é uma fonte potencial de economias substanciais para a célula, pois reduz a quantidade de nitrogênio e fósforo, dois elementos particularmente limitantes na parte superior do oceano, que são necessários, por exemplo, na síntese de DNA. Outra vantagem é que ela permite uma redução concomitante do volume celular. Foi previamente sugerido (ver, por exemplo ) que, para um organismo fitoplanctónico, um pequeno volume celular confere duas vantagens selectivas ao reduzir o auto-sombreamento (o efeito pacote) e ao aumentar a relação superfície/volume celular, o que pode melhorar a absorção de nutrientes. A primeira vantagem melhoraria a aptidão das estirpes LL, enquanto a segunda ofereceria uma vantagem para as estirpes HL que vivem em águas superficiais com falta de nutrientes. Finalmente, a divisão celular é menos cara para uma célula pequena do que para uma célula grande. Com base nestas observações, assumimos que a maior força motriz para a redução do genoma dentro da radiação de Prochlorococcus tem sido a seleção para um estilo de vida mais econômico. O viés para um genoma rico em A+T em MED4 e SS120 também é consistente com esta hipótese, pois pode ser visto como uma forma de economizar em nitrogênio. De fato, um par básico AT contém sete átomos de nitrogênio, um a menos do que um par básico GC.
Com esta hipótese em mente, propomos um cenário possível para a evolução dos genomas de Prochlorococcus. Usando uma taxa de 16S rRNA divergência de 1% por 50 milhões de anos , pode-se estimar que a diferenciação destes dois gêneros é tão recente quanto 150 milhões de anos, como a hipótese do relógio molecular para este gene em Prochlorococcus e Synechococcus. As células ancestrais de Prochlorococcus devem ter se desenvolvido no nicho LL, um nicho provavelmente deixado livre por outras picocianobactérias. Dada a considerável diferença no tamanho do genoma entre as linhagens LL MIT9313 e SS120, parece que a própria redução do genoma deve ter começado em uma (ou possivelmente várias) linhagem(ões) dentro do nicho LL algum tempo após a diferenciação de Prochlorococcus de seu ancestral comum com espécies marinhas Synechococcus. Porque é que a selecção afectou apenas uma (ou algumas?) e nem todas as linhagens de Prochlorococcus permanecem pouco claras. O exame do repertório genético de P. marinus SS120 sugere que esta redução do genoma deve ter se preocupado com a perda aleatória de genes dispensáveis de muitos caminhos diferentes. Em algum momento durante a evolução, alguns genes envolvidos no reparo do DNA foram afetados; estes incluiriam o gene ada, que pode ser responsável pela mudança na composição da base, mas também possivelmente vários outros, não necessariamente envolvidos no reparo da mutação GC para AT (ver Tabela 3). A perda destes genes pode ter levado a um aumento na taxa de mutação e, portanto, na taxa de evolução dos genes codificadores de proteínas, acompanhada por uma contração mais rápida do genoma e um deslocamento da composição da base em direção à TA. Vale notar que uma consequência provável desta mudança de composição em todo o genoma é a ausência do viés adaptativo do códão nos genomas das espécies MED4 e SS120 de Prochlorococcus. Os códões ricos em AT são preferencialmente utilizados qualquer que seja o aminoácido (Figura 3a). Assim, o uso do códão nestes genomas parece refletir mais o viés de composição básica local do que a seleção para uma tradução mais eficiente através do uso de códões ideais. A mesma conclusão foi tirada para outros pequenos genomas com alto conteúdo de A+T .
Later durante a evolução (cerca de 80 milhões de anos atrás, de acordo com o grau de divergência de sequência 16S rRNA entre MED4 e SS120) uma população LL que provavelmente já tinha uma célula significativamente reduzida e o tamanho do genoma deve ter-se adaptado progressivamente ao nicho HL e eventualmente recolonizado a camada superior. Como esta mudança no nicho ecológico foi possível ainda é difícil de definir. A comparação do conjunto de genes que difere entre o SS120 adaptado à LL e o MED4 adaptado à HL mostra que muito poucos genes podem ser suficientes para mudar de um para outro nicho, incluindo a multiplicação dos genes hli e a retenção diferencial de genes que estavam presentes no ancestral comum de Prochlorococcus e Synechococcus, (como as fotolises e os transportadores de cianato mencionados acima) e foram perdidos secundariamente nas linhagens adaptadas à LL.