Il processo di riduzione del genoma che si è verificato nella radiazione Prochlorococcus non è mai stato osservato finora in nessun altro procariote vivente libero. Poiché Prochlorococcus sp. MIT9313 ha una dimensione del genoma molto simile a quella di Synechococcus sp. WH8102 (2,4 megabase-pair (Mbp)), così come diversi altri Synechococcus spp. marini (M. Ostrowski e D. Scanlan, comunicazione personale), è ragionevole assumere che l’antenato comune di tutte le specie di Prochlorococcus avesse anch’esso una dimensione del genoma intorno ai 2,4 Mbp. Secondo questa ipotesi, la riduzione del genoma che si è verificata in MED4 corrisponderebbe a circa il 31%. In confronto, l’entità della riduzione del genoma nell’endosimbionte insetto Buchnera, rispetto a un genoma ancestrale ricostruito, è di circa il 77%. Il genoma di P. marinus SS120 – e a maggior ragione il genoma MED4 – è considerato quasi minimo per un organismo ossi-fototrofico a vita libera. Sembrerebbe che la riduzione del genoma in questi organismi probabilmente non può procedere al di sotto di un certo limite, corrispondente a un pool di geni contenente tutti i geni essenziali dei percorsi biosintetici e le funzioni di mantenimento (probabilmente includendo la maggior parte dei 1.306 geni ortogonali a quattro vie identificati in questo studio) più un certo numero di altri geni, compresi i geni specifici del genere e della nicchia. Per esempio, MED4 codifica una serie di proteine legate alla fotolisi, alcuni trasportatori ABC specifici (per il cianato, per esempio; e dati non mostrati). Questi composti specifici potrebbero essere critici per la sopravvivenza nello strato superiore dell’acqua, che riceve alti flussi di fotoni, luce UV ed è povero di nutrienti, ma meno per la vita più profonda nella colonna d’acqua.
Se sia i lignaggi di proclorococco che gli organismi dipendenti dall’ospite hanno subito una riduzione del genoma associata a tassi di sostituzione accelerati, questi fenomeni devono essere sorti da cause molto diverse, poiché i repertori genici risultanti dei due tipi di organismi differiscono enormemente. In effetti, l’evoluzione del genoma degli endosimbionti e degli agenti patogeni obbligatori è guidata da due processi principali che hanno effetti di rinforzo reciproco sulla dimensione del genoma e sui tassi di evoluzione. Essendo confinati all’interno del loro ospite, questi batteri hanno piccole dimensioni di popolazione e sono regolarmente sottoposti a un collo di bottiglia ad ogni generazione dell’ospite o ad ogni nuova infezione dell’ospite. Di conseguenza, sperimentano una forte deriva genetica che comporta un aumento del tasso di sostituzione. Questa accelerazione si traduce nell’accumulo casuale di mutazioni leggermente deleterie nei geni codificanti le proteine e nei geni rRNA. Questa deriva genetica aumenta il ridimensionamento del genoma attraverso l’inattivazione e poi l’eliminazione di geni potenzialmente benefici ma dispensabili. Tra questi, ci sono stati un certo numero di geni di riparazione del DNA, la cui scomparsa potrebbe aver ulteriormente aumentato il tasso di mutazione. Inoltre, un certo numero di geni può essere soggetto ad un rilassamento della selezione purificatrice che è quindi resa meno efficace nel mantenere la funzione genica. Questo rilassamento colpisce in particolare i geni che sono diventati inutili perché ridondanti nel loro genoma ospite, come i geni coinvolti nella biosintesi di aminoacidi, nucleotidi, acidi grassi e anche ATP . La pressione di selezione è anche ridotta per i geni coinvolti nei sistemi di rilevamento e regolazione ambientale, come i sistemi a due componenti, a causa dell’ambiente molto tamponato offerto dall’ospite.
Nel genere Prochlorococcus a vita libera, la dimensione molto grande delle popolazioni di campo significa che queste popolazioni sono soggette a una deriva genetica molto più bassa e i loro genomi sono soggetti a una selezione purificante molto più forte di quelli degli endosimbionti e dei patogeni. Di conseguenza, il tasso di evoluzione accelerato osservato deriva probabilmente solo dall’aumento del tasso di mutazione, che a sua volta è probabilmente dovuto alla perdita di geni di riparazione del DNA, anche se si dovrebbe notare che, in P. marinus SS120 solo due tali geni mancano (Tabella 3). Abbiamo osservato una simile accelerazione delle sostituzioni di aminoacidi per tutte le categorie funzionali (Figura 4). Questo risultato è più coerente con un aumento globale del tasso di mutazione che con una selezione rilassata, essendo improbabile che quest’ultima si verifichi nella stessa misura in tutti i loci. Assumiamo anche che la maggior parte delle sostituzioni di aminoacidi che si sono verificate nelle proteine del proclorococco siano neutre, cioè non hanno alterato la funzione della proteina. Infatti, le popolazioni del clade HL che, come MED4, hanno le sequenze proteiche più derivate di tutte le specie di Prochlorococcus, sembrano essere gli organismi fotosintetici più abbondanti nello strato superiore degli oceani temperati e intertropicali. Un tale successo ecologico sarebbe difficilmente possibile per organismi handicappati da un gran numero di mutazioni leggermente deleterie, soprattutto per il fatto che la maggior parte dei geni sono a copia singola, e quindi la compensazione della funzione genica non è generalmente possibile. L’effetto del mantenimento di un alto livello di selezione purificante nel contrastare le sostituzioni deleterie è particolarmente evidente nei geni rRNA. Contrariamente ai geni codificanti le proteine, i test dei tassi relativi non hanno mostrato alcuna differenza significativa nei tassi di evoluzione dei geni 16S rRNA nei quattro genomi picocyanobacteriali marini, e quindi non c’è alcuna prova che SS120 o MED4 possano aver accumulato mutazioni destabilizzanti la struttura secondaria della loro molecola 16S rRNA. Una conseguenza degna di nota dell’accelerazione dei tassi di evoluzione dei geni codificanti le proteine in Prochlorococcus è che le ricostruzioni filogenetiche basate sulle sequenze proteiche sono distorte. Infatti, questo porta a rami molto più lunghi per questi due ceppi che per MIT9313. La topologia dell’albero risultante il più delle volte non supporta quella ottenuta con il gene 16S rRNA, per il quale l’ipotesi dell’orologio molecolare è vera secondo le nostre analisi. Quindi, i geni rRNA sono probabilmente tra i pochi geni che daranno stime affidabili delle distanze filogenetiche tra i ceppi di Prochlorococcus.
Se non è stato né l’allentamento della selezione purificatrice né un aumento della deriva genetica il fattore principale che ha causato la riduzione del genoma di Prochlorococcus, una possibilità alternativa è che quest’ultima potrebbe essere il risultato di un processo selettivo che favorisce l’adattamento di Prochlorococcus al suo ambiente. Il successo ecologico apparentemente migliore nelle aree oligotrofiche delle specie Prochlorococcus rispetto al loro parente stretto Synechococcus, suggerisce fortemente che la riduzione delle dimensioni del genoma Prochlorococcus potrebbe fornire un vantaggio competitivo al primo. Infatti, i confronti estesi dei complementi genici di questi due organismi mostrano pochissimi esempi – almeno tra i geni di cui si conosce la funzione – di presenza di geni specifici in MED4 che potrebbero spiegare il suo migliore adattamento (dati non mostrati). Un’eccezione degna di nota è la presenza in Prochlorococcus, ma non in Synechococcus, di flavodossina e ferritina, due proteine che forse danno al Prochlorococcus una migliore resistenza allo stress da ferro. A parte questo, il Synechococcus appare più come un generalista, in particolare per quanto riguarda l’assorbimento e l’assimilazione dell’azoto o del fosforo, e dovrebbe a priori essere più adatto a sostenere la concorrenza. Quindi, supponiamo che la chiave del successo del proclorococco risieda meno nello sviluppo di un complesso o di una via specifica per affrontare meglio le condizioni sfavorevoli che nella semplificazione del suo genoma e della sua organizzazione cellulare, che può permettere a questo organismo di fare delle economie sostanziali in energia e materiale per il mantenimento delle cellule.
La semplice riduzione delle dimensioni del genoma è di per sé una potenziale fonte di economie sostanziali per la cellula, in quanto riduce la quantità di azoto e fosforo, due elementi particolarmente limitanti nella parte superiore dell’oceano, che sono necessari, ad esempio, nella sintesi del DNA. Un altro vantaggio è che permette una concomitante riduzione del volume della cellula. È stato precedentemente suggerito (vedi, per esempio) che, per un organismo fitoplanctonico, un piccolo volume cellulare conferisce due vantaggi selettivi riducendo l’auto-ombreggiatura (l’effetto pacchetto) e aumentando il rapporto superficie cellulare-volume, che può migliorare l’assorbimento dei nutrienti. Il primo vantaggio migliorerebbe la forma fisica dei ceppi LL, mentre il secondo offrirebbe un vantaggio ai ceppi HL che vivono in acque superficiali povere di nutrienti. Infine, la divisione cellulare è meno costosa per una cellula piccola che per una grande. Sulla base di queste osservazioni, supponiamo che la principale forza trainante per la riduzione del genoma all’interno della radiazione Prochlorococcus sia stata la selezione per uno stile di vita più economico. La tendenza verso un genoma ricco di A+T in MED4 e SS120 è anche coerente con questa ipotesi, in quanto può essere vista come un modo per risparmiare azoto. Infatti, una coppia di basi AT contiene sette atomi di azoto, uno in meno di una coppia di basi GC.
Con questa ipotesi in mente, proponiamo un possibile scenario per l’evoluzione dei genomi di Prochlorococcus. Utilizzando un tasso di divergenza del 16S rRNA dell’1% ogni 50 milioni di anni, si può stimare che la differenziazione di questi due generi sia recente come 150 milioni di anni, poiché l’ipotesi dell’orologio molecolare vale per questo gene in Prochlorococcus e Synechococcus. Le cellule ancestrali di Prochlorococcus devono essersi sviluppate nella nicchia LL, una nicchia probabilmente lasciata libera da altri picocyanobacteria. Data la notevole differenza di dimensioni del genoma tra i ceppi LL MIT9313 e SS120, sembra che la riduzione del genoma stesso debba essere iniziata in uno (o forse più) lignaggi all’interno della nicchia LL qualche tempo dopo la differenziazione di Prochlorococcus dal suo antenato comune con le specie marine Synechococcus. Perché la selezione abbia colpito solo uno (o alcuni?) e non tutti i lignaggi di Prochlorococcus rimane poco chiaro. L’esame del repertorio genico di P. marinus SS120 suggerisce che questa riduzione del genoma deve aver riguardato la perdita casuale di geni dispensabili da molti percorsi diversi. Ad un certo punto durante l’evoluzione, alcuni geni coinvolti nella riparazione del DNA sono stati colpiti; questi includerebbero il gene ada, che potrebbe essere responsabile dello spostamento nella composizione delle basi, ma anche eventualmente diversi altri, non necessariamente coinvolti nella riparazione delle mutazioni da GC a AT (vedi Tabella 3). La perdita di questi geni potrebbe aver portato a un aumento del tasso di mutazione e quindi del tasso di evoluzione dei geni codificanti le proteine, accompagnato da una più rapida contrazione del genoma e da uno spostamento della composizione di base verso AT. Vale la pena notare che una probabile conseguenza di questo spostamento della composizione del genoma è l’assenza del bias adattativo dei codoni nei genomi delle specie Prochlorococcus MED4 e SS120. I codoni ricchi di AT sono usati preferenzialmente qualunque sia l’amminoacido (Figura 3a). Quindi, l’uso dei codoni in questi genomi sembra riflettere più il bias di composizione della base locale che la selezione per una traduzione più efficiente attraverso l’uso di codoni ottimali. La stessa conclusione è stata tratta per altri piccoli genomi ad alto contenuto di A+T.
Più tardi durante l’evoluzione (circa 80 milioni di anni fa, secondo il grado di divergenza della sequenza 16S rRNA tra MED4 e SS120) una popolazione LL che probabilmente aveva già una dimensione cellulare e genomica significativamente ridotta deve essersi progressivamente adattata alla nicchia HL e alla fine ha ricolonizzato lo strato superiore. Come sia stato possibile questo cambiamento di nicchia ecologica è ancora difficile da definire. Il confronto del set di geni che differisce tra la SS120 adattata a LL e la MED4 adattata a HL mostra che pochissimi geni potrebbero essere sufficienti per passare da una all’altra nicchia, compresa una moltiplicazione dei geni hli e la ritenzione differenziale di geni che erano presenti nell’antenato comune di Prochlorococcus e Synechococcus, (come le fotolasi e i trasportatori di cianato menzionati sopra) e sono stati secondariamente persi nei lignaggi adattati a LL.