Der Prozess der Genomverkleinerung, der innerhalb der Prochlorococcus-Strahlung stattgefunden hat, ist unseres Wissens bisher bei keinem anderen freilebenden Prokaryoten beobachtet worden. Da Prochlorococcus sp. MIT9313 eine Genomgröße aufweist, die der von Synechococcus sp. WH8102 (2,4 Megabasenpaare (Mbp)) und mehreren anderen marinen Synechococcus spp. sehr ähnlich ist (M. Ostrowski und D. Scanlan, persönliche Mitteilung), liegt die Annahme nahe, dass der gemeinsame Vorfahre aller Prochlorococcus-Arten ebenfalls eine Genomgröße von etwa 2,4 Mbp hatte. Unter dieser Hypothese würde die Genomverkleinerung, die in MED4 stattgefunden hat, etwa 31 % entsprechen. Im Vergleich dazu beträgt das Ausmaß der Genomverkleinerung bei dem Insekten-Endosymbionten Buchnera im Vergleich zu einem rekonstruierten Vorgängergenom etwa 77 %. Das Genom von P. marinus SS120 – und erst recht das MED4-Genom – gilt als nahezu minimal für einen freilebenden oxyphotrophen Organismus. Es hat den Anschein, dass die Genomreduktion bei diesen Organismen wahrscheinlich nicht unterhalb einer bestimmten Grenze stattfinden kann, die einem Genpool entspricht, der alle wesentlichen Gene der Biosynthesewege und der Haushaltsfunktionen (wahrscheinlich einschließlich der meisten der in dieser Studie identifizierten 1 306 vierfach orthologen Gene) sowie eine Reihe anderer Gene enthält, darunter sowohl gattungs- als auch nischenspezifische Gene. So kodiert MED4 beispielsweise für eine Reihe von Proteinen, die mit der Photolyase zusammenhängen, sowie für einige spezifische ABC-Transporter (z. B. für Cyanat; Daten nicht gezeigt). Diese spezifischen Verbindungen könnten für das Überleben in der oberen Wasserschicht, die hohe Photonenflüsse und UV-Licht empfängt und nährstoffarm ist, entscheidend sein, weniger jedoch für das Leben tiefer in der Wassersäule.
Wenn sowohl die Prochlorococcus-Linien als auch die wirtsabhängigen Organismen eine Genomverkleinerung in Verbindung mit beschleunigten Substitutionsraten erfahren haben, müssen diese Phänomene aus sehr unterschiedlichen Gründen entstanden sein, da sich die resultierenden Genrepertoires der beiden Arten von Organismen enorm unterscheiden. Die Genomevolution von Endosymbionten und obligatorischen Krankheitserregern wird durch zwei Hauptprozesse vorangetrieben, die sich gegenseitig verstärkende Auswirkungen auf die Genomgröße und die Evolutionsraten haben. Da diese Bakterien in ihrem Wirt eingeschlossen sind, haben sie winzige Populationsgrößen und erfahren bei jeder Wirtsgeneration oder bei jeder neuen Wirtsinfektion einen Engpass. Infolgedessen erleben sie eine starke genetische Drift, die mit einer Zunahme der Substitutionsrate einhergeht. Diese Beschleunigung führt zu einer zufälligen Anhäufung von leicht schädlichen Mutationen in proteinkodierenden Genen sowie in rRNA-Genen. Diese genetische Drift verstärkt die Verkleinerung des Genoms durch Inaktivierung und anschließende Eliminierung potenziell nützlicher, aber überflüssiger Gene. Unter diesen Genen gab es eine Reihe von DNA-Reparaturgenen, deren Verschwinden die Mutationsrate weiter erhöht haben könnte. Darüber hinaus kann es bei einer Reihe von Genen zu einer Lockerung der reinigenden Selektion kommen, wodurch die Funktion des Gens weniger wirksam aufrechterhalten wird. Diese Lockerung betrifft insbesondere Gene, die nutzlos geworden sind, weil sie in ihrem Wirtsgenom redundant sind, wie z. B. Gene, die an der Biosynthese von Aminosäuren, Nukleotiden, Fettsäuren und sogar ATP beteiligt sind. Der Selektionsdruck ist auch bei Genen geringer, die an Umweltsensor- und Regulierungssystemen beteiligt sind, wie z. B. Zweikomponentensystemen, da der Wirt eine viel besser gepufferte Umgebung bietet.
In der freilebenden Gattung Prochlorococcus bedeutet die sehr große Größe der Feldpopulationen, dass diese Populationen einer viel geringeren genetischen Drift ausgesetzt sind und ihre Genome einer viel stärkeren reinigenden Selektion unterliegen als die von Endosymbionten und Krankheitserregern. Folglich resultiert die beobachtete beschleunigte Evolutionsrate wahrscheinlich nur aus dem Anstieg der Mutationsrate, die wiederum wahrscheinlich auf den Verlust von DNA-Reparaturgenen zurückzuführen ist, auch wenn man beachten sollte, dass in P. marinus SS120 nur zwei solcher Gene fehlen (Tabelle 3). Wir beobachteten eine ähnliche Beschleunigung der Aminosäuresubstitutionen für alle funktionellen Kategorien (Abbildung 4). Dieser Befund steht eher im Einklang mit einem globalen Anstieg der Mutationsrate als mit einer entspannten Selektion, da letztere wahrscheinlich nicht an allen Loci in gleichem Maße stattfindet. Wir gehen auch davon aus, dass die meisten Aminosäuresubstitutionen in Prochlorococcus-Proteinen neutral sind, d. h. sie haben die Proteinfunktion nicht verändert. Tatsächlich scheinen Populationen der HL-Gruppe, die wie MED4 die meisten abgeleiteten Proteinsequenzen aller Prochlorococcus-Arten aufweisen, die am häufigsten vorkommenden photosynthetischen Organismen in der oberen Schicht der gemäßigten und subtropischen Ozeane zu sein. Ein derartiger ökologischer Erfolg wäre für Organismen, die durch eine große Anzahl leicht schädlicher Mutationen behindert werden, kaum möglich, zumal die meisten Gene nur in einer Kopie vorliegen, so dass eine Kompensation der Genfunktion im Allgemeinen nicht möglich ist. Die Auswirkung der Aufrechterhaltung eines hohen Maßes an reinigender Selektion auf die Kompensation von schädlichen Substitutionen ist bei den rRNA-Genen besonders offensichtlich. Im Gegensatz zu den proteinkodierenden Genen ergaben die Tests der relativen Raten keine signifikanten Unterschiede in den Evolutionsraten der 16S rRNA-Gene in den vier marinen Picocyanobakterien-Genomen, und somit gibt es keinen Hinweis darauf, dass SS120 oder MED4 Mutationen akkumuliert haben könnten, die die Sekundärstruktur ihres 16S rRNA-Moleküls destabilisieren. Eine bemerkenswerte Konsequenz der Beschleunigung der Evolutionsraten von proteinkodierenden Genen in Prochlorococcus ist, dass phylogenetische Rekonstruktionen auf der Grundlage von Proteinsequenzen verzerrt sind. Tatsächlich führt dies bei diesen beiden Stämmen zu viel längeren Ästen als bei MIT9313. Die sich daraus ergebende Baumtopologie stimmt meist nicht mit derjenigen überein, die sich aus dem 16S-rRNA-Gen ergibt, für das die Hypothese der molekularen Uhr nach unseren Analysen zutrifft. Somit gehören die rRNA-Gene wahrscheinlich zu den wenigen Genen, die zuverlässige Schätzungen der phylogenetischen Abstände zwischen den Prochlorococcus-Stämmen liefern.
Wenn weder die Abschwächung der reinigenden Selektion noch eine Zunahme der genetischen Drift der Hauptfaktor für die Reduktion des Prochlorococcus-Genoms war, könnte letztere das Ergebnis eines selektiven Prozesses sein, der die Anpassung von Prochlorococcus an seine Umwelt begünstigt. Der offensichtlich bessere ökologische Erfolg von Prochlorococcus-Arten in oligotrophen Gebieten im Vergleich zu ihrem nahen Verwandten Synechococcus deutet stark darauf hin, dass die Verkleinerung des Prochlorococcus-Genoms einen Wettbewerbsvorteil für erstere darstellen könnte. Ausführliche Vergleiche der Genkomplexe dieser beiden Organismen zeigen in der Tat nur sehr wenige Beispiele – zumindest bei den Genen, deren Funktion bekannt ist – für das Vorkommen spezifischer Gene in MED4, die seine bessere Anpassung erklären könnten (Daten nicht gezeigt). Eine bemerkenswerte Ausnahme ist das Vorhandensein von Flavodoxin und Ferritin in Prochlorococcus, aber nicht in Synechococcus, zwei Proteinen, die Prochlorococcus möglicherweise eine bessere Resistenz gegen Eisenstress verleihen. Abgesehen davon scheint Synechococcus eher ein Generalist zu sein, insbesondere im Hinblick auf die Stickstoff- oder Phosphoraufnahme und -assimilation, und sollte a priori besser geeignet sein, den Wettbewerb aufrechtzuerhalten. Wir gehen daher davon aus, dass der Schlüssel zum Erfolg von Prochlorococcus weniger in der Entwicklung eines spezifischen Komplexes oder Weges liegt, um mit ungünstigen Bedingungen besser zurechtzukommen, als vielmehr in der Vereinfachung seines Genoms und seiner Zellorganisation, die es diesem Organismus ermöglicht, erhebliche Einsparungen an Energie und Material für die Zellerhaltung zu erzielen.
Die bloße Verkleinerung des Genoms an sich ist eine potenzielle Quelle erheblicher Einsparungen für die Zelle, da sie die Menge an Stickstoff und Phosphor reduziert, zwei besonders limitierende Elemente im oberen Teil des Ozeans, die zum Beispiel für die DNA-Synthese notwendig sind. Ein weiterer Vorteil ist die gleichzeitige Verringerung des Zellvolumens. Es wurde bereits früher vorgeschlagen (siehe z. B. ), dass ein kleines Zellvolumen für einen phytoplanktonischen Organismus zwei Selektionsvorteile mit sich bringt, indem es die Selbstabschattung (den Paketeffekt) verringert und das Verhältnis von Zelloberfläche zu Zellvolumen erhöht, was die Nährstoffaufnahme verbessern kann. Der erste Vorteil würde die Fitness der LL-Stämme verbessern, während der zweite den HL-Stämmen, die in nährstoffarmen Oberflächengewässern leben, einen Vorteil bieten würde. Schließlich ist die Zellteilung für eine kleine Zelle weniger kostspielig als für eine große Zelle. Auf der Grundlage dieser Beobachtungen gehen wir davon aus, dass die Hauptantriebskraft für die Genomverkleinerung innerhalb der Prochlorococcus-Strahlung die Selektion auf eine wirtschaftlichere Lebensweise war. Die Tendenz zu einem A+T-reichen Genom in MED4 und SS120 stimmt ebenfalls mit dieser Hypothese überein, da dies als eine Möglichkeit zur Einsparung von Stickstoff angesehen werden kann. In der Tat enthält ein AT-Basenpaar sieben Stickstoffatome, eines weniger als ein GC-Basenpaar.
Anhand dieser Hypothese schlagen wir ein mögliches Szenario für die Evolution der Prochlorococcus-Genome vor. Bei einer Divergenzrate der 16S rRNA von 1 % pro 50 Millionen Jahre kann man davon ausgehen, dass die Differenzierung dieser beiden Gattungen erst vor 150 Millionen Jahren stattgefunden hat, da die Hypothese der molekularen Uhr für dieses Gen in Prochlorococcus und Synechococcus zutrifft. Die Vorläuferzellen von Prochlorococcus müssen sich in der LL-Nische entwickelt haben, einer Nische, die wahrscheinlich von anderen Picocyanobakterien frei gelassen wurde. Angesichts des beträchtlichen Unterschieds in der Genomgröße zwischen den LL-Stämmen MIT9313 und SS120 scheint es, dass die Genomreduktion selbst in einer (oder möglicherweise mehreren) Linie(n) innerhalb der LL-Nische einige Zeit nach der Differenzierung von Prochlorococcus von seinem gemeinsamen Vorfahren mit marinen Synechococcus-Arten begonnen haben muss. Warum die Selektion nur eine (oder einige?) und nicht alle Prochlorococcus-Stämme betroffen hat, bleibt unklar. Eine Untersuchung des Genrepertoires von P. marinus SS120 deutet darauf hin, dass es sich bei dieser Genomverkleinerung um den zufälligen Verlust von entbehrlichen Genen aus vielen verschiedenen Bereichen gehandelt haben muss. Irgendwann im Laufe der Evolution wurden einige Gene, die an der DNA-Reparatur beteiligt sind, in Mitleidenschaft gezogen; dazu gehört das ada-Gen, das für die Verschiebung der Basenzusammensetzung verantwortlich sein könnte, aber möglicherweise auch mehrere andere, die nicht unbedingt an der Reparatur von GC- zu AT-Mutationen beteiligt sind (siehe Tabelle 3). Der Verlust dieser Gene könnte zu einem Anstieg der Mutationsrate und damit der Evolutionsrate der proteinkodierenden Gene geführt haben, begleitet von einer schnelleren Schrumpfung des Genoms und einer Verschiebung der Basenzusammensetzung in Richtung AT. Eine wahrscheinliche Folge dieser genomweiten Verschiebung der Zusammensetzung ist das Fehlen des adaptiven Codon Bias in den Genomen der Prochlorococcus-Arten MED4 und SS120. AT-reiche Codons werden unabhängig von der Aminosäure bevorzugt verwendet (Abbildung 3a). Der Codongebrauch in diesen Genomen scheint also eher die lokale Basenzusammensetzung als die Auswahl für eine effizientere Übersetzung durch die Verwendung optimaler Codons widerzuspiegeln. Dieselbe Schlussfolgerung wurde für andere kleine Genome mit hohem A+T-Gehalt gezogen.
Später im Laufe der Evolution (vor etwa 80 Millionen Jahren, nach dem Grad der 16S rRNA-Sequenzdivergenz zwischen MED4 und SS120) muss sich eine LL-Population, die wahrscheinlich bereits eine deutlich reduzierte Zell- und Genomgröße hatte, schrittweise an die HL-Nische angepasst und schließlich die obere Schicht wiederbesiedelt haben. Wie dieser Wechsel der ökologischen Nische möglich war, ist noch schwer zu definieren. Ein Vergleich des Gensets, das sich zwischen dem LL-adaptierten SS120 und dem HL-adaptierten MED4 unterscheidet, zeigt, dass nur wenige Gene ausreichen könnten, um von der einen in die andere Nische zu wechseln, einschließlich einer Vervielfachung der hli-Gene und der unterschiedlichen Beibehaltung von Genen, die im gemeinsamen Vorfahren von Prochlorococcus und Synechococcus vorhanden waren (wie die oben erwähnten Photolyasen und Cyanat-Transporter) und in den LL-adaptierten Linien sekundär verloren gingen.