Het proces van genoomreductie dat zich heeft voorgedaan binnen de Prochlorococcus-straling is bij ons weten tot nu toe nog nooit waargenomen bij enige andere vrijlevende prokaryoot. Aangezien Prochlorococcus sp. MIT9313 een genoomgrootte heeft die sterk lijkt op die van Synechococcus sp. WH8102 (2,4 megabase-pair (Mbp)), alsook verschillende andere mariene Synechococcus spp. (M. Ostrowski en D. Scanlan, persoonlijke mededeling), is het redelijk om aan te nemen dat de gemeenschappelijke voorouder van alle Prochlorococcus soorten ook een genoomgrootte rond 2,4 Mbp had. Volgens deze hypothese zou de genoomverkleining die in MED4 heeft plaatsgevonden, overeenkomen met ongeveer 31%. Ter vergelijking, de omvang van de genoomreductie in het insecten-endosymbiont Buchnera, in vergelijking met een gereconstrueerd voorouderlijk genoom, bedraagt ongeveer 77% . Het genoom van P. marinus SS120 – en a fortiori het MED4-genoom – wordt beschouwd als bijna minimaal voor een vrij levend oxyfotroof organisme. Het lijkt erop dat de genoomreductie bij deze organismen waarschijnlijk niet beneden een bepaalde grens kan gaan, die overeenkomt met een genenpool die alle essentiële genen van biosynthetische paden en huishoudfuncties bevat (waarschijnlijk inclusief de meeste van de 1.306 vierweg-orthologe genen die in deze studie zijn geïdentificeerd) plus een aantal andere genen, waaronder genus-specifieke en nichespecifieke genen. Zo codeert MED4 voor een aantal fotolyase-gerelateerde eiwitten, een paar specifieke ABC-transporters (voor cyanaat, bijvoorbeeld; en gegevens niet weergegeven). Deze specifieke verbindingen zouden van cruciaal belang kunnen zijn voor overleving in de bovenste waterlaag, die hoge fotonfluxen en UV-licht ontvangt en voedselarm is, maar minder voor leven dieper in de waterkolom.
Als zowel Prochlorococcus-lijnen als gastheer-afhankelijke organismen een genoomverkleining hebben ondergaan die gepaard ging met versnelde substitutiesnelheden, moeten deze verschijnselen door zeer verschillende oorzaken zijn ontstaan, aangezien de resulterende genrepertoires van de twee soorten organismen enorm verschillen. De evolutie van het genoom van endosymbionten en obligate pathogenen wordt immers gestuurd door twee belangrijke processen die elkaar wederzijds versterkende effecten hebben op de omvang van het genoom en de evolutiesnelheid. Omdat ze opgesloten zitten in hun gastheer, hebben deze bacteriën kleine populatiegroottes en worden ze regelmatig gebotteld bij elke gastheergeneratie of bij elke nieuwe gastheerinfectie. Bijgevolg ondervinden zij een sterke genetische drift met een toename van de substitutiesnelheid. Deze versnelling resulteert in een willekeurige accumulatie van licht schadelijke mutaties in eiwit-coderende genen en in rRNA-genen. Deze genetische drift bevordert de verkleining van het genoom door de inactivering en vervolgens de eliminatie van potentieel nuttige maar overbodige genen. Daaronder zijn er een aantal DNA-herstelgenen geweest, waarvan de verdwijning het mutatiepercentage verder zou kunnen hebben verhoogd . Bovendien kan een aantal genen worden onderworpen aan een versoepeling van de zuiverende selectie, die daardoor minder doeltreffend wordt voor het behoud van de genfunctie. Deze versoepeling treft vooral genen die nutteloos zijn geworden omdat zij in hun gastheergenoom redundant zijn, zoals genen die betrokken zijn bij de biosynthese van aminozuren, nucleotiden, vetzuren en zelfs ATP . De selectiedruk wordt ook verminderd voor genen die betrokken zijn bij omgevingsdetectie en regulerende systemen, zoals twee-componentensystemen, vanwege de sterk gebufferde omgeving die de gastheer biedt.
In het vrijlevende genus Prochlorococcus betekent de zeer grote omvang van de veldpopulaties dat deze populaties onderhevig zijn aan een veel geringere genetische drift en dat hun genomen onderhevig zijn aan een veel sterkere zuiverende selectie dan die van endosymbionten en pathogenen. Bijgevolg is de waargenomen versnelde evolutiesnelheid waarschijnlijk enkel het gevolg van de toename van de mutatiesnelheid, die op haar beurt waarschijnlijk te wijten is aan het verlies van DNA-herstelgenen, ook al moet men opmerken dat in P. marinus SS120 slechts twee van dergelijke genen ontbreken (Tabel 3). We observeerden een gelijkaardige versnelling van aminozuursubstituties voor alle functionele categorieën (Figuur 4). Deze bevinding is meer consistent met een globale toename van de mutatiesnelheid dan met ontspannen selectie, omdat het onwaarschijnlijk is dat dit laatste in alle loci in dezelfde mate optreedt. We nemen ook aan dat de meeste aminozuursubstituties die in Prochlorococcus-eiwitten zijn opgetreden, neutraal zijn; dat wil zeggen dat ze de eiwitfunctie niet hebben veranderd. Inderdaad, populaties van de HL clade die, zoals MED4, de meest afgeleide eiwitsequenties hebben van alle Prochlorococcus soorten, blijken de meest overvloedige fotosynthetische organismen te zijn in de bovenste laag van de gematigde en inter-tropische oceanen . Een dergelijk ecologisch succes zou nauwelijks mogelijk zijn voor organismen die worden gehinderd door een groot aantal licht schadelijke mutaties, vooral gezien het feit dat de meeste genen uit één enkele kopie bestaan, zodat compensatie van de genfunctie in het algemeen niet mogelijk is. Het effect van de handhaving van een hoog niveau van zuiverende selectie op het tegengaan van schadelijke substituties is bijzonder duidelijk in de rRNA-genen. In tegenstelling tot de eiwit-coderende genen, toonden relatieve snelheidstesten geen significante verschillen aan in de snelheid van evolutie van de 16S rRNA genen in de vier mariene picocyanobacteriële genomen, en er zijn dus geen aanwijzingen dat SS120 of MED4 mutaties zouden kunnen hebben geaccumuleerd die de secundaire structuur van hun 16S rRNA molecuul destabiliseren. Een opmerkelijk gevolg van de versnelde evolutie van eiwit-coderende genen in Prochlorococcus is dat fylogenetische reconstructies gebaseerd op eiwit-sequenties vertekend zijn. Dit leidt inderdaad tot veel langere takken voor deze twee stammen dan voor MIT9313. De resulterende boomtopologie ondersteunt meestal niet die verkregen met het 16S rRNA gen, waarvoor volgens onze analyses de moleculaire klok hypothese opgaat. De rRNA genen behoren dus waarschijnlijk tot de weinige genen die betrouwbare schattingen geven van de fylogenetische afstanden tussen Prochlorococcus stammen.
Als noch de versoepeling van zuiverende selectie, noch een toename van genetische drift de voornaamste factor is geweest die de vermindering van het genoom van Prochlorococcus heeft veroorzaakt, is een alternatieve mogelijkheid dat dit laatste het resultaat zou kunnen zijn van een selectief proces dat de aanpassing van Prochlorococcus aan zijn omgeving bevordert. Het blijkbaar betere ecologische succes in oligotrofe gebieden van Prochlorococcus-soorten in vergelijking met hun nauwe verwant Synechococcus, wijst er sterk op dat de vermindering van de Prochlorococcus-genoomgrootte aan eerstgenoemde een concurrentievoordeel zou kunnen opleveren. Uitgebreide vergelijkingen van de genencomplementen van deze twee organismen tonen inderdaad zeer weinig voorbeelden – althans onder de genen waarvan de functie bekend is – van het voorkomen van specifieke genen in MED4 die zijn betere aanpassing zouden kunnen verklaren (gegevens niet aangetoond). Een opmerkelijke uitzondering is de aanwezigheid in Prochlorococcus, maar niet in Synechococcus, van flavodoxine en ferritine, twee eiwitten die Prochlorococcus mogelijk een betere weerstand tegen ijzerstress geven. Afgezien daarvan lijkt Synechococcus meer een generalist, met name wat betreft stikstof- of fosforopname en assimilatie, en zou het a priori meer geschikt moeten zijn om de concurrentie in stand te houden. Daarom nemen wij aan dat de sleutel tot het succes van Prochlorococcus niet zozeer ligt in de ontwikkeling van een specifiek complex of een specifieke route om beter bestand te zijn tegen ongunstige omstandigheden, maar veeleer in de vereenvoudiging van zijn genoom en celorganisatie, waardoor dit organisme aanzienlijke besparingen kan realiseren op energie en materiaal voor celonderhoud.
De vermindering van de omvang van het genoom op zich is al een potentiële bron van aanzienlijke besparingen voor de cel, omdat daardoor de hoeveelheid stikstof en fosfor wordt verminderd, twee bijzonder beperkende elementen in het bovenste deel van de oceaan, die bijvoorbeeld nodig zijn voor de DNA-synthese. Een ander voordeel is dat het een gelijktijdige vermindering van het celvolume mogelijk maakt. Eerder is gesuggereerd (zie bijvoorbeeld ) dat voor een fytoplanktonisch organisme een klein celvolume twee selectieve voordelen oplevert: het vermindert de zelfbeschaduwing (het pakketeffect) en het vergroot de verhouding celoppervlak/volume, waardoor de nutriëntenopname kan verbeteren. Het eerste voordeel zou de fitness van de LL-stammen verbeteren, terwijl het tweede een voordeel zou bieden aan de HL-stammen die leven in oppervlaktewateren met een tekort aan voedingsstoffen. Tenslotte is celdeling minder kostbaar voor een kleine dan voor een grote cel. Op basis van deze waarnemingen nemen wij aan dat de belangrijkste drijvende kracht achter de genoomverkleining binnen de Prochlorococcus-stam de selectie voor een economischer levenswijze is geweest. De bias naar een A+T-rijk genoom in MED4 en SS120 is ook consistent met deze hypothese, aangezien het gezien kan worden als een manier om te besparen op stikstof. Inderdaad, een AT basepaar bevat zeven atomen stikstof, één minder dan een GC basepaar.
Met deze hypothese in het achterhoofd, stellen wij een mogelijk scenario voor voor de evolutie van Prochlorococcus genomen. Uitgaande van een divergentiesnelheid van 16S rRNA van 1% per 50 miljoen jaar, kan men schatten dat de differentiatie van deze twee geslachten zo recent is als 150 miljoen jaar, aangezien de moleculaire klokhypothese voor dit gen in Prochlorococcus en Synechococcus geldt. De voorouderlijke Prochlorococcus-cellen moeten zich ontwikkeld hebben in de LL-nis, een niche die waarschijnlijk door andere picocyanobacteriën is vrijgelaten. Gezien het aanzienlijke verschil in genoomgrootte tussen de LL stammen MIT9313 en SS120, lijkt het erop dat de genoomverkleining zelf moet zijn begonnen in één (of mogelijk meerdere) lijn(en) binnen de LL niche, enige tijd na de differentiatie van Prochlorococcus van zijn gemeenschappelijke voorouder met mariene Synechococcus soorten. Waarom de selectie slechts één (of enkele?) en niet alle Prochlorococcus-lijnen heeft beïnvloed, blijft onduidelijk. Onderzoek van het genenrepertoire van P. marinus SS120 suggereert dat deze genoomreductie het willekeurige verlies van overbodige genen uit vele verschillende paden moet hebben betroffen. Op een bepaald moment in de evolutie zijn enkele genen die betrokken zijn bij DNA reparatie aangetast; hiertoe zou het ada gen behoren, dat verantwoordelijk kan zijn voor de verschuiving in basissamenstelling, maar mogelijk ook verscheidene andere, niet noodzakelijk betrokken bij GC naar AT mutatieherstel (zie Tabel 3). Het verlies van deze genen kan geleid hebben tot een toename van de mutatiesnelheid en daardoor van de evolutiesnelheid van eiwit-coderende genen, gepaard gaande met een snellere inkrimping van het genoom en een verschuiving van de basissamenstelling naar AT. Het is vermeldenswaard dat een waarschijnlijk gevolg van deze genoomwijde verschuiving in de samenstelling de afwezigheid is van de adaptieve codon bias in de genomen van Prochlorococcus soorten MED4 en SS120. AT-rijke codons worden bij voorkeur gebruikt, ongeacht het aminozuur (Figuur 3a). Het codongebruik in deze genomen lijkt dus meer de lokale bias in de basissamenstelling te weerspiegelen dan de selectie voor een efficiëntere vertaling door het gebruik van optimale codons. Dezelfde conclusie werd getrokken voor andere kleine genomen met een hoog A+T gehalte.
Later in de evolutie (rond 80 miljoen jaar geleden, volgens de graad van 16S rRNA sequentie divergentie tussen MED4 en SS120) moet een LL populatie die waarschijnlijk reeds een sterk gereduceerde cel- en genoomgrootte had, zich geleidelijk hebben aangepast aan de HL niche en uiteindelijk de bovenlaag hebben gerekoloniseerd. Hoe deze verandering in ecologische niche mogelijk was, is nog steeds moeilijk te definiëren. Vergelijking van de genenset die verschilt tussen de LL-aangepaste SS120 en de HL-aangepaste MED4 toont aan dat zeer weinig genen voldoende zouden kunnen zijn om over te schakelen van de ene naar de andere niche, inclusief een vermenigvuldiging van hli genen en het differentieel behoud van genen die aanwezig waren in de gemeenschappelijke voorouder van Prochlorococcus en Synechococcus, (zoals de fotolyasen en cyanaat transporters hierboven vermeld) en secundair verloren gingen in de LL-aangepaste lineages.