Den proces med reduktion af genomet, der er sket i Prochlorococcus-strålingen, er så vidt vi ved aldrig blevet observeret hos andre fritlevende prokaryoter. Da Prochlorococcus sp. MIT9313 har en genomstørrelse, der minder meget om Synechococcus sp. WH8102’s (2,4 megabasepar (Mbp)) samt flere andre marine Synechococcus spp. (M. Ostrowski og D. Scanlan, personlig kommunikation), er det rimeligt at antage, at den fælles forfader for alle Prochlorococcus-arter også havde en genomstørrelse på omkring 2,4 Mbp. Under denne hypotese ville den reduktion af genomet, der er sket i MED4, svare til ca. 31 %. Til sammenligning er omfanget af genomreduktionen i insekt-endosymbiont Buchnera, sammenlignet med et rekonstrueret forfædrenes genom, ca. 77 % . Genomet i P. marinus SS120 – og a fortiori MED4-genomet – anses for at være næsten minimalt for en fritlevende oxyfototrofisk organisme . Det ser ud til, at genomreduktionen i disse organismer sandsynligvis ikke kan fortsætte under en vis grænse, svarende til en genpulje, der indeholder alle de essentielle gener for biosyntetiske veje og husholdningsfunktioner (sandsynligvis inklusive de fleste af de 1.306 firevejs ortologer, der er identificeret i denne undersøgelse) plus en række andre gener, herunder både slægtsspecifikke og nichespecifikke gener. MED4 koder f.eks. for en række fotolyase-relaterede proteiner, nogle få specifikke ABC-transportører (f.eks. for cyanat; og data ikke vist). Disse specifikke forbindelser kan være kritiske for overlevelse i det øverste vandlag, som modtager høje fotonstrømme, UV-lys og er næringsfattigt, men mindre kritiske for livet dybere i vandsøjlen.
Hvis både Prochlorococcus-linjer og værtsafhængige organismer har gennemgået genomreduktion i forbindelse med accelererede substitutionshastigheder, må disse fænomener være opstået af meget forskellige årsager, da de resulterende genrepertoirer i de to typer organismer er enormt forskellige. Faktisk drives genomudviklingen af endosymbionter og obligatoriske patogener af to hovedprocesser, som har gensidigt forstærkende virkninger på genomstørrelse og udviklingshastighed. Da disse bakterier er indespærret i deres vært, har de meget små populationer, og der sker regelmæssigt en flaskehals ved hver værtsgeneration eller ved hver ny værtsinfektion. Som følge heraf oplever de en stærk genetisk drift, der medfører en stigning i substitutionsraten. Denne acceleration resulterer i en tilfældig ophobning af let skadelige mutationer i proteinkoderende gener og i rRNA-gener . Denne genetiske drift fremmer nedskæringen af genomet gennem inaktivering og derefter eliminering af potentielt nyttige, men overflødige gener. Blandt disse har der været en række DNA-reparationsgener, hvis forsvinden kunne have øget mutationsraten yderligere . Desuden kan en række gener være genstand for en lempelse af den rensende selektion, som derfor er mindre effektiv med hensyn til at opretholde genfunktionen. Denne afslapning berører især de gener, der er blevet ubrugelige, fordi de er overflødige i deres værtsgenom, f.eks. gener, der er involveret i biosyntesen af aminosyrer, nukleotider, fedtsyrer og endog ATP . Selektionspresset er også reduceret for gener, der er involveret i miljøafsøgnings- og reguleringssystemer, f.eks. to-komponent-systemer, på grund af det meget mere bufferede miljø, som værten tilbyder .
I den fritlevende slægt Prochlorococcus betyder den meget store størrelse af feltpopulationer, at disse populationer er udsat for meget mindre genetisk drift, og deres genomer er udsat for en meget stærkere rensende selektion end end endosymbionter og patogener . Den observerede accelererede udviklingshastighed skyldes derfor sandsynligvis kun stigningen i mutationshastigheden, som igen sandsynligvis skyldes tabet af DNA-reparationsgener, selv om man bør bemærke, at der i P. marinus SS120 kun mangler to sådanne gener (tabel 3). Vi observerede en lignende acceleration af aminosyresubstitutioner for alle funktionelle kategorier (figur 4). Dette resultat er mere i overensstemmelse med en global stigning i mutationshastigheden end med afslappet selektion, idet sidstnævnte sandsynligvis ikke forekommer i samme omfang på alle loci. Vi antager også, at de fleste aminosyresubstitutioner, der er forekommet i Prochlorococcus-proteiner, er neutrale; det vil sige, at de ikke har ændret proteinfunktionen. Faktisk synes populationer af HL-kladen, der ligesom MED4 har de mest afledte proteinsekvenser af alle Prochlorococcus-arter, at være de mest udbredte fotosyntetiske organismer i det øverste lag af de tempererede og intertropiske oceaner . En sådan økologisk succes ville næppe være mulig for organismer, der er handicappet af et stort antal let skadelige mutationer, især i betragtning af, at de fleste gener er enkeltkopierede, og at det derfor generelt ikke er muligt at kompensere for genfunktionen. Virkningen af opretholdelsen af et højt niveau af rensende selektion på modvirkningen af skadelige substitutioner er særlig tydelig i rRNA-generne. I modsætning til de proteinkodende gener viste relative hastighedstests ikke nogen signifikante forskelle i udviklingshastigheden for 16S rRNA-generne i de fire marine picocyanobakteriegenomer, og der er således ingen tegn på, at hverken SS120 eller MED4 kunne have akkumuleret mutationer, der destabiliserer den sekundære struktur af deres 16S rRNA-molekyle. En bemærkelsesværdig konsekvens af den accelererende udviklingshastighed for proteinkodende gener i Prochlorococcus er, at fylogenetiske rekonstruktioner baseret på proteinsekvenser er skævvredet. Dette fører nemlig til meget længere grene for disse to stammer end for MIT9313. Den resulterende trætopologi understøtter oftest ikke den topologi, der er opnået med 16S rRNA-genet, for hvilket hypotesen om det molekylære ur holder stik ifølge vores analyser. Således er rRNA-generne sandsynligvis blandt de få gener, der vil give pålidelige estimater af de fylogenetiske afstande mellem Prochlorococcus-stammer.
Hvis det hverken er lempelsen af den rensende selektion eller en stigning i den genetiske drift, der har været den vigtigste faktor, der har forårsaget Prochlorococcus’ genomreduktion, er en alternativ mulighed, at sidstnævnte kunne være resultatet af en selektiv proces, der begunstiger Prochlorococcus’ tilpasning til miljøet. Den tilsyneladende bedre økologiske succes i oligotrofe områder for Prochlorococcus-arter sammenlignet med deres nære slægtning Synechococcus tyder stærkt på, at reduktionen af Prochlorococcus’ genomstørrelse kan give førstnævnte arter en konkurrencefordel. Omfattende sammenligninger af disse to organismers genkomplementer viser nemlig meget få eksempler – i det mindste blandt de gener, hvis funktion er kendt – på forekomst af specifikke gener i MED4, som kunne forklare dens bedre tilpasning (data ikke vist). En bemærkelsesværdig undtagelse er tilstedeværelsen i Prochlorococcus, men ikke i Synechococcus, af flavodoxin og ferritin, to proteiner, som muligvis giver Prochlorococcus en bedre modstandsdygtighed over for jernstress. Bortset fra dette forekommer Synechococcus mere som en generalist, især med hensyn til kvælstof- eller fosforoptagelse og -assimilation , og burde a priori være mere egnet til at opretholde konkurrence. Vi antager derfor, at nøglen til Prochlorococcus’ succes mindre ligger i udviklingen af et specifikt kompleks eller en specifik vej til at klare sig bedre under ugunstige forhold end i forenklingen af dens genom og celleorganisation, hvilket kan gøre det muligt for denne organisme at opnå betydelige besparelser i energi og materiale til vedligeholdelse af cellerne.
Den blotte reduktion af genomets størrelse er i sig selv en potentiel kilde til betydelige besparelser for cellen, da den reducerer mængden af kvælstof og fosfor, to særligt begrænsende elementer i den øvre del af havet, som f.eks. er nødvendige i DNA-syntesen. En anden fordel er, at det giver mulighed for en samtidig reduktion af cellens volumen. Det er tidligere blevet foreslået (se f.eks. ), at et lille cellevolumen for en fytoplanktonorganisme giver to selektive fordele ved at reducere selvafskærmning (pakkeeffekten) og ved at øge forholdet mellem celleoverflade og -volumen, hvilket kan forbedre optagelsen af næringsstoffer. Den første fordel ville forbedre LL-stammernes fitness, mens den anden ville give en fordel til HL-stammer, der lever i næringsfattige overfladevandområder. Endelig er celledeling mindre omkostningsfuld for en lille celle end for en stor celle. På grundlag af disse observationer antager vi, at den vigtigste drivkraft for genomreduktion inden for Prochlorococcus-strålingen har været udvælgelsen til en mere økonomisk livsstil. Fordelen mod et A+T-rigt genom i MED4 og SS120 er også i overensstemmelse med denne hypotese, da det kan ses som en måde at spare på kvælstof på. Faktisk indeholder et AT-basepar syv kvælstofatomer, et mindre end et GC-basepar.
Med denne hypotese i tankerne foreslår vi et muligt scenarie for udviklingen af Prochlorococcus-genomer. Hvis man anvender en 16S rRNA-divergenshastighed på 1 % pr. 50 millioner år , kan man anslå, at differentieringen af disse to slægter er så nyligt som 150 millioner år, da hypotesen om det molekylære ur holder for dette gen i Prochlorococcus og Synechococcus. De forfødte Prochlorococcus-celler må have udviklet sig i LL-nichen, en niche, der sandsynligvis er blevet efterladt fri af andre picocyanobakterier. I betragtning af den betydelige forskel i genomstørrelse mellem LL-stammerne MIT9313 og SS120 ser det ud til, at selve genomreduktionen må være begyndt i en (eller muligvis flere) slægt(er) inden for LL-nichen et stykke tid efter Prochlorococcus’ differentiering fra sin fælles forfader med marine Synechococcus-arter. Hvorfor selektionen kun har påvirket én (eller nogle?) og ikke alle Prochlorococcus-linjer er fortsat uklart. En undersøgelse af genrepertoiret hos P. marinus SS120 tyder på, at denne reduktion af genomet må have drejet sig om tilfældigt tab af overflødige gener fra mange forskellige veje. På et eller andet tidspunkt i evolutionen er nogle gener, der er involveret i DNA-reparation, blevet påvirket; disse omfatter ada-genet, som kan være ansvarlig for skiftet i basesammensætningen, men muligvis også flere andre, der ikke nødvendigvis er involveret i reparation af GC- til AT-mutationer (se tabel 3). Tabet af disse gener kan have ført til en stigning i mutationshastigheden og dermed i udviklingshastigheden for proteinkodende gener, ledsaget af en hurtigere skrumpning af genomet og et skift i basesammensætningen i retning af AT. Det er værd at bemærke, at en sandsynlig konsekvens af dette skift i sammensætningen på tværs af genomet er fraværet af den adaptive kodonbias i genomerne af Prochlorococcus-arter MED4 og SS120. AT-rige kodoner anvendes fortrinsvis uanset hvilken aminosyre der er tale om (figur 3a). Kodonanvendelsen i disse genomer synes således mere at afspejle den lokale basesammensætningsbias end udvælgelsen af en mere effektiv oversættelse gennem brug af optimale kodoner. Den samme konklusion er blevet draget for andre små genomer med højt A+T-indhold .
Sidst i løbet af evolutionen (for ca. 80 millioner år siden, ifølge graden af 16S rRNA-sekvensdivergens mellem MED4 og SS120) må en LL-population, som sandsynligvis allerede havde en betydeligt reduceret celle- og genomstørrelse, gradvist have tilpasset sig HL-nichen og til sidst genkoloniseret det øvre lag. Hvordan denne ændring i den økologiske niche var mulig, er stadig svært at definere. En sammenligning af det gensæt, der adskiller sig mellem den LL-tilpassede SS120 og den HL-tilpassede MED4, viser, at meget få gener kan være tilstrækkelige til at skifte fra den ene til den anden niche, herunder en multiplikation af hli-gener og den differentielle bevarelse af gener, der var til stede i Prochlorococcus’ og Synechococcus’ fælles forfader (f.eks. fotolyaser og cyanattransportører som nævnt ovenfor), og som sekundært gik tabt i de LL-tilpassede slægter.