Den process av minskning av genomet som har inträffat inom Prochlorococcus-strålningen har såvitt vi vet aldrig observerats hittills hos någon annan fritt levande prokaryot. Eftersom Prochlorococcus sp. MIT9313 har en genomstorlek som är mycket lik den hos Synechococcus sp. WH8102 (2,4 megabaspar (Mbp)), liksom hos flera andra marina Synechococcus spp. (M. Ostrowski och D. Scanlan, personlig kommunikation), är det rimligt att anta att den gemensamma förfadern till alla Prochlorococcus-arter också hade en genomstorlek kring 2,4 Mbp. Enligt denna hypotes skulle den minskning av genomet som har skett i MED4 motsvara cirka 31 %. Som jämförelse kan nämnas att minskningen av genomet i insektsendosymbionten Buchnera, jämfört med ett rekonstruerat ursprungligt genom, är cirka 77 %. Genomet hos P. marinus SS120 – och i synnerhet MED4-genomet – anses vara nästan minimalt för en fritt levande oxyfototrofisk organism . Det verkar som om minskningen av genomet hos dessa organismer förmodligen inte kan fortsätta under en viss gräns, som motsvarar en genpool som innehåller alla viktiga gener för biosyntetiska vägar och hushållsfunktioner (förmodligen inklusive de flesta av de 1 306 fyrvägsortologer som identifierats i denna studie) plus ett antal andra gener, inklusive genusspecifika såväl som nischspecifika gener. MED4 kodar till exempel för ett antal fotolyasrelaterade proteiner, några specifika ABC-transportörer (till exempel för cyanat, och data visas inte). Dessa specifika föreningar kan vara kritiska för överlevnad i det övre vattenskiktet, som får höga fotonflöden, UV-ljus och är näringsfattigt, men mindre viktiga för livet djupare ner i vattenkolumnen.
Om både Prochlorococcus-linjer och värdberoende organismer har genomgått en genomreduktion som är förknippad med accelererande substitutionshastigheter, måste dessa fenomen ha uppstått av mycket olika orsaker eftersom de resulterande genrepertoarerna hos de två typerna av organismer skiljer sig enormt mycket åt. Genomevolutionen hos endosymbionter och obligatoriska patogener drivs faktiskt av två huvudprocesser som har ömsesidigt förstärkande effekter på genomstorlek och utvecklingshastighet. Eftersom dessa bakterier är instängda i sin värd har de små populationsstorlekar och flaskhalsar regelbundet vid varje värdgeneration eller vid varje ny värdinfektion. Följaktligen upplever de en stark genetisk drift som innebär en ökning av substitutionsfrekvensen. Denna acceleration resulterar i en slumpmässig ackumulering av svagt skadliga mutationer i proteinkodande gener och i rRNA-gener . Denna genetiska drift förstärker minskningen av genomet genom inaktivering och sedan eliminering av potentiellt fördelaktiga men överflödiga gener. Bland dessa har det funnits ett antal DNA-reparationsgener, vars försvinnande skulle ha kunnat öka mutationsfrekvensen ytterligare . Dessutom kan ett antal gener utsättas för en avmattning av det renande urvalet som därmed blir mindre effektivt när det gäller att bibehålla genens funktion. Denna avmattning påverkar särskilt gener som har blivit oanvändbara eftersom de är överflödiga i sitt värdgenom, t.ex. gener som är inblandade i biosyntesen av aminosyror, nukleotider, fettsyror och t.o.m. ATP . Selektionstrycket minskar också för gener som är involverade i miljöavkänning och regleringssystem, t.ex. tvåkomponentsystem, på grund av den mycket buffrade miljö som värddjuret erbjuder.
I det fritt levande släktet Prochlorococcus innebär den mycket stora storleken på fältpopulationerna att dessa populationer utsätts för en mycket lägre genetisk drift och att deras genom är föremål för ett mycket starkare renande urval än vad som är fallet med endosymbionter och patogener. Följaktligen är den observerade accelererade evolutionstakten troligen bara ett resultat av den ökade mutationsfrekvensen, som i sin tur troligen beror på förlusten av DNA-reparationsgener, även om man bör notera att det i P. marinus SS120 endast saknas två sådana gener (tabell 3). Vi observerade en liknande acceleration av aminosyrasubstitutioner för alla funktionella kategorier (figur 4). Detta fynd stämmer bättre överens med en global ökning av mutationshastigheten än med avslappnat urval, eftersom det sistnämnda sannolikt inte skulle förekomma i samma utsträckning på alla loci. Vi antar också att de flesta aminosyresubstitutioner som har förekommit i Prochlorococcus-proteiner är neutrala, det vill säga att de inte har förändrat proteinets funktion. Populationer av HL-kladen, som i likhet med MED4 har de mest härledda proteinsekvenserna av alla Prochlorococcus-arter, tycks vara de vanligaste fotosyntetiska organismerna i det övre skiktet av de tempererade och mellantropiska oceanerna. En sådan ekologisk framgång skulle knappast vara möjlig för organismer som är handikappade av ett stort antal lätt skadliga mutationer, särskilt med tanke på att de flesta gener är enkelkopierade och att det därför i allmänhet inte är möjligt att kompensera genfunktionen. Effekten av upprätthållandet av en hög nivå av renande urval för att motverka skadliga substitutioner är särskilt tydlig i rRNA-generna. I motsats till de proteinkodande generna visade tester av den relativa hastigheten inga signifikanta skillnader i 16S rRNA-genernas utvecklingshastighet i de fyra marina picocyanobakteriegenomerna, och det finns således inga bevis för att vare sig SS120 eller MED4 skulle kunna ha ackumulerat mutationer som destabiliserar den sekundära strukturen hos deras 16S rRNA-molekyl. En anmärkningsvärd konsekvens av den accelererande evolutionstakten för proteinkodande gener i Prochlorococcus är att fylogenetiska rekonstruktioner baserade på proteinsekvenser är snedvridna. Detta leder faktiskt till mycket längre grenar för dessa två stammar än för MIT9313. Den resulterande trädtopologin stöder oftast inte den som erhålls med 16S rRNA-genen, för vilken hypotesen om den molekylära klockan håller enligt våra analyser. Således är rRNA-generna sannolikt bland de få gener som ger tillförlitliga uppskattningar av de fylogenetiska avstånden mellan Prochlorococcus-stammar.
Om det varken är en avmattning av det renodlande urvalet eller en ökning av den genetiska driften som har varit den viktigaste faktorn som har orsakat Prochlorococcus’ minskning av arvsmassan, är en alternativ möjlighet att det sistnämnda skulle kunna vara ett resultat av en selektiv process som gynnar Prochlorococcus’ anpassning till sin miljö. Den uppenbart bättre ekologiska framgången i oligotrofa områden för Prochlorococcus-arter jämfört med deras nära släkting Synechococcus tyder starkt på att minskningen av Prochlorococcus genomstorlek skulle kunna ge de förstnämnda en konkurrensfördel. Omfattande jämförelser av genkomplementen hos dessa två organismer visar mycket få exempel – åtminstone bland de gener vars funktion är känd – på förekomsten av specifika gener i MED4 som skulle kunna förklara dess bättre anpassning (data visas inte). Ett anmärkningsvärt undantag är förekomsten i Prochlorococcus, men inte i Synechococcus, av flavodoxin och ferritin, två proteiner som möjligen ger Prochlorococcus bättre motståndskraft mot järnstress. I övrigt verkar Synechococcus mer som en generalist, särskilt när det gäller upptag och assimilering av kväve eller fosfor , och borde a priori vara mer lämpad för att upprätthålla konkurrensen. Vi antar därför att nyckeln till Prochlorococcus framgång mindre ligger i utvecklingen av ett specifikt komplex eller en specifik väg för att klara sig bättre under ogynnsamma förhållanden än i förenklingen av dess genom och cellorganisation, vilket kan göra det möjligt för denna organism att göra betydande besparingar på energi och material för cellunderhåll.
Den blotta minskningen av genomets storlek i sig är en potentiell källa till betydande besparingar för cellen, eftersom den minskar mängden kväve och fosfor, två särskilt begränsande grundämnen i den övre delen av havet, som är nödvändiga till exempel för DNA-syntesen. En annan fördel är att det möjliggör en samtidig minskning av cellvolymen. Det har tidigare föreslagits (se t.ex. ) att en liten cellvolym för en växtplanktonisk organism ger två selektiva fördelar genom att minska självskuggningen (paketeffekten) och genom att öka förhållandet mellan cellens yta och volym, vilket kan förbättra upptaget av näringsämnen. Den första fördelen skulle förbättra LL-stammarna, medan den andra skulle ge en fördel för HL-stammarna som lever i näringsfattiga ytvatten. Slutligen är celldelningen mindre kostsam för en liten än för en stor cell. På grundval av dessa observationer antar vi att den viktigaste drivkraften för genomreduktion inom Prochlorococcus-strålningen har varit urvalet för en mer ekonomisk livsstil. Förskjutningen mot ett A+T-rikt genom i MED4 och SS120 är också förenlig med denna hypotes, eftersom den kan ses som ett sätt att spara på kväve. Ett AT-baspar innehåller nämligen sju atomer kväve, en mindre än ett GC-baspar.
Med denna hypotes i åtanke föreslår vi ett möjligt scenario för evolutionen av Prochlorococcus genomer. Om man använder en 16S rRNA-divergenshastighet på 1 % per 50 miljoner år , kan man uppskatta att differentieringen av dessa två släkten är så nyligen som 150 miljoner år, eftersom hypotesen om den molekylära klockan gäller för denna gen i Prochlorococcus och Synechococcus. De ursprungliga Prochlorococcus-cellerna måste ha utvecklats i LL-nischen, en nisch som troligen lämnats fri av andra picocyanobakterier. Med tanke på den avsevärda skillnaden i genomstorlek mellan LL-stammarna MIT9313 och SS120 verkar det som om själva minskningen av genomet måste ha påbörjats i en (eller möjligen flera) linje(n) inom LL-nischen någon gång efter det att Prochlorococcus differentierats från sin gemensamma förfader med marina Synechococcus-arter. Varför urvalet har påverkat endast en (eller några?) och inte alla Prochlorococcus-linjer är fortfarande oklart. En undersökning av genrepertoaren hos P. marinus SS120 tyder på att denna minskning av genomet måste ha gällt en slumpmässig förlust av överflödiga gener från många olika vägar. Vid någon tidpunkt under evolutionen har vissa gener som är involverade i DNA-reparation påverkats; dessa skulle inkludera ada-genen, som kan vara ansvarig för skiftet i bassammansättningen, men också möjligen flera andra, som inte nödvändigtvis är involverade i reparation av GC- till AT-mutationer (se tabell 3). Förlusten av dessa gener kan ha lett till en ökning av mutationshastigheten och därmed av evolutionstakten för proteinkodande gener, tillsammans med en snabbare krympning av genomet och en förskjutning av bassammansättningen mot AT. Det är värt att notera att en trolig konsekvens av denna kompositionsförskjutning i hela genomet är frånvaron av den adaptiva kodonbias i genomerna hos Prochlorococcus-arterna MED4 och SS120. AT-rika kodoner används företrädesvis oavsett aminosyra (figur 3a). Kodonanvändningen i dessa genom tycks alltså mer återspegla den lokala baskompositionsfördelningen än urvalet för en effektivare översättning genom användning av optimala kodoner. Samma slutsats har dragits för andra små genomer med högt A+T-innehåll .
Senare under evolutionen (för cirka 80 miljoner år sedan, enligt graden av 16S rRNA-sekvensdivergens mellan MED4 och SS120) måste en LL-population, som troligen redan hade en betydligt minskad cell- och genomstorlek, successivt ha anpassat sig till HL-nischen och slutligen återkoloniserat det övre lagret. Hur denna förändring av den ekologiska nischen var möjlig är fortfarande svårt att definiera. En jämförelse av den genuppsättning som skiljer sig åt mellan den LL-anpassade SS120 och den HL-anpassade MED4 visar att mycket få gener kan vara tillräckliga för att övergå från den ena till den andra nischen, inklusive en multiplikation av hli-gener och ett differentiellt bibehållande av gener som fanns i Prochlorococcus och Synechococcus gemensamma förfader (t.ex. de fotolyaser och cyanattransportörer som nämns ovan) och som i andra hand försvann i de LL-anpassade linjerna.