Proces redukcji genomu, który wystąpił w obrębie promieniowania Prochlorococcus, według naszej wiedzy nie był dotychczas obserwowany u żadnego innego wolno żyjącego prokariota. Ponieważ Prochlorococcus sp. MIT9313 ma genom bardzo podobny do Synechococcus sp. WH8102 (2,4 megabazy-pary (Mbp)), jak również kilku innych morskich Synechococcus spp. (M. Ostrowski i D. Scanlan, komunikacja osobista), można przypuszczać, że wspólny przodek wszystkich gatunków Prochlorococcus również miał genom o wielkości około 2,4 Mbp. Zgodnie z tą hipotezą, redukcja genomu, która wystąpiła u MED4 odpowiadałaby około 31%. Dla porównania, stopień redukcji genomu u endosymbionta owadów Buchnera, w porównaniu do zrekonstruowanego genomu przodka, wynosi około 77% . Genom P. marinus SS120 – a tym bardziej genom MED4 – jest uważany za niemal minimalny dla wolno żyjącego organizmu oksyfotroficznego. Wydaje się, że redukcja genomu u tych organizmów prawdopodobnie nie może postępować poniżej pewnego limitu, odpowiadającego puli genów zawierającej wszystkie istotne geny szlaków biosyntezy i funkcji porządkowych (prawdopodobnie łącznie z większością z 1 306 czterokierunkowych genów ortologicznych zidentyfikowanych w tym badaniu) oraz szereg innych genów, w tym genów specyficznych dla danego rodzaju, jak również genów specyficznych dla danej niszy. Na przykład, MED4 koduje pewną liczbę białek związanych z fotoliazą, kilka specyficznych transporterów ABC (na przykład dla cyjanianu; dane nie pokazane). Te specyficzne związki mogą być krytyczne dla przetrwania w górnej warstwie wody, która otrzymuje wysokie strumienie fotonów, promieniowanie UV i jest zubożona w składniki odżywcze, ale mniej dla życia głębiej w słupie wody.
Jeśli zarówno linie Prochlorococcus jak i organizmy zależne od gospodarza przeszły redukcję genomu związaną z przyspieszonym tempem substytucji, zjawiska te musiały powstać z bardzo różnych przyczyn, jako że wynikowy repertuar genów tych dwóch typów organizmów różni się ogromnie. Istotnie, ewolucja genomu endosymbiontów i obligatoryjnych patogenów jest napędzana przez dwa główne procesy, które wzajemnie się wzmacniają, wpływając na rozmiar genomu i tempo ewolucji. Będąc zamkniętymi wewnątrz gospodarza, bakterie te mają niewielkie rozmiary populacji i są regularnie wypierane przez wąskie gardło przy każdym pokoleniu gospodarza lub przy każdym nowym zakażeniu. W konsekwencji, doświadczają one silnego dryfu genetycznego związanego ze wzrostem tempa substytucji. Przyspieszenie to powoduje nagromadzenie w sposób losowy nieznacznie szkodliwych mutacji w genach kodujących białka, jak również w genach rRNA. Ten dryf genetyczny wzmaga zmniejszanie się genomu poprzez inaktywację, a następnie eliminację potencjalnie korzystnych, ale zbędnych genów. Wśród nich znajduje się pewna liczba genów naprawiających DNA, których zniknięcie mogłoby jeszcze bardziej zwiększyć tempo mutacji. Ponadto pewna liczba genów może podlegać rozluźnieniu selekcji oczyszczającej, która w związku z tym staje się mniej skuteczna w utrzymywaniu funkcji genu. To rozluźnienie dotyczy w szczególności genów, które stały się bezużyteczne, ponieważ są nadmiarowe w ich genomie gospodarza, takich jak geny zaangażowane w biosyntezę aminokwasów, nukleotydów, kwasów tłuszczowych, a nawet ATP . Presja selekcyjna jest również zmniejszona dla genów zaangażowanych w wyczuwanie środowiska i systemów regulacyjnych, takich jak systemy dwuskładnikowe, ze względu na znacznie buforowane środowisko oferowane przez gospodarza .
W wolno żyjącym rodzaju Prochlorococcus, bardzo duży rozmiar populacji terenowych oznacza, że populacje te podlegają znacznie niższemu dryfowi genetycznemu, a ich genomy podlegają znacznie silniejszej selekcji oczyszczającej niż endosymbionty i patogeny . W związku z tym obserwowane przyspieszone tempo ewolucji wynika prawdopodobnie jedynie ze wzrostu tempa mutacji, co z kolei jest prawdopodobnie skutkiem utraty genów naprawiających DNA, nawet jeśli zauważyć, że u P. marinus SS120 brakuje tylko dwóch takich genów (tab. 3). Podobną akcelerację substytucji aminokwasowych zaobserwowaliśmy dla wszystkich kategorii funkcjonalnych (Ryc. 4). To odkrycie jest bardziej spójne z globalnym wzrostem tempa mutacji niż z rozluźnioną selekcją, przy czym jest mało prawdopodobne, by ta ostatnia występowała w tym samym stopniu we wszystkich loci. Zakładamy również, że większość substytucji aminokwasowych, które wystąpiły w białkach Prochlorococcus jest neutralna; to znaczy, że nie zmieniły one funkcji białka. Rzeczywiście, populacje kladu HL, które, podobnie jak MED4, mają najbardziej pochodne sekwencje białek spośród wszystkich gatunków Prochlorococcus, wydają się być najliczniejszymi organizmami fotosyntetyzującymi w górnej warstwie umiarkowanych i międzyzwrotnikowych oceanów. Taki sukces ekologiczny nie byłby możliwy dla organizmów upośledzonych przez dużą liczbę lekko szkodliwych mutacji, zwłaszcza biorąc pod uwagę fakt, że większość genów jest jednokopijna, a więc kompensacja funkcji genów jest na ogół niemożliwa. Wpływ utrzymania wysokiego poziomu selekcji oczyszczającej na przeciwdziałanie szkodliwym substytucjom jest szczególnie widoczny w genach rRNA. W przeciwieństwie do genów kodujących białka, testy tempa względnego nie wykazały żadnych istotnych różnic w tempie ewolucji genów 16S rRNA w czterech genomach morskich pikocyanobakterii, a zatem nie ma dowodów na to, że SS120 lub MED4 mogły nagromadzić mutacje destabilizujące strukturę drugorzędową ich cząsteczki 16S rRNA. Jedną z wartych odnotowania konsekwencji przyspieszenia tempa ewolucji genów kodujących białka u Prochlorococcus jest to, że rekonstrukcje filogenetyczne oparte na sekwencjach białkowych są tendencyjne. Rzeczywiście, prowadzi to do znacznie dłuższych gałęzi dla tych dwóch szczepów niż dla MIT9313. Wynikająca z tego topologia drzewa najczęściej nie potwierdza topologii uzyskanej na podstawie genu 16S rRNA, dla którego hipoteza zegara molekularnego jest prawdziwa zgodnie z naszymi analizami. Tak więc, geny rRNA będą prawdopodobnie jednymi z niewielu genów, które dadzą wiarygodne szacunki odległości filogenetycznych między szczepami Prochlorococcus.
Jeśli to nie rozluźnienie selekcji oczyszczającej ani wzrost dryfu genetycznego były głównym czynnikiem powodującym redukcję genomu Prochlorococcus, alternatywną możliwością jest, że ten ostatni może być wynikiem selektywnego procesu sprzyjającego adaptacji Prochlorococcus do środowiska. Pozornie lepszy sukces ekologiczny na obszarach oligotroficznych gatunków Prochlorococcus w porównaniu z ich bliskim krewniakiem Synechococcus , silnie sugeruje, że redukcja rozmiaru genomu Prochlorococcus może zapewnić tym pierwszym przewagę konkurencyjną. Rzeczywiście, obszerne porównania genomów tych dwóch organizmów pokazują bardzo niewiele przykładów – przynajmniej wśród genów, których funkcje są znane – występowania specyficznych genów w MED4, które mogłyby wyjaśnić jego lepsze przystosowanie (dane nie pokazane). Jednym wartym odnotowania wyjątkiem jest obecność u Prochlorococcus, ale nie u Synechococcus, flawoksyny i ferrytyny, dwóch białek, które prawdopodobnie zapewniają Prochlorococcus lepszą odporność na stres żelazowy. Poza tym, Synechococcus wydaje się być bardziej generalistą, w szczególności w odniesieniu do pobierania i asymilacji azotu lub fosforu, i a priori powinien być bardziej przystosowany do podtrzymywania konkurencji. Stąd zakładamy, że klucz do sukcesu Prochlorococcus leży mniej w rozwoju specyficznego kompleksu lub ścieżki, aby lepiej radzić sobie z niekorzystnymi warunkami, niż w uproszczeniu jego genomu i organizacji komórki, co może pozwolić temu organizmowi na znaczne oszczędności energii i materiału do utrzymania komórki.
Samo zmniejszenie rozmiaru genomu per se jest potencjalnym źródłem znacznych oszczędności dla komórki, ponieważ zmniejsza ilość azotu i fosforu, dwóch szczególnie ograniczających elementów w górnej części oceanu, które są niezbędne, na przykład, w syntezie DNA. Inną zaletą jest to, że pozwala na jednoczesne zmniejszenie objętości komórki. Wcześniej sugerowano (zob. np. ), że w przypadku organizmów fitoplanktonowych mała objętość komórki daje dwie selektywne korzyści poprzez zmniejszenie samozaciemniania (efekt pakietowy) oraz poprzez zwiększenie stosunku powierzchni komórki do jej objętości, co może poprawić pobieranie składników odżywczych. Pierwsza korzyść poprawiłaby kondycję szczepów LL, podczas gdy druga zapewniłaby przewagę szczepom HL żyjącym w wodach powierzchniowych ubogich w składniki odżywcze. Wreszcie, podział komórki jest mniej kosztowny dla małej niż dla dużej komórki. Na podstawie tych obserwacji zakładamy, że główną siłą napędową redukcji genomu w obrębie promieniowania Prochlorococcus była selekcja do bardziej ekonomicznego trybu życia. Skłonność do genomu bogatego w A+T w MED4 i SS120 jest również zgodna z tą hipotezą, ponieważ może być postrzegana jako sposób na oszczędzanie azotu. Rzeczywiście, para zasad AT zawiera siedem atomów azotu, o jeden mniej niż para zasad GC.
Mając tę hipotezę na uwadze, proponujemy możliwy scenariusz ewolucji genomów Prochlorococcus. Używając tempa dywergencji 16S rRNA 1% na 50 milionów lat, można oszacować, że zróżnicowanie tych dwóch rodzajów jest tak niedawne jak 150 milionów lat, jak hipoteza zegara molekularnego trzyma się dla tego genu w Prochlorococcus i Synechococcus. Przodkowe komórki Prochlorococcus musiały rozwinąć się w niszy LL, niszy prawdopodobnie pozostawionej wolnej przez inne picocyanobacteria. Biorąc pod uwagę znaczną różnicę w wielkości genomu między szczepami LL MIT9313 i SS120, wydaje się, że sama redukcja genomu musiała rozpocząć się w jednej (lub być może kilku) liniach w niszy LL jakiś czas po zróżnicowaniu Prochlorococcus od wspólnego przodka z morskimi gatunkami Synechococcus. Dlaczego ta selekcja dotknęła tylko jedną (lub niektóre?), a nie wszystkie linie Prochlorococcus, pozostaje niejasne. Badanie repertuaru genów P. marinus SS120 sugeruje, że ta redukcja genomu musiała dotyczyć losowej utraty zbędnych genów z wielu różnych ścieżek. W pewnym momencie ewolucji niektóre geny zaangażowane w naprawę DNA zostały uszkodzone; należy do nich gen ada, który może być odpowiedzialny za zmianę składu zasad, ale także prawdopodobnie kilka innych, niekoniecznie zaangażowanych w naprawę mutacji GC do AT (patrz Tabela 3). Utrata tych genów mogła doprowadzić do wzrostu tempa mutacji, a tym samym tempa ewolucji genów kodujących białka, czemu towarzyszyło szybsze kurczenie się genomu i przesunięcie składu zasad w kierunku AT. Warto zauważyć, że jedną z prawdopodobnych konsekwencji tego przesunięcia kompozycyjnego w całym genomie jest brak adaptacyjnej tendencyjności kodonów w genomach Prochlorococcus species MED4 i SS120. Kodony bogate w AT są preferencyjnie używane niezależnie od aminokwasu (Rysunek 3a). Tak więc, użycie kodonów w tych genomach wydaje się bardziej odzwierciedlać lokalną tendencyjność składu podstawowego niż selekcję dla bardziej wydajnej translacji poprzez użycie optymalnych kodonów. Ten sam wniosek wyciągnięto dla innych małych genomów o wysokiej zawartości A+T.
Później w toku ewolucji (około 80 milionów lat temu, zgodnie ze stopniem dywergencji sekwencji 16S rRNA między MED4 i SS120) jedna z populacji LL, która prawdopodobnie miała już znacznie zredukowany rozmiar komórek i genomu, musiała stopniowo przystosować się do niszy HL i ostatecznie skolonizować górną warstwę. Jak ta zmiana niszy ekologicznej była możliwa, jest wciąż trudne do określenia. Porównanie zestawu genów różniących SS120 przystosowany do LL i MED4 przystosowany do HL wskazuje, że do przejścia z jednej do drugiej niszy mogło wystarczyć bardzo niewiele genów, w tym namnożenie genów hli i zróżnicowane zachowanie genów, które były obecne u wspólnego przodka Prochlorococcus i Synechococcus (takich jak fotolazy i transportery cyjanianu wspomniane powyżej), a zostały wtórnie utracone w liniach przystosowanych do LL.
.