プロクロロコッカス放射光で起こったゲノム減少の過程は、我々の知る限り、他の自由生活原核生物ではこれまで観察されたことがないものである。 プロクロロコッカス属MIT9313のゲノムサイズは、シネココッカス属WH8102(2.4メガベースペア(Mbp))や他のいくつかの海洋シネコッカス属と非常に似ているので(M. Ostrowski and D. Scanlan, personal communication)、すべてのプロクロロコッカスの共通祖先も約2.4Mbpのゲノムサイズだったと考えることは妥当であると思われます。 この仮説のもとでは、MED4で起こったゲノムの減少は約31%に相当する。 一方、昆虫内共生生物Buchneraでは、復元された祖先ゲノムと比較して、ゲノム減少の程度は約77%であった。 P. marinus SS120のゲノム、ひいてはMED4のゲノムは、自由生活する酸素栄養生物としては最小に近いと考えられている。 このような生物では、生合成経路やハウスキーピング機能の必須遺伝子(本研究で同定された1,306個の4ウェイオーソログ遺伝子の大部分を含む)に、属特異的遺伝子やニッチ特異的遺伝子などの多くの遺伝子を加えた遺伝子プールに相当するある限界以下に、ゲノム縮小が進まないのだろうと推測される。 例えば、MED4は、多くの光分解酵素関連タンパク質、いくつかの特定のABCトランスポーター(例えば、シアネート用;およびデータは示していない)をコードしている。 これらの特定の化合物は、高い光束、紫外線を受け、栄養が欠乏している上層水域での生存には重要かもしれないが、水柱の深部の生命にはそれほど重要ではない。
もしプロクロロコッカス系統と宿主依存型生物の両方が、加速した置換率を伴うゲノム減少を受けたとしたら、結果として2種類の生物の遺伝子レパートリーが非常に異なるので、これらの現象は非常に異なる原因によって生じたはずである。 実際、共生生物と義務的病原体のゲノム進化は、ゲノムサイズと進化速度に相互に補強的な影響を及ぼす2つの主要なプロセスによって推進されている。 宿主の体内に閉じ込められているため、これらの細菌は個体数が少なく、宿主の世代ごと、あるいは新たな宿主の感染ごとに定期的にボトルネックとなる。 その結果、置換率の上昇を伴う強い遺伝的ドリフトを経験することになる。 その結果、タンパク質をコードする遺伝子やrRNA遺伝子に、わずかな変異がランダムに蓄積される。 この遺伝的ドリフトは、潜在的に有益だが不要な遺伝子を不活性化し、除去することによってゲノムの縮小化を促進する。 これらの遺伝子の中には、DNA修復遺伝子も多く、これらの遺伝子の消滅は突然変異率をさらに増加させた可能性がある。 さらに、多くの遺伝子は、純化選択の緩和を受け、その結果、遺伝子の機能を維持する効果が低くなっている可能性がある。 この緩和は、アミノ酸、ヌクレオチド、脂肪酸、さらにはATPの生合成に関与する遺伝子など、宿主ゲノムにおいて冗長であるために役に立たなくなった遺伝子に特に影響を与える。 また、2成分系などの環境感知・調節系に関わる遺伝子は、宿主が提供する緩衝環境のため、選択圧が低下する。
自由生活するプロクロロコッカス属では、野外集団のサイズが非常に大きいため、これらの集団は、共生生物や病原体のゲノムよりもはるかに強い純化選択を受けており、遺伝子ドリフトの可能性が低いことを意味している。 その結果、進化速度が加速されたのは、おそらく突然変異率の増加によるものであり、DNA修復遺伝子の消失によるものであると考えられる。 また、すべての機能カテゴリーにおいて、アミノ酸置換が同様に加速されていることが確認された(図4)。 この結果は、緩和された選択というよりも、世界的な突然変異率の上昇と一致する。後者は、すべての遺伝子座で同じ程度に起こるとは考えにくい。 また、プロクロロコッカスのタンパク質で起こったアミノ酸置換のほとんどは、タンパク質の機能を変化させない中立的なものであると仮定している。 実際、MED4と同様にプロクロロコッカス属の中で最も多くのタンパク質配列を持つHLクレードの個体群は、温帯・亜熱帯の海洋上層部で最も豊富な光合成生物であるように思われる 。 このような生態学的な成功は、多数のわずかな突然変異によってハンディキャップを負った生物にはほとんど不可能である。特に、ほとんどの遺伝子が単一コピーであり、遺伝子の機能を補償することは一般に不可能であることを考えると、なおさらである。 高水準の純化選択の維持が劇症的置換を打ち消す効果は、特にrRNA遺伝子において明らかである。 タンパク質コード遺伝子とは異なり、相対速度検定では4つの海洋ピコシアノバクテリアゲノムにおける16S rRNA遺伝子の進化速度に有意差は見られなかった。したがって、SS120とMED4のいずれも、その16S rRNA分子の二次構造を不安定にする変異を蓄積した可能性を示す証拠はない。 プロクロロコッカスでタンパク質をコードする遺伝子の進化速度が加速した結果、タンパク質配列に基づく系統樹復元に偏りが生じていることは注目に値する。 実際、この2つの株では、MIT9313よりもはるかに長い枝を持つことになる。 この結果得られた樹形は、16S rRNA遺伝子で得られた樹形と一致しないことが多く、我々の分析によれば、分子時計仮説が成立している。
プロクロロコッカスゲノム減少の主要因が純化選択の緩和でも遺伝的ドリフトの増加でもないとすれば、後者はプロクロロコッカスの環境への適応を促進する選択過程の結果である可能性も考えられる。 プロクロロコッカス属は、近縁種のシネココッカス属に比べて貧栄養域での生態的成功率が高いことから、プロクロロコッカス属のゲノムサイズ縮小が前者に競争優位をもたらす可能性が強く示唆されています。 実際、この2つの生物の遺伝子を広範囲に比較したところ、少なくとも機能がわかっている遺伝子の中で、MED4の方が適応に優れていることを説明できるような特定の遺伝子が存在する例はほとんどありませんでした(データは示していません)。 注目すべき例外は、プロクロロコッカスにはフラボドキシンとフェリチンが存在するが、シネココッカスにはないことである。この2つのタンパク質は、おそらくプロクロロコッカスに鉄ストレスに対する優れた抵抗力を与えているのだろう。 それとは別に、シネココッカスは、特に窒素やリンの取り込みや同化に関して、よりジェネラリストであるように見え、先験的に、より競争を維持するのに適しているはずである。 したがって、プロクロロコッカスの成功の鍵は、不利な条件にうまく対処するための特定の複合体や経路の開発よりも、ゲノムや細胞組織の簡素化にあると考えられる。これにより、この生物は細胞維持のためのエネルギーや物質を大幅に節約することができるのである。
ゲノムサイズの単なる縮小それ自体は、例えばDNA合成に必要な、海洋上部で特に制限的な2つの元素である窒素とリンの量を減らすため、細胞にとって実質的な経済の源となる可能性があります。 もう一つの利点は、それに伴って細胞の体積を減らすことができることである。 植物プランクトンの場合、細胞体積が小さいと、自己遮蔽が少なくなり(パッケージ効果)、細胞表面と体積の比が大きくなり、栄養分の取り込みがよくなるという2つの選択的利点があることが以前から示唆されている(例えば、「植物プランクトン」)。 最初の利点はLL株の体力を向上させ、2番目の利点は栄養不足の表層水域に生息するHL株に有利に働くと思われる。 最後に、細胞分裂は大きい細胞よりも小さい細胞の方がコストがかからない。 これらのことから、プロクロロコッカス属のゲノムの減少は、より経済的な生活様式を選択することが大きな原動力となったと推測される。 MED4とSS120がA+Tに富むゲノムに偏っているのも、窒素を節約するためと考えられ、この仮説と整合的である。 実際、AT塩基対は7個の窒素原子を含み、GC塩基対より1個少ない。
この仮説を念頭に置き、プロクロロコッカスゲノムの進化のシナリオの可能性を提案する。 16S rRNAの分岐率を5000万年に1%とすると、プロクロロコッカスとシネコッカスのこの遺伝子の分子時計仮説が成立することから、この2属の分化は1億5000万年と最近であると推定される。 プロクロロコッカスの祖先は、他のピコシアノバクテリアが取り残したLLニッチで発展したに違いない。 LL株MIT9313とSS120のゲノムサイズに大きな差があることから、プロクロロコッカスが海洋性シネココッカスとの共通祖先から分化した後、LLニッチ内の1系統(あるいは複数系統)でゲノム減少そのものが始まったと考えられる。 なぜ、プロクロロコッカスの全系統ではなく、1系統(あるいは数系統)だけが淘汰されたのか、その理由はまだ不明である。 P. marinus SS120の遺伝子レパートリーを調べてみると、このゲノム減少には、多くの異なる経路から不要な遺伝子がランダムに失われたことが関係していることがわかった。 進化のある時点で、DNA修復に関わるいくつかの遺伝子が影響を受けた。この中には、塩基組成のシフトに関与していると考えられるada遺伝子や、おそらくGCからATへの変異修復には必ずしも関与していない他のいくつかの遺伝子が含まれている(表3参照)。 これらの遺伝子が失われたことにより、タンパク質コード遺伝子の突然変異率が上昇し、その結果、ゲノムの縮小と塩基組成のATへのシフトがより速く起こったと考えられる。 このゲノム全体の組成シフトの結果として、プロクロロコッカス属MED4とSS120のゲノムに適応的なコドンの偏りが見られなくなったと考えられることは注目に値する。 ATに富むコドンは、アミノ酸が何であれ優先的に使用される(図3a)。 したがって、これらのゲノムにおけるコドンの使用は、最適なコドンを使用することによってより効率的な翻訳を選択するというよりも、局所的な塩基組成の偏りを反映していると思われる。 同じ結論が、A+T含量の高い他の小さなゲノムについても導かれている。
進化の後半(MED4とSS120の16S rRNA配列分岐度からすると約8000万年前)、おそらくすでに細胞やゲノムサイズが著しく小さくなっていたあるLL集団が、徐々にHLニッチに適応し、最終的には上層を再召喚してきたのだろう。 このような生態的ニッチの変化がどのように可能であったかは、まだ定義が困難である。 LLに適応したSS120とHLに適応したMED4の間で異なる遺伝子セットを比較すると、hli遺伝子の増殖や、プロクロロコッカスとシネコッカスの共通祖先に存在しLL適応系統で二次的に失われた遺伝子(上記の光分解酵素やシアン酸トランスポーターなど)の保持の違いなど、ごく少数の遺伝子で一方のニッチから他方へシフトできる可能性があることがわかった
(注)1.