Results and Discussion
同化シキミ酸経路は7段階あり、7種類のポリペプチドで触媒することも、より少ない多機能ポリペプチドで触媒することもある(22). このうち、5段階の生合成酵素は、この経路を持つすべての生物で相同性がある。 2つのステップについては、それぞれ2種類の酵素が知られており、その経路を発現するすべての生物は、これらの酵素のいずれかに対して相同性を有している。 さらに、N. vectensisのシキミ酸経路酵素をコードする遺伝子を検出する上で、さらに2つの考慮すべき点がある。 (i) 遺伝子の進化的起源は不確かであるため、使用した比較配列からかなり分岐している可能性があること、(ii) ゲノム配列にイントロンが含まれている可能性があること。
尋問の感度を最大限に高めるため、HMMERプログラム群(23)を使用して、隠れマルコフモデルプロファイルを使用してタンパク質共通配列の検索を行った。 この方法は、進化的に保存された残基により大きな重みを与え、局所的なプロファイルはコーディングエクソン内のタンパク質断片を明らかにする。 N. vectensisのゲノム配列を6つのリーディングフレームで翻訳し、Pfamデータベース(24)から得たシキミ酸経路の7つの酵素をすべて網羅した9つのプロファイルを用いて検索を行った。 aroAとaroBのプロファイルを用いたHMMERでは、大きなスキャフォールドに2つのアラインメント(「ヒット」)が見つかった(SI Dataset 1)。 aroAのヒットはscaffold_33 (1.4Mbp)で発生した。 この予測されたタンパク質配列をBLAST検索に用いたところ、様々なバクテリアのmurA遺伝子産物と≈40%のアミノ酸同一性で整列した。 この細菌遺伝子は、aroA (3-phosphoshikimate 1-carboxyvinyltransferase) に関連する酵素であるUDP-N-acetylglucosamine 1-carboxyvinyltransferase (SI Dataset 2) をコードし、一方、MurA酵素はペプチドグリカンの細胞壁の生合成に関与していることが判明した。 この結果は、当初、この配列がバクテリアの汚染に由来する可能性を示唆するものであった。 しかし、HMMERの結果を詳細に調べたところ、予測されるタンパク質はC末端に≈20個の保存アミノ酸を欠き、その欠落したアミノ酸配列は足場の≈1 kb下流に位置していることが判明した。 ゲノム配列と脊椎動物のイントロンのコンセンサス配列を視覚的に比較したところ、もっともらしいスプライスサイト(それぞれAGGTRAとAGG)が見つかり、検索プロファイルにほぼ適合した完全長のmurAホモログをコードするmRNAが生成されるだろうことがわかった。
aroA-like ホモログを含む 1.4Mbp のスキャフォールドを 6 つのリーディングフレームすべてで翻訳し、HMMER を使用して Pfam ライブラリ全体をスキャンした。 この過程で、逆転写酵素、EGF、カルシウム結合EGFドメイン、ディフェンシン様ペプチド、アクチン、フォークヘッドドメインなど、真核生物らしい様々なドメインの存在が示され、aroA様ホモログがN. vectensisゲノムそのものに含まれているという考えが再び支持されることになりました。 予測されたタンパク質の配列をもとに系統樹を作成し、BLAST検索で見つかった最も近い細菌の配列、Tenacibaculum sp. MED152やEscherichia coli W3110と比較した(図1)。 N. vectensisのaroA様配列は、テストしたどの細菌群のホモログともクラスター化せず、異なる細菌群間のmurA遺伝子と同等の細菌配列との配列分岐を示した。 N. vectensisのこの遺伝子がペプチドグリカンやシキミテート経路の中間体の生合成を指令しているかどうかはまだ不明である
N.vectensisのaroA様遺伝子の予測タンパク質配列と、BLAST解析でベストヒットした7つのmurAタンパク質配列、および大腸菌とテナシバクラムの予測タンパク質配列との関係を示す系統樹である。 距離はJones-Taylor-Thornton行列を用いたCLUSTAL Wアライメントから算出し、PHYLIPパッケージのプログラム(バージョン3.63)の近傍結合アルゴリズムを用いて樹を構築した。 1206>
2番目のアラインメントはaroBに関するもので、scaffold-85 (0.8 Mbp)に存在するものであった。 予測されたタンパク質配列をBLAST検索に使用したところ(SI Dataset 3)、最も適合したのは渦鞭毛藻Oxyrrhis marina(アミノ酸配列同一性66%)であった。 この渦鞭毛藻では、葉緑体にaroB酵素(3-デヒドロキナーゼ合成酵素)が存在し、O-メチルトランスフェラーゼと融合している(25)。 O. marinaの融合タンパク質全配列を用いて、N. vectensisの翻訳DNAとのBLAST検索を行ったところ、N. vectensisにも融合タンパク質遺伝子が存在することが明らかになった(SI Dataset 4)。 この遺伝子は5つのイントロンを含んでいる。 この遺伝子のaroBセグメントを用いて、最も近いBLASTヒットで系統樹を構築したところ(図2)、N. vectensisの配列は、それぞれが完全な融合遺伝子を持つ2つの渦鞭毛藻(O. marinaとHeterocapsa triquetra)の配列と最も近いことが判明した。 この遺伝子もまた、シキミ酸経路由来の二次代謝産物、特にMAA生合成の中間分岐点とされる3-デヒドロキナートの合成に関与していると考えられる(5)
N.vectensisのAroB-O-methyltransferaseタンパク質のaroB部分の推定タンパク質配列と、相同な渦鞭毛藻タンパク質との関係を示す系統樹である。 配列はCLUSTALWで整列し、Jones-Taylor-Thorntonモデルから得た距離でneighbor-joiningアルゴリズムを用いて木を構築した(PHYLIP version 3.63使用)。 樹木はAnabaena variabilisをout groupとして根付かせた。 距離はアミノ酸置換の割合で、100サンプルに基づくブートストラップ値を示す。
内生 dinoflagellates は刺胞動物としばしば関連しているので、N. vectensis の配列に未検出の dinoflagellate が混入している可能性を考慮しなければならなかった。 aroB様ホモログの両隣の遺伝子に由来する予測タンパク質配列を用いて、BLAST検索を行った。 このことから、宿主メタゾアンのゲノムに存在するこれらのシキミテート経路遺伝子は、関連する渦鞭毛藻のゲノムによる汚染に由来するとは考えにくい(SI Dataset 5)。 また、O. marina由来の3つの推定タンパク質配列を用い、N. vectensisとのBLAST検索を行った。 その結果、N. vectensisとO. marinaの配列が密接に関連しているケースはなかった(図3)。 しかし、これらの遺伝子がどのような機能を持つのか、また、刺胞動物が非メタゾーンの祖先から受け継いだ保存遺伝子を持つことを証明するためには、さらなる証拠が必要であることを強調しなければならない(26)。 真核生物の進化における水平伝播の重要性についてはまだ議論の余地があるが、N. vectensisでは別の水平伝播事象の発生を示す独立した証拠が存在する。 グリオキシル酸サイクル酵素の比較ゲノム解析により、二重機能性イソクエン酸リアーゼ(ICL)とMS(ICL-MS融合遺伝子)が細菌由来の前駆体からN. vectensisゲノムに転移した可能性が高いことが明らかになった(27)。 我々の発見は、複数の祖先の真核生物パートナーから淡水刺胞動物(ヒドラ)種への遺伝子移入の証拠を報告している他の研究者と同様である(18、28)
PCNAタンパク質配列の系統樹。 O. marinaのPCNAタンパク質の配列を用い、N. vectensisの翻訳ゲノム配列とのBLAST検索を行った。 このBLASTアラインメントを用いて、N. vectensisのタンパク質配列を組み上げた。 この2種の配列をGenBankのBLAST検索に使用し、各生物種の最良のヒットを選択して、PHYLIPパッケージのプログラム(バージョン3.63)の近隣結合アルゴリズムを用いて系統樹を構築した。 1206>
N. vectensisのゲノムマイニングの結果、刺胞動物のゲノムに細菌と渦鞭毛藻の遺伝子が移入していること以外にも、もう一つの驚きを発見することができた。 シキミ酸経路の5つの潜在的な遺伝子に対応する7つの良好な配列のアラインメントを見いだした。 このうち、大腸菌の遺伝子 aroA, aroB, aroC, aroE に対応する4つの非常に強いアラインメントを見出した(SI Dataset 6)。 これらの遺伝子の予測されるタンパク質配列を、米国国立生物工学情報センター(NCBI)のGenBankデータベースに対するBLAST検索クエリ(29)で使用し、関連する配列を明らかにした。 4例とも、フラボバクテリアのシキミ酸経路の遺伝子と≈70%のアミノ酸同一性を持ち、最もよく一致した(SI Dataset 7)。 ほとんどの場合、ゲノム解読中のTenacibaculum sp. MED152(www.moore.org/marine-micro.aspx)が最もよく一致したが、この細菌については、厳密な類似性はデータベースのバイアスに影響される可能性がある。 N. vectensisの5番目の遺伝子は、3-deoxy-d-arabinoheptulosonate-7-phosphate synthase(DAHPS)のアイソザイムをコードする大腸菌のaroF-H遺伝子と対応した。 しかし、BLAST検索の結果、最もよくヒットしたのはフラボバクテリアのkdsA遺伝子で、これらはリポポリサッカライド合成に関与するDAHPSファミリーの他のアイソザイムをコードしていた。
N. vectensisの遺伝子配列と細菌のシキメタ経路の遺伝子との高い類似性は、最近のHGTイベントかN. vectensisゲノム配列に細菌DNAが混入したことによって説明できると思われた。 コドン使用法はN. vectensisよりもむしろTenacibaculumに類似していた。 細菌の16S rRNA遺伝子の重要な断片と思われる配列が2つ同定された。 1つの16S rRNA配列(985 bp; SI Dataset 8a )はPseudomonasの配列に最も近い類似性を示した。 しかし、それは他の細菌配列を含む足場には属さず、また他のPseudomonas様ゲノム配列も検出されなかったので、配列決定時の汚染物質に由来する可能性が高い。 これは、小さなスキャフォールドにコードされたホロゲノムの割合を定量化するのに有効な方法であり、したがって生きた細菌に由来する可能性が高かった。
もう一つの16S rRNA配列は足場に属しており、そこにはrRNAオペロンに典型的な配列で23S rRNA配列も含まれていた(720 bp; SI Dataset 8b )。16S rRNA部分の系統樹(図4)は、それがフラボバクテリアに由来することを示していたが、既知の属には割り当てられないことが判明した。 aroA, aroB, aroC, aroE の各配列についても系統樹を構築したが、同様の結果となった。 さらに、N. vectensisのゲノムの多くは大きな足場に編成されているのに対し、これらの16S rRNA断片は短いコンティグを配列決定した小さな足場に存在するため、不完全な遺伝子配列のみが明らかになった。 この結果は、これらの16S rRNA断片が厳密な意味でのN. vectensisのゲノムDNA由来ではなく、細菌汚染由来である可能性を初めて示唆するものであった。 Tenacibaculumゲノムプロジェクトにより、そのほとんどの遺伝子が同定された。ゲノムアノテーションから予測される2,679のタンパク質配列を用い、翻訳されたN. vectensisのDNAとのBLAST検索を行ったところ、N. vectensisの16S RNA断片は、N. vectensisのゲノムDNAに由来するものであることがわかった。 期待値<10-30という厳しい値を用いたところ、Tenacibaculumの配列のうち509個(19%)が陽性となった。 しかし、より厳密でないカットオフ値(10-10)を用いると、1,563個(58%)のヒットが得られた。 これらの多くの場合、ヒットしたのは小さなコンティグを持つ小さなスキャフォールドで、スキャフォールドの多くの塩基が決定されていないため、高い期待値は部分配列と関連していた。 実際、aroEとkdsA遺伝子はコンティグの末端にあったため、その配列は切り捨てられ、それぞれ最後の40aaと25aaが欠落していた。 N. vectensisの鋳型に偶然混入した可能性は否定できないが、Tenacibaculumに似たこれまで疑われていなかったフラボバクテリアの仲間に由来する配列である可能性は非常に高い。
N. vectensisゲノム配列で見つかった16S rRNA遺伝子配列(StellaBaseのエントリc429301624.Contig1の720bpフラグメント、http://evodevo.bu.edu/stellabase; SI Dataset 8a )とRibosomal Data Base Project II (release 9.52; http://rdp.cme.msu.edu) の最も近いタイプ株の配列の関係を示す系統樹である。
N. vectensisの公開ゲノム中の前述の配列は、イソギンチャクの初期発生段階に関連するバクテリアに由来するのではないかという我々の主張には、独自の裏付けが存在する。 Nematostella vectensisのゲノムを報告した著者らは、その補助オンライン資料(www.sciencemag.org/cgi/content/full/317/5834/86/DC1のSupplement S2)において、成体について報告されている常在菌や共生菌による汚染を避けるために幼生からゲノムDNAを調製したと明言しているが、後者の記述についてはそのような仲間に関する言及がない。 この注意にもかかわらず、このイソギンチャクの胚および初期プラヌラ幼生から分離したDNAには、今回報告したものと同じグループ(FlavobacteriaおよびPseudomonas)を含む細菌に起因するPCRアンプリコンから得られた16S rRNA配列が含まれているという別の知見がある(H. Marlow and M. Q. Martindale, personal communication)
<5597>刺胞動物の細菌の仲間は少なくとも30年前に知られていた(例えば, また、イソギンチャクの外皮細胞間の洞窟に包まれた集合体として可視化された(34)。 このような外部の物理的障壁を持たない後生動物細胞との密接な関係は、サンゴにおける病原性(35)、刺胞動物における免疫反応の発達(33)、そして今回示したようなバクテリアから宿主刺胞動物へのHGTに至った密接な共生統合など、さまざまに現れる宿主と微生物の直接的相互作用を可能にするものである。
Baldo ら (36) は最近、細菌と特定の後生動物 (昆虫や線虫を含む生態動物) との間の HGT が予想以上に広く行われていることを明らかにした。 彼らは、バクテリアの配列は以前は汚染とみなされ、真核生物のゲノム配列決定プロジェクトで組織的に除外されており、多様な無脊椎動物におけるこのような移動の重要性を隠している可能性があると指摘している。 先に、アブラムシに見られる細菌内共生体Carsonella ruddiiのゲノム配列が公開された(37, 38)。 このゲノム配列を、アブラムシのもう一つの細菌共生体であるBuchnera aphidicolaのゲノム配列と比較したところ、どちらのゲノムも、必須代謝経路をコードするいくつかの遺伝子を失うなど、かなりの欠失が起こっていることがわかった。 C. ruddiiでは、芳香族アミノ酸であるトリプトファンの生成につながる経路が失われていることが注目された。 ドグマ(10)によれば、この必須アミノ酸の前駆体は、常在菌のシキミ酸経路で合成されるはずである。 今回も、これらの細菌のゲノムから、シキミ酸経路の酵素をコードする遺伝子をグローバル配列アラインメントで検索した。 その結果、5-enolpyruvylshikimate-3-phosphate phospholyaseをコードする推定遺伝子を1つ、C. aphidicolaゲノムには7つのシキミ酸経路遺伝子のうち3つ(シキミ酸5-デヒドロゲナーゼ、5-エノルピルビルシキミ酸3-リン酸ホスホリアーゼ、5-エノルピルビルシキミ酸3-リン酸合成酵素)だけが存在した(SI Dataset 9)。 この結果は、テナガバチのような共生生物とその宿主N. vectensisに関する我々の知見と合わせると、共生生物の進化において、共生生物に必須の代謝機能の喪失は、遺伝子移動と欠失の進行過程であり、最終的には共生生物の遺伝物質の宿主ゲノムへの同化が進行し絶滅に至る可能性を強く示唆している(37, 38)。
必須代謝産物の生産に共生のパートナー(一方が退化していても)が投入される「共有代謝適応」の解明には、無脊椎動物-微生物共生のユニークな組織と分子機能をさらにゲノム解析することが必要です。 このことは、古典的に「動物」には存在しないと言われてきたシキミ経路の酵素遺伝子のうち2つが、メタゾーンの宿主のゲノムにコードされていることを発見したことで強調された。 冒頭で述べた刺胞動物の代謝異常が、どの程度までこのようなHGTや細菌の関与によって説明できるのか、さらなる調査が必要である。 これらの過程を理解することは、気候変動や環境ストレスによって引き起こされる代謝機能不全の原因、特に熱帯サンゴや他の海洋刺胞動物の壊れやすい共生の原因について、重要な洞察を与えてくれるかもしれない
。