Ergebnisse und Diskussion
Der anabole Shikimisäure-Weg hat sieben Schritte, die von sieben verschiedenen Polypeptiden oder von weniger multifunktionellen Polypeptiden katalysiert werden können (22). Die Enzyme für fünf der Biosyntheseschritte sind in allen Organismen, die über den Stoffwechselweg verfügen, homolog. Für zwei der Schritte sind jeweils zwei verschiedene Enzyme bekannt, und jeder Organismus, der den Stoffwechselweg exprimiert, hat ein Homologes zu einem dieser Enzyme. Darüber hinaus gibt es zwei weitere Überlegungen zum Nachweis von Genen, die für Enzyme des Shikimisäurewegs in N. vectensis kodieren: (i) der evolutionäre Ursprung der Gene ist ungewiss, so dass sich die Sequenzen erheblich von den verwendeten Vergleichssequenzen unterscheiden könnten, und (ii) die genomische Sequenz kann Introns enthalten.
Um eine möglichst hohe Sensitivität der Abfrage zu erreichen, wurde die HMMER-Programmsuite (23) für die Suche nach Konsensus-Proteinsequenzen unter Verwendung von Hidden-Markov-Modell-Profilen verwendet. Diese Methode verleiht evolutionär konservierten Resten ein größeres Gewicht, und lokale Profile zeigen die Proteinfragmente in kodierenden Exons auf. Die Genomsequenz von N. vectensis wurde in alle sechs Leseraster übersetzt und mit Hilfe von neun Profilen durchsucht, die alle sieben Enzyme des Shikimisäure-Stoffwechsels aus der Pfam-Datenbank abdecken (24). Zwei Übereinstimmungen („Treffer“) wurden in großen Gerüsten mit HMMER unter Verwendung der aroA- und aroB-Profile gefunden (SI Dataset 1). Der aroA-Treffer trat in scaffold_33 (1,4 Mbp) auf. Als die vorhergesagte Proteinsequenz für eine BLAST-Suche verwendet wurde, stimmte sie mit dem murA-Genprodukt einer Vielzahl von Bakterien mit ≈40 % Aminosäureidentität überein. Dieses bakterielle Gen kodiert für UDP-N-Acetylglucosamin-1-Carboxyvinyltransferase (SI-Datensatz 2), ein mit aroA (3-Phosphoshikimat-1-Carboxyvinyltransferase) verwandtes Enzym, während das MurA-Enzym an der Biosynthese der Peptidoglykan-Zellwand beteiligt ist. Dieser Befund ließ zunächst vermuten, dass die übereinstimmende Sequenz von einer bakteriellen Kontamination stammen könnte. Eine genaue Untersuchung der HMMER-Ergebnisse zeigte jedoch, dass dem vorhergesagten Protein ≈20 konservierte Aminosäuren am C-Terminus fehlten und dass sich die fehlende Aminosäuresequenz ≈1 kb stromabwärts im Gerüst befand. Ein visueller Vergleich der genomischen Sequenz mit Konsensussequenzen für Introns von Wirbeltieren ergab plausible Spleißstellen (AGGTRA bzw. AGG), die mRNA hervorbringen würden, die für ein murA-Homolog in voller Länge kodiert, das dem Suchprofil sehr nahe kommt. Das Vorhandensein von Introns schließt somit die Frage nach bakteriellen Verunreinigungen oder Symbionten als proximale Quelle dieses Gens aus.
Das 1,4-Mbp-Gerüst, das das aroA-ähnliche Homolog enthält, wurde in allen sechs Leserahmen übersetzt und mit Hilfe von HMMER mit der gesamten Pfam-Bibliothek gescannt. Dieser Prozess zeigte das Vorhandensein einer Vielzahl typischer eukaryotischer Domänen, einschließlich reverser Transkriptase, EGF, kalziumbindender EGF-Domäne, defensinähnlichem Peptid, Aktin und der Gabelkopfdomäne, was wiederum die Idee unterstützt, dass das aroA-ähnliche Homolog im N. vectensis-Genom selbst enthalten ist. Die Sequenz des vorhergesagten Proteins wurde verwendet, um einen phylogenetischen Baum zu erstellen und mit den nächstgelegenen bakteriellen Sequenzen zu vergleichen, die bei der BLAST-Suche gefunden wurden, sowie mit Tenacibaculum sp. MED152 und Escherichia coli W3110 (Abb. 1). Die aroA-ähnliche Sequenz von N. vectensis wurde nicht mit Homologen aus irgendeiner der getesteten Bakteriengruppen geclustert, sondern zeigte eine Sequenzdivergenz zu bakteriellen Sequenzen, die mit der von murA-Genen zwischen verschiedenen Bakteriengruppen vergleichbar ist. Ob dieses Gen in N. vectensis die Biosynthese von Peptidoglykan oder Zwischenprodukten des Shikimatwegs steuert, ist noch nicht bekannt.
Phylogenetischer Baum, der die Beziehung der vorhergesagten Proteinsequenz des N. vectensis aroA-ähnlichen Gens zu den vorhergesagten murA-Proteinsequenzen der sieben besten Treffer in einer BLAST-Analyse und zu denen in E. coli und Tenacibaculum zeigt. Die Abstände wurden anhand eines CLUSTAL W-Alignments unter Verwendung der Jones-Taylor-Thornton-Matrix berechnet, und der Baum wurde mit Hilfe des Nachbarschaftsverbindungsalgorithmus in Programmen des PHYLIP-Pakets (Version 3.63) erstellt. Der Abstand ist das Verhältnis der Aminosäure-Substitutionen.
Das zweite Alignment, das sich auf aroB bezieht, war auf Scaffold-85 (0,8 Mbp) vorhanden. Als die vorhergesagte Proteinsequenz für eine BLAST-Suche verwendet wurde (SI-Datensatz 3), ergab sich die beste Übereinstimmung mit dem Dinoflagellaten Oxyrrhis marina (66 % Aminosäuresequenzidentität). In diesem Dinoflagellaten ist das Enzym aroB (3-Dehydrochinat-Synthase) im Chloroplasten vorhanden und mit einer O-Methyltransferase fusioniert (25). Als die vollständige Sequenz des Fusionsproteins aus O. marina in einer BLAST-Suche gegen die übersetzte DNA von N. vectensis verwendet wurde, zeigte sich, dass auch in N. vectensis ein Fusionsproteingen vorhanden ist (SI-Datensatz 4). Dieses Gen enthält fünf Introns. Als das aroB-Segment des Gens verwendet wurde, um einen phylogenetischen Baum mit den nächstgelegenen BLAST-Treffern zu erstellen (Abb. 2), stellte sich heraus, dass die N. vectensis-Sequenz den Sequenzen von zwei Dinoflagellaten (O. marina und Heterocapsa triquetra) am nächsten liegt, die jeweils das vollständige Fusionsgen besitzen. Auch dieses Gen könnte an der Synthese von Vorläufern beteiligt sein, die zu Sekundärmetaboliten aus dem Shikimatweg führen, insbesondere 3-Dehydrochinat, dem mutmaßlichen Zwischenglied der MAA-Biosynthese (5).
Phylogenetischer Baum, der die Beziehung der abgeleiteten Proteinsequenz des aroB-Teils des AroB-O-Methyltransferase-Proteins von N. vectensis zu homologen Dinoflagellaten-Proteinen zeigt. Die Sequenzen wurden mit CLUSTALW aneinandergereiht, und der Baum wurde mit Hilfe des Algorithmus für die Nachbarschaftsverbindung mit Abständen, die aus dem Jones-Taylor-Thornton-Modell abgeleitet wurden, konstruiert (mit PHYLIP Version 3.63). Der Baum wurde unter Verwendung von Anabaena variabilis als Außengruppe verwurzelt. Die Abstände sind der Anteil der Aminosäure-Substitutionen, und die Bootstrap-Werte auf der Grundlage von 100 Proben sind angegeben.
Da endosymbiotische Dinoflagellaten häufig mit Nesseltieren assoziiert sind, musste die Möglichkeit in Betracht gezogen werden, dass die N. vectensis-Sequenz von einem unentdeckten Dinoflagellaten kontaminiert wurde. Die vorhergesagten Proteinsequenzen, die von den benachbarten Genen auf beiden Seiten des aroB-ähnlichen Homologs stammen, wurden für BLAST-Suchen verwendet. Die engsten Übereinstimmungen gab es mit verschiedenen Wirbeltieren und mit Sequenzen aus dem Seeigel Strongylocentrotus purpuratus, was es unwahrscheinlich macht, dass diese Shikimat-Signalweg-Gene im Genom des Wirtsmetazoen von einer Kontamination durch das Genom eines assoziierten Dinoflagellaten stammen (SI-Datensatz 5). Darüber hinaus wurden drei mutmaßliche Proteinsequenzen aus O. marina für BLAST-Suchen gegen N. vectensis verwendet. Die besten Treffer wurden verwendet, um einen phylogenetischen Baum zu erstellen, und in keinem Fall waren die Sequenzen von N. vectensis und O. marina eng miteinander verwandt (Abb. 3). Es muss jedoch betont werden, dass zusätzliche Beweise erforderlich sind, um die angenommene Funktion dieser Gene zu bestimmen und um nachzuweisen, dass sie durch horizontalen Gentransfer (HGT) in N. vectensis erworben wurden, insbesondere weil Nesseltiere angeblich konservierte Gene haben, die sie von nichtmetazoischen Vorfahren geerbt haben (26). Obwohl die Bedeutung von HGT in der eukaryotischen Evolution umstritten bleibt, gibt es unabhängige Beweise für das Auftreten eines weiteren HGT-Ereignisses in N. vectensis. Eine vergleichende genomische Untersuchung von Enzymen des Glyoxylatzyklus hat den wahrscheinlichen Transfer einer bifunktionellen Isocitratlyase (ICL) und einer MS, die von einem fusionierten ICL-MS-Gen aus einem bakteriellen Vorläufer kodiert wird, in das N. vectensis-Genom ergeben (27). Unsere Ergebnisse ähneln denen anderer Untersuchungen, die einen Gentransfer auf Süßwasser-Nesseltierarten (Hydra) von mehreren eukaryotischen Vorläufern belegen (18, 28).
Phylogenetischer Baum der PCNA-Proteinsequenzen. Die Sequenz des PCNA-Proteins von O. marina wurde für eine BLAST-Suche gegen die übersetzten genomischen Sequenzen von N. vectensis verwendet. Die BLAST-Alignments wurden verwendet, um die Proteinsequenz von N. vectensis zusammenzusetzen. Die Sequenzen der beiden Arten wurden für BLAST-Suchen in GenBank verwendet, und eine Auswahl der besten Treffer für jede Art wurde verwendet, um einen phylogenetischen Baum mit Hilfe des Nachbarschaftsverbindungsalgorithmus in Programmen des PHYLIP-Pakets (Version 3.63) zu erstellen. Der Abstand ist das Verhältnis der Nukleotid-Substitutionen.
Unsere genomische Untersuchung von N. vectensis brachte eine weitere Überraschung zutage, die über den Transfer von Genen aus einem Bakterium und einem Dinoflagellaten in das Genom des Nesseltiers hinausgeht. Wir fanden sieben gute Sequenzalignments, die fünf potenziellen Genen des Shikimisäure-Stoffwechsels entsprechen. Darunter waren vier sehr starke Alignments, die den Genen aroA, aroB, aroC und aroE von E. coli entsprechen (SI Dataset 6). Die vorhergesagten Proteinsequenzen dieser Gene wurden in BLAST-Suchanfragen (29) in der GenBank-Datenbank des National Center for Biotechnology Information (NCBI) verwendet, um verwandte Sequenzen zu finden. In allen vier Fällen waren die besten Übereinstimmungen mit den Genen des Shikimisäure-Stoffwechsels in Flavobakterien, mit ≈70% Aminosäure-Identität (SI-Datensatz 7). In den meisten Fällen war Tenacibaculum sp. MED152, dessen Genom gerade sequenziert wird (www.moore.org/marine-micro.aspx), die beste Übereinstimmung, obwohl eine strikte Ähnlichkeit bei diesem Bakterium durch eine Verzerrung der Datenbank beeinflusst sein könnte. Ein fünftes Gen in N. vectensis entsprach den aroF-H-Genen von E. coli, die für Isoenzyme der 3-Desoxy-d-arabinoheptulosonat-7-phosphat-Synthase (DAHPS) kodieren. BLAST-Suchen ergaben jedoch, dass die besten Treffer (90 % Aminosäure-Identität) die kdsA-Gene von Flavobakterien sind; diese kodieren andere Isoenzyme der DAHPS-Familie, die an der Lipopolysaccharid-Synthese beteiligt sind.
Die hohe Ähnlichkeit der N. vectensis-Gensequenzen mit denen des bakteriellen Shikimat-Stoffwechsels könnte entweder durch ein kürzlich stattgefundenes HGT-Ereignis oder eine bakterielle DNA-Kontamination in den N. vectensis-Genomsequenzen erklärt werden. Die Codon-Nutzung ähnelte eher der von Tenacibaculum als der von N. vectensis. Es wurden zwei Sequenzen identifiziert, bei denen es sich offenbar um signifikante Fragmente bakterieller 16S rRNA-Gene handelt. Eine 16S rRNA-Sequenz (985 bp; SI-Datensatz 8a) zeigte die größte Ähnlichkeit mit Pseudomonas-Sequenzen. Da sie jedoch nicht zu einem Gerüst gehörte, das andere bakterielle Sequenzen enthielt, und keine anderen Pseudomonas-ähnlichen genomischen Sequenzen entdeckt wurden, ist es wahrscheinlich, dass sie von einer Sequenzierungsverunreinigung stammt. Da uns die ursprünglichen Shotgun-Sequenzierungsdaten nicht zur Verfügung standen, konnten wir das N. vectensis-Genom nicht mit Hilfe einer kürzlich veröffentlichten Version des Glimmer-Genannotationstools (http://cbcb.umd.edu/software/glimmer; Ref. 30) analysieren, was eine nützliche Methode gewesen wäre, um den Prozentsatz des Hologenoms zu quantifizieren, der auf kleinen Gerüsten kodiert und daher wahrscheinlich von lebenden Bakterien stammt.
Die andere 16S rRNA-Sequenz gehörte zu einem Gerüst, das auch 23S rRNA-Sequenzen in einer für rRNA-Operons typischen Anordnung enthielt (720 bp; SI-Datensatz 8b ), und ein phylogenetischer Baum des 16S rRNA-Teils (Abb. 4) zeigte, dass er von einem Flavobakterium stammte, konnte aber keiner bekannten Gattung zugeordnet werden. Phylogenetische Bäume wurden auch für die aroA-, aroB-, aroC- und aroE-Sequenzen erstellt, mit ähnlichen Ergebnissen. Eine weitere Überlegung war, dass ein Großteil des Genoms von N. vectensis in großen Gerüsten organisiert war, während diese 16S rRNA-Fragmente in kleinen Gerüsten vorhanden waren, aus denen kurze Contigs sequenziert wurden, so dass nur unvollständige Gensequenzen aufgedeckt wurden. Dieses Ergebnis lieferte den ersten Hinweis darauf, dass diese 16S rRNA-Fragmente möglicherweise von bakterieller Kontamination und nicht von genomischer DNA von N. vectensis im engeren Sinne stammen. Im Rahmen des Tenacibaculum-Genomprojekts wurden die meisten Gene identifiziert, und die 2.679 vorhergesagten Proteinsequenzen aus der Genomannotation wurden für eine BLAST-Suche gegen übersetzte N. vectensis-DNA verwendet. Bei Verwendung eines strengen Erwartungswerts von <10-30 ergaben 509 der Tenacibaculum-Sequenzen (19 %) positive Treffer. Ein weniger strenger Cutoff-Wert (10-10) ergab jedoch 1.563 (58 %) Treffer. In vielen dieser Fälle waren die höheren erwarteten Werte mit Teilsequenzen verbunden, da die Treffer in kleineren Gerüsten mit kleinen Contigs lagen und viele Basen in den Gerüsten nicht bestimmt werden konnten. Tatsächlich befanden sich die aroE- und kdsA-Gene an den Enden von Contigs, so dass ihre Sequenzen abgeschnitten waren und die letzten 40 bzw. 25 aa fehlten. Obwohl eine versehentliche Kontamination der ursprünglichen N. vectensis-Vorlage nicht ausgeschlossen werden kann, besteht die spannende Möglichkeit, dass die Sequenzen von einem bisher unvermuteten flavobakteriellen Assoziierten stammen, der Tenacibaculum ähnlich ist.
Phylogenetischer Baum, der die Beziehung der in der N. vectensis-Genomsequenz gefundenen 16S rRNA-Gensequenz (720-bp-Fragment im Eintrag c429301624.Contig1 von StellaBase, http://evodevo.bu.edu/stellabase; SI-Datensatz 8a ) zu den Sequenzen der nächstgelegenen Typstämme im Ribosomal Data Base Project II (Release 9.52; http://rdp.cme.msu.edu) zeigt. Die Abstände wurden anhand eines CLUSTAL W-Alignments unter Verwendung des F84-Modells berechnet, und der Baum wurde wie in Abb. 3 konstruiert.
Es gibt eine unabhängige Unterstützung für unsere Behauptung, dass die vorstehenden Sequenzen im veröffentlichten Genom von N. vectensis von Bakterien stammen könnten, die mit den frühen Entwicklungsstadien der Anemone in Verbindung stehen. Die Autoren des veröffentlichten Genoms von Nematostella vectensis (20) haben in ihrem Online-Material (Supplement S2 in www.sciencemag.org/cgi/content/full/317/5834/86/DC1) ausdrücklich darauf hingewiesen, dass sie die genomische DNA aus Larven präpariert haben, um eine Kontamination durch Kommensalen oder Symbionten zu vermeiden, die für die adulten Tiere berichtet wurden, obwohl sie für die letztgenannte Behauptung keinen Hinweis auf solche Assoziierten gegeben haben. Trotz dieser Vorsichtsmaßnahme gibt es separate Befunde, dass DNA-Isolate aus Embryonen und frühen Planula-Larven dieser Seeanemone 16S rRNA-Sequenzen enthalten, die aus PCR-Amplikons gewonnen wurden, die Bakterien zugeschrieben werden, einschließlich solcher aus denselben Gruppen (Flavobakterien und Pseudomonas), über die wir hier berichten (H. Marlow und M. Q. Martindale, persönliche Mitteilung).
Bakterielle Assoziierte von Nesseltieren sind seit mindestens 30 Jahren bekannt (z. B., Ref. 31 und 32), und in jüngster Zeit wurden sie mikroskopisch als Epibionten und Endosymbionten in zwei Arten von Süßwasser-Hydra (33) und als umhüllte Aggregate in Höhlen zwischen ektodermalen Zellen der nominell nicht symbiotischen Seeanemone Metridium senile (34) sichtbar gemacht. Eine solch enge Verbindung mit metazoischen Zellen ohne äußere physische Barriere bietet sich für direkte Wirt-Mikroben-Interaktionen an, die sich in Form von Pathogenität bei Korallen (35), der Entwicklung der Immunantwort bei Nesseltieren (33) und einer engen symbiotischen Integration bis hin zu HGT von Bakterien auf Nesseltiere, wie hier gezeigt, manifestieren. Über die biosynthetische oder andere metabolische Funktion von Bakterien, die mit Nesseltieren symbiotisch leben, ist praktisch nichts bekannt, ein Thema, das wie so viele andere in der modernen Meeresmikrobiologie untersucht werden sollte.
HGT zwischen Bakterien und bestimmten Metazoen (Ekdysozoen, einschließlich Insekten und Nematoden) wurde kürzlich von Baldo et al. (36) als weiter verbreitet nachgewiesen als angenommen. Sie wiesen darauf hin, dass bakterielle Sequenzen bisher als Verunreinigung angesehen und bei Projekten zur Sequenzierung eukaryontischer Genome systematisch ausgeschlossen wurden, wodurch möglicherweise die Bedeutung einer solchen Übertragung bei verschiedenen wirbellosen Tieren verschleiert wurde. Zuvor war die Genomsequenz des bakteriellen Endosymbionten Carsonella ruddii, der in Blattläusen vorkommt, veröffentlicht worden (37, 38). Ein Vergleich dieser Genomsequenz mit der eines anderen bakteriellen Endosymbionten von Blattläusen, Buchnera aphidicola, zeigte, dass in beiden Genomen beträchtliche Deletionen stattgefunden hatten, einschließlich des Verlusts einiger Gene, die für wesentliche Stoffwechselwege kodieren. Ein solcher fehlender Stoffwechselweg, der zur Bildung der aromatischen Aminosäure Tryptophan in C. ruddii führt, erregte unsere Aufmerksamkeit. Nach dem Dogma (10) sollten Vorstufen dieser essenziellen Aminosäure über den Shikimisäure-Weg in den kommensalen Bakterien synthetisiert werden. Auch in diesen Bakteriengenomen suchten wir in globalen Sequenzalignments nach Genen, die für Enzyme des Shikimisäure-Weges kodieren. Wir fanden ein Gen, das für eine mutmaßliche 5-Enolpyruvylshikimat-3-phosphat-Phospholyase in C. ruddii ein Gen, das für eine mutmaßliche 5-Enolpyruvylshikimat-3-Phosphat-Phospholyase kodiert (ob dieses Gen ein funktionelles Produkt transkribiert, ist jedoch aufgrund der großen Anzahl von Stoppcodons in der Sequenz fraglich), und nur drei (die für Shikimat-5-Dehydrogenase, 5-Enolpyruvylshikimat-3-Phosphat-Phospholyase und 5-Enolpyruvylshikimat-3-Phosphat-Synthase kodieren) der sieben Gene für den Stoffwechselweg wurden im Genom von B. aphidicola gefunden (SI-Datensatz 9). Zusammen mit unseren Ergebnissen für den mutmaßlichen Tenacibaculum-ähnlichen Symbionten und seinen Wirt N. vectensis deutet dies stark darauf hin, dass der Verlust wesentlicher Stoffwechselfunktionen im Endosymbionten ein fortlaufender Prozess des Gentransfers und der Deletion in der Evolution von Symbiosen ist, der schließlich zum Aussterben des Symbionten durch fortschreitende Assimilation seines genetischen Materials in das Wirtsgenom führen könnte (37, 38).
Die Aufklärung „gemeinsamer Stoffwechselanpassungen“, bei denen die Produktion essentieller Metaboliten einen Beitrag der Partner einer Symbiose erfordert (selbst wenn einer von ihnen degeneriert ist), erfordert eine weitere genomische Untersuchung der einzigartigen Organisation und molekularen Funktionsweise von wirbellosen mikrobiellen Symbiosen. Dies wird durch unsere Entdeckung unterstrichen, dass zwei der Gene für Enzyme des Shikimis-Wegs, von denen man klassischerweise sagt, dass sie bei „Tieren“ fehlen, im Genom des metazoischen Wirts kodiert werden. Inwieweit ein solcher HGT oder die Beteiligung unvermuteter bakterieller Partner für die in der Einleitung beschriebenen offensichtlichen Stoffwechselanomalien bei Nesseltieren verantwortlich sein könnte, bedarf weiterer Untersuchungen. Das Verständnis dieser Prozesse könnte darüber hinaus einen entscheidenden Einblick in die Ursache von Stoffwechselstörungen geben, die durch Klimawandel und Umweltstress hervorgerufen werden, insbesondere in den empfindlichen Symbiosen tropischer Korallen und anderer mariner Nesseltiere.