Resultaten en discussie
De anabole shikiminezuurroute heeft zeven stappen, die gekatalyseerd kunnen worden door zeven verschillende polypeptiden of door minder multifunctionele polypeptiden (22). De enzymen voor vijf van de biosynthetische stappen zijn homoloog in alle organismen die de pathway bezitten. Voor twee van de stappen zijn er telkens twee verschillende enzymen bekend, en elk organisme dat de pathway tot expressie brengt, heeft een homoloog van een van deze enzymen. Bovendien zijn er twee extra overwegingen bij het opsporen van genen die coderen voor enzymen van de shikiminezuurroute in N. vectensis: (i) de evolutionaire oorsprong van de genen zou onzeker zijn, zodat de sequenties aanzienlijk zouden kunnen zijn afgeweken van alle gebruikte vergelijkingssequenties en (ii) de genoomsequentie kan introns bevatten.
Om de grootste gevoeligheid van de ondervraging te verkrijgen, werd de HMMER suite van programma’s (23) gebruikt om te zoeken naar consensus-eiwitsequenties door gebruik te maken van verborgen Markov modelprofielen. Deze methode geeft een groter gewicht aan evolutionair geconserveerde residuen, en lokale profielen onthullen de eiwitfragmenten in coderende exonen. De genoomsequentie van N. vectensis werd vertaald in alle zes leesramen en doorzocht met behulp van negen profielen die alle zeven enzymen van de shikiminezuurroute omvatten, verkregen uit de Pfam-database (24). Twee uitlijningen (“hits”) werden gevonden in grote scaffolds met HMMER met gebruikmaking van de aroA en aroB profielen (SI Dataset 1). De aroA hit vond plaats in scaffold_33 (1.4 Mbp). Wanneer de voorspelde eiwitsequentie werd gebruikt voor een BLAST-zoekopdracht, het uitgelijnd met het murA-gen product van een verscheidenheid van bacteriën met ≈40% aminozuur identiteit. Dit bacteriële gen codeert voor UDP-N-acetylglucosamine 1-carboxyvinyltransferase (SI Dataset 2), een enzym dat verwant is aan aroA (3-phosphoshikimate 1-carboxyvinyltransferase), terwijl het MurA enzym betrokken is bij de biosynthese van de peptidoglycaan celwand. Deze bevinding suggereerde aanvankelijk dat de uitgelijnde sequentie afkomstig zou kunnen zijn van bacteriële besmetting. Nader onderzoek van de HMMER-resultaten toonde echter aan dat het voorspelde eiwit ≈20 geconserveerde aminozuren aan de C-terminal miste, en dat de ontbrekende aminozuursequentie zich ≈1 kb stroomafwaarts in de scaffold bevond. Visuele vergelijking van de genoomsequentie met consensus sequenties voor vertebrate introns onthuld plausibele splice sites (AGGTRA en AGG, respectievelijk) dat zou produceren mRNA coderen voor een full-length murA homoloog met een nauwe pasvorm aan de zoekopdracht profiel. De aanwezigheid van introns elimineert dus de kwestie van bacteriële contaminanten of symbionten als de proximale bron van dit gen.
De 1.4-Mbp scaffold die de aroA-achtige homoloog bevat werd vertaald in alle zes leesramen en gescand door gebruik te maken van HMMER met de gehele Pfam bibliotheek. Dit proces toonde de aanwezigheid van een verscheidenheid aan typische eukaryotische domeinen, waaronder reverse transcriptase, EGF, calcium bindend EGF domein, defensine-achtig peptide, actine, en het vork-kop domein, wat opnieuw het idee ondersteunt dat de aroA-achtige homoloog in het N. vectensis genoom zelf aanwezig is. De sequentie van het voorspelde eiwit werd gebruikt om een fylogenetische boom te construeren ter vergelijking met de dichtstbijzijnde bacteriële sequenties gevonden in de BLAST-zoekopdracht en met Tenacibaculum sp. MED152 en Escherichia coli W3110 (Fig. 1). De aroA-achtige sequentie van N. vectensis clusterde niet met homologe sequenties van enige geteste groep bacteriën, maar vertoonde een sequentie-divergentie ten opzichte van bacteriële sequenties die vergelijkbaar is met die van murA-genen tussen verschillende bacteriële groepen. Of dit gen in N. vectensis de biosynthese van peptidoglycaan of tussenproducten van de shikimate pathway leidt is nog onbekend.
Phylogenetische boom toont de relatie van de voorspelde eiwitsequentie van het N. vectensis aroA-achtige gen tot de voorspelde murA eiwitsequenties van de zeven beste hits in een BLAST analyse en tot die in E. coli en Tenacibaculum. Afstanden werden berekend uit een CLUSTAL W alignment met behulp van de Jones-Taylor-Thornton matrix, en de boom werd geconstrueerd met behulp van de neighbor-joining algoritme in programma’s van het PHYLIP pakket (versie 3.63). De afstand is de verhouding van aminozuursubstituties.
De tweede uitlijning, gerelateerd aan aroB, was aanwezig op scaffold-85 (0.8 Mbp). Wanneer de voorspelde eiwitsequentie werd gebruikt voor een BLAST-zoekopdracht (SI Dataset 3), was de beste overeenkomst die met het dinoflagellaat Oxyrrhis marina (66% aminozuursequentie-identiteit). In dit dinoflagellaat is het aroB enzym (3-dehydroquinate synthase) aanwezig in de chloroplast en is gefuseerd met een O-methyltransferase (25). Toen de volledige fusie-eiwitsequentie van O. marina werd gebruikt in een BLAST-zoekopdracht tegen het vertaalde DNA van N. vectensis, bleek dat ook in N. vectensis een fusie-eiwitgen aanwezig was (SI Dataset 4). Dit gen bevat vijf intronen. Wanneer het aroB segment van het gen werd gebruikt om een fylogenetische boom te construeren met de dichtstbijzijnde BLAST treffers (Fig. 2), bleek de sequentie van N. vectensis het dichtst bij die van twee dinoflagellaten te liggen (O. marina en Heterocapsa triquetra) die elk het volledige fusiegen bezitten. Ook dit gen zou betrokken kunnen zijn bij de synthese van precursoren die leiden tot secundaire metabolieten afgeleid van de shikimate pathway, met name 3-dehydroquinaat, de vermoedelijke tussenstap naar de MAA-biosynthese (5).
Phylogenetische boom die de relatie toont tussen de afgeleide eiwitsequentie van het aroB-deel van het AroB-O-methyltransferase-eiwit van N. vectensis en homologe dinoflagellateiwitten. De sequenties werden uitgelijnd met CLUSTALW en de boom werd geconstrueerd met behulp van het neighbor-joining algoritme met afstanden afgeleid van het Jones-Taylor-Thornton model (met PHYLIP versie 3.63). De boom werd geworteld door Anabaena variabilis als uitgroep te gebruiken. De afstanden zijn de verhouding van aminozuursubstituties, en de bootstrap waarden op basis van 100 monsters worden getoond.
Omdat endosymbiotische dinoflagellaten vaak geassocieerd worden met cnidaria, moest de mogelijkheid overwogen worden dat er een niet gedetecteerd dinoflagellaat de N. vectensis sequentie contamineerde. De voorspelde eiwitsequenties afkomstig van de naburige genen aan weerszijden van de aroB-achtige homoloog werden gebruikt voor BLAST-zoekopdrachten. De dichtste overeenkomsten waren met verschillende gewervelde dieren en met sequenties van de zee-egel Strongylocentrotus purpuratus, wat het onwaarschijnlijk maakt dat deze shikimate pathway genen in het genoom van de gastheer metazoan afkomstig zijn van contaminatie door het genoom van een geassocieerd dinoflagellaat (SI Dataset 5). Bovendien werden drie vermoedelijke eiwitsequenties van O. marina gebruikt voor BLAST-zoekopdrachten tegen N. vectensis. De beste treffers werden gebruikt om een fylogenetische boom te construeren, en in geen enkel geval waren de N. vectensis en O. marina sequenties nauw verwant (Fig. 3). Benadrukt moet echter worden dat aanvullend bewijs nodig is om de veronderstelde functie van deze genen vast te stellen en om te bewijzen dat zij door horizontale genoverdracht (HGT) bij N. vectensis zijn verworven, vooral omdat cnidaria vermoedelijk geconserveerde genen hebben die zij van niet-metazoan voorouders hebben geërfd (26). Hoewel het belang van HGT in de evolutie van eukaryoten controversieel blijft, zijn er onafhankelijke aanwijzingen voor het optreden van een andere HGT gebeurtenis in N. vectensis. Vergelijkend genomisch onderzoek van enzymen in de glyoxylaatcyclus heeft de waarschijnlijke overdracht van een bifunctioneel isocitraat lyase (ICL) en een MS, gecodeerd door een gefuseerd ICL-MS gen van een bacteriële voorloper, naar het genoom van N. vectensis aangetoond (27). Onze bevindingen zijn vergelijkbaar met die van anderen die bewijs rapporteren van genoverdracht naar zoetwater cnidarian (Hydra) soorten van meerdere voorouderlijke eukaryotische partners (18, 28).
Phylogenetische boom van PCNA eiwit sequenties. De sequentie van het PCNA eiwit van O. marina werd gebruikt voor een BLAST zoekactie tegen de vertaalde genomische sequenties van N. vectensis. De BLAST alignments werden gebruikt om de eiwitsequentie van N. vectensis te assembleren. De sequenties van de twee soorten werden gebruikt voor BLAST-zoekopdrachten in GenBank, en een selectie van de beste treffers voor elke soort werd gebruikt om een fylogenetische boom te construeren met behulp van het neighbor-joining algoritme in programma’s van het PHYLIP-pakket (versie 3.63). De afstand is de verhouding van de nucleotide-substituties.
Onze genomische ontginning van N. vectensis bracht nog een andere verrassing aan het licht dan de overdracht van genen van een bacterie en een dinoflagellate naar het genoom van de cnidarian. Wij vonden zeven goede sequentie-afstemmingen die overeenkomen met vijf potentiële genen van de shikiminezuur-route. Daaronder waren vier zeer sterke alignments die overeenkomen met de genen aroA, aroB, aroC, en aroE van E. coli (SI Dataset 6). De voorspelde eiwitsequenties van deze genen werden gebruikt in BLAST-zoekopdrachten (29) tegen de GenBank-database van het National Center for Biotechnology Information (NCBI) om verwante sequenties te ontdekken. In alle vier gevallen waren de beste overeenkomsten de genen van de shikiminezuurroute in Flavobacteria, met ≈70% aminozuuridentiteit (SI Dataset 7). In de meeste gevallen was Tenacibaculum sp. MED152, waarvan het genoom momenteel wordt gesequencet (www.moore.org/marine-micro.aspx), de beste overeenkomst, hoewel een strikte overeenkomst voor deze bacterie beïnvloed kan zijn door bias in de databank. Een vijfde gen in N. vectensis kwam overeen met de aroF-H genen van E. coli, die coderen voor isoenzymen voor 3-deoxy-d-arabinoheptulosonate-7-fosfaat synthase (DAHPS). BLAST-zoekopdrachten toonden echter aan dat de beste treffers (90% aminozuuridentiteit) de kdsA-genen van Flavobacteria waren; deze coderen voor andere isoenzymen van de DAHPS-familie die betrokken zijn bij de synthese van lipopolysacchariden.
De grote overeenkomst van de gensequenties van N. vectensis met die van de bacteriële shikimate pathway zou verklaard kunnen worden door een recente HGT-gebeurtenis of bacteriële DNA-verontreiniging in de genoomsequenties van N. vectensis. Het codongebruik leek meer op dat van Tenacibaculum dan op dat van N. vectensis. Er werden twee sequenties geïdentificeerd die significante fragmenten van bacteriële 16S rRNA-genen leken te zijn. Eén 16S rRNA-sequentie (985 bp; SI Dataset 8a ) vertoonde de grootste gelijkenis met Pseudomonas-sequenties. Aangezien deze sequentie echter niet behoorde tot een scaffold met andere bacteriële sequenties en er geen andere Pseudomonas-achtige genomische sequenties werden gedetecteerd, is het waarschijnlijk dat deze sequentie afkomstig is van een sequentieverontreiniging. Omdat de oorspronkelijke shotgun sequencing gegevens niet beschikbaar waren voor ons, konden we het genoom van N. vectensis niet analyseren met behulp van een recent uitgebrachte versie van het Glimmer genannotatiehulpmiddel (http://cbcb.umd.edu/software/glimmer; ref. 30), wat een nuttige manier zou zijn geweest om het percentage van het hologenoom te kwantificeren dat gecodeerd is op kleine scaffolds en daarom waarschijnlijk afkomstig is van levende bacteriën.
De andere 16S rRNA-sequentie behoorde tot een scaffold, die ook 23S rRNA-sequenties bevatte in een regeling die typisch is voor rRNA-operons (720 bp; SI Dataset 8b ), en een fylogenetische boom van het 16S rRNA-gedeelte (Fig. 4) toonde aan dat het afkomstig was van een flavobacterium, maar het kon niet worden toegewezen aan een bekend genus. Fylogenetische bomen werden ook geconstrueerd voor de aroA, aroB, aroC, en aroE sequenties, met vergelijkbare resultaten. Een andere overweging was dat een groot deel van het genoom van N. vectensis georganiseerd was in grote scaffolds, terwijl deze 16S rRNA fragmenten aanwezig waren in kleine scaffolds waarvan korte contigs werden gesequeneerd, zodat alleen onvolledige gensequenties werden onthuld. Dit resultaat gaf de eerste aanwijzing dat deze 16S rRNA fragmenten afkomstig zouden kunnen zijn van bacteriële contaminatie en niet van genomisch DNA van N. vectensis in strikte zin. Het Tenacibaculum genoomproject heeft de meeste genen geïdentificeerd, en de 2.679 voorspelde eiwitsequenties uit de genomische annotatie werden gebruikt voor een BLAST-zoekopdracht tegen vertaald N. vectensis DNA. Wanneer een strikte verwachtingswaarde van <10-30 werd gebruikt, leverden 509 van de Tenacibaculum-sequenties (19%) positieve treffers op. Een minder stringente cutoff (10-10) leverde echter 1.563 (58%) treffers op. In veel van deze gevallen waren de hogere verwachte waarden geassocieerd met partiële sequenties, aangezien de treffers in kleinere scaffolds met kleine contigs zaten, waarbij veel basen in de scaffolds niet werden bepaald. In feite bevonden de aroE- en kdsA-genen zich aan het eind van contigs, zodat hun sequenties waren afgekapt en respectievelijk de laatste 40 of 25 aa ontbraken. Hoewel een toevallige contaminatie van het oorspronkelijke N. vectensis sjabloon niet kan worden uitgesloten, is het een opwindende mogelijkheid dat de sequenties afkomstig zijn van een voorheen onvermoede flavobacteriële associatie die lijkt op Tenacibaculum.
Phylogenetische boom die de relatie toont tussen de 16S rRNA gensequentie gevonden in de N. vectensis genoomsequentie (720-bp fragment in entry c429301624.Contig1 van StellaBase, http://evodevo.bu.edu/stellabase; SI Dataset 8a ) en de sequenties van de dichtstbijzijnde type stammen in Ribosomal Data Base Project II (release 9.52; http://rdp.cme.msu.edu). Afstanden werden berekend uit een CLUSTAL W alignment met gebruikmaking van het F84 model, en de boom werd geconstrueerd als in Fig. 3.
Er is onafhankelijke steun voor onze stelling dat de voorgaande sequenties in het gepubliceerde genoom voor N. vectensis afkomstig kunnen zijn van bacteriën die geassocieerd worden met de vroege ontwikkelingsstadia van de anemoon. De auteurs van het gerapporteerde Nematostella vectensis genoom (20), in hun ondersteunende online materiaal (Supplement S2 in www.sciencemag.org/cgi/content/full/317/5834/86/DC1), hebben expliciet verklaard dat zij genomisch DNA van larven hebben geprepareerd om besmetting door de commensalen of symbionten die zijn gerapporteerd voor de volwassenen te vermijden, hoewel zij geen referentie gaven voor de laatste verklaring betreffende dergelijke geassocieerden. Ondanks deze voorzorgsmaatregel zijn er afzonderlijke bevindingen dat DNA-isolaten van embryo’s en vroege planula-larven van deze zeeanemoon 16S rRNA-sequenties bevatten, verkregen uit PCR-amplicons die worden toegeschreven aan bacteriën, waaronder die van dezelfde groepen (Flavobacteria en Pseudomonas) die wij hier rapporteren (H. Marlow en M. Q. Martindale, persoonlijke mededeling).
Bacteriële associaties van cnidarianen zijn al minstens 30 jaar bekend (bijv, refs. 31 en 32), en recentelijk zijn ze microscopisch gevisualiseerd als epibionten en endosymbionten in twee soorten zoetwater Hydra (33) en als omhulde aggregaten in spelonken tussen ectodermale cellen van de nominaal niet-symbiotische zeeanemoon Metridium senile (34). Een dergelijke intieme associatie met metazoacellen zonder externe fysieke barrière leent zich voor directe gastheer-microbe interacties die zich op verschillende manieren manifesteren als pathogeniciteit in koralen (35), de ontwikkeling van de immuunrespons in Cnidaria (33), en een nauwe symbiotische integratie die culmineert in HGT van bacterie naar gastheer cnidarian zoals hier aangetoond. Er is vrijwel niets bekend over de biosynthese of andere metabolische functies van bacteriën in symbiose met cnidarian gastheren, een onderwerp dat, zoals zo vele andere in de moderne mariene microbiologie, onderzoek verdient.
HGT tussen bacteriën en bepaalde metazoanen (ecdysozoën, waaronder insecten en nematoden) werd onlangs aangetoond door Baldo et al. (36) dat het wijdverbreider is dan vermoed. Zij merkten op dat bacteriële sequenties vroeger als contaminatie werden beschouwd en systematisch werden uitgesloten door eukaryote genoomsequencingprojecten, waardoor het belang van een dergelijke overdracht bij diverse ongewervelden mogelijk werd verhuld. Eerder werd de genoomsequentie van de bacteriële endosymbiont Carsonella ruddii, aangetroffen in bladluizen, openbaar gemaakt (37, 38). Vergelijking van deze genoomsequentie met die van een andere bacteriële endosymbiont van bladluizen, Buchnera aphidicola, toonde aan dat beide genomen een aanzienlijke deletie hadden ondergaan, waaronder het verlies van een aantal genen die coderen voor essentiële metabolische routes. Eén zo’n ontbrekende route die leidt tot de vorming van het aromatische aminozuur tryptofaan in C. ruddii trok onze aandacht. Volgens het dogma (10) zouden precursors voor dit essentiële aminozuur gesynthetiseerd moeten worden via de shikiminezuur-route in de commensale bacteriën. Opnieuw zochten wij in de genomen van deze bacteriën naar genen die coderen voor enzymen van de shikiminezuurroute. Wij vonden één gen dat codeert voor een vermoedelijk 5-enolpyruvylshikimaat-3-fosfaat-fosfolyase in C. ruddii (hoewel het vanwege het grote aantal stopcodons in de sequentie twijfelachtig is of dit gen een functioneel product zou transcriberen), en slechts drie (die voor shikimaat-5-dehydrogenase, 5-enolpyruvylshikimaat-3-fosfaat fosfolyase en 5-enolpyruvylshikimaat-3-fosfaat synthase) van de zeven genen voor de pathway kwamen voor in het genoom van B. aphidicola (SI Dataset 9). Samen met onze bevindingen voor de vermeende Tenacibaculum-achtige symbiont en zijn gastheer N. vectensis, suggereert dit bewijs sterk dat het verlies van essentiële metabolische functies in de endosymbiont een voortdurend proces van genoverdracht en deletie is in de evolutie van symbiose dat uiteindelijk zou kunnen leiden tot het uitsterven van de symbiont door progressieve assimilatie van zijn genetisch materiaal in het gastheergenoom (37, 38).
De opheldering van “gedeelde metabolische aanpassingen”, waarbij de productie van essentiële metabolieten een inbreng vereist van de partners van een symbiose (zelfs als er één gedegenereerd is), zal een verdere genomische ontleding vereisen van de unieke organisatie en het moleculaire functioneren van ongewervelde-microbiële symbioses. Dit wordt onderstreept door onze bevinding dat twee van de genen voor enzymen van de shikimic pathway, waarvan klassiek wordt gezegd dat ze afwezig zijn in “dieren”, gecodeerd zijn in het genoom van de metazoan-gastheer. De mate waarin een dergelijke HGT, of de betrokkenheid van onvermoede bacteriële consorten, de verklaring kan zijn voor de schijnbare metabolische anomalieën bij cnidarianen die in de inleiding zijn beschreven, verdient nader onderzoek. Inzicht in deze processen kan bovendien kritisch inzicht verschaffen in de oorzaak van metabolische disfunctie die wordt opgeroepen door klimaatverandering en milieustress, met name in de fragiele symbiose van tropische koralen en andere mariene cnidaria.