Eredmények és vita
Az anabolikus szikimisav útvonal hét lépésből áll, amelyeket hét különböző polipeptid vagy kevesebb multifunkcionális polipeptid katalizálhat (22). A bioszintézis öt lépésének enzimjei homológok minden olyan szervezetben, amely rendelkezik az útvonallal. Két lépés esetében két különböző enzim ismert, és minden, az útvonalat kifejező szervezet rendelkezik az egyik enzim homológjával. Ezenkívül két további szempontot kell figyelembe venni a N. vectensisben a szikimisav-útvonal enzimjeit kódoló gének kimutatásakor: (i) a gének evolúciós eredete bizonytalan lenne, így a szekvenciák jelentősen eltérhettek a felhasznált összehasonlító szekvenciáktól, és (ii) a genomszekvencia intronokat tartalmazhat.
A vizsgálat legnagyobb érzékenységének elérése érdekében a HMMER programcsomagot (23) használtuk a konszenzusos fehérjeszekvenciák keresésére rejtett Markov-modell profilok segítségével. Ez a módszer nagyobb súlyt ad az evolúciósan konzervált maradékoknak, és a lokális profilok feltárják a kódoló exonokban lévő fehérjefragmentumokat. A N. vectensis genomszekvenciáját mind a hat leolvasási keretben lefordítottuk, és a Pfam adatbázisból (24) nyert, a sikiminsav útvonal mind a hét enzimjét lefedő kilenc profil segítségével kerestük. Az aroA és aroB profilok felhasználásával két illesztést (“találatot”) találtunk a HMMER segítségével nagy scaffoldokban (SI Dataset 1). Az aroA találat a scaffold_33-ban történt (1,4 Mbp). Amikor a megjósolt fehérjeszekvenciát BLAST-keresésre használtuk, az számos baktérium murA géntermékével igazodott ≈40%-os aminosavazonossággal. Ez a bakteriális gén az UDP-N-acetilglükozamin 1-karboxivinyltranszferázt (SI Dataset 2) kódolja, amely az aroA (3-foszfoszfoszikimát 1-karboxivinyltranszferáz) enzimmel rokon enzim, míg a MurA enzim a peptidoglikán sejtfal bioszintézisében vesz részt. Ez a megállapítás kezdetben azt sugallta, hogy az összehangolt szekvencia bakteriális szennyeződésből származhat. A HMMER eredmények alapos vizsgálata azonban azt mutatta, hogy a prediktált fehérjéből hiányzik ≈20 konzervált aminosav a C-terminálison, és hogy a hiányzó aminosav-szekvencia ≈1 kb-mal lejjebb található az állványzatban. A genomi szekvencia vizuális összehasonlítása a gerincesek intronjainak konszenzus szekvenciáival olyan plauzibilis splice-helyeket (AGGTRA és AGG, illetve AGG) mutatott ki, amelyek egy teljes hosszúságú murA homológot kódoló mRNS-t eredményeznének, amely szorosan illeszkedik a keresési profilhoz. Az intronok jelenléte így kizárja a bakteriális szennyeződések vagy szimbionták kérdését, mint e gén proximális forrását.
Az aroA-féle homológot tartalmazó 1,4 Mbp-os állványzatot mind a hat olvasási keretben lefordítottuk, és a HMMER segítségével a teljes Pfam-könyvtárral szkenneltük. Ez az eljárás számos tipikus eukarióta domén jelenlétét mutatta ki, beleértve a reverz transzkriptázt, az EGF-et, a kalciumkötő EGF-domént, a defensinszerű peptidet, az aktint és a villafej-domént, ami ismét alátámasztja azt az elképzelést, hogy az aroA-like homológot maga a N. vectensis genom tartalmazza. A megjósolt fehérje szekvenciája alapján filogenetikai fát építettünk, amelyet a BLAST keresés során talált legközelebbi bakteriális szekvenciákkal, valamint a Tenacibaculum sp. MED152 és az Escherichia coli W3110 szekvenciákkal hasonlítottunk össze (1. ábra). A N. vectensis aroA-szerű szekvenciája nem klasztereződött a vizsgált baktériumcsoportok egyikének homológjaival sem, hanem a különböző baktériumcsoportok közötti murA génekhez hasonló szekvencia-divergenciát mutatott a bakteriális szekvenciákhoz képest. Hogy ez a gén a N. vectensisben a peptidoglikán vagy a sikimát útvonal köztitermékeinek bioszintézisét irányítja-e, még nem ismert.
Filogenetikai fa, amely a N. vectensis aroAszerű génjének prediktált fehérjeszekvenciájának kapcsolatát mutatja a BLAST-analízis hét legjobb találatának prediktált murA fehérjeszekvenciáival, valamint az E. coli és a Tenacibaculum génjeivel. A távolságokat a Jones-Taylor-Thornton mátrixot használó CLUSTAL W illesztésből számoltuk ki, a fát pedig a PHYLIP csomag (3.63-as verzió) programjaiban a szomszéd-összekötő algoritmus segítségével építettük fel. A távolság az aminosav-helyettesítések aránya.
A második, az aroB-vel kapcsolatos igazítás a scaffold-85-ön (0,8 Mbp) volt jelen. Amikor a megjósolt fehérjeszekvenciát BLAST kereséshez használtuk (SI Dataset 3), a legközelebbi illeszkedés a dinoflagellata Oxyrrhis marina-val volt (66%-os aminosav szekvencia azonosság). Ebben a dinoflagellátban az aroB enzim (3-dehidrokinát-szintáz) a kloroplasztiszban van jelen, és egy O-metiltranszferázzal van fuzionálva (25). Amikor az O. marina teljes fúziós fehérje szekvenciáját BLAST keresésben használtuk a N. vectensis lefordított DNS-ével szemben, nyilvánvalóvá vált, hogy a fúziós fehérje génje a N. vectensisben is jelen van (SI Dataset 4). Ez a gén öt intront tartalmaz. Amikor a gén aroB szegmensét használtuk a legközelebbi BLAST találatokat tartalmazó filogenetikai fa megalkotásához (2. ábra), kiderült, hogy a N. vectensis szekvenciája két olyan dinoflagellata (O. marina és Heterocapsa triquetra) szekvenciájához áll a legközelebb, amelyek mindegyike rendelkezik a teljes fúziós génnel. Ez a gén ismét részt vehet a shikimát útvonalból származó másodlagos metabolitokhoz vezető prekurzorok szintézisében, leginkább a 3-dehidrokinátban, a MAA bioszintézis feltételezett köztes elágazásában (5).
Filogenetikai fa, amely a N. vectensis AroB-O-metiltranszferáz fehérje aroB részének levezetett fehérjeszekvenciájának rokonságát mutatja a homológ dinoflagellata fehérjékkel. A szekvenciákat CLUSTALW segítségével igazítottuk egymáshoz, a fát pedig a Jones-Taylor-Thornton-modellből származtatott távolságok segítségével, a szomszéd-összekötő algoritmus segítségével építettük fel (a PHYLIP 3.63-as verzióját használva). A fát az Anabaena variabilis mint külső csoport felhasználásával gyökereztettük. A távolságok az aminosavcserék arányát jelentik, és a 100 mintán alapuló bootstrap-értékek láthatók.
Mivel az endoszimbionta dinoflagelláták gyakran társulnak a cnidariákkal, számolni kellett azzal a lehetőséggel, hogy a N. vectensis szekvenciáját egy fel nem ismert dinoflagellátum szennyezi. Az aroB-szerű homológ két oldalán lévő szomszédos génekből származó prediktált fehérjeszekvenciákat használtuk a BLAST-kereséshez. A legközelebbi illesztések különböző gerincesekkel és a Strongylocentrotus purpuratus tengeri sün szekvenciáival voltak, ami valószínűtlenné teszi, hogy ezek a shikimát útvonal génjei a gazdaszervezet metazoán genomjában egy társult dinoflagellata genomjának szennyeződéséből származnak (SI Dataset 5). Ezenkívül az O. marina három feltételezett fehérje szekvenciáját használtuk a N. vectensis elleni BLAST kereséshez. A legjobb találatokból filogenetikai fát építettünk, és a N. vectensis és az O. marina szekvenciái egyetlen esetben sem álltak szoros rokonságban egymással (3. ábra). Hangsúlyozni kell azonban, hogy további bizonyítékokra van szükség e gének feltételezett funkciójának meghatározásához és annak bizonyításához, hogy a N. vectensisben horizontális géntranszfer (HGT) útján szerezték meg őket, különösen azért, mert a cnidariák állítólag konzervált génekkel rendelkeznek, amelyeket nem metazoai ősöktől örököltek (26). Bár a HGT jelentősége az eukarióta evolúcióban továbbra is vitatott, független bizonyítékok vannak arra, hogy a N. vectensisben egy másik HGT esemény is bekövetkezett. A glioxilát-ciklus enzimeinek összehasonlító genomikai vizsgálata kimutatta egy bifunkcionális izocitrát-liáz (ICL) és egy MS valószínűsíthető átvitelét a N. vectensis genomjába, amelyet egy bakteriális elődből származó fuzionált ICL-MS gén kódol (27). Eredményeink hasonlóak másokéhoz, akik több ősi eukarióta partnertől származó génátvitelről számoltak be az édesvízi hínárfélék (Hydra) fajaiba (18, 28).
A PCNA fehérje szekvenciák filogenetikai fája. Az O. marina PCNA fehérjének szekvenciáját a N. vectensis lefordított genomiális szekvenciáival végzett BLAST kereséshez használtuk. A BLAST-illesztések alapján összeállítottuk a N. vectensis fehérje szekvenciáját. A két fajból származó szekvenciákat a GenBankban végzett BLAST-kereséshez használtuk, és az egyes fajok legjobb találatainak kiválasztása alapján a PHYLIP csomag (3.63-as verzió) programjaiban a szomszéd-összekötő algoritmus segítségével filogenetikai fát építettünk. A távolság a nukleotid-helyettesítések aránya.
A N. vectensis genomikai bányászata a baktériumból és egy dinoflagellátából származó géneknek a cnidárium genomjába való átvitelén túl egy másik meglepetést is feltárt. Hét jó szekvenciaillesztést találtunk, amelyek a sikiminsav-útvonal öt potenciális génjének felelnek meg. Ezek között volt négy nagyon erős illeszkedés, amelyek az E. coli aroA, aroB, aroC és aroE génjeinek felelnek meg (SI Dataset 6). Ezeknek a géneknek a megjósolt fehérjeszekvenciáit a National Center for Biotechnology Information (NCBI) GenBank adatbázisában végzett BLAST keresési lekérdezésekben (29) használtuk fel a rokon szekvenciák feltárására. Mind a négy esetben a legjobb egyezés a Flavobacteria shikimisav útvonal génjeivel volt, ≈70%-os aminosav azonossággal (SI Dataset 7). A legtöbb esetben a Tenacibaculum sp. MED152, amelynek genomjának szekvenálása folyamatban van (www.moore.org/marine-micro.aspx), volt a legjobb egyezés, bár a szigorú hasonlóságot befolyásolhatja az adatbázisok torzítása erre a baktériumra vonatkozóan. Egy ötödik gén a N. vectensisben megfelelt az E. coli aroF-H génjeinek, amelyek a 3-deoxi-d-arabinoheptulozonát-7-foszfát-szintáz (DAHPS) izoenzimjeit kódolják. A BLAST keresések azonban a legjobb találatokat (90%-os aminosav azonosság) a Flavobacteria kdsA génjeinek mutatták; ezek a DAHPS család más izoenzimjeit kódolják, amelyek részt vesznek a lipopoliszacharid szintézisében.
A N. vectensis génszekvenciáinak nagyfokú hasonlósága a bakteriális sikimát útvonal génszekvenciáival vagy egy közelmúltbeli HGT esemény vagy a N. vectensis genom szekvenciáiban lévő bakteriális DNS szennyeződéssel magyarázható. A kodonhasználat inkább a Tenacibaculumhoz, mint a N. vectensishez hasonlított. Két olyan szekvenciát azonosítottak, amelyek a bakteriális 16S rRNS-gének jelentős töredékeinek tűntek. Az egyik 16S rRNS-szekvencia (985 bp; SI Dataset 8a ) a Pseudomonas-szekvenciákkal mutatta a legnagyobb hasonlóságot. Mivel azonban nem tartozott más baktériumszekvenciákat tartalmazó állványzathoz, és más Pseudomonas-szerű genomszekvenciát sem észleltünk, valószínű, hogy szekvenálási szennyeződésből származik. Mivel az eredeti shotgun szekvenálási adatok nem álltak rendelkezésünkre, nem tudtuk elemezni a N. vectensis genomját a Glimmer génannotációs eszköz (http://cbcb.umd.edu/software/glimmer; hivatkozás 30) nemrég megjelent változatával, ami hasznos módszer lett volna arra, hogy számszerűsítsük a hologénom kis állványzaton kódolt és ezért valószínűleg élő baktériumokból származó százalékát.
A másik 16S rRNS-szekvencia egy olyan állványzathoz tartozott, amely 23S rRNS-szekvenciákat is tartalmazott az rRNS-operonokra jellemző elrendezésben (720 bp; SI Dataset 8b ), és a 16S rRNS-rész filogenetikai fája (4. ábra) azt mutatta, hogy flavobaktériumból származik, de nem lehetett ismert nemzetséghez rendelni. A filogenetikai fákat az aroA, aroB, aroC és aroE szekvenciákra is felépítettük, hasonló eredményekkel. További szempont volt, hogy a N. vectensis genomjának nagy része nagy scaffoldokba szerveződött, míg ezek a 16S rRNS-töredékek kis scaffoldokban voltak jelen, amelyekből rövid kontigokat szekvenáltak, így csak hiányos génszekvenciákat tártak fel. Ez az eredmény adta az első jelét annak, hogy ezek a 16S rRNS-fragmentumok inkább bakteriális szennyeződésből származhatnak, mint a szigorú értelemben vett N. vectensis genomiális DNS-éből. A Tenacibaculum genomprojekt a legtöbb génjét azonosította, és a genomiális annotációból származó 2679 előre jelzett fehérjeszekvenciát használtuk fel a BLAST kereséshez a lefordított N. vectensis DNS-sel szemben. Amikor egy szigorú, <10-30 várható értéket használtak, a Tenacibaculum szekvenciák közül 509 (19%) adott pozitív találatot. Egy kevésbé szigorú határérték (10-10) azonban 1563 (58%) találatot adott. Ezen esetek közül sok esetben a magasabb várható értékek a részleges szekvenciákhoz kapcsolódtak, mivel a találatok kisebb, kis kontigokkal rendelkező scaffoldokban voltak, amelyekben sok bázis nem volt meghatározva. Valójában az aroE és a kdsA gének a kontigok végén voltak, így a szekvenciájuk csonka volt, és hiányzott az utolsó 40, illetve 25 aa. Bár az eredeti N. vectensis sablon véletlenszerű szennyeződése nem zárható ki, izgalmas lehetőség, hogy a szekvenciák egy eddig gyanútlan, a Tenacibaculumhoz hasonló flavobaktérium-társulásból származnak.
Filogenetikai fa, amely a N. vectensis genomszekvenciájában talált 16S rRNS génszekvencia (720 bp töredék a StellaBase c429301624.Contig1 bejegyzésében, http://evodevo.bu.edu/stellabase; SI Dataset 8a ) és a Ribosomal Data Base Project II (release 9.52; http://rdp.cme.msu.edu) legközelebbi típustörzsek szekvenciáinak kapcsolatát mutatja. A távolságokat egy CLUSTAL W illesztésből számoltuk ki az F84 modell segítségével, és a fát a 3. ábra szerint építettük fel.
Független alátámasztása van annak az állításunknak, hogy a N. vectensis publikált genomjában található fenti szekvenciák az anemona korai fejlődési szakaszaihoz kapcsolódó baktériumokból származhatnak. A Nematostella vectensis közölt genomjának (20) szerzői a támogató online anyagukban (Supplement S2 in www.sciencemag.org/cgi/content/full/317/5834/86/DC1) kifejezetten kijelentették, hogy a genomi DNS-t lárvákból állították elő, hogy elkerüljék a felnőttek esetében bejelentett komenzálisok vagy szimbionták általi szennyeződést, bár ez utóbbi állításukra nem adtak hivatkozást az ilyen társulásokra vonatkozóan. Ennek az elővigyázatosságnak az ellenére vannak olyan különálló eredmények, amelyek szerint e tengeri anemona embrióiból és korai planula lárváiból származó DNS izolátumok 16S rRNS szekvenciákat tartalmaznak, amelyeket baktériumoknak tulajdonított PCR amplikonokból nyertek, beleértve ugyanazon csoportok (Flavobacteria és Pseudomonas) tagjait, amelyekről itt beszámolunk (H. Marlow és M. Q. Martindale, személyes közlés).
A cnidariák baktérium társulásai már legalább 30 éve ismertek (pl, hivatkozások 31. és 32.), és a közelmúltban mikroszkóposan láthatóvá váltak epibiontaként és endoszimbiontaként két édesvízi Hydra fajban (33), valamint burkolatba csomagolt aggregátumokként a Metridium senile névlegesen nem szimbiotikus tengeri anemóna ektodermális sejtjei közötti üregekben (34). A külső fizikai gátat nem tartalmazó metazoai sejtekkel való ilyen bensőséges társulás közvetlen gazdatest-mikroba kölcsönhatásokhoz vezet, amelyek a korallokban patogenitásban (35), a Cnidariákban az immunválasz kialakulásában (33) és a szoros szimbiózis integrációban nyilvánulnak meg, amely a baktériumoktól a gazdatest cnidariába történő HGT-ben csúcsosodik ki, amint azt itt bemutattuk. Gyakorlatilag semmit sem tudunk a cnidáriákkal szimbiózisban élő baktériumok bioszintetikus vagy más anyagcsere-funkcióiról, ami a modern tengeri mikrobiológia számos más témájához hasonlóan vizsgálatot igényel.
A baktériumok és bizonyos metazoák (ecdysozoák, beleértve a rovarokat és fonálférgeket) közötti HGT-ről Baldo és munkatársai (36) nemrégiben kimutatták, hogy a feltételezettnél sokkal elterjedtebb. Megjegyezték, hogy a bakteriális szekvenciákat korábban szennyeződésnek tekintették és szisztematikusan kizárták az eukarióta genom szekvenálási projektekből, ami valószínűleg elfedte az ilyen transzfer fontosságát a különféle gerinctelenekben. Korábban nyilvánosságra hozták a levéltetvekben talált Carsonella ruddii baktérium endoszimbionta genomszekvenciáját (37, 38). E genomszekvencia összehasonlítása a levéltetvek egy másik bakteriális endoszimbiontájának, a Buchnera aphidicola-nak a genomszekvenciájával azt mutatta, hogy mindkét genom jelentős törlésen ment keresztül, beleértve néhány alapvető anyagcsere-útvonalakat kódoló gén elvesztését. Az egyik ilyen hiányzó útvonal, amely az aromás aminosav triptofán képződéséhez vezet a C. ruddii-ban, felkeltette a figyelmünket. A dogma szerint (10) ennek az esszenciális aminosavnak az előanyagainak a shikimisav útvonalon keresztül kellene szintetizálódniuk a kommensális baktériumokban. Ismét globális szekvenciaillesztéseket kerestünk a shikimisav-útvonal enzimjeit kódoló gének után ezekben a baktériumgenomokban. Egy feltételezett 5-enolpiruvil-sikimát-3-foszfát-foszfoliázt kódoló gént találtunk a C. ruddii genomban (bár a szekvencia nagyszámú stopkódonja miatt kérdéses, hogy ez a gén átírna-e funkcionális terméket), és a B. aphidicola genomban az útvonal hét génje közül csak három (a shikimát-5-dehidrogenázt, az 5-enolpyruvylshikimate-3-foszfát-foszfoliázt és az 5-enolpyruvylshikimate-3-foszfát-szintázt kódoló gének) volt látható (SI Dataset 9). A feltételezett Tenacibaculum-szerű szimbiontára és gazdaszervezetére, a N. vectensisre vonatkozó eredményeinkkel együttesen ez a bizonyíték határozottan arra utal, hogy az endoszimbiontában az alapvető metabolikus funkciók elvesztése egy folyamatos génátviteli és törlési folyamat a szimbiózisok evolúciójában, amely végül a szimbionta kihalásához vezethet a genetikai anyagának a gazdaszervezet genomjába való fokozatos beolvadása révén (37, 38).
A “közös metabolikus adaptációk” tisztázása, ahol az esszenciális metabolitok előállításához a szimbiózis mindkét partnere hozzájárul (még akkor is, ha az egyik degenerált), a gerinctelen-mikrobiális szimbiózisok egyedi szervezetének és molekuláris működésének további genomikai feltárását teszi szükségessé. Erre rávilágít az a megállapításunk, hogy a shikimikus útvonal enzimeinek két génje, amelyekről klasszikusan azt mondják, hogy az “állatokban” nincsenek, a metazoák gazdaszervezetének genomjában kódolva van. További vizsgálatot igényel, hogy az ilyen HGT vagy a gyanútlan baktériumtársak bevonása milyen mértékben magyarázza a bevezetőben leírt, a cnidariák anyagcsere-rendellenességeit. Ezeknek a folyamatoknak a megértése emellett kritikus betekintést nyújthat az éghajlatváltozás és a környezeti stressz által kiváltott anyagcserezavarok okaiba, különösen a trópusi korallok és más tengeri haslábúak törékeny szimbiózisaiban.