Tulokset ja keskustelu
Anabolista shikimiinihappoa tuottavassa polussa on seitsemän vaihetta , joita voi katalysoida seitsemän erilaista polypeptidiä tai harvempi monikäyttöinen polypeptidi (22). Viiden biosynteettisen vaiheen entsyymit ovat homologisia kaikissa reitin omaavissa organismeissa. Kahdesta vaiheesta tunnetaan kaksi erilaista entsyymiä, ja jokaisella organismilla, joka ilmentää reittiä, on homologinen entsyymi jollekin näistä entsyymeistä. Lisäksi shikimiinihappopolun entsyymejä koodaavien geenien havaitsemiseen N. vectensiksessä liittyy kaksi muuta näkökohtaa: (i) geenien evolutiivinen alkuperä olisi epävarma, joten sekvenssit ovat saattaneet poiketa huomattavasti käytetyistä vertailusekvensseistä, ja (ii) genomisekvenssi saattaa sisältää introneja.
Kyselyn suurimman herkkyyden saavuttamiseksi käytettiin HMMER-ohjelmapakettia (23) konsensusproteiinisekvenssien etsimiseen piilotettujen Markov-mallien profiileja käyttäen. Tämä menetelmä antaa suuremman painoarvon evolutiivisesti konservoiduille jäännöksille, ja paikalliset profiilit paljastavat koodaavissa eksoneissa olevat proteiinifragmentit. N. vectensiksen genomisekvenssi käännettiin kaikkiin kuuteen lukukehykseen ja sitä etsittiin käyttämällä yhdeksää profiilia, jotka kattavat kaikki seitsemän shikimiinihappopolun entsyymiä ja jotka saatiin Pfam-tietokannasta (24). HMMER:llä löydettiin kaksi kohdistusta (”osumaa”) suurissa telineissä käyttäen aroA- ja aroB-profiileja (SI Dataset 1). Osuma aroA:n kohdalla oli scaffold_33 (1,4 Mbp). Kun ennustettua proteiinisekvenssiä käytettiin BLAST-hakuun, se kohdistui useiden bakteerien murA-geenituotteen kanssa ≈40 %:n aminohappoidentiteetillä. Tämä bakteerigeeni koodaa UDP-N-asetyyliglukosamiini-1-karboksyvinyltransferaasia (SI Dataset 2), joka on aroA:n (3-fosfoshikimaatti-1-karboksyvinyltransferaasi) kanssa sukua oleva entsyymi, kun taas MurA-entsyymi osallistuu peptidoglykaanisen soluseinän biosynteesiin. Tämä havainto viittasi aluksi siihen, että samansuuntainen sekvenssi saattaisi olla peräisin bakteerikontaminaatiosta. HMMER-tulosten tarkempi tarkastelu osoitti kuitenkin, että ennustetusta proteiinista puuttui ≈20 konservoitua aminohappoa C-terminaalista ja että puuttuva aminohapposekvenssi sijaitsi ≈1 kb:n etäisyydellä alavirtaan telineessä. Genomisekvenssin visuaalinen vertailu selkärankaisten intronien konsensussekvensseihin paljasti uskottavia liitoskohtia (AGGTRA ja AGG), jotka tuottaisivat mRNA:ta, joka koodaisi täyspitkän murA-homologin, joka vastaisi hyvin hakuprofiilia. Intronien läsnäolo poistaa siten kysymyksen bakteerikontaminaatioista tai symbionteista tämän geenin lähilähteenä.
AroA:n kaltaisen homologin sisältävä 1,4 Mbp:n teline käännettiin kaikissa kuudessa lukukehyksessä ja skannattiin HMMER:llä koko Pfam-kirjaston avulla. Tämä prosessi osoitti useiden tyypillisten eukaryoottisten domeenien, kuten käänteistranskriptaasin, EGF:n, kalsiumia sitovan EGF-domeenin, defensiinin kaltaisen peptidin, aktiinin ja haarukkapään domeenin, läsnäolon, mikä jälleen kerran tukee ajatusta siitä, että aroA:n kaltainen homologi sisältyy itse N. vectensis -genomiin. Ennustetun proteiinin sekvenssiä käytettiin fylogeneettisen puun rakentamiseen, jota verrattiin BLAST-haun perusteella löydettyihin lähimpiin bakteerisekvensseihin sekä Tenacibaculum sp. MED152:n ja Escherichia coli W3110:n sekvensseihin (kuva 1). N. vectensiksen aroA:n kaltainen sekvenssi ei klusteroitunut minkään testatun bakteeriryhmän homologien kanssa, mutta sen sekvenssiero bakteerisekvensseistä oli verrattavissa eri bakteeriryhmien murA-geenien sekvenssien eroavaisuuksiin. Sitä, ohjaako tämä geeni N. vectensiksessä peptidoglykaanin tai shikimaattipolun välituotteiden biosynteesiä, ei vielä tiedetä.
Fylogeneettinen puu, joka osoittaa N. vectensiksen aroA:n kaltaisen geenin ennustetun proteiinisekvenssin suhteen BLAST-analyysin seitsemän parhaan osuman ennustettuihin murA-proteiinisekvensseihin sekä E. coli- ja Tenacibaculum-geeneihin. Etäisyydet laskettiin CLUSTAL W -kohdistuksesta Jones-Taylor-Thornton-matriisin avulla, ja puu muodostettiin PHYLIP-paketin (versio 3.63) ohjelmissa käytetyllä naapuriliitosalgoritmilla. Etäisyys on aminohapposubstituutioiden osuus.
Toinen, aroB:hen liittyvä linjaus oli scaffold-85:ssä (0,8 Mbp). Kun ennustettua proteiinisekvenssiä käytettiin BLAST-hakuun (SI Dataset 3), lähin vastaavuus oli dinoflagellaatin Oxyrrhis marina kanssa (66 % aminohapposekvenssi-identiteetti). Tässä dinoflagellaatissa aroB-entsyymi (3-dehydrokinaattisyntaasi) sijaitsee kloroplastissa ja on fuusioitu O-metyylitransferaasiin (25). Kun O. marinan täydellistä fuusioproteiinisekvenssiä käytettiin BLAST-haussa N. vectensiksen translatoitua DNA:ta vastaan, kävi ilmi, että fuusioproteiinigeeni esiintyy myös N. vectensiksessä (SI Dataset 4). Tämä geeni sisältää viisi intronia. Kun geenin aroB-segmenttiä käytettiin rakentamaan fylogeneettinen puu lähimpien BLAST-osumien avulla (kuva 2), N. vectensiksen sekvenssi osoittautui lähimmäksi kahden dinoflagellatin (O. marina ja Heterocapsa triquetra) sekvenssiä, joilla kummallakin on täydellinen fuusiogeeni. Tämäkin geeni voisi olla mukana syntetisoimassa esiasteita, jotka johtavat shikimatiittireitiltä peräisin oleviin sekundaarisiin aineenvaihduntatuotteisiin, erityisesti 3-dehydrokinaattiin, joka on MAA:n biosynteesin oletettu välihaara (5).
Fylogeneettinen puu, joka osoittaa N. vectensiksen AroB-O-metyylitransferaasiproteiinin aroB-osan dedusoidun proteiinisekvenssin suhdetta homologisiin dinoflagellaattien proteiineihin. Sekvenssit linjattiin CLUSTALW-ohjelmalla, ja puu rakennettiin käyttämällä naapuriyhdistämisalgoritmia Jones-Taylor-Thornton-mallista johdettujen etäisyyksien avulla (käyttäen PHYLIP-versiota 3.63). Puu juurrutettiin käyttämällä Anabaena variabilis -lajia ulkoryhmänä. Etäisyydet ovat aminohapposubstituutioiden osuuksia, ja 100 näytteeseen perustuvat bootstrap-arvot on esitetty.
Koska endosymbioottiset dinoflagellaatit liittyvät usein nilviäisiin, oli otettava huomioon mahdollisuus, että N. vectensis -sekvenssiä kontaminoi jokin havaitsematon dinoflagellaatti. BLAST-hakuja varten käytettiin aroB:n kaltaisen homologin molemmin puolin sijaitsevista naapurigeeneistä peräisin olevia ennustettuja proteiinisekvenssejä. Lähimmät kohdistukset olivat eri selkärankaisten ja merisiilin Strongylocentrotus purpuratus -lajin sekvenssien kanssa, mikä tekee epätodennäköiseksi, että nämä shikimatiittireitin geenit isäntäeläimen metazoan genomissa olisivat peräisin assosioituneen dinoflagellatin genomin aiheuttamasta kontaminaatiosta (SI Dataset 5). Lisäksi kolmea O. marinan oletettua proteiinisekvenssiä käytettiin BLAST-hakuun N. vectensis -bakteeria vastaan. Parhaita osumia käytettiin fylogeneettisen puun rakentamiseen, eivätkä N. vectensiksen ja O. marinan sekvenssit olleet missään tapauksessa läheisesti sukua toisilleen (kuva 3). On kuitenkin korostettava, että lisätodisteet ovat tarpeen näiden geenien oletetun tehtävän määrittämiseksi ja todisteiden saamiseksi siitä, että N. vectensis on saanut ne horisontaalisen geeninsiirron (HGT) kautta, erityisesti siksi, että nilviäisillä on tiettävästi konservoituneita geenejä, jotka ne ovat perineet muilta kuin metazoalaisilta esi-isiltään (26). Vaikka HGT:n merkitys eukaryoottisessa evoluutiossa on edelleen kiistanalainen, on olemassa riippumatonta näyttöä toisen HGT-tapahtuman esiintymisestä N. vectensiksessä. Glyoksylaattikierron entsyymien vertaileva genomitutkimus on paljastanut bifunktionaalisen isositraattilyaasin (ICL) ja MS:n, jota koodaa fuusioitu ICL-MS-geeni bakteeriperäisestä esiasteesta, todennäköisen siirtymisen N. vectensiksen genomiin (27). Löydöksemme ovat samankaltaisia kuin muut, jotka ovat raportoineet todisteista geeninsiirrosta makean veden nilviäislajeihin (Hydra) useilta eukaryoottisilta esivanhempien kumppaneilta (18, 28).
PCNA-proteiinisekvenssien fylogeneettinen puu. O. marinan PCNA-proteiinin sekvenssiä käytettiin BLAST-hakuun N. vectensiksen käännettyjä genomisekvenssejä vastaan. BLAST-kohdistuksia käytettiin N. vectensiksen proteiinisekvenssin kokoamiseen. Näiden kahden lajin sekvenssejä käytettiin GenBankin BLAST-hakuun, ja parhaiden osumien valintaa kummankin lajin osalta käytettiin fylogeneettisen puun rakentamiseen PHYLIP-paketin (versio 3.63) ohjelmissa käytetyn naapuriyhdistämisalgoritmin avulla. Etäisyys on nukleotidisubstituutioiden osuus.
N. vectensiksen genomitutkimuksemme paljasti toisenkin yllätyksen kuin geenien siirtymisen bakteerista ja dinoflagellaatista nilviäisen genomiin. Löysimme seitsemän hyvää sekvenssikohdistusta, jotka vastaavat viittä potentiaalista shikimiinihappopolun geeniä. Näiden joukossa oli neljä erittäin vahvaa linjausta, jotka vastaavat E. colin geenejä aroA, aroB, aroC ja aroE (SI Dataset 6). Näiden geenien ennustettuja proteiinisekvenssejä käytettiin BLAST-hakukyselyissä (29) National Center for Biotechnology Informationin (NCBI) GenBank-tietokantaan sukua olevien sekvenssien löytämiseksi. Kaikissa neljässä tapauksessa parhaat yhteneväisyydet olivat Flavobakteerien shikimiinihappopolun geeneihin, joiden aminohappoidentiteetti oli ≈70 % (SI Dataset 7). Useimmissa tapauksissa Tenacibaculum sp. MED152, jonka genomia sekvensoidaan parhaillaan (www.moore.org/marine-micro.aspx), oli paras vastine, vaikka tiukkaan samankaltaisuuteen saattaa vaikuttaa tietokannan vääristymä tämän bakteerin osalta. Viides geeni N. vectensiksessä vastasi E. colin aroF-H-geenejä, jotka koodaavat 3-deoksi-d-arabinoheptulosonaatti-7-fosfaattisyntaasin (DAHPS) isoentsyymejä. BLAST-haku osoitti kuitenkin, että parhaat osumat (90 % aminohappoidentiteetti) olivat Flavobakteerien kdsA-geenejä; ne koodaavat muita DAHPS-perheen isoentsyymejä, jotka osallistuvat lipopolysakkaridisynteesiin.
N. vectensiksen geenisekvenssien suuri samankaltaisuus bakteerien shikimaattireitin geenisekvenssien kanssa voisi selittyä joko hiljattaisella HGT-tapahtumalla tai bakteeriperäisen DNA:n kontaminaatiolla N. vectensiksen perimän sekvensseissä. Koodonien käyttö muistutti pikemminkin Tenacibaculumia kuin N. vectensistä. Tunnistettiin kaksi sekvenssiä, jotka näyttivät olevan merkittäviä fragmentteja bakteerien 16S rRNA-geeneistä. Yksi 16S rRNA -sekvenssi (985 bp; SI Dataset 8a ) oli lähimpänä Pseudomonas-sekvenssiä. Koska se ei kuitenkaan kuulunut muita bakteerisekvenssejä sisältävään telineeseen eikä muita Pseudomonasin kaltaisia genomisekvenssejä havaittu, on todennäköistä, että se on peräisin sekvensointikontaminaatiosta. Koska alkuperäiset shotgun-sekvensointitiedot eivät olleet käytettävissämme, emme voineet analysoida N. vectensiksen genomia käyttämällä hiljattain julkaistua versiota Glimmer-geeniannotaatiotyökalusta (http://cbcb.umd.edu/software/glimmer; ref. 30), mikä olisi ollut hyödyllinen tapa kvantifioida pienillä telineillä koodatun ja siten todennäköisesti elävistä bakteereista peräisin olevan hologenomin osuus.
Toinen 16S rRNA-sekvenssi kuului telineeseen, joka sisälsi myös 23S rRNA-sekvenssejä rRNA-operoneille tyypillisessä järjestyksessä (720 bp; SI Dataset 8b ), ja 16S rRNA:n osuuden fylogeneettinen puu (kuva 4) osoitti, että sekvenssi oli peräisin flavobakteerista, mutta sitä ei voitu luokitella tunnettuun sukuun. Myös aroA-, aroB-, aroC- ja aroE-sekvensseille muodostettiin fylogeneettiset puut, ja tulokset olivat samanlaisia. Toinen näkökohta oli se, että suuri osa N. vectensiksen genomista oli järjestäytynyt suuriksi telineiksi, kun taas nämä 16S rRNA:n pätkät esiintyivät pieninä telineinä, joista sekvensoitiin lyhyitä kontigeja, joten vain epätäydellisiä geenisekvenssejä saatiin esiin. Tämä tulos antoi ensimmäisen viitteen siitä, että nämä 16S rRNA-fragmentit saattaisivat olla peräisin bakteerikontaminaatiosta eivätkä varsinaisesti N. vectensiksen genomisesta DNA:sta. Tenacibaculum-genomihankkeessa on tunnistettu suurin osa sen geeneistä, ja genomin annotaatiosta saatuja 2 679 ennustettua proteiinisekvenssiä käytettiin BLAST-hakuun käännettyä N. vectensis -DNA:ta vastaan. Kun käytettiin tiukkaa odotusarvoa <10-30, 509 Tenacibaculum-sekvenssiä (19 %) antoi positiivisia osumia. Vähemmän tiukka raja-arvo (10-10) antoi kuitenkin 1563 (58 %) osumaa. Monissa näistä tapauksista korkeammat odotusarvot liittyivät osittaisiin sekvensseihin, koska osumat olivat pienemmissä telineissä, joissa oli pieniä kontigeja, joissa monia telineiden emäksiä ei voitu määrittää. Itse asiassa aroE- ja kdsA-geenit olivat kontigien päissä, joten niiden sekvenssit olivat typistyneitä ja niistä puuttui viimeiset 40 ja 25 aa:ta. Vaikka alkuperäisen N. vectensis -mallin vahingossa tapahtunutta kontaminaatiota ei voida sulkea pois, jännittävä mahdollisuus on, että sekvenssit ovat peräisin aiemmin epäilemättömästä flavobakteeriyhdistelmästä, joka muistuttaa Tenacibaculumia.
Fylogeneettinen puu, joka osoittaa N. vectensiksen genomisekvenssistä löytyneen 16S rRNA -geenin sekvenssin (720-bp:n fragmentti StellaBase-tietokannan merkinnässä c429301624.Contig1, http://evodevo.bu.edu/stellabase; SI Dataset 8a ) suhdetta Ribosomal Data Base Project II:ssa (julkaisu 9.52; http://rdp.cme.msu.edu) oleviin lähimpien tyyppikantojen sekvensseihin. Etäisyydet laskettiin CLUSTAL W -kohdistuksesta käyttäen F84-mallia, ja puu rakennettiin kuten kuvassa 3.
Väitteellemme, että N. vectensiksen julkaistussa genomissa olevat edellä mainitut sekvenssit voivat olla peräisin bakteereista, jotka liittyvät anemonin varhaisiin kehitysvaiheisiin, on riippumatonta tukea. Raportoidun Nematostella vectensis -genomin (20) kirjoittajat totesivat tukevassa verkkoaineistossaan (Supplement S2 osoitteessa www.sciencemag.org/cgi/content/full/317/5834/86/DC1) nimenomaisesti, että he valmistivat genomista DNA:ta toukista välttääkseen aikuisten osalta raportoitujen vierasperäisten organismien tai symbionttien aiheuttaman kontaminaation, vaikkakaan he eivät antaneet mitään viitteitä jälkimmäiselle väitteelle, joka koski kyseisiä kumppaneita. Tästä varotoimenpiteestä huolimatta on erillisiä havaintoja siitä, että tämän merianemonin alkioista ja varhaisista planulan toukista saadut DNA-isolaatit sisältävät 16S rRNA-sekvenssejä, jotka on saatu PCR-amplikoneista, jotka on liitetty bakteereihin, mukaan lukien samoihin ryhmiin (Flavobacteria ja Pseudomonas) kuuluviin bakteereihin, joista raportoimme tässä (H. Marlow ja M. Q. Martindale, henkilökohtainen tiedonanto).
Nilviäiseläimiin kuuluvista bakteerikumppaneista (bacterial associates of cnidarians of cnidarians) on tiedetty jo ainakin 30 vuotta sitten (esim, Viitteet 31 ja 32), ja viimeisimpänä ne on visualisoitu mikroskooppisesti epibionteina ja endosymbionteina kahdessa makeanveden Hydra-lajissa (33) ja kuoriin käärittyinä aggregaatteina nimellisesti ei-symbioottisen merianemonin Metridium senilen ektodermisolujen välisissä luolissa (34). Tällainen läheinen assosiaatio metazoan-solujen kanssa, joista puuttuu ulkoinen fyysinen este, mahdollistaa suoran isännän ja mikrobin välisen vuorovaikutuksen, joka ilmenee eri tavoin patogeenisuutena koralleissa (35), immuunivasteen kehittymisenä nilviäisissä (33) ja tiiviinä symbioottisena integraationa, joka huipentuu HGT:hen bakteereista isäntäeläimiin, kuten tässä on osoitettu. Nilviäis-isäntien kanssa symbioosissa elävien bakteerien biosynteettisestä tai muusta aineenvaihdunnallisesta toiminnasta ei tiedetä juuri mitään, ja tämä aihe, kuten niin monet muutkin nykyaikaisen merimikrobiologian aiheet, vaatii tutkimuksia.
Baldo et al. (36) osoittivat hiljattain, että bakteerien ja eräiden metazoanien (ekdysozoanien, mukaan lukien hyönteiset ja sukkulamatot) välinen HGT on yleisempää kuin on epäilty. He totesivat, että bakteerisekvenssejä on aiemmin pidetty kontaminaationa ja jätetty systemaattisesti pois eukaryoottisten genomien sekvensointihankkeissa, mikä mahdollisesti peittää alleen tällaisen siirron merkityksen erilaisissa selkärangattomissa. Aiemmin julkistettiin kirvoissa esiintyvän bakteerien endosymbiontti Carsonella ruddii -bakteerin genomisekvenssi (37, 38). Tämän genomisekvenssin vertailu toisen kirvojen bakteerien endosymbiontin, Buchnera aphidicolan, genomisekvenssiin osoitti, että molempien genomit olivat kärsineet huomattavasta deletoitumisesta, mukaan luettuna joidenkin keskeisiä aineenvaihduntateitä koodaavien geenien häviäminen. Yksi tällainen puuttuva reitti, joka johtaa aromaattisen aminohapon tryptofaanin muodostumiseen C. ruddiissa, kiinnitti huomiomme. Dogmin (10) mukaan tämän välttämättömän aminohapon esiasteiden pitäisi syntetisoitua shikimiinihapporeitin kautta kommensaalisissa bakteereissa. Etsimme jälleen maailmanlaajuisista sekvenssikohdistuksista shikimiinihappopolun entsyymejä koodaavia geenejä näistä bakteerien genomeista. Löysimme yhden geenin, joka koodaa oletettua 5-enolpyruvyylishikimaatti-3-fosfaattifosfolyaasia C. ruddii (vaikkakin on kyseenalaista, voisiko tämä geeni transkriboida funktionaalista tuotetta, koska sekvenssissä on paljon stop-kodoneja), ja vain kolme (shikimaatti-5-dehydrogenaasia, 5-enolipyruvyylishikimaatti-3-fosfaattifosfolyaasia ja 5-enolipyruvyylishikimaatti-3-fosfaattisyntaasia koodaavia geenejä) seitsemästä geenistä näkyi B. aphidicola -geenipatsaan genomissa (SI-tietue 9). Yhdessä oletettua Tenacibaculum-tyyppistä symbionttia ja sen isäntää N. vectensis -kasvintuhoojaa koskevien havaintojemme kanssa nämä todisteet viittaavat vahvasti siihen, että olennaisen aineenvaihduntatoiminnan häviäminen endosymbiontista on symbioosien evoluutiossa meneillään oleva geenien siirto- ja poistoprosessi, joka voi viime kädessä johtaa symbiontin sukupuuttoon sen geneettisen materiaalin asteittaisen sulauttamisen kautta isännän genomiin (37, 38).
”Jaettujen metabolisten sopeutumisten” selvittäminen, jossa olennaisten aineenvaihduntatuotteiden tuotantoon liittyy symbioosin kumppaneiden panos (vaikka toinen niistä olisikin degeneroitunut), edellyttää selkärangattomien ja mikrobien symbioosien ainutlaatuisen organisaation ja molekulaarisen toiminnan tarkempaa genomista selvittämistä. Tätä korostaa havaintomme siitä, että kaksi shikimiinireitin entsyymien geeneistä, joiden on klassisesti sanottu puuttuvan ”eläimistä”, on koodattu metazoan-isännän genomissa. Se, missä määrin tällainen HGT tai epäilemättömien bakteerikumppanien osallistuminen voi selittää johdannossa kuvatut ilmeiset aineenvaihduntapoikkeavuudet nilviäisissä, vaatii lisätutkimuksia. Näiden prosessien ymmärtäminen voi lisäksi tarjota ratkaisevan tärkeää tietoa ilmastonmuutoksen ja ympäristöstressin aiheuttamien aineenvaihduntahäiriöiden syistä erityisesti trooppisten korallien ja muiden merten nilviäisten herkissä symbiooseissa.