Rezultate și discuții
Calea anabolică a acidului shikimic are șapte etape , care pot fi catalizate de șapte polipeptide diferite sau de mai puține polipeptide multifuncționale (22). Enzimele pentru cinci dintre etapele de biosinteză sunt omoloage în toate organismele care posedă această cale. Pentru două dintre etape, există două enzime diferite cunoscute pentru fiecare, iar fiecare organism care exprimă calea are un omolog pentru una dintre aceste enzime. În plus, există două considerente suplimentare în ceea ce privește detectarea genelor care codifică enzimele căii acidului shikimic la N. vectensis: (i) originea evolutivă a genelor ar fi incertă, astfel încât secvențele ar fi putut diverge considerabil față de orice secvențe de comparație utilizate și (ii) secvența genomică poate conține introni.
Pentru a obține cea mai mare sensibilitate a interogării, a fost utilizată suita de programe HMMER (23) pentru a căuta secvențe proteice consensuale prin utilizarea profilurilor modelului Markov ascuns. Această metodă oferă o pondere mai mare reziduurilor conservate din punct de vedere evolutiv, iar profilurile locale dezvăluie fragmentele de proteine din exonii codificatori. Secvența genomului de N. vectensis a fost tradusă în toate cele șase cadre de citire și a fost căutată prin utilizarea a nouă profiluri care acoperă toate cele șapte enzime ale căii acidului shikimic obținute din baza de date Pfam (24). Două alinieri („hit-uri”) au fost găsite în scheletele mari cu HMMER folosind profilurile aroA și aroB (SI Dataset 1). Rezultatul aroA a apărut în scaffold_33 (1,4 Mbp). Atunci când secvența proteică prezisă a fost utilizată pentru o căutare BLAST, aceasta s-a aliniat cu produsul genic murA al unei varietăți de bacterii cu o identitate de ≈40% de aminoacizi. Această genă bacteriană codifică UDP-N-acetilglucozamina 1-carboxiviniltransferaza (SI Dataset 2), o enzimă înrudită cu aroA (3-fosfozihikimat 1-carboxiviniltransferaza), în timp ce enzima MurA este implicată în biosinteza peretelui celular peptidoglican. Această constatare a sugerat inițial că secvența aliniată ar putea proveni dintr-o contaminare bacteriană. Cu toate acestea, o examinare atentă a rezultatelor HMMER a arătat că proteinei prezise îi lipseau ≈20 de aminoacizi conservați la terminalul C și că secvența de aminoacizi lipsă era localizată la ≈1 kb în aval în schelet. Compararea vizuală a secvenței genomice cu secvențele consensuale pentru intronii de vertebrate a dezvăluit situsuri de îmbinare plauzibile (AGGTRA și, respectiv, AGG) care ar produce ARNm care codifică un omolog murA de lungime completă având o potrivire apropiată de profilul de căutare. Prezența intronilor elimină astfel problema contaminanților bacterieni sau a simbioților ca sursă proximală a acestei gene.
Schema de 1,4 Mbp care conține omologul asemănător cu aroA a fost tradusă în toate cele șase cadre de citire și scanată prin utilizarea HMMER cu întreaga bibliotecă Pfam. Acest proces a arătat prezența unei varietăți de domenii eucariote tipice, inclusiv transcriptaza inversă, EGF, domeniul EGF de legare a calciului, peptida asemănătoare cu defensina, actina și domeniul fork-head, susținând din nou ideea că omologul asemănător cu aroA este conținut chiar în genomul N. vectensis. Secvența proteinei prezise a fost utilizată pentru a construi un arbore filogenetic pentru a o compara cu cele mai apropiate secvențe bacteriene găsite în cadrul căutării BLAST și cu Tenacibaculum sp. MED152 și Escherichia coli W3110 (Fig. 1). Secvența asemănătoare aroA din N. vectensis nu s-a grupat cu omologii din niciun grup de bacterii testate, dar a prezentat o divergență de secvență față de secvențele bacteriene comparabilă cu cele ale genelor murA între diferite grupuri bacteriene. Nu se știe încă dacă această genă din N. vectensis dirijează biosinteza peptidoglicanului sau a intermediarilor căii shikimatului.
Arbore filogenetic care arată relația dintre secvența proteică prezisă a genei asemănătoare aroA din N. vectensis și secvențele proteice murA prezise ale celor mai bune șapte rezultate într-o analiză BLAST și cu cele din E. coli și Tenacibaculum. Distanțele au fost calculate pornind de la o aliniere CLUSTAL W utilizând matricea Jones-Taylor-Thornton, iar arborele a fost construit prin utilizarea algoritmului de îmbinare a vecinilor în programele din pachetul PHYLIP (versiunea 3.63). Distanța este proporția de substituții de aminoacizi.
Cea de-a doua aliniere, legată de aroB, a fost prezentă pe schela-85 (0,8 Mbp). Atunci când secvența proteică prezisă a fost utilizată pentru o căutare BLAST (SI Dataset 3), cea mai apropiată potrivire a fost cu dinoflagelata Oxyrrhis marina (66% identitate de secvență de aminoacizi). La acest dinoflagelat, enzima aroB (3-dehidrochinat sintetază) este prezentă în cloroplast și este fuzionată cu o O-metiltransferază (25). Atunci când secvența completă a proteinei de fuziune din O. marina a fost utilizată într-o căutare BLAST împotriva ADN-ului tradus din N. vectensis, a fost evident că o genă a proteinei de fuziune era, de asemenea, prezentă în N. vectensis (SI Dataset 4). Această genă conține cinci introni. Atunci când segmentul aroB al genei a fost utilizat pentru a construi un arbore filogenetic cu cele mai apropiate rezultate BLAST (Fig. 2), secvența N. vectensis a apărut ca fiind cea mai apropiată de cele a două dinoflagelate (O. marina și Heterocapsa triquetra) care posedă fiecare gena de fuziune completă. Din nou, această genă ar putea fi implicată în sinteza precursorilor care conduc la metaboliții secundari derivați din calea shikimatului, mai ales 3-dehidrochinatul, punctul intermediar putativ de ramificare către biosinteza MAA (5).
Arborele filogenetic care arată relația dintre secvența proteică dedusă a părții aroB a proteinei AroB-O-metiltransferazei din N. vectensis și proteinele omologe din dinoflagelate. Secvențele au fost aliniate cu CLUSTALW, iar arborele a fost construit cu ajutorul algoritmului de alăturare a vecinilor cu distanțe derivate din modelul Jones-Taylor-Thornton (utilizând PHYLIP versiunea 3.63). Arborele a fost înrădăcinat prin utilizarea Anabaena variabilis ca grup de ieșire. Distanțele reprezintă proporția de substituții de aminoacizi, iar valorile bootstrap bazate pe 100 de eșantioane sunt prezentate.
Pentru că dinoflagelatele endosimbiotice sunt adesea asociate cu cnidarii, a trebuit să se ia în considerare posibilitatea ca un dinoflagelat nedetectat să fi contaminat secvența N. vectensis. Secvențele de proteine prezise derivate din genele vecine de o parte și de alta a omologului asemănător cu aroB au fost utilizate pentru căutările BLAST. Cele mai apropiate alinieri au fost cu diverse vertebrate și cu secvențe din ariciul de mare Strongylocentrotus purpuratus, ceea ce face puțin probabil ca aceste gene ale căii shikimatului din genomul metazoarului gazdă să provină din contaminarea cu genomul unei dinoflagelate asociate (SI Dataset 5). În plus, trei secvențe proteice presupuse de la O. marina au fost utilizate pentru căutări BLAST față de N. vectensis. Cele mai bune rezultate au fost utilizate pentru a construi un arbore filogenetic și, în niciun caz, secvențele din N. vectensis și O. marina nu au fost strâns legate între ele (Fig. 3). Cu toate acestea, trebuie subliniat faptul că sunt necesare dovezi suplimentare pentru a determina funcția presupusă a acestor gene și pentru a dovedi că acestea au fost achiziționate prin transfer orizontal de gene (HGT) la N. vectensis, în special pentru că se presupune că cnidarii au gene conservate pe care le-au moștenit de la strămoșii nemetazoieni (26). Deși importanța HGT în evoluția eucariotă rămâne controversată, există dovezi independente pentru apariția unui alt eveniment HGT la N. vectensis. Examinarea genomică comparativă a enzimelor ciclului glioxilatului a evidențiat transferul probabil al unei isocitrat liaze bifuncționale (ICL) și al unei MS, codificate de o genă ICL-MS fuzionată de la un precursor bacterian, în genomul N. vectensis (27). Constatările noastre sunt similare cu cele ale altora care raportează dovezi ale transferului de gene la speciile de cnidari de apă dulce (Hydra) de la mai mulți parteneri eucarioți ancestrali (18, 28).
Arborele filogenetic al secvențelor proteice PCNA. Secvența proteinei PCNA din O. marina a fost utilizată pentru o căutare BLAST față de secvențele genomice traduse din N. vectensis. Alinierile BLAST au fost utilizate pentru a asambla secvența proteinei din N. vectensis. Secvențele din cele două specii au fost utilizate pentru căutări BLAST în GenBank, iar o selecție a celor mai bune rezultate pentru fiecare specie a fost utilizată pentru a construi un arbore filogenetic prin utilizarea algoritmului de îmbinare a vecinilor în programele din pachetul PHYLIP (versiunea 3.63). Distanța este proporția de substituții de nucleotide.
Explorarea noastră genomică a N. vectensis a dezvăluit o altă surpriză dincolo de transferul de gene de la o bacterie și o dinoflagelată în genomul cnidarianului. Am găsit șapte aliniamente bune de secvențe care corespund la cinci gene potențiale ale căii acidului shikimic. Printre acestea se numărau patru alinieri foarte puternice care corespund genelor aroA, aroB, aroC și aroE din E. coli (SI Dataset 6). Secvențele proteice prezise ale acestor gene au fost utilizate în interogările de căutare BLAST (29) în baza de date GenBank a National Center for Biotechnology Information (NCBI) pentru a descoperi secvențe înrudite. În toate cele patru cazuri, cele mai bune corespondențe au fost cu genele căii acidului shikimic din Flavobacteria, având o identitate de ≈70% de aminoacizi (SI Dataset 7). În majoritatea cazurilor, Tenacibaculum sp. MED152, al cărui genom este în curs de secvențiere (www.moore.org/marine-micro.aspx), a fost cea mai bună potrivire, deși o similitudine strictă poate fi influențată de prejudecata din baza de date pentru această bacterie. O a cincea genă din N. vectensis a corespuns cu genele aroF-H din E. coli, care codifică izoenzimele pentru 3-deoxi-d-arabinoheptulosonat-7-fosfat sintetază (DAHPS). Cu toate acestea, căutările BLAST au arătat că cele mai bune rezultate (90% identitate de aminoacizi) sunt genele kdsA de la Flavobacteria; acestea codifică alte izoenzime din familia DAHPS care sunt implicate în sinteza lipopolizaharidelor.
Similitudinea ridicată a secvențelor genelor N. vectensis cu cele ale căii bacteriene a shikimatului ar putea fi explicată fie printr-un eveniment HGT recent, fie prin contaminarea ADN-ului bacterian în secvențele genomului N. vectensis. Utilizarea codonilor a fost similară mai degrabă la Tenacibaculum decât la N. vectensis. Au fost identificate două secvențe care păreau a fi fragmente semnificative ale genelor ARNr 16S bacteriene. Una dintre secvențele de ARNr 16S (985 pb; SI Dataset 8a ) a prezentat cea mai mare similitudine cu secvențele Pseudomonas. Cu toate acestea, deoarece nu aparținea unui schelet care conținea alte secvențe bacteriene și nu au fost detectate alte secvențe genomice asemănătoare cu Pseudomonas, este probabil ca aceasta să provină dintr-un contaminant de secvențiere. Deoarece nu am avut la dispoziție datele originale de secvențiere shotgun, nu am putut analiza genomul N. vectensis utilizând o versiune recent lansată a instrumentului de adnotare genetică Glimmer (http://cbcb.umd.edu/software/glimmer; ref. 30), care ar fi fost o modalitate utilă de a cuantifica procentul hologenomului codificat pe schele mici și care, prin urmare, este probabil să provină din bacterii vii.
Cealaltă secvență de ARNr 16S aparținea unei schele, care conținea, de asemenea, secvențe de ARNr 23S într-un aranjament tipic pentru operonii de ARNr (720 pb; SI Dataset 8b ), iar un arbore filogenetic al porțiunii de ARNr 16S (Fig. 4) a arătat că provine de la o flavobacterie, dar nu a putut fi atribuită unui gen cunoscut. Arborii filogenetici au fost, de asemenea, construiți pentru secvențele aroA, aroB, aroC și aroE, cu rezultate similare. Un alt aspect de luat în considerare a fost faptul că o mare parte din genomul N. vectensis a fost organizat în eșantioane mari, în timp ce aceste fragmente de ARNr 16S au fost prezente în eșantioane mici din care au fost secvențiate contig-uri scurte, astfel încât au fost evidențiate doar secvențe genetice incomplete. Acest rezultat a oferit primul indiciu că aceste fragmente de ARNr 16S ar putea proveni mai degrabă din contaminarea bacteriană decât din ADN genomic de N. vectensis în sens strict. Proiectul privind genomul Tenacibaculum a identificat majoritatea genelor sale, iar cele 2 679 de secvențe proteice prezise din adnotarea genomică au fost utilizate pentru o căutare BLAST cu ADN tradus de N. vectensis. Atunci când a fost utilizată o valoare așteptată strictă de <10-30, 509 dintre secvențele Tenacibaculum (19%) au dat rezultate pozitive. Cu toate acestea, o valoare limită mai puțin strictă (10-10) a dat 1 563 (58%) de rezultate pozitive. În multe dintre aceste cazuri, valorile așteptate mai mari au fost asociate cu secvențe parțiale, deoarece rezultatele pozitive se aflau în eșantioane mai mici având contig-uri mici, multe baze din eșantioane nefiind determinate. De fapt, genele aroE și kdsA se aflau la capetele contigurilor, astfel încât secvențele lor erau trunchiate și le lipseau ultimii 40, respectiv 25 aa. Deși nu poate fi exclusă o contaminare accidentală a șablonului original N. vectensis, o posibilitate interesantă este aceea că secvențele provin de la un asociat flavobacterian nesuspectat anterior, similar cu Tenacibaculum.
Arborele filogenetic care arată relația dintre secvența genei 16S ARNr găsită în secvența genomului N. vectensis (fragment de 720-bp în intrarea c429301624.Contig1 din StellaBase, http://evodevo.bu.edu/stellabase; SI Dataset 8a ) și secvențele tulpinilor tip cele mai apropiate din Ribosomal Data Base Project II (versiunea 9.52; http://rdp.cme.msu.edu). Distanțele au fost calculate dintr-o aliniere CLUSTAL W folosind modelul F84, iar arborele a fost construit ca în Fig. 3.
Există un sprijin independent pentru afirmația noastră conform căreia secvențele de mai sus din genomul publicat pentru N. vectensis pot proveni de la bacterii asociate cu stadiile timpurii de dezvoltare a anemonei. Autorii genomului Nematostella vectensis raportat (20), în materialul online de susținere (Supliment S2 în www.sciencemag.org/cgi/content/full/317/5834/86/DC1), au declarat în mod explicit că au pregătit ADN genomic din larve pentru a evita contaminarea cu comensali sau simbioți care au fost raportați pentru adulți, deși nu au oferit nicio referință pentru această ultimă afirmație cu privire la astfel de asociați. În ciuda acestei precauții, există constatări separate că ADN-ul izolat din embrionii și larvele de planule timpurii ale acestei anemone de mare conțin secvențe de ARNr 16S obținute din ampliconi PCR atribuiți unor bacterii, inclusiv cele din aceleași grupuri (Flavobacteria și Pseudomonas) pe care le raportăm aici (H. Marlow și M. Q. Martindale, comunicare personală).
Asociații bacterieni ai cnidariilor sunt cunoscuți de cel puțin 30 de ani (de ex, ref. 31 și 32), iar cel mai recent au fost vizualizați la microscop sub formă de epibionți și endosimbionți la două specii de Hydra de apă dulce (33) și sub formă de agregate învelite în plic în cavernele dintre celulele ectodermice ale anemonei de mare Metridium senile, nominal nesimbiotice (34). O astfel de asociere intimă cu celulele metazoarelor, lipsită de o barieră fizică externă, se pretează la interacțiuni directe între gazdă și microb, care se manifestă în diverse moduri, cum ar fi patogenitatea la corali (35), dezvoltarea răspunsului imunitar la cnidarii (33) și o integrare simbiotică strânsă care culminează cu HGT de la bacterie la cnidarul gazdă, așa cum s-a demonstrat aici. Practic nu se știe aproape nimic despre funcția biosintetică sau alte funcții metabolice ale bacteriilor simbiotice cu gazdele cnidare, un subiect care, ca multe altele în microbiologia marină modernă, merită investigat.
HGT între bacterii și anumite metazoare (ecdysozoare, inclusiv insecte și nematode) a fost demonstrat recent de Baldo et al. (36) ca fiind mai răspândit decât se bănuia. Aceștia au remarcat faptul că secvențele bacteriene au fost considerate anterior drept contaminare și excluse în mod sistematic de către proiectele de secvențiere a genomului eucariot, ceea ce poate masca importanța unui astfel de transfer la diverse nevertebrate. Anterior, a fost făcută publică secvența genomului endosimbiontului bacterian Carsonella ruddii găsit în afide (37, 38). Compararea secvenței acestui genom cu cea a unui alt endosimbiont bacterian al afidelor, Buchnera aphidicola, a arătat că ambele genomuri au suferit o deleție considerabilă, inclusiv pierderea unor gene care codifică căi metabolice esențiale. Una dintre aceste căi lipsă, care duce la formarea aminoacidului aromatic triptofan la C. ruddii, ne-a atras atenția. Conform dogmei (10), precursorii pentru acest aminoacid esențial ar trebui să fie sintetizați prin calea acidului shikimic în bacteriile comensale. Din nou, am căutat alinieri de secvențe globale pentru genele care codifică enzimele căii acidului shikimic în aceste genomuri bacteriene. Am găsit o genă care codifică o fosfoliază putativă a 5-enolpiruvylshikimat-3-fosfat în C. ruddii (deși este discutabil dacă această genă ar putea transcrie un produs funcțional din cauza numărului mare de codoni de oprire din secvență) și numai trei (cele care codifică shikimat 5-dehidrogenază, 5-enolpiruvylshikimat-3-fosfat fosfoliază și 5-enolpiruvylshikimat-3-fosfat sintetază) din cele șapte gene ale căii au fost evidente în genomul B. aphidicola (SI Dataset 9). Luate împreună cu constatările noastre pentru simbiotul putativ asemănător cu Tenacibaculum și gazda sa N. vectensis, aceste dovezi sugerează cu tărie că pierderea funcției metabolice esențiale în endosimbiont este un proces continuu de transfer și ștergere de gene în evoluția simbiozelor, care ar putea duce în cele din urmă la dispariția simbiotului prin asimilarea progresivă a materialului său genetic în genomul gazdei (37, 38).
Elucidarea „adaptărilor metabolice partajate”, în care producția de metaboliți esențiali implică aportul partenerilor unei simbioze (chiar dacă unul dintre ei este degenerat), va necesita o disecție genomică suplimentară a organizării unice și a funcționării moleculare a simbiozelor nevertebrate-microbiene. Acest lucru este evidențiat de constatarea noastră că două dintre genele pentru enzimele căii shikimice, despre care se spune în mod clasic că sunt absente la „animale”, sunt codificate în genomul gazdei metazoare. Măsura în care o astfel de HGT, sau implicarea unor consorți bacterieni nesuspectați, poate explica anomaliile metabolice aparente la cnidari descrise în introducere, justifică investigații suplimentare. Înțelegerea acestor procese poate oferi, în plus, o perspectivă critică asupra cauzelor disfuncțiilor metabolice evocate de schimbările climatice și de stresul de mediu, în special în simbiozele fragile ale coralilor tropicali și ale altor cnidari marini.
.