Resultados y discusión
La vía anabólica del ácido shikímico tiene siete pasos , que pueden ser catalizados por siete polipéptidos diferentes o por menos polipéptidos multifuncionales (22). Las enzimas para cinco de los pasos biosintéticos son homólogas en todos los organismos que poseen la vía. Para dos de los pasos, se conocen dos enzimas diferentes para cada uno, y cada organismo que expresa la vía tiene un homólogo de una de estas enzimas. Además, hay dos consideraciones adicionales para detectar los genes que codifican las enzimas de la vía del ácido shikímico en N. vectensis: (i) el origen evolutivo de los genes sería incierto por lo que las secuencias podrían haber divergido considerablemente de cualquier secuencia de comparación utilizada y (ii) la secuencia genómica puede contener intrones.
Para obtener la mayor sensibilidad de la interrogación, se utilizó el conjunto de programas HMMER (23) para buscar secuencias proteicas de consenso utilizando perfiles de modelos de Markov ocultos. Este método proporciona un mayor peso a los residuos conservados evolutivamente, y los perfiles locales revelan los fragmentos de proteína en los exones codificantes. La secuencia del genoma de N. vectensis se tradujo en los seis marcos de lectura y se buscó utilizando nueve perfiles que cubrían las siete enzimas de la vía del ácido shikímico obtenidas de la base de datos Pfam (24). Se encontraron dos alineaciones («hits») en grandes andamios con HMMER utilizando los perfiles aroA y aroB (SI Dataset 1). La coincidencia con aroA se produjo en el andamio 33 (1,4 Mbp). Cuando la secuencia de la proteína predicha se utilizó para una búsqueda BLAST, se alineó con el producto del gen murA de una variedad de bacterias con ≈40% de identidad de aminoácidos. Este gen bacteriano codifica la UDP-N-acetilglucosamina 1-carboxiviniltransferasa (SI Dataset 2), una enzima relacionada con la aroA (3-fosfoshikimato 1-carboxiviniltransferasa), mientras que la enzima MurA está implicada en la biosíntesis de la pared celular del peptidoglicano. Este hallazgo sugirió inicialmente que la secuencia alineada podría proceder de una contaminación bacteriana. Sin embargo, un examen detallado de los resultados del HMMER mostró que la proteína predicha carecía de ≈20 aminoácidos conservados en el terminal C, y que la secuencia de aminoácidos que faltaba se localizaba ≈1 kb aguas abajo en el andamio. La comparación visual de la secuencia genómica con las secuencias de consenso para los intrones de los vertebrados reveló sitios de empalme plausibles (AGGTRA y AGG, respectivamente) que producirían un ARNm que codificaría un homólogo de murA de longitud completa que se ajustaría al perfil de búsqueda. La presencia de intrones elimina, por tanto, la cuestión de los contaminantes bacterianos o los simbiontes como fuente próxima de este gen.
El andamio de 1,4 Mbp que contiene el homólogo de aroA se tradujo en los seis marcos de lectura y se escaneó utilizando HMMER con toda la biblioteca Pfam. Este proceso mostró la presencia de una variedad de dominios eucariotas típicos, incluyendo la transcriptasa inversa, el EGF, el dominio EGF de unión al calcio, el péptido similar a la defensina, la actina y el dominio de la cabeza de horquilla, apoyando de nuevo la idea de que el homólogo aroA-like está contenido en el propio genoma de N. vectensis. La secuencia de la proteína predicha se utilizó para construir un árbol filogenético que se comparó con las secuencias bacterianas más cercanas encontradas en la búsqueda BLAST y con Tenacibaculum sp. MED152 y Escherichia coli W3110 (Fig. 1). La secuencia aroA-like de N. vectensis no se agrupó con homólogas de ningún grupo de bacterias analizadas, pero mostró una divergencia de secuencia con respecto a las secuencias bacterianas comparable a la de los genes murA entre diferentes grupos bacterianos. Todavía se desconoce si este gen en N. vectensis dirige la biosíntesis del peptidoglicano o de los intermediarios de la vía del shikimato.
Árbol filogenético que muestra la relación de la secuencia proteica predicha del gen aroA-like de N. vectensis con las secuencias proteicas murA predichas de los siete mejores resultados de un análisis BLAST y con las de E. coli y Tenacibaculum. Las distancias se calcularon a partir de un alineamiento CLUSTAL W utilizando la matriz Jones-Taylor-Thornton, y el árbol se construyó utilizando el algoritmo de unión de vecinos en programas del paquete PHYLIP (versión 3.63). La distancia es la proporción de sustituciones de aminoácidos.
El segundo alineamiento, relacionado con aroB, estaba presente en el andamio-85 (0,8 Mbp). Cuando la secuencia de la proteína predicha se utilizó para una búsqueda BLAST (SI Dataset 3), el ajuste más cercano fue con el dinoflagelado Oxyrrhis marina (66% de identidad de secuencia de aminoácidos). En este dinoflagelado, la enzima aroB (3-dehidroquinato sintasa) está presente en el cloroplasto y está fusionada con una O-metiltransferasa (25). Cuando se utilizó la secuencia completa de la proteína de fusión de O. marina en una búsqueda BLAST contra el ADN traducido de N. vectensis, fue evidente que un gen de la proteína de fusión también estaba presente en N. vectensis (SI Dataset 4). Este gen contiene cinco intrones. Cuando se utilizó el segmento aroB del gen para construir un árbol filogenético con los resultados de BLAST más cercanos (Fig. 2), la secuencia de N. vectensis resultó ser la más cercana a las de dos dinoflagelados (O. marina y Heterocapsa triquetra) que poseen cada uno el gen de fusión completo. De nuevo, este gen podría estar implicado en la síntesis de precursores que conducen a los metabolitos secundarios derivados de la vía del shikimato, sobre todo el 3-dehidroquinato, el punto de ramificación intermedio putativo para la biosíntesis de MAA (5).
Árbol filogenético que muestra la relación de la secuencia proteica deducida de la parte aroB de la proteína AroB-O-metiltransferasa de N. vectensis con las proteínas homólogas de dinoflagelados. Las secuencias se alinearon con CLUSTALW y el árbol se construyó utilizando el algoritmo de unión de vecinos con distancias derivadas del modelo Jones-Taylor-Thornton (utilizando PHYLIP versión 3.63). El árbol se enraizó utilizando Anabaena variabilis como grupo externo. Las distancias son la proporción de sustituciones de aminoácidos, y se muestran los valores bootstrap basados en 100 muestras.
Debido a que los dinoflagelados endosimbióticos se asocian a menudo con los cnidarios, había que considerar la posibilidad de que hubiera un dinoflagelado no detectado que contaminara la secuencia de N. vectensis. Las secuencias de proteínas predichas derivadas de los genes vecinos a ambos lados del homólogo aroB se utilizaron para las búsquedas BLAST. Los alineamientos más cercanos fueron con varios vertebrados y con secuencias del erizo de mar Strongylocentrotus purpuratus, lo que hace poco probable que estos genes de la vía del shikimato en el genoma del metazoo hospedador procedan de la contaminación por el genoma de un dinoflagelado asociado (SI Dataset 5). Además, se utilizaron tres secuencias proteicas putativas de O. marina para realizar búsquedas BLAST contra N. vectensis. Los mejores resultados se utilizaron para construir un árbol filogenético, y en ningún caso las secuencias de N. vectensis y O. marina estaban estrechamente relacionadas (Fig. 3). Sin embargo, hay que subrayar que se necesitan pruebas adicionales para determinar la supuesta función de estos genes y para probar su adquisición por transferencia horizontal de genes (HGT) en N. vectensis, especialmente porque los cnidarios supuestamente tienen genes conservados que heredaron de ancestros no metazoarios (26). Aunque la importancia del HGT en la evolución de los eucariotas sigue siendo controvertida, existen pruebas independientes de la ocurrencia de otro evento HGT en N. vectensis. El examen genómico comparativo de las enzimas del ciclo del glioxilato ha revelado la probable transferencia al genoma de N. vectensis de una isocitrato liasa (ICL) bifuncional y una EM, codificada por un gen fusionado ICL-MS procedente de un precursor bacteriano (27). Nuestros hallazgos son similares a los de otros que reportan evidencia de transferencia de genes a especies de cnidarios de agua dulce (Hydra) desde múltiples socios eucariotas ancestrales (18, 28).
Árbol filogenético de las secuencias de la proteína PCNA. La secuencia de la proteína PCNA de O. marina se utilizó para una búsqueda BLAST contra las secuencias genómicas traducidas de N. vectensis. Las alineaciones BLAST se utilizaron para ensamblar la secuencia de la proteína de N. vectensis. Las secuencias de las dos especies se utilizaron para realizar búsquedas BLAST en GenBank, y se utilizó una selección de los mejores resultados de cada especie para construir un árbol filogenético mediante el algoritmo de unión de vecinos en programas del paquete PHYLIP (versión 3.63). La distancia es proporción de sustituciones de nucleótidos.
Nuestra minería genómica de N. vectensis reveló otra sorpresa más allá de la transferencia de genes de una bacteria y un dinoflagelado al genoma del cnidario. Encontramos siete buenas alineaciones de secuencias correspondientes a cinco genes potenciales de la vía del ácido shikímico. Entre ellos había cuatro alineamientos muy fuertes correspondientes a los genes aroA, aroB, aroC y aroE de E. coli (SI Dataset 6). Las secuencias proteicas predichas de estos genes se utilizaron en consultas de búsqueda BLAST (29) contra la base de datos GenBank del Centro Nacional de Información Biotecnológica (NCBI) para revelar secuencias relacionadas. En los cuatro casos, las mejores coincidencias fueron con los genes de la vía del ácido shikímico en Flavobacteria, teniendo ≈70% de identidad de aminoácidos (SI Dataset 7). En la mayoría de los casos, Tenacibaculum sp. MED152, cuyo genoma está siendo secuenciado (www.moore.org/marine-micro.aspx), fue la mejor coincidencia, aunque una similitud estricta puede estar influenciada por el sesgo de la base de datos para esta bacteria. Un quinto gen de N. vectensis correspondía a los genes aroF-H de E. coli, que codifican isoenzimas para la 3-deoxi-d-arabinoheptulosonato-7-fosfato sintasa (DAHPS). Sin embargo, las búsquedas de BLAST mostraron que las mejores coincidencias (90% de identidad de aminoácidos) eran los genes kdsA de Flavobacteria; éstos codifican otras isoenzimas de la familia DAHPS que están implicadas en la síntesis de lipopolisacáridos.
La alta similitud de las secuencias genéticas de N. vectensis con las de la vía del shikimato bacteriano podría explicarse por un evento HGT reciente o por la contaminación de ADN bacteriano en las secuencias del genoma de N. vectensis. El uso de codones era similar al de Tenacibaculum y no al de N. vectensis. Se identificaron dos secuencias que parecían ser fragmentos significativos de genes 16S rRNA bacterianos. Una secuencia de ARNr 16S (985 pb; SI Dataset 8a ) mostraba la mayor similitud con las secuencias de Pseudomonas. Sin embargo, como no pertenecía a un andamiaje que contuviera otras secuencias bacterianas y no se detectaron otras secuencias genómicas similares a Pseudomonas, es probable que proceda de un contaminante de la secuenciación. Debido a que los datos originales de secuenciación de escopeta no estaban disponibles para nosotros, no pudimos analizar el genoma de N. vectensis utilizando una versión recientemente publicada de la herramienta de anotación de genes Glimmer (http://cbcb.umd.edu/software/glimmer; ref. 30), que habría sido una forma útil de cuantificar el porcentaje del hologenoma codificado en andamios pequeños y que, por lo tanto, es probable que provenga de bacterias vivas.
La otra secuencia de ARNr 16S pertenecía a un andamio, que también contenía secuencias de ARNr 23S en una disposición típica de operones de ARNr (720 pb; SI Dataset 8b ), y un árbol filogenético de la porción de ARNr 16S (Fig. 4) mostró que procedía de una flavobacteria, pero no pudo asignarse a un género conocido. También se construyeron árboles filogenéticos para las secuencias aroA, aroB, aroC y aroE, con resultados similares. Otra consideración fue que gran parte del genoma de N. vectensis estaba organizado en grandes andamios, mientras que estos fragmentos de ARNr 16S estaban presentes en pequeños andamios de los que se secuenciaron contigs cortos, de modo que sólo se revelaron secuencias genéticas incompletas. Este resultado dio el primer indicio de que estos fragmentos de ARNr 16S podrían proceder de la contaminación bacteriana y no del ADN genómico de N. vectensis en sentido estricto. El proyecto del genoma de Tenacibaculum ha identificado la mayoría de sus genes, y las 2.679 secuencias de proteínas predichas a partir de la anotación genómica se utilizaron para una búsqueda BLAST contra el ADN traducido de N. vectensis. Cuando se utilizó un valor esperado estricto de <10-30, 509 de las secuencias de Tenacibaculum (19%) dieron resultados positivos. Sin embargo, un límite menos estricto (10-10) dio 1.563 (58%) resultados positivos. En muchos de estos casos, los valores esperados más altos se asociaron con secuencias parciales, ya que los aciertos se encontraban en andamios más pequeños que tenían contigs pequeños con muchas bases en los andamios sin determinar. De hecho, los genes aroE y kdsA se encontraban en los extremos de los contigs, por lo que sus secuencias estaban truncadas y carecían de los últimos 40 o 25 aa, respectivamente. Aunque no se puede descartar una contaminación accidental de la plantilla original de N. vectensis, una posibilidad emocionante es que las secuencias procedan de un asociado de flavobacterias similar a Tenacibaculum, previamente insospechado.
Árbol filogenético que muestra la relación de la secuencia del gen 16S rRNA encontrada en la secuencia del genoma de N. vectensis (fragmento de 720 pb en la entrada c429301624.Contig1 de StellaBase, http://evodevo.bu.edu/stellabase; SI Dataset 8a ) con las secuencias de las cepas tipo más cercanas en Ribosomal Data Base Project II (release 9.52; http://rdp.cme.msu.edu). Las distancias se calcularon a partir de un alineamiento CLUSTAL W utilizando el modelo F84, y el árbol se construyó como en la Fig. 3.
Hay un apoyo independiente para nuestra afirmación de que las secuencias anteriores en el genoma publicado para N. vectensis pueden provenir de bacterias asociadas con las primeras etapas de desarrollo de la anémona. Los autores del genoma de Nematostella vectensis publicado (20), en su material de apoyo en línea (Suplemento S2 en www.sciencemag.org/cgi/content/full/317/5834/86/DC1), declararon explícitamente que prepararon el ADN genómico de las larvas para evitar la contaminación por los comensales o simbiontes que se han notificado para los adultos, aunque no dieron ninguna referencia para esta última afirmación en relación con dichos asociados. A pesar de esta precaución, existen hallazgos separados de que los aislados de ADN de embriones y larvas de plánulas tempranas de esta anémona de mar contienen secuencias de ARNr 16S obtenidas de amplicones de PCR atribuidos a bacterias, incluyendo las de los mismos grupos (Flavobacteria y Pseudomonas) que reportamos aquí (H. Marlow y M. Q. Martindale, comunicación personal).
Los asociados bacterianos de los cnidarios se conocen desde hace al menos 30 años (e.g., refs. 31 y 32), y más recientemente han sido visualizados microscópicamente como epibiontes y endosimbiontes en dos especies de Hydra de agua dulce (33) y como agregados envueltos en cavernas entre células ectodérmicas de la anémona marina Metridium senile, nominalmente no simbiótica (34). Esta asociación tan íntima con las células de los metazoos, que carecen de una barrera física externa, se presta a interacciones directas entre el huésped y el microbio, que se manifiestan en forma de patogenicidad en los corales (35), en el desarrollo de la respuesta inmunitaria en los cnidarios (33), y en una estrecha integración simbiótica que culmina en una transferencia genética de la bacteria al cnidario, como se demuestra aquí. Prácticamente no se sabe nada de la función biosintética u otra función metabólica de las bacterias simbióticas con los huéspedes cnidarios, un tema que, como tantos otros en la microbiología marina moderna, merece ser investigado.
El HGT entre bacterias y ciertos metazoos (ecdisozoos, incluyendo insectos y nematodos) fue demostrado recientemente por Baldo et al. (36) como más extendido de lo que se sospechaba. Señalaron que las secuencias bacterianas han sido consideradas anteriormente como contaminación y excluidas sistemáticamente por los proyectos de secuenciación de genomas eucariotas, lo que posiblemente oculta la importancia de dicha transferencia en diversos invertebrados. Anteriormente, se hizo pública la secuencia del genoma del endosimbionte bacteriano Carsonella ruddii encontrado en los áfidos (37, 38). La comparación de esta secuencia genómica con la de otro endosimbionte bacteriano de los áfidos, Buchnera aphidicola, mostró que ambos genomas habían sufrido una considerable supresión, incluida la pérdida de algunos genes que codifican vías metabólicas esenciales. Nos llamó la atención una de esas vías perdidas que conducen a la formación del aminoácido aromático triptófano en C. ruddii. Según el dogma (10), los precursores de este aminoácido esencial deberían sintetizarse a través de la vía del ácido shikímico en las bacterias comensales. De nuevo, buscamos alineaciones de secuencia globales para los genes que codifican las enzimas de la vía del ácido shikímico en estos genomas bacterianos. Encontramos un gen que codifica una putativa 5-enolpiruvilshikimato-3-fosfasa en C. ruddii (aunque es discutible que este gen transcriba un producto funcional debido al gran número de codones de parada en la secuencia), y sólo tres (los que codifican la shikimato 5-deshidrogenasa, la 5-enolpiruvilshikimato-3-fosfato fosfoliasa y la 5-enolpiruvilshikimato-3-fosfato sintasa) de los siete genes de la vía eran evidentes en el genoma de B. aphidicola (SI Dataset 9). Junto con nuestros hallazgos para el simbionte putativo tipo Tenacibaculum y su huésped N. vectensis, esta evidencia sugiere fuertemente que la pérdida de la función metabólica esencial en el endosimbionte es un proceso continuo de transferencia y eliminación de genes en la evolución de las simbiosis que podría conducir finalmente a la extinción del simbionte por la asimilación progresiva de su material genético en el genoma del huésped (37, 38).
La elucidación de las «adaptaciones metabólicas compartidas», en las que la producción de metabolitos esenciales implica la aportación de los socios de una simbiosis (incluso si uno de ellos es degenerado), requerirá una mayor disección genómica de la organización y el funcionamiento molecular únicos de las simbiosis invertebrados-microbios. Esto se pone de manifiesto en nuestro hallazgo de que dos de los genes de las enzimas de la vía shikímica, que clásicamente se dice que están ausentes en los «animales», están codificados en el genoma del huésped metazoo. La medida en que este HGT, o la implicación de consorcios bacterianos insospechados, puede explicar las aparentes anomalías metabólicas de los cnidarios descritas en la Introducción, justifica una investigación más profunda. La comprensión de estos procesos puede proporcionar además una visión crítica de la causa de la disfunción metabólica evocada por el cambio climático y el estrés ambiental, en particular en las frágiles simbiosis de los corales tropicales y otros cnidarios marinos.