Presentación del enfoque
Dentro del SCS, los bloques de construcción del hábitat del arroyo se representan como una serie de capas, cada una de las cuales representa diferentes categorías de características físicas (por ejemplo, tamaño, gradiente). Cada capa está compuesta por múltiples clases (por ejemplo, cabecera, arroyo, gradiente bajo, gradiente alto). Las capas se construyeron utilizando enfoques inductivos basados en patrones de datos empíricos, a diferencia de los enfoques deductivos basados en la regionalización del paisaje. Las fuentes de los datos empíricos utilizados para derivar las clases de arroyos se indican en la Tabla 1. A través de revisiones previas y de la solicitud de un cuerpo de conservacionistas y ecologistas de arroyos6,25, seleccionamos seis capas de hábitat de arroyos que podían ser mapeadas a la resolución del alcance del arroyo y que tenían la hipótesis de ejercer fuertes controles sobre la función ecológica y la composición de la comunidad ecológica. Estos incluyen (en orden de importancia ecológica decreciente): tamaño, gradiente, hidrología, temperatura, bifurcación de la red de arroyos y confinamiento del valle.
Una consideración importante en la selección de capas y en la determinación de las particiones entre clases fue la disponibilidad de métodos documentados para los enfoques de clasificación y los umbrales entre clases. Por lo tanto, seleccionamos preferentemente capas respaldadas por clasificaciones preexistentes y publicadas o, si no se disponía de clasificaciones anteriores, nos basamos en la literatura para determinar las rupturas y los umbrales para dividir los valores (por ejemplo, el gradiente) en clases cuando estaban disponibles. Debido a que los resultados de la clasificación están influenciados por el enfoque adoptado, utilizamos múltiples enfoques alternativos, si estaban disponibles, en el desarrollo de las clases dentro de las capas.
Compilación de variables predictoras
La información sobre el tamaño, el gradiente y la bifurcación de la red se derivó del conjunto de datos NHDPlus V2. Sin embargo, las observaciones discretas in situ de la hidrología, la temperatura y las características del canal del río (confinamiento del valle) requirieron que desarrolláramos modelos para extrapolar estas clases al nivel del alcance del arroyo. Se reunió un total de 66 variables de paisaje, clima, topografía y suelo para las cuencas de drenaje que contribuyen a cada estación de medición de arroyos y para toda la red de drenaje aguas arriba de cada tramo de arroyo en los Estados Unidos (Tabla 2 (disponible sólo en línea)). De éstas, 44 fueron proporcionadas por la base de datos Stream Cat26 (https://www.epa.gov/national-aquatic-resource-surveys/streamcat), 21 del conjunto de datos NHDPlus V2, y una de WorldClim (http://worldclim.org/version2) (Tabla 2 (disponible sólo en línea)). En aproximadamente el 2% de las observaciones, faltaban valores para las variables resumidas para las redes de drenaje por encima de cada tramo de arroyo (principalmente datos de StreamCat). Utilizamos el paquete Multivariate Imputation by Chained Equation (MICE) en el entorno de programación R27 para estimar los valores más probables para las variables que faltaban basándonos en los valores presentes para otras variables. Para cada variable con valores perdidos, se especificó una matriz binaria que indicaba qué subconjunto de predictores debía utilizarse para estimar los valores perdidos durante la imputación. Se desarrollaron modelos separados de emparejamiento de medias predictivas para cada variable incompleta27.
Tamaño
En comparación con otras clases, el desarrollo de esquemas de clasificación para el tamaño y el gradiente no se basó en observaciones in situ o en el desarrollo de modelos predictivos (por ejemplo, la hidrología). Utilizamos dos variables relevantes para el tamaño disponibles a través del conjunto de datos NHDPlus V2 para proporcionar clasificaciones alternativas del tamaño del arroyo: El orden de los arroyos de Strahler y la descarga media anual (representativa de condiciones de mínimo impacto humano). El orden de los arroyos describe la naturaleza dendrítica de los entornos de los arroyos28 y se utiliza comúnmente para caracterizar la distribución de la frecuencia de los tamaños de los arroyos en grandes regiones o globalmente29. Las limitaciones del orden de los arroyos, sin embargo, son que el orden puede estar influenciado por la escala de la hidrografía mapeada30 y la descarga puede variar ampliamente a través de los regímenes climáticos para un orden dado. Del mismo modo, utilizar el área de drenaje para caracterizar el tamaño también puede ser problemático, ya que la descarga por unidad de área también variará drásticamente entre regiones de clima muy variado30. Como alternativa, el tamaño de un arroyo puede caracterizarse por el caudal que transporta. Sin embargo, esto requiere determinar un enfoque estandarizado para dividir las clases basadas en la descarga. Dado que las leyes geométricas que rigen la organización de los arroyos (por ejemplo, la frecuencia, la longitud del arroyo, el área de drenaje) se basan en el orden del arroyo31 , el orden proporciona una plantilla física universal para dividir la amplia variación continental de la descarga basándose en umbrales consistentes. Para desarrollar una clasificación de tamaño basada en la descarga, calculamos la mediana de la descarga para todos los tramos de los arroyos del NHDPlus V2 de acuerdo con el orden de los arroyos de Strahler y luego utilizamos los puntos medios entre estos valores para crear los cortes de descarga como umbrales de la clase de tamaño. (Nota: las variables utilizadas en la clasificación hidrológica están estandarizadas por la descarga media anual y, por lo tanto, no están influenciadas por el tamaño del río).
Gradiente
Los valores de gradiente (es decir, la pendiente del lecho del arroyo) también se proporcionaron como un atributo de las líneas de flujo de NHDPlus V2. Las pendientes de los arroyos se midieron para cada línea de flujo como la proporción del aumento de la elevación sobre la distancia de la línea de flujo32. Los datos de elevación suavizados se derivaron de modelos digitales de elevación (DEM) de 10 m para la nación. Se utilizaron las elevaciones máximas y mínimas para determinar la elevación, que se dividió por la longitud total de la línea de flujo. Hasta donde sabemos, los umbrales de gradiente más utilizados son los proporcionados por Rosgen4, que distingue las morfologías de los canales basándose en el gradiente, la relación anchura-profundidad, el afianzamiento y la sinuosidad. Múltiples esfuerzos de clasificación de arroyos se han basado también en estos umbrales de gradiente para dividir las clases6,9,25. En las últimas dos décadas, se han desarrollado numerosas clasificaciones hidrológicas a escala regional y global a partir de observaciones discretas de estaciones de monitoreo de caudales2,18,33 . En general, el desarrollo de clasificaciones hidrológicas inductivas requiere el ensamblaje de observaciones in situ de la descarga, resumiendo la descarga en estadísticas hidrológicas, y luego agrupando las observaciones basadas en similitudes en las propiedades hidrológicas22. Recientemente, McManamay et al.34 desarrollaron una clasificación hidrológica para todo EE.UU. basada en los patrones naturales de flujo de los arroyos en 2.600 estaciones de medición de arroyos del Servicio Geológico de EE.UU. (USGS), con cuencas hidrográficas aguas arriba que representan la condición menos perturbada para su respectiva región. Tras la descomposición de 110 estadísticas hidrológicas en 13 puntuaciones de componentes utilizando el Análisis de Componentes Principales (ACP), las estaciones de medición de arroyos se asignaron de forma probabilística a 1 de 15 clases hidrológicas utilizando algoritmos óptimos de agrupación de modelos mixtos gaussianos determinados mediante inferencia bayesiana34. Estas clases representan la variación en los patrones hidrológicos en oposición a la variación en el volumen de descarga, ya que todas las estadísticas hidrológicas relacionadas con la magnitud fueron estandarizadas por el flujo diario medio antes del PCA y la agrupación.
Este estilo difuso de clasificación (es decir, agrupación suave) es flexible en el sentido de que caracteriza a los arroyos como teóricamente compartiendo la membresía entre muchos grupos33,35. En cambio, las técnicas de agrupación «duras», como los métodos aglomerativos jerárquicos basados en la distancia (por ejemplo, el método de Ward)36 , son relativamente sencillas, más fáciles de entender y producen membresías anidadas y nítidas22. Por lo tanto, utilizamos el método aglomerativo de Ward para agrupar los 2600 medidores del USGS utilizando las 13 puntuaciones de PC y luego determinamos una serie de números óptimos de grupos basados en el examen visual del dendrograma.
Todos los medidores de arroyos del USGS se unieron espacialmente a los tramos de arroyos del NHDPlus V2. Utilizando las variables predictoras de la Tabla 2 (disponible sólo en línea), construimos modelos de clasificación de bosque aleatorio37 en el entorno de programación R para predecir la pertenencia a la clase hidrológica y luego extrapolamos las clases hidrológicas a todos los tramos de arroyos del NHDPlus V2.
Temperatura
En comparación con la hidrología, las clasificaciones de temperatura son menos comunes3,38,39, posiblemente debido a la escasez de datos de temperatura en comparación con la descarga. Recientemente, Maheu et al.3 agruparon aproximadamente 130 estaciones de medición (representativas de las condiciones de referencia) a lo largo de los EE.UU. en diferentes tipos de regímenes térmicos basados en varias estadísticas que describen la magnitud y la variación. Este enfoque multivariante proporciona una alternativa multivariante a las clases de temperatura de verano univariantes que nosotros generamos. Las ubicaciones de los medidores utilizados en la clasificación de Maheu et al. se obtuvieron de los autores y se unieron espacialmente a los tramos de arroyos de NHDPlus V2. Utilizando 65 de las variables predictoras, desarrollamos un modelo de bosque aleatorio para las clases de Maheu et al. a los tramos de los arroyos de los Estados Unidos. Debido a que la temperatura es una función del tamaño del río, excluimos el Qwsa del modelo (es decir, el flujo medio anual dividido por el área de drenaje).
Como alternativa, desarrollamos una simple clasificación de la temperatura basada en los valores de la temperatura media del agua en verano que se producen de forma natural. Múltiples estudios sugieren que los regímenes térmicos divergentes en los arroyos están principalmente influenciados por la variación natural de los valores de temperatura de verano (promedios de julio-agosto)3,40,41. Además, los valores de temperatura estivales se encuentran entre los datos más fácilmente disponibles de fuentes públicas y no públicas. Recopilamos datos de la temperatura del agua de los arroyos para 5.907 sitios de múltiples fuentes, incluyendo Deweber & Wagner41 (n = 2893), Hill et al.40 (n = 566), medidores del USGS con registros diarios (n = 2184), monitoreo de campo estacional del USGS (n = 240), y otros datos de temperatura de registradores desplegados por agencias (n = 24) (Tabla 1). Para determinar la duración adecuada de los registros de temperatura fue necesario encontrar un equilibrio entre la minimización de la incertidumbre en los promedios de julio-agosto y el hecho de tener muy pocas muestras para una representación regional adecuada. Por ejemplo, Jones y Schmidt42 proporcionaron recomendaciones para las longitudes de registro requeridas para minimizar adecuadamente la incertidumbre en la estimación de las métricas del régimen térmico; sin embargo, seguir esta orientación habría reducido los registros del USGS mencionados anteriormente (n = 2424) en un 70 a 90%. Además, la evaluación de Jones y Schmidt incluía métricas mensuales máximas, mínimas y de rango, mientras que nuestro análisis se basó en una métrica media bimensual más gruesa (julio-agosto), que consideramos menos susceptible a la variación interanual que los extremos de temperatura (Archivo Suplementario 1). Utilizando 22 medidores del USGS en todo Estados Unidos y las bandas de confianza de Jones y Schmidt, estimamos que 1-2 temporadas de datos podrían estimar de forma fiable las temperaturas medias de julio-agosto con una confianza del 80% y el 90%, respectivamente (Archivo Suplementario 1). Seleccionamos los sitios para asegurarnos de que el período de registro estuviera comprendido entre 1995 y 2015 y que los datos estuvieran disponibles durante al menos 60 días consecutivos en julio y agosto.
Todos los sitios de temperatura se unieron espacialmente a los tramos de arroyos NHDPlus V2. A continuación, se determinaron las condiciones de referencia para los sitios de monitoreo utilizando indicadores de perturbación de la tierra y la regulación de la presa aguas arriba. La alteración de la tierra se evaluó utilizando la evaluación del hábitat de la National Fish Habitat Partnership (NFHP) de 2015, que proporciona puntuaciones de degradación del hábitat que van de «muy baja» a «muy alta» alteración dentro de los segmentos de alcance del arroyo NHDPlus43. Evaluamos el grado de regulación aguas arriba por los embalses utilizando el grado de regulación (DOR) (% de la descarga anual almacenada por las presas aguas arriba)44 , proporcionado por StreamCat. Las estaciones de control de la temperatura con puntuaciones de evaluación de riesgo como «muy baja» o «baja» y DOR < 4% (indicando poca influencia de los embalses44,45) se determinaron como representativas de las condiciones de referencia, lo que dio lugar a 1764 sitios que también cumplían nuestros criterios de longitud de registro. De ellos, el 70% de las observaciones se obtuvieron de Deweber & Wagner41 (n = 1211) o Hill et al.40 (n = 33). De las 520 observaciones restantes, el 71,7% tenía al menos 2 temporadas de datos.
Usando el mismo conjunto de predictores anterior, desarrollamos bosques aleatorios para predecir las temperaturas de verano para los sitios de referencia y luego extrapolamos esos valores a todos los tramos de arroyos de NHD. Utilizamos cortes en la distribución de frecuencias de las temperaturas del agua de EE.UU. para dividir las temperaturas de verano en clases. Utilizando los valores estimados de la temperatura estival para todos los tramos de los arroyos, utilizamos un procedimiento de rupturas naturales de Jenks46 para dividir las temperaturas en 2 a 20 clases y luego nos basamos en la bondad de ajuste óptima y en la precisión tabular para determinar el número más parsimonioso de clases que explican la mayor parte de la información. En ausencia de un enfoque justificado para la partición de clases con base física, el método de Jenks es óptimo para la agrupación univariada de la información espacial, ya que busca minimizar la variación dentro de las clases mientras maximiza la varianza entre ellas46.
Bifurcación de la red
Mientras que el tamaño del arroyo captura la variación longitudinal de las funciones ecológicas a lo largo del continuo de un arroyo15, las uniones de los afluentes y las divergencias de los arroyos también son importantes ya que crean discontinuidades en los procesos longitudinales47. Los cruces de arroyos, concretamente los tamaños diferenciales de los arroyos que comprenden los cruces, tienen una gran influencia en el hábitat y la diversidad biológica48. Además, la composición de la comunidad ecológica puede cambiar drásticamente con la proximidad a los cruces de arroyos49. Para capturar las diferencias en las configuraciones de la red y las situaciones de divergencia, creamos dos clases de bifurcación. En primer lugar, creamos clases que representaban combinaciones de diferentes tamaños de afluentes que formaban una confluencia en el extremo aguas arriba de cada tramo de arroyo. En segundo lugar, desarrollamos clases que indicaban los tramos de arroyos como canales principales o secundarios por debajo de las divergencias y donde los arroyos recibían el flujo de las divergencias aguas arriba.
La mayoría de los tramos de arroyos individuales dentro del conjunto de datos de NHDplus V2 representan características hidrológicas distintas de las redes fluviales definidas por los orígenes de los arroyos, las confluencias de los afluentes y las intersecciones con lagos y embalses50. Las relaciones topológicas entre los tramos de arroyos de NHDplus V2 se proporcionan en una tabla «de-a» que define los tramos aguas arriba que contribuyen a un tramo dado (es decir, de) y el tramo aguas abajo que recibe el flujo (es decir, a). Utilizando la tabla «de-a», las combinaciones de diferentes órdenes de corrientes de Strahler en el extremo aguas arriba de cada alcance se combinaron para crear una combinación afluente-aguas. Por ejemplo, la confluencia de un afluente de primer orden y otro de segundo orden en el extremo aguas arriba de un sistema de segundo orden produciría la siguiente clase 2.12 (Fig. 1a). En la mayoría de los casos, sólo hubo 2 afluentes aguas arriba. Sin embargo, en casos raros o situaciones de divergencia, 3 o más afluentes se unen aguas arriba de un alcance y nosotros incluimos hasta cuatro órdenes aguas arriba (por ejemplo, Fig. 1b, 5.511). En algunos casos, los tramos de arroyos reciben flujos de múltiples divergencias de canales aguas arriba, es decir, divisiones de un tramo en dos o más canales en la dirección aguas abajo (Fig. 1c). Debido a que a estos canales se les asigna un orden de corriente y crean cruces que imitan confluencias tributarias, la clasificación de la bifurcación de la red requiere incluir las divergencias de canales como un tipo de confluencia. En los casos de divergencia de canales, NHDplus V2 designa los tramos como canales principales (D1) o secundarios (D2) (Fig. 1c). Usamos la tabla desde-hasta para identificar los tramos de arroyos que estaban inmediatamente debajo de las confluencias de divergencias de canales (DU), para distinguirlas de las confluencias de afluentes. Después de tener en cuenta estas divergencias, observamos situaciones de confluencias de afluentes sin sentido (por ejemplo, 5_5.5) que surgieron porque NHDplus V2 no designó adecuadamente todas las situaciones de divergencia de canales. Debido a que fue difícil determinar si cada uno de estos tramos eran canales divergentes o tramos que recibían flujo de canales divergentes, asignamos estos tramos a una clase de divergencia genérica (D).
Aunque la mayoría de los cruces de afluentes en el NHDPlus V2 son hidrológicamente relevantes, un subgrupo de cruces de tramos fueron divididos en puntos no significativos, como los límites de los mapas de cuadrángulos, durante la digitalización50 (Fig. 1d). En el caso de las clases de bifurcación y las divergencias, estas divisiones conducen a uniones no significativas. Para corregir estos casos, Wieferich et al.51 produjeron una Tabla de Identificación de Alcances Ecológicos que asignó los alcances divididos a identificadores ecológicos comunes. En estos casos, asignamos todos los tramos pertenecientes a la misma unidad ecológica con la clase de bifurcación y divergencia del tramo más arriba (Fig. 1d).
Confinamiento de los valles
El grado en que los valles controlan la migración lateral de los canales fluviales es indicativo de la fuerza de la interacción entre los ríos y su llanura de inundación. Delineamos fondos de valle sin restricciones (es decir, polígonos) para todos los tramos de arroyos del NHDPlus V2 utilizando la herramienta del Algoritmo de Confinamiento de Valles (VCA)52 en ArcMap 10.3. El VCA estima la profundidad de la orilla del canal del arroyo utilizando una función empírica basada en los datos de precipitación regional (http://www.prism.oregonstate.edu/normals) y el área de drenaje para cada tramo del arroyo53. Nagle et al.52 sugirieron una profundidad de llenado de ribera de 5 veces para determinar la altura de la inundación, lo que también consideramos apropiado dada la resolución espacial de NHDplus y los datos DEM de 30 m (https://nationalmap.gov/elevation.html) para la topografía circundante. Basándose en el terreno circundante caracterizado a través de los MDE, el programa de AVC utilizó un algoritmo para intersecar la altura de la inundación con la ladera circundante. Se utilizaron cuerpos de agua para evitar la delineación de fondos de valle en áreas inundadas.
Una vez delineados los fondos de valle, se requieren umbrales para clasificar los tramos de arroyos como no confinados, confinados o un nivel intermedio. Por ejemplo, un fondo de valle puede no abarcar todo un tramo de arroyo o puede no extenderse lateralmente una distancia suficiente más allá de las orillas del arroyo para ser clasificado como no confinado. Esto requiere una estimación de la anchura del río para cada tramo del arroyo. Hemos recopilado observaciones in situ y de teledetección de >52.000 lugares para desarrollar un modelo empírico que prediga la anchura del río para todos los tramos de arroyos en los Estados Unidos. Las observaciones de campo de la anchura de los ríos se derivaron de la Evaluación Nacional de Ríos y Arroyos de la Agencia de Protección Medioambiental (n = 852) (https://www.epa.gov/national-aquatic-resource-surveys/nrsa), una revisión bibliográfica de la anchura de los arroyos (n = 243)29, y el Conjunto de Datos de Anchura de Ríos de América del Norte (n = 50.230) (http://gaia.geosci.unc.edu/NARWidth/). Sin embargo, estos conjuntos de datos no incluían en gran medida los pequeños arroyos de cabecera y los sistemas intermitentes. Para asegurarnos de que se estimaba correctamente la anchura de estos tipos de arroyos, se estratificaron los tramos de arroyos según su tamaño (véase la clasificación por tamaños) y se seleccionó un subconjunto aleatorio (n = 407) de toda la población de tramos de arroyos de Estados Unidos. Se utilizaron imágenes aéreas para estimar la anchura del río en el punto medio, aguas arriba y aguas abajo de cada tramo, y luego se calculó la anchura media. Se utilizaron modelos de bosque aleatorio para predecir la anchura del río y extrapolar las estimaciones a todos los tramos del río. Las estimaciones de la anchura del río se utilizaron para generar polígonos alrededor de todos los tramos de los arroyos.
Superpusimos las anchuras de los ríos y los fondos de los valles para determinar el estado de las restricciones de los valles. Hall et al.53 consideraron que los tramos de los arroyos no estaban limitados si la anchura del valle de la llanura de inundación era al menos cuatro veces la anchura, mientras que los cauces de los arroyos con una interacción moderada de la llanura de inundación tienen relaciones de anchura de la llanura de inundación a la de la orilla >24. Más allá de la extensión lateral de las llanuras de inundación, nuestra evaluación del confinamiento también requirió examinar la longitud de cada tramo de arroyo cubierto por fondos de valle. Los tramos de arroyo se clasificaron como «no confinados» si un fondo de valle cubría al menos el 50% de la longitud del tramo de arroyo y tenía una anchura al menos cuatro veces superior a la del río. Los tramos de arroyo «moderadamente confinados» tenían fondos de valle con una anchura >4X la anchura del río, pero sólo cubrían el 25-50% de la longitud del tramo de arroyo, o si cubrían más del 50% de la longitud del arroyo, los fondos de valle tenían relaciones de llanura de inundación:anchura del río entre 2 y 4. Todos los demás tramos de arroyo se definieron como «confinados».