Visão geral da abordagem
Com a SCS, os blocos de construção do habitat do fluxo são representados como uma série de camadas, cada uma delas representando diferentes categorias de características físicas (por exemplo, tamanho, gradiente). Cada camada é composta por múltiplas classes (por exemplo, água da cabeceira, riacho, gradiente baixo, gradiente alto). As camadas foram construídas utilizando abordagens indutivas baseadas em padrões em dados empíricos, em oposição às abordagens dedutivas baseadas na regionalização da paisagem. As fontes de dados empíricos usadas para derivar as classes de riachos são fornecidas na Tabela 1. Através de revisões e solicitações anteriores de um corpo de conservacionistas e ecologistas de riachos6,25, selecionamos seis camadas de habitat de riachos que poderiam ser mapeadas na resolução de alcance do riacho e foram feitas hipóteses para exercer fortes controles sobre a função ecológica e a composição da comunidade ecológica. Estes incluíram (em ordem decrescente de importância ecológica): tamanho, gradiente, hidrologia, temperatura, bifurcação da rede de córregos e confinamento de vales.
Uma grande consideração na seleção das camadas e na determinação das partições entre as classes foi a disponibilidade de métodos documentados para abordagens de classificação e limiares entre as classes. Assim, nós preferivelmente selecionamos camadas suportadas por classificações pré-existentes e publicadas ou se classificações anteriores não estavam disponíveis, nós confiamos na literatura para determinar quebras e limiares para valores de partição (por exemplo, gradiente) em classes quando disponíveis. Como os resultados das classificações são influenciados pela abordagem tomada, utilizamos múltiplas abordagens alternativas, se disponíveis, no desenvolvimento de classes dentro das camadas.
Predictor Variable Compilation
Informação sobre tamanho, gradiente e bifurcação da rede foram derivadas do conjunto de dados NHDPlus V2. Entretanto, observações discretas in situ de hidrologia, temperatura e características do canal do rio (confinamento do vale) exigiram que desenvolvêssemos modelos para extrapolar essas classes para o nível de alcance do riacho. Um total de 66 variáveis de paisagem, clima, topografia e solo foram montadas para as bacias de drenagem que contribuem para cada estação de tratamento de água e para toda a rede de drenagem a montante de cada curso de água nos EUA (Tabela 2 (disponível apenas online)). Destes, 44 foram fornecidos pela base de dados Stream Cat26 (https://www.epa.gov/national-aquatic-resource-surveys/streamcat), 21 pelo conjunto de dados NHDPlus V2, e um pelo WorldClim (http://worldclim.org/version2) (Tabela 2 (disponível apenas online)). Em aproximadamente 2% das observações, faltaram valores para variáveis resumidas para redes de drenagem acima do alcance de cada fluxo (principalmente dados do StreamCat). Utilizamos o pacote Imputação Multivariada por Equação Encadeada (MICE) no ambiente de programação R27 para estimar os valores mais prováveis para variáveis ausentes com base em valores presentes para outras variáveis. Para cada variável com valores ausentes, especificamos uma matriz binária indicando qual subconjunto de preditores deve ser usado para estimar os valores ausentes durante a imputação. Foram desenvolvidos modelos separados de Predictive Mean Matching para cada variável incompleta27,
Size
Em comparação com outras classes, o desenvolvimento de esquemas de classificação para tamanho e gradiente não se baseou em observações in situ ou no desenvolvimento de modelos preditivos (por exemplo, hidrologia). Utilizamos duas variáveis de tamanho relevantes disponíveis através do conjunto de dados NHDPlus V2 para fornecer classificações alternativas de tamanho de fluxo: Ordem do fluxo de Strahler e descarga média anual (representativa das condições de impacto humano mínimo). A ordem do fluxo retrata a natureza dendrítica dos ambientes de fluxo28 e é comumente usada para caracterizar a distribuição de freqüência dos tamanhos de fluxo em grandes regiões ou globalmente29. As limitações da ordem do fluxo, no entanto, são que a ordem pode ser influenciada pela escala da hidrografia mapeada30 e a descarga pode variar amplamente entre regimes climáticos para uma determinada ordem. Da mesma forma, o uso da área de drenagem para caracterizar o tamanho também pode ser problemático, já que a descarga por unidade de área também irá variar drasticamente entre regiões de clima muito variável30. Alternativamente, o tamanho de um riacho pode ser caracterizado pelo fluxo que ele transporta. Entretanto, isto requer a determinação de uma abordagem padronizada para classes de partição com base na descarga. Como as leis geométricas que governam a organização do fluxo (por exemplo, freqüência, comprimento do fluxo, área de drenagem) são baseadas na ordem do fluxo31 , a ordem fornece um modelo físico universal para dividir a grande variação continental na descarga com base em limiares consistentes. Para desenvolver uma classificação de tamanho baseada na descarga, calculamos a descarga mediana para todos os fluxos de NHDPlus V2 de acordo com a ordem do fluxo de Strahler e depois usamos pontos médios entre esses valores para criar quebras de descarga como limites da classe de tamanho. (Nota: as variáveis utilizadas na classificação hidrológica são padronizadas por descarga média anual e, portanto, não são influenciadas pelo tamanho do rio).
Gradiente
Valores de gradiente (isto é, inclinação do leito do rio) também foram fornecidos como um atributo das linhas de fluxo NHDPlus V2. As inclinações do leito do riacho foram medidas para cada linha de fluxo como a proporção de elevação da elevação sobre a distância da linha de fluxo32. Os dados de elevação suavizada foram derivados de modelos digitais de elevação de 10 m (DEMs) para a nação. Elevações máximas e mínimas foram usadas para determinar a elevação, que foi dividida pelo comprimento total da linha de fluxo. Para nosso conhecimento, os limiares de inclinação mais utilizados são fornecidos pelo Rosgen4, que distingue as morfologias dos canais com base no gradiente, relações largura/profundidade, entrincheiramento e sinuosidade. Os esforços de classificação de fluxos múltiplos também se basearam nestes limiares de gradiente para as classes de partição6,9,25. Adotamos essas quebras para desenvolver tipos de gradiente e mapeamos os que atingem o fluxo.
Hidrologia
Nos últimos duas décadas, numerosas classificações hidrológicas em escalas regionais e globais foram desenvolvidas a partir de observações discretas de estações de monitoramento de fluxo2,18,33. Em geral, o desenvolvimento de classificações hidrológicas indutivas requer a montagem de observações in situ de descarga, resumindo a descarga em estatísticas hidrológicas e, em seguida, agrupando observações baseadas em similaridades nas propriedades hidrológicas22. Recentemente, McManamay et al.34 desenvolveram uma classificação hidrológica para todos os EUA com base em padrões de fluxo natural em 2.600 estações de medição do fluxo de água do USGS (USGS) com bacias hidrográficas a montante representando a condição menos perturbada para sua respectiva região. Após a decomposição de 110 estatísticas hidrológicas em 13 pontuações de componentes utilizando Análise de Componentes Principais (PCA), os medidores de fluxo foram probabilisticamente atribuídos a 1 das 15 classes hidrológicas utilizando algoritmos de agrupamento de modelos mistos Gaussianos óptimos determinados utilizando a inferência Bayesiana34. Essas classes representam variação nos padrões hidrológicos em oposição à variação no volume de descarga, uma vez que todas as estatísticas hidrológicas relacionadas à magnitude foram padronizadas por fluxo médio diário antes do PCA e clustering.
Este estilo de classificação (ou seja, clustering suave) é flexível na medida em que caracteriza fluxos como teoricamente compartilhamento de membros entre muitos clusters33,35. Em contraste, técnicas de agrupamento “duro”, tais como métodos hierárquicos baseados na distância (por exemplo, método de Ward)36 , são relativamente simples, mais fáceis de entender e produzem associações aninhadas e nítidas22. Assim, usamos o método aglomerativo de Ward para agrupar os 2600 USGS gages usando as 13 pontuações de PC e depois determinamos uma série de números ótimos de clusters com base no exame visual do dendrograma.
Todos os USGS gages do fluxo foram espacialmente unidos aos alcances do fluxo NHDPlus V2. Usando variáveis preditoras na Tabela 2 (disponível apenas online), construímos modelos aleatórios de classificação florestal37 no ambiente de programação R para prever a adesão à classe hidrológica e depois extrapolamos as classes hidrológicas para todos os alcances de NHDPlus V2.
Temperatura
Comparadas à hidrologia, as classificações de temperatura são menos comuns3,38,39, possivelmente devido a dados de temperatura mais escassos em comparação com a descarga. Recentemente, Maheu et al.3 agruparam cerca de 130 estações de gaging (representativas das condições de referência) nos EUA em diferentes tipos de regimes térmicos com base em várias estatísticas que descrevem a magnitude e variação. Esta abordagem multivariada fornece uma alternativa multivariada para as classes de temperatura univariadas de verão que geramos. As localizações dos gages utilizados na classificação Maheu et al. foram adquiridas dos autores e foram unidas espacialmente aos alcances do fluxo NHDPlus V2. Usando 65 das variáveis preditoras, desenvolvemos um modelo florestal aleatório para as classes de Maheu et al. para o alcance dos córregos em todos os EUA. Como a temperatura é uma função do tamanho do rio, excluímos Qwsa do modelo (isto é, fluxo médio anual dividido pela área de drenagem).
Como alternativa, desenvolvemos uma classificação simples de temperatura baseada nos valores da temperatura média natural da água no verão. Vários estudos sugerem que regimes térmicos divergentes em cursos de água são influenciados principalmente pela variação natural dos valores da temperatura de verão (médias de julho-agosto)3,40,41. Além disso, os valores de temperatura no verão estão entre os dados mais prontamente disponíveis de fontes públicas e não públicas. Compilamos dados de temperatura da água dos córregos para 5.907 locais de múltiplas fontes, incluindo Deweber & Wagner41 (n = 2893), Hill et al.40 (n = 566), medidores USGS com registros diários (n = 2184), monitoramento de campo sazonal USGS (n = 240), e outros dados de temperatura de registradores implantados por agências (n = 24) (Tabela 1). Determinação do comprimento adequado dos registros para os dados de temperatura necessários para obter um equilíbrio entre a minimização da incerteza nas médias de julho-agosto com poucas amostras para uma representação regional adequada. Por exemplo, Jones e Schmidt42 forneceram recomendações para comprimentos de registro necessários para minimizar adequadamente a incerteza na estimativa da métrica do regime térmico; no entanto, seguindo esta orientação teria reduzido os registros do USGS acima (n = 2424) em 70 a 90%. Além disso, a avaliação de Jones e Schmidt incluiu métricas mensais máximas, mínimas e de faixa, enquanto nossa análise se baseou em uma métrica média bimestral mais grosseira (julho-agosto), que consideramos menos suscetível à variação ano a ano do que os extremos de temperatura (Arquivo Suplementar 1). Utilizando 22 USGS gages nos EUA e faixas de confiança de Jones e Schmidt, estimamos que 1-2 estações de dados poderiam estimar de forma confiável as temperaturas médias de julho-agosto dentro de 1 °C a 80% e 90% de confiança, respectivamente (Arquivo Suplementar 1). Nós selecionamos os locais para garantir que o período de registro cairia entre 1995 e 2015 e os dados estavam disponíveis por pelo menos 60 dias consecutivos em julho e agosto.
Todos os locais de temperatura foram espacialmente unidos ao alcance do fluxo NHDPlus V2. Em seguida, determinamos as condições de referência para o monitoramento dos locais usando indicadores de perturbação da terra e regulação da barragem a montante. A perturbação do solo foi avaliada usando a avaliação de habitat da National Fish Habitat Partnership (NFHP) 2015, que fornece escores de degradação do habitat que variam de “muito baixo” a “muito alto” perturbações dentro dos segmentos de alcance do riacho NHDPlus43. Avaliamos o grau de regulação a montante por represas usando o grau de regulação (DOR) (% da descarga anual armazenada pelas barragens a montante)44 , fornecido pela StreamCat. Estações de monitoramento de temperatura com pontuação de avaliação de risco como “muito baixa” ou “baixa” e DOR < 4% (indicando pouca influência dos reservatórios44,45) foram determinadas como representativas das condições de referência, o que resultou em 1764 locais que também atenderam aos nossos critérios de comprimento recorde. Destes, 70% das observações foram obtidas de Deweber & Wagner41 (n = 1211) ou Hill et al.40 (n = 33). Das 520 observações restantes, 71,7% tiveram pelo menos 2 estações de dados.
Usando o mesmo conjunto de preditores acima, desenvolvemos florestas aleatórias para prever as temperaturas de verão para locais de referência e depois extrapolamos esses valores para todos os alcances de NHD. Usamos intervalos na distribuição de freqüência das temperaturas da água nos EUA para dividir as temperaturas de verão em classes. Usando valores estimados de temperatura de verão para todos os cursos de água, usamos um procedimento Jenks Natural Breaks46 para dividir as temperaturas em 2 a 20 classes e, em seguida, contamos com uma precisão ótima de ajuste e tabulação para determinar o número mais parcimonioso de classes, explicando a maioria das informações. Na ausência de uma abordagem justificada para particionamento físico de classes, o método Jenks é ótimo para agrupamento univariado de informações espaciais, pois procura minimizar a variação dentro das classes enquanto maximiza a variação entre classes46.
Bifurcação em rede
Quando o tamanho do fluxo captura a variação longitudinal das funções ecológicas ao longo do contínuo de um fluxo15 , as junções tributárias e divergências de fluxo também são importantes, pois criam descontinuidades nos processos longitudinais47. As junções de riachos, especificamente os tamanhos diferenciais dos riachos que compreendem as junções, têm grande influência no habitat e na diversidade biológica48. Além disso, a composição da comunidade ecológica pode mudar drasticamente com a proximidade de junções de riachos49. Para capturar as diferenças nas configurações de rede e situações de divergência, criamos duas classes de bifurcação. Em primeiro lugar, criamos classes que contabilizavam diferentes combinações de tamanhos de afluentes formando uma confluência na extremidade a montante do alcance de cada córrego. Em segundo lugar, desenvolvemos classes indicando os cursos de água que atingem como canais principais ou secundários abaixo das divergências e onde os cursos de água recebem o fluxo das divergências a montante.
A maioria dos cursos de água individuais atinge dentro do conjunto de dados NHDplus V2 representam características hidrológicas distintas das redes fluviais definidas pelas origens dos cursos de água, confluências tributárias e interseções com lagos e reservatórios50. As relações topológicas entre os alcances de NHDplus V2 são fornecidas em uma tabela “de para” que define os alcances de montante contribuindo para um determinado alcance (i.e., de) e o alcance de jusante recebendo o fluxo (i.e., para). Usando a tabela “de para”, as combinações de diferentes ordens de cursos de água Strahler na extremidade a montante de cada alcance foram combinadas para criar uma combinação afluente-mais-tempo. Por exemplo, a confluência de um tributário de 1ª e 2ª ordem na extremidade a montante de um sistema de 2ª ordem produziria a seguinte classe: 2.12 (Fig. 1a). Na maioria dos casos, apenas 2 tributários ocorreram a montante. Contudo, em casos raros ou situações de divergência, 3 ou mais tributários se fundem a montante acima de um alcance e incluímos até quatro ordens a montante (por exemplo, Fig. 1b, 5.511). Em alguns casos, o fluxo atinge o fluxo recebido de múltiplas divergências de canais a montante, ou seja, divisões de um alcance em dois ou mais canais na direção a jusante (Fig. 1c). Como esses canais recebem uma ordem de fluxo e criam junções que imitam as confluências tributárias, a classificação da bifurcação da rede requer a inclusão das divergências de canais como um tipo de confluência. Em casos de divergência de canais, NHDplus V2 designa como canais principais (D1) ou secundários (D2) (Fig. 1c). Utilizamos a tabela de parênteses para identificar os alcances de canais que estavam imediatamente abaixo das confluências de divergências de canais (DU), de modo a distingui-los das confluências tributárias. Após contabilizarmos essas divergências, observamos situações de junções tributárias não-sensoriais (por exemplo, 5_5,5) que surgiram porque o NHDplus V2 não designou apropriadamente todas as situações de divergência de canais. Como era difícil determinar se cada um desses alcances eram canais divergentes ou alcances de recebimento de fluxo de canais divergentes, atribuímos esses alcances a uma classe de divergência genérica (D).
Embora a maioria das junções tributárias no NHDPlus V2 sejam hidrologicamente relevantes, um subconjunto de junções de alcance foi dividido em pontos não significativos, tais como limites do mapa de quadrangulação, durante a digitalização50 (Fig. 1d). No caso de classes de bifurcação e divergências, essas divisões levariam a junções não-sensoriais. Para corrigir estes casos, Wieferich et al.51 produziram uma Tabela de Identificação de Alcance Ecológico que atribui a partição alcança os identificadores ecológicos comuns. Nesses casos, atribuímos todos os alcances pertencentes à mesma unidade ecológica com a classe de bifurcação e divergência do alcance mais a montante (Fig. 1d).
Valley Confinement
O grau em que os vales controlam a migração lateral dos canais dos rios é indicativo da força de interação entre os rios e sua planície de inundação. Delineamos os fundos dos vales sem restrições (isto é, polígonos) para todos os cursos de água NHDPlus V2 utilizando a ferramenta Algoritmo de Confinamento de Vales (VCA)52 no ArcMap 10.3. O VCA estima a profundidade total do canal do riacho utilizando uma função empírica baseada em dados de precipitação regional (http://www.prism.oregonstate.edu/normals) e área de drenagem para cada alcance do riacho53. Nagle et al.52 sugeriram 5X de profundidade de bankfull para determinar a altura da cheia, o que também consideramos apropriado dada a resolução espacial do NHDplus e dados de 30-m DEM (https://nationalmap.gov/elevation.html) para topografia circundante. Com base no terreno circundante caracterizado por DEMs, o programa VCA usou um algoritmo para intersectar a altura de cheia com a encosta circundante. Corpos de água foram usados para evitar a delimitação de fundos de vales em áreas inundadas.
Foram delimitados fundos de vales, limiares são necessários para classificar os cursos de água como não confinados, confinados, ou um nível intermediário. Por exemplo, o fundo de um vale pode não abranger todo um curso de água ou pode não estender lateralmente uma distância suficiente para além das margens do curso de água para ser classificado como não confinado. Isto requer uma estimativa da largura do rio para cada extensão de riacho. Nós compilamos observações de campo in situ e de sensoriamento remoto de >52.000 locais para desenvolver um modelo empírico para prever a largura do rio para todos os cursos de água no CONUS. As observações de campo da largura do rio foram derivadas da Avaliação Nacional de Rios e Cursos de Água da Agência de Proteção Ambiental (n = 852) (https://www.epa.gov/national-aquatic-resource-surveys/nrsa), uma revisão da literatura sobre a largura dos cursos de água (n = 243)29, e o Conjunto de Dados de Largura do Rio da América do Norte (n = 50.230) (http://gaia.geosci.unc.edu/NARWidth/). No entanto, estes conjuntos de dados falharam em grande parte pequenos cursos de água de cabeceira e sistemas intermitentes. Para assegurar uma largura devidamente estimada para estes tipos de riachos, os cursos de água foram estratificados por tamanho (ver Classificação de tamanho) e um subconjunto aleatório (n = 407) foi seleccionado de toda a população de cursos de água dos EUA. Imagens aéreas foram usadas para estimar a largura do rio no ponto médio, montante e jusante de cada curso de água, e então calcular uma largura média. Modelos florestais aleatórios foram usados para prever a largura do rio e extrapolar estimativas para todos os alcances de cursos d’água. As estimativas de largura do rio foram então usadas para gerar amortecedores poligonais em torno de todas as linhas de córregos.
Sobrepomos as larguras do rio e os fundos dos vales para determinar o estado de restrição dos vales. Hall et al.53 considerado riacho atinge não-confinado se a largura do vale da planície de inundação é pelo menos quatro vezes a largura, enquanto canais de riachos com interação moderada de planície de inundação têm proporções de largura de planície de inundação para planície de inundação >24. Além da extensão lateral das planícies aluviais, nossa avaliação de confinamento também requereu o exame do comprimento de cada curso de água coberto por fundos de vales. Os cursos de água foram classificados como “não confinados” se o fundo de um vale cobrisse pelo menos 50% do comprimento do curso de água e tivesse uma largura pelo menos quatro vezes maior do que a largura do rio. Os cursos de água “moderadamente confinados” tinham fundos de vales com larguras >4X da largura do rio, mas só cobriam 25-50% do comprimento do curso de água, ou se maior que 50% de cobertura do comprimento do curso de água, os fundos dos vales tinham proporções de planície de inundação:largura do rio entre 2 e 4. Todos os outros cursos de água foram definidos como “confinados”