Panoramica dell’approccio
Nel SCS, i blocchi dell’habitat dei corsi d’acqua sono rappresentati come una serie di strati, ognuno dei quali rappresenta diverse categorie di caratteristiche fisiche (per esempio, dimensioni, pendenza). Ogni strato è composto da più classi (per esempio, headwater, creek, basso gradiente, alto gradiente). Gli strati sono stati costruiti usando approcci induttivi basati su modelli di dati empirici, in contrasto con approcci deduttivi basati sulla regionalizzazione del paesaggio. Le fonti dei dati empirici usati per derivare le classi di flusso sono fornite nella Tabella 1. Attraverso revisioni precedenti e sollecitazioni da parte di un gruppo di ambientalisti ed ecologi dei corsi d’acqua6,25, abbiamo selezionato sei strati di habitat dei corsi d’acqua che potevano essere mappati alla risoluzione del tratto di fiume e che si ipotizzava esercitassero forti controlli sulla funzione ecologica e sulla composizione della comunità ecologica. Questi includevano (in ordine di importanza ecologica decrescente): dimensione, gradiente, idrologia, temperatura, biforcazione della rete fluviale e confinamento della valle.
Una considerazione importante nella selezione degli strati e nella determinazione delle partizioni tra le classi è stata la disponibilità di metodi documentati per gli approcci di classificazione e le soglie tra le classi. Quindi, abbiamo selezionato preferibilmente gli strati supportati da classificazioni preesistenti e pubblicate o, se le classificazioni precedenti non erano disponibili, ci siamo basati sulla letteratura per determinare le pause e le soglie per partizionare i valori (ad esempio, il gradiente) in classi quando disponibili. Poiché i risultati della classificazione sono influenzati dall’approccio adottato, abbiamo utilizzato più approcci alternativi, se disponibili, nello sviluppo delle classi all’interno degli strati.
Compilazione delle variabili predittive
Le informazioni su dimensioni, gradiente e biforcazione della rete sono state derivate dal set di dati NHDPlus V2. Tuttavia, le osservazioni discrete in situ dell’idrologia, della temperatura e delle caratteristiche dei canali fluviali (confinamento della valle) hanno richiesto lo sviluppo di modelli per estrapolare queste classi a livello di portata del flusso. Un totale di 66 variabili paesaggistiche, climatiche, topografiche e del suolo sono state assemblate per i bacini di drenaggio che contribuiscono ad ogni stazione di rilevamento del flusso e per l’intera rete di drenaggio a monte di ogni portata del flusso negli Stati Uniti (Tabella 2 (disponibile solo online)). Di questi, 44 sono stati forniti dal database Stream Cat26 (https://www.epa.gov/national-aquatic-resource-surveys/streamcat), 21 dal dataset NHDPlus V2 e uno da WorldClim (http://worldclim.org/version2) (Tabella 2 (disponibile solo online)). In circa il 2% delle osservazioni, i valori erano mancanti per le variabili riassunte per le reti di drenaggio sopra ogni portata del torrente (principalmente dati StreamCat). Abbiamo usato il pacchetto Multivariate Imputation by Chained Equation (MICE) nell’ambiente di programmazione R27 per stimare i valori più probabili per le variabili mancanti sulla base dei valori presenti per altre variabili. Per ogni variabile con valori mancanti, abbiamo specificato una matrice binaria che indicava quale sottoinsieme di predittori doveva essere usato per stimare i valori mancanti durante l’imputazione. Sono stati sviluppati modelli separati di Predictive Mean Matching per ogni variabile incompleta27.
Grandezza
In confronto ad altre classi, lo sviluppo di schemi di classificazione per la dimensione e il gradiente non si è basato su osservazioni in situ o sullo sviluppo di modelli predittivi (per esempio, idrologia). Abbiamo usato due variabili rilevanti per le dimensioni disponibili attraverso il set di dati NHDPlus V2 per fornire classificazioni alternative delle dimensioni dei flussi: Strahler stream order e la portata media annuale (rappresentativa delle condizioni di minimo impatto umano). L’ordine di flusso descrive la natura dendritica degli ambienti di flusso28 ed è comunemente usato per caratterizzare la distribuzione di frequenza delle dimensioni dei flussi su grandi regioni o a livello globale29. I limiti dell’ordine dei corsi d’acqua, tuttavia, sono che l’ordine può essere influenzato dalla scala dell’idrografia mappata30 e la portata può variare ampiamente tra i regimi climatici per un dato ordine. Allo stesso modo, anche l’utilizzo dell’area di drenaggio per caratterizzare le dimensioni può essere problematico, poiché il deflusso per unità di superficie varia notevolmente nelle regioni con clima molto diverso30. In alternativa, la dimensione di un torrente può essere caratterizzata dal flusso che trasporta. Tuttavia, questo richiede la determinazione di un approccio standardizzato per dividere le classi basate sulla portata. Poiché le leggi geometriche che governano l’organizzazione dei flussi (ad esempio, la frequenza, la lunghezza del flusso, l’area di drenaggio) si basano sull’ordine del flusso31 , l’ordine fornisce un modello fisico universale per suddividere l’ampia variazione continentale della portata sulla base di soglie coerenti. Per sviluppare una classificazione delle dimensioni basata sulla portata, abbiamo calcolato la portata mediana per tutti i corsi d’acqua NHDPlus V2 in base all’ordine di Strahler e poi abbiamo usato i punti medi tra questi valori per creare delle interruzioni della portata come soglie della classe di dimensioni. (Nota: le variabili utilizzate nella classificazione idrologica sono standardizzate dalla portata media annuale e quindi non sono influenzate dalle dimensioni del fiume).
Gradiente
I valori di radiosità (cioè la pendenza del letto del torrente) sono stati forniti anche come attributo delle linee di flusso NHDPlus V2. Le pendenze dei torrenti sono state misurate per ogni linea di flusso come la proporzione dell’aumento dell’elevazione sulla distanza della linea di flusso32. I dati di elevazione smussati sono stati derivati da modelli digitali di elevazione (DEM) da 10 metri per la nazione. Le quote massime e minime sono state utilizzate per determinare l’aumento, che è stato diviso per la lunghezza totale della linea di flusso. A nostra conoscenza, le soglie di pendenza più ampiamente utilizzate sono fornite da Rosgen4, che distingue le morfologie dei canali in base alla pendenza, al rapporto larghezza/profondità, all’avvallamento e alla sinuosità. Molteplici sforzi di classificazione dei flussi si sono anche basati su queste soglie di gradiente per dividere le classi6,9,25. Negli ultimi due decenni, numerose classificazioni idrologiche su scala regionale e globale sono state sviluppate da osservazioni discrete di stazioni di monitoraggio della portata dei torrenti2,18,33. In generale, lo sviluppo di classificazioni idrologiche induttive richiede l’assemblaggio di osservazioni di deflusso in situ, riassumendo il deflusso in statistiche idrologiche, e poi raggruppando le osservazioni sulla base di somiglianze nelle proprietà idrologiche22. Recentemente, McManamay et al.34 hanno sviluppato una classificazione idrologica per tutti gli Stati Uniti basata sui modelli di flusso naturale in 2.600 stazioni di rilevamento dei flussi dell’US Geological Survey (USGS), con gli spartiacque a monte che rappresentano la condizione meno disturbata per la loro rispettiva regione. In seguito alla decomposizione di 110 statistiche idrologiche in 13 punteggi di componenti utilizzando l’analisi delle componenti principali (PCA), i punti di misurazione dei flussi sono stati assegnati probabilisticamente a una delle 15 classi idrologiche utilizzando algoritmi ottimali di clustering del modello misto gaussiano determinati utilizzando l’inferenza bayesiana34. Queste classi rappresentano la variazione nei modelli idrologici in contrapposizione alla variazione nel volume di scarico, in quanto tutte le statistiche idrologiche relative alla grandezza sono state standardizzate dalla portata media giornaliera prima della PCA e del clustering.
Questo stile di classificazione fuzzy (cioè, soft clustering) è flessibile in quanto caratterizza i flussi come teoricamente appartenenti a molti cluster33,35. Al contrario, le tecniche di clustering “hard”, come i metodi gerarchici agglomerativi basati sulla distanza (ad esempio il metodo di Ward)36, sono relativamente semplici, più facili da capire e producono appartenenze nidificate e nette22. Così, abbiamo usato il metodo agglomerativo di Ward per raggruppare le 2600 stazioni USGS usando i 13 punteggi PC e poi abbiamo determinato una serie di numeri ottimali di cluster basati sull’esame visivo del dendrogramma.
Tutte le stazioni USGS sono state unite spazialmente agli stream reaches NHDPlus V2. Utilizzando le variabili predittive della tabella 2 (disponibile solo online), abbiamo costruito modelli di classificazione a foresta casuale37 nell’ambiente di programmazione R per prevedere l’appartenenza alla classe idrologica e poi estrapolato le classi idrologiche a tutti i corsi d’acqua NHDPlus V2.
Temperatura
Rispetto all’idrologia, le classificazioni della temperatura sono meno comuni3,38,39, probabilmente a causa dei dati sulla temperatura più scarsi rispetto alla portata. Recentemente, Maheu et al.3 hanno raggruppato circa 130 stazioni di rilevamento (rappresentative delle condizioni di riferimento) negli Stati Uniti in diversi tipi di regimi termici basati su diverse statistiche che descrivono la grandezza e la variazione. Questo approccio multivariato fornisce un’alternativa multivariata alle classi univariate di temperatura estiva che abbiamo generato. Le ubicazioni dei sensori utilizzati nella classificazione di Maheu et al. sono state acquisite dagli autori e sono state unite spazialmente ai corsi d’acqua NHDPlus V2. Utilizzando 65 delle variabili predittive, abbiamo sviluppato un modello di foresta casuale per le classi di Maheu et al. ai corsi d’acqua in tutti gli Stati Uniti. Poiché la temperatura è una funzione delle dimensioni del fiume, abbiamo escluso il Qwsa dal modello (cioè il flusso medio annuale diviso per l’area di drenaggio).
Come alternativa, abbiamo sviluppato una semplice classificazione della temperatura basata sui valori della temperatura media estiva dell’acqua in natura. Numerosi studi suggeriscono che i regimi termici divergenti nei torrenti sono principalmente influenzati dalla variazione naturale dei valori della temperatura estiva (medie di luglio-agosto)3,40,41. Inoltre, i valori della temperatura estiva sono tra i dati più facilmente disponibili da fonti pubbliche e non. Abbiamo compilato i dati sulla temperatura dell’acqua dei ruscelli per 5.907 siti da più fonti, tra cui Deweber & Wagner41 (n = 2893), Hill et al.40 (n = 566), misuratori USGS con registrazioni giornaliere (n = 2184), monitoraggio stagionale sul campo USGS (n = 240), e altri dati di temperatura da logger distribuiti da agenzie (n = 24) (Tabella 1). Determinare un’adeguata lunghezza di registrazione per i dati di temperatura ha richiesto di trovare un equilibrio tra la minimizzazione dell’incertezza nelle medie di luglio-agosto e l’avere troppo pochi campioni per un’adeguata rappresentazione regionale. Per esempio, Jones e Schmidt42 hanno fornito raccomandazioni per la lunghezza dei record necessari per minimizzare adeguatamente l’incertezza nella stima delle metriche del regime termico; tuttavia, seguire questa guida avrebbe ridotto i record USGS di cui sopra da soli (n = 2424) dal 70 al 90%. Inoltre, la valutazione di Jones e Schmidt includeva massimi, minimi e range mensili, mentre la nostra analisi si è basata su una metrica media bimestrale più grossolana (luglio-agosto), che riteniamo meno suscettibile alle variazioni da un anno all’altro rispetto agli estremi di temperatura (File supplementare 1). Utilizzando 22 stazioni di misurazione USGS negli Stati Uniti e le bande di confidenza di Jones e Schmidt, stimiamo che 1-2 stagioni di dati potrebbero stimare in modo affidabile le temperature medie di luglio-agosto entro 1 °C con una confidenza dell’80% e 90%, rispettivamente (File supplementare 1). Abbiamo selezionato i siti per garantire che il periodo di registrazione cadesse tra il 1995 e il 2015 e che i dati fossero disponibili per almeno 60 giorni consecutivi in luglio e agosto.
Tutti i siti di temperatura sono stati uniti spazialmente ai corsi d’acqua NHDPlus V2. Abbiamo poi determinato le condizioni di riferimento per i siti di monitoraggio utilizzando indicatori di disturbo del terreno e di regolazione della diga a monte. La perturbazione del terreno è stata valutata utilizzando la valutazione dell’habitat della National Fish Habitat Partnership (NFHP) 2015, che fornisce punteggi di degrado dell’habitat che vanno da “molto basso” a “molto alto” disturbi all’interno dei segmenti di portata del flusso NHDPlus43. Abbiamo valutato il grado di regolazione a monte da parte degli argini utilizzando il grado di regolazione (DOR) (% della portata annuale immagazzinata dalle dighe a monte)44 , fornito da StreamCat. Le stazioni di monitoraggio della temperatura con punteggi di valutazione del rischio come “molto basso” o “basso” e DOR < 4% (che indica una scarsa influenza dei bacini44,45) sono state determinate rappresentative delle condizioni di riferimento, il che ha portato a 1764 siti che hanno anche soddisfatto i nostri criteri di lunghezza del record. Di questi, il 70% delle osservazioni sono state ottenute da Deweber & Wagner41 (n = 1211) o Hill et al.40 (n = 33). Delle rimanenti 520 osservazioni, il 71,7% aveva almeno 2 stagioni di dati.
Utilizzando lo stesso insieme di predittori di cui sopra, abbiamo sviluppato foreste casuali per prevedere le temperature estive per i siti di riferimento e poi estrapolato quei valori a tutti i corsi d’acqua NHD. Abbiamo usato le interruzioni nella distribuzione di frequenza delle temperature dell’acqua degli Stati Uniti per dividere le temperature estive in classi. Utilizzando i valori stimati della temperatura estiva per tutti i corsi d’acqua, abbiamo usato una procedura di Jenks Natural Breaks46 per suddividere le temperature in 2-20 classi e poi ci siamo basati sulla bontà ottimale dell’adattamento e sull’accuratezza tabellare per determinare il numero più parsimonioso di classi che spiegano la maggior parte delle informazioni. In assenza di un approccio giustificato per il partizionamento delle classi su base fisica, il metodo Jenks è ottimale per il clustering univariato delle informazioni spaziali in quanto cerca di minimizzare la variazione all’interno delle classi massimizzando la varianza tra le classi46.
Biforcazione della rete
Come la dimensione del flusso cattura la variazione longitudinale delle funzioni ecologiche lungo il continuum di un flusso15, anche le giunzioni e le divergenze degli affluenti sono importanti perché creano discontinuità nei processi longitudinali47. Le giunzioni dei corsi d’acqua, in particolare le dimensioni differenziali dei corsi d’acqua che comprendono le giunzioni, hanno una grande influenza sull’habitat e sulla diversità biologica48. Inoltre, la composizione della comunità ecologica può cambiare drasticamente con la vicinanza alle giunzioni dei flussi49. Per catturare le differenze nelle configurazioni di rete e nelle situazioni di divergenza, abbiamo creato due classi di biforcazione. In primo luogo, abbiamo creato classi che tengono conto delle diverse combinazioni di dimensioni degli affluenti che formano una confluenza all’estremità a monte di ogni portata del torrente. In secondo luogo, abbiamo sviluppato delle classi che indicano i corsi d’acqua come canali principali o secondari al di sotto delle divergenze e dove i corsi d’acqua ricevono il flusso dalle divergenze a monte.
La maggior parte dei singoli corsi d’acqua all’interno del dataset NHDplus V2 rappresentano caratteristiche idrologiche distinte delle reti fluviali definite dalle origini dei corsi d’acqua, dalle confluenze degli affluenti e dalle intersezioni con laghi e serbatoi50. Le relazioni topologiche tra i corsi d’acqua NHDplus V2 sono fornite in una tabella “da-a” che definisce i corsi d’acqua a monte che contribuiscono a un dato corso d’acqua (cioè, da) e il corso d’acqua a valle che riceve il flusso (cioè, a). Usando la tabella “from-to”, le combinazioni dei diversi ordini di flusso di Strahler all’estremità a monte di ogni portata sono state combinate per creare una combinazione affluente-mainstem. Per esempio, la confluenza di un affluente di 1° ordine e di un affluente di 2° ordine all’estremità a monte di un sistema di 2° ordine produrrebbe la seguente classe: 2.12 (Fig. 1a). Nella maggior parte dei casi, solo 2 affluenti si sono presentati a monte. Tuttavia, in rari casi o situazioni di divergenza, 3 o più affluenti si uniscono a monte di un reach e abbiamo incluso fino a quattro ordini a monte (ad esempio, Fig. 1b, 5.511). In alcuni casi, i corsi d’acqua ricevono il flusso da più divergenze di canali a monte, vale a dire la divisione di un corso d’acqua in due o più canali in direzione di valle (Fig. 1c). Poiché a questi canali viene assegnato un ordine di flusso e creano giunzioni che imitano le confluenze degli affluenti, la classificazione della biforcazione della rete richiede di includere le divergenze dei canali come un tipo di confluenza. Nei casi di divergenza dei canali, NHDplus V2 designa le portate come canali principali (D1) o secondari (D2) (Fig. 1c). Abbiamo usato la tabella from-to per identificare i corsi d’acqua che erano immediatamente sotto le confluenze delle divergenze dei canali (DU), in modo da distinguerli dalle confluenze degli affluenti. Dopo aver tenuto conto di queste divergenze, abbiamo osservato situazioni di confluenze di affluenti non sensate (ad esempio, 5_5.5) che sono sorte perché NHDplus V2 non ha designato in modo appropriato tutte le situazioni di divergenza di canali. Poiché era difficile determinare se ognuno di questi tratti fossero canali divergenti o tratti che ricevevano il flusso da canali divergenti, abbiamo assegnato questi tratti a una classe di divergenza generica (D).
Anche se la maggior parte delle giunzioni di affluenti in NHDPlus V2 sono idrologicamente rilevanti, un sottoinsieme di giunzioni sono state divise in punti non significativi, come i confini delle mappe quadrangolari, durante la digitalizzazione50 (Fig. 1d). Nel caso di classi di biforcazione e divergenze, queste suddivisioni porterebbero a giunzioni non sensate. Per correggere questi casi, Wieferich et al.51 hanno prodotto una Ecological Reach Identification Table che ha assegnato gli split reaches a identificatori ecologici comuni. In questi casi, abbiamo assegnato tutti i reach appartenenti alla stessa unità ecologica con la classe di biforcazione e divergenza del reach più a monte (Fig. 1d).
Valley Confinement
Il grado in cui le valli controllano la migrazione laterale dei canali fluviali è indicativo della forza di interazione tra i fiumi e la loro pianura alluvionale. Abbiamo delineato i fondivalle non vincolati (cioè i poligoni) per tutti i corsi d’acqua NHDPlus V2 utilizzando lo strumento Valley Confinement Algorithm (VCA)52 in ArcMap 10.3. VCA stima la profondità di piena del canale del torrente usando una funzione empirica basata sui dati regionali delle precipitazioni (http://www.prism.oregonstate.edu/normals) e sull’area di drenaggio per ogni tratto di torrente53. Nagle et al.52 hanno suggerito una profondità di invaso di 5 volte per determinare l’altezza della piena, che abbiamo ritenuto appropriata data la risoluzione spaziale di NHDplus e i dati DEM 30-m (https://nationalmap.gov/elevation.html) per la topografia circostante. Sulla base del terreno circostante caratterizzato tramite DEM, il programma VCA ha usato un algoritmo per intersecare l’altezza dell’inondazione con la collina circostante. I corpi idrici sono stati usati per evitare di delineare i fondivalle nelle aree inondate.
Una volta delineati i fondivalle, sono necessarie delle soglie per classificare i corsi d’acqua come non confinati, confinati, o un livello intermedio. Per esempio, un fondovalle può non comprendere un intero corso d’acqua o può non estendersi lateralmente una distanza sufficiente oltre le rive del torrente per essere classificato come non confinato. Questo richiede una stima della larghezza del fiume per ogni portata. Abbiamo compilato sia le osservazioni in situ che le osservazioni di telerilevamento da >52.000 siti per sviluppare un modello empirico per prevedere la larghezza del fiume per tutti i corsi d’acqua del CONUS. Le osservazioni sul campo della larghezza del fiume sono state derivate dal National Rivers and Streams Assessment dell’Environmental Protection Agency (n = 852) (https://www.epa.gov/national-aquatic-resource-surveys/nrsa), da una revisione della letteratura sulla larghezza dei fiumi (n = 243)29 e dal North American River Width Data Set (n = 50.230) (http://gaia.geosci.unc.edu/NARWidth/). Tuttavia, queste serie di dati hanno largamente tralasciato i piccoli corsi d’acqua di testa e i sistemi intermittenti. Per essere sicuri di stimare correttamente la larghezza di questi tipi di corsi d’acqua, i corsi d’acqua sono stati stratificati per dimensioni (vedi classificazione delle dimensioni) e un sottoinsieme casuale (n = 407) è stato selezionato dall’intera popolazione di corsi d’acqua degli Stati Uniti. Le immagini aeree sono state utilizzate per stimare la larghezza del fiume nel punto medio, a monte e a valle di ogni portata, e poi calcolare una larghezza media. Sono stati utilizzati modelli di foresta casuale per prevedere la larghezza del fiume ed estrapolare le stime a tutti i corsi d’acqua. Le stime della larghezza del fiume sono state poi utilizzate per generare poligoni intorno a tutti i corsi d’acqua.
Abbiamo sovrapposto le larghezze del fiume e i fondi valle per determinare lo stato di vincolo della valle. Hall et al.53 hanno considerato i corsi d’acqua non vincolati se la larghezza della valle alluvionale è almeno quattro volte la larghezza, mentre i canali con moderata interazione della pianura alluvionale hanno rapporti di larghezza tra la pianura alluvionale e il fondovalle >24. Oltre all’estensione laterale delle pianure alluvionali, la nostra valutazione del confinamento ha richiesto anche l’esame della lunghezza di ogni tratto di torrente coperto da fondovalle. I corsi d’acqua sono stati classificati come “non confinati” se un fondovalle copriva almeno il 50% della lunghezza del corso d’acqua e aveva una larghezza di almeno quattro volte quella del fiume. I corsi d’acqua “moderatamente confinati” avevano fondivalle con larghezze >4 volte la larghezza del fiume, ma coprivano solo il 25-50% della lunghezza del corso d’acqua, o se la copertura era superiore al 50% della lunghezza del corso d’acqua, i fondivalle avevano un rapporto larghezza della pianura alluvionale:fiume tra 2 e 4. Tutti gli altri corsi d’acqua sono stati definiti come “confinati”.