Vue d’ensemble de l’approche
Dans le SCS, les éléments constitutifs de l’habitat des cours d’eau sont représentés comme une série de couches, chacune d’entre elles représentant différentes catégories de caractéristiques physiques (par exemple, la taille, le gradient). Chaque couche est composée de plusieurs classes (par exemple, eau de tête, ruisseau, faible gradient, gradient élevé). Les couches ont été construites en utilisant des approches inductives basées sur des modèles de données empiriques, par opposition à des approches déductives reposant sur la régionalisation du paysage. Les sources des données empiriques utilisées pour dériver les classes de cours d’eau sont fournies dans le tableau 1. Grâce à des examens antérieurs et à la sollicitation d’un groupe de défenseurs de l’environnement et d’écologistes des cours d’eau6,25, nous avons sélectionné six couches d’habitat des cours d’eau qui pouvaient être cartographiées à la résolution du tronçon de cours d’eau et dont on a supposé qu’elles exerçaient un contrôle important sur la fonction écologique et la composition des communautés écologiques. Il s’agit (par ordre d’importance écologique décroissante) de la taille, du gradient, de l’hydrologie, de la température, de la bifurcation du réseau de cours d’eau et du confinement de la vallée.
La disponibilité de méthodes documentées pour les approches de classification et les seuils entre les classes a été une considération majeure dans la sélection des couches et la détermination des partitions entre les classes. Par conséquent, nous avons sélectionné de préférence les couches soutenues par des classifications préexistantes et publiées ou, si les classifications précédentes n’étaient pas disponibles, nous nous sommes appuyés sur la littérature pour déterminer les ruptures et les seuils pour partitionner les valeurs (par exemple, le gradient) dans les classes lorsqu’elles étaient disponibles. Parce que les résultats de la classification sont influencés par l’approche adoptée, nous avons utilisé plusieurs approches alternatives, si elles étaient disponibles, pour développer des classes au sein des couches.
Compilation des variables prédictives
Les informations sur la taille, le gradient et la bifurcation du réseau ont été dérivées de l’ensemble de données NHDPlus V2. Cependant, les observations discrètes in situ de l’hydrologie, de la température et des caractéristiques du chenal de la rivière (confinement de la vallée) ont nécessité que nous développions des modèles pour extrapoler ces classes au niveau de la portée du cours d’eau. Un total de 66 variables paysagères, climatiques, topographiques et pédologiques ont été rassemblées pour les bassins de drainage contribuant à chaque station de jaugeage de cours d’eau et pour l’ensemble du réseau de drainage en amont de chaque tronçon de cours d’eau aux États-Unis (Tableau 2 (disponible en ligne uniquement)). Parmi celles-ci, 44 ont été fournies par la base de données Stream Cat26 (https://www.epa.gov/national-aquatic-resource-surveys/streamcat), 21 par l’ensemble de données NHDPlus V2 et une par WorldClim (http://worldclim.org/version2) (Tableau 2 (disponible en ligne uniquement)). Dans environ 2 % des observations, les valeurs manquaient pour les variables résumées pour les réseaux de drainage au-dessus de chaque portée de cours d’eau (principalement les données StreamCat). Nous avons utilisé le progiciel Multivariate Imputation by Chained Equation (MICE) dans l’environnement de programmation R27 pour estimer les valeurs les plus probables des variables manquantes en fonction des valeurs présentes pour les autres variables. Pour chaque variable à valeurs manquantes, nous avons spécifié une matrice binaire indiquant quel sous-ensemble de prédicteurs devait être utilisé pour estimer les valeurs manquantes pendant l’imputation. Des modèles distincts d’appariement moyen prédictif ont été élaborés pour chaque variable incomplète27.
Size
Par rapport aux autres classes, l’élaboration de schémas de classification pour la taille et le gradient ne reposait pas sur des observations in situ ou l’élaboration de modèles prédictifs (par exemple, l’hydrologie). Nous avons utilisé deux variables relatives à la taille disponibles par le biais du jeu de données NHDPlus V2 pour fournir des classifications alternatives de la taille des cours d’eau : L’ordre des cours d’eau de Strahler et le débit annuel moyen (représentatif des conditions d’impact humain minimal). L’ordre des cours d’eau décrit la nature dendritique des environnements de cours d’eau28 et est couramment utilisé pour caractériser la distribution de fréquence des tailles de cours d’eau sur de grandes régions ou à l’échelle mondiale29. Les limites de l’ordre des cours d’eau, cependant, sont que l’ordre peut être influencé par l’échelle de l’hydrographie cartographiée30 et que le débit peut varier considérablement selon les régimes climatiques pour un ordre donné. De même, l’utilisation de l’aire de drainage pour caractériser la taille peut également être problématique, car le débit par unité de surface variera également de façon spectaculaire entre des régions au climat très variable30. La taille d’un cours d’eau peut également être caractérisée par le débit qu’il transporte. Cependant, cela nécessite de déterminer une approche normalisée pour partitionner les classes en fonction du débit. Étant donné que les lois géométriques qui régissent l’organisation des cours d’eau (par exemple, la fréquence, la longueur du cours d’eau, la zone de drainage) sont basées sur l’ordre des cours d’eau31, l’ordre fournit un modèle physique universel pour partitionner la grande variation continentale du débit en fonction de seuils cohérents. Pour développer une classification de taille basée sur le débit, nous avons calculé le débit médian de tous les tronçons de cours d’eau NHDPlus V2 selon l’ordre des cours d’eau de Strahler, puis nous avons utilisé les points médians entre ces valeurs pour créer des ruptures de débit comme seuils de classe de taille. (Remarque : les variables utilisées dans la classification hydrologique sont normalisées par le débit annuel moyen et ne sont donc pas influencées par la taille de la rivière).
Gradient
Les valeurs de gradient (c.-à-d. la pente du lit du cours d’eau) ont également été fournies comme attribut des lignes de courant NHDPlus V2. Les pentes des cours d’eau ont été mesurées pour chaque ligne de courant comme la proportion de l’élévation sur la distance de la ligne de courant32. Les données d’élévation lissées ont été dérivées de modèles numériques d’élévation (MNE) de 10 m pour la nation. Les élévations maximales et minimales ont été utilisées pour déterminer l’élévation, qui a été divisée par la longueur totale de la ligne de courant. À notre connaissance, les seuils de gradient les plus largement utilisés sont fournis par Rosgen4, qui distingue les morphologies de chenaux en fonction du gradient, des rapports largeur/profondeur, de l’encaissement et de la sinuosité. De multiples efforts de classification des cours d’eau se sont également appuyés sur ces seuils de gradient pour partitionner les classes également6,9,25. Nous avons adopté ces ruptures pour développer des types de gradient et les avons cartographiés aux tronçons de cours d’eau.
Hydrologie
Au cours des deux dernières décennies, de nombreuses classifications hydrologiques à l’échelle régionale à mondiale ont été développées à partir d’observations discrètes de stations de surveillance du débit des cours d’eau2,18,33. En général, le développement de classifications hydrologiques inductives nécessite de rassembler les observations in situ du débit, de résumer le débit en statistiques hydrologiques, puis de regrouper les observations en fonction des similitudes des propriétés hydrologiques22. Récemment, McManamay et al.34 ont développé une classification hydrologique pour l’ensemble des États-Unis, basée sur les modèles de débit naturel de 2 600 stations de jaugeage de cours d’eau de l’US Geological Survey (USGS), les bassins versants en amont représentant la condition la moins perturbée pour leur région respective. Après la décomposition de 110 statistiques hydrologiques en 13 scores de composantes à l’aide de l’analyse en composantes principales (ACP), les stations de jaugeage ont été affectées de manière probabiliste à l’une des 15 classes hydrologiques à l’aide d’algorithmes optimaux de regroupement de modèles mixtes gaussiens déterminés par inférence bayésienne34. Ces classes représentent la variation des modèles hydrologiques par opposition à la variation du volume du débit, car toutes les statistiques hydrologiques liées à la magnitude ont été normalisées par le débit quotidien moyen avant l’ACP et le regroupement.
Ce style de classification flou (c’est-à-dire le regroupement souple) est flexible dans la mesure où il caractérise les cours d’eau comme partageant théoriquement l’appartenance à de nombreux clusters33,35. En revanche, les techniques de regroupement » dures « , telles que les méthodes agglomératives hiérarchiques basées sur la distance (par exemple, la méthode de Ward)36, sont relativement simples, plus faciles à comprendre et produisent des appartenances imbriquées et nettes22. Ainsi, nous avons utilisé la méthode agglomérative de Ward pour regrouper les 2600 jauges USGS à l’aide des 13 scores PC, puis nous avons déterminé une série de nombres optimaux de clusters en nous basant sur un examen visuel du dendrogramme.
Toutes les jauges de cours d’eau USGS ont été jointes spatialement aux tronçons de cours d’eau NHDPlus V2. À l’aide des variables prédictives du tableau 2 (disponible en ligne seulement), nous avons construit des modèles de classification par forêt aléatoire37 dans l’environnement de programmation R pour prédire l’appartenance à une classe hydrologique, puis nous avons extrapolé les classes hydrologiques à tous les tronçons de cours d’eau NHDPlus V2.
Température
Par rapport à l’hydrologie, les classifications de température sont moins courantes3,38,39, peut-être en raison de la rareté des données de température par rapport au débit. Récemment, Maheu et al.3 ont regroupé environ 130 stations de jaugeage (représentatives des conditions de référence) à travers les États-Unis en différents types de régimes thermiques basés sur plusieurs statistiques décrivant l’ampleur et la variation. Cette approche multivariée fournit une alternative multivariée aux classes de température estivale univariées que nous avons générées. Les emplacements des jauges utilisées dans la classification de Maheu et al. ont été obtenus auprès des auteurs et ont été joints spatialement aux tronçons de cours d’eau NHDPlus V2. En utilisant 65 des variables prédictives, nous avons développé un modèle de forêt aléatoire pour classer les classes de Maheu et al. dans les cours d’eau à travers les États-Unis. Comme la température est une fonction de la taille du cours d’eau, nous avons exclu le Qwsa du modèle (c’est-à-dire le débit annuel moyen divisé par la zone de drainage).
En guise d’alternative, nous avons développé une classification simple de la température basée sur les valeurs moyennes de la température de l’eau en été qui se produisent naturellement. De multiples études suggèrent que les régimes thermiques divergents des cours d’eau sont principalement influencés par la variation naturelle des valeurs de température estivale (moyennes de juillet-août)3,40,41. De plus, les valeurs de la température estivale sont parmi les données les plus facilement accessibles à partir de sources publiques et non publiques. Nous avons compilé des données sur la température de l’eau des cours d’eau pour 5 907 sites provenant de sources multiples, notamment Deweber & Wagner41 (n = 2893), Hill et al.40 (n = 566), les jauges de l’USGS avec des enregistrements quotidiens (n = 2184), la surveillance saisonnière sur le terrain de l’USGS (n = 240) et d’autres données sur la température provenant d’enregistreurs déployés par des organismes (n = 24) (tableau 1). Pour déterminer la longueur d’enregistrement adéquate pour les données de température, il a fallu trouver un équilibre entre la minimisation de l’incertitude dans les moyennes de juillet-août et le fait d’avoir trop peu d’échantillons pour une représentation régionale adéquate. Par exemple, Jones et Schmidt42 ont fourni des recommandations sur les longueurs d’enregistrement requises pour minimiser adéquatement l’incertitude dans l’estimation des paramètres du régime thermique ; toutefois, si l’on avait suivi ces conseils, on aurait réduit de 70 à 90 % les enregistrements de l’USGS (n = 2424). De plus, l’évaluation de Jones et Schmidt incluait des maxima, minima et étendues mensuels, alors que notre analyse s’est basée sur une moyenne bimensuelle plus grossière (juillet-août), que nous estimons moins sensible aux variations annuelles que les extrêmes de température (Fichier supplémentaire 1). En utilisant 22 jauges USGS à travers les États-Unis et les bandes de confiance de Jones et Schmidt, nous estimons qu’une à deux saisons de données pourraient estimer de manière fiable les températures moyennes de juillet-août à 1 °C près avec un niveau de confiance de 80 % et 90 %, respectivement (Fichier supplémentaire 1). Nous avons passé en revue les sites pour nous assurer que la période d’enregistrement se situait entre 1995 et 2015 et que les données étaient disponibles pendant au moins 60 jours consécutifs en juillet et août.
Tous les sites de température ont été spatialement joints aux tronçons de cours d’eau NHDPlus V2. Nous avons ensuite déterminé les conditions de référence pour les sites de surveillance en utilisant des indicateurs de perturbation des terres et de régulation des barrages en amont. La perturbation des terres a été évaluée à l’aide de l’évaluation de l’habitat 2015 du National Fish Habitat Partnership (NFHP), qui fournit des scores de dégradation de l’habitat allant de perturbations » très faibles » à » très élevées » dans les segments de portée de cours d’eau NHDPlus43. Nous avons évalué le degré de régulation en amont par les retenues en utilisant le degré de régulation (DOR) (% du débit annuel stocké par les barrages en amont)44, fourni par StreamCat. Les stations de surveillance de la température dont les scores d’évaluation des risques étaient » très faibles » ou » faibles » et le DOR < 4% (indiquant une faible influence des réservoirs44,45) ont été déterminées comme représentatives des conditions de référence, ce qui a donné 1764 sites qui répondaient également à nos critères de longueur d’enregistrement. Parmi ceux-ci, 70 % des observations ont été obtenues de Deweber & Wagner41 (n = 1211) ou de Hill et al.40 (n = 33). Sur les 520 observations restantes, 71,7% avaient au moins 2 saisons de données.
En utilisant le même ensemble de prédicteurs ci-dessus, nous avons développé des forêts aléatoires pour prédire les températures estivales pour les sites de référence, puis extrapolé ces valeurs à tous les tronçons de cours d’eau NHD. Nous avons utilisé des ruptures dans la distribution de fréquence des températures de l’eau aux États-Unis pour partitionner les températures estivales en classes. En utilisant les valeurs estimées des températures estivales pour tous les tronçons de cours d’eau, nous avons utilisé une procédure de Jenks Natural Breaks46 pour répartir les températures en 2 à 20 classes, puis nous nous sommes appuyés sur la qualité optimale de l’ajustement et la précision tabulaire pour déterminer le nombre le plus parcimonieux de classes expliquant la majorité de l’information. En l’absence d’une approche justifiée pour le partitionnement des classes basé sur la physique, la méthode de Jenks est optimale pour le regroupement univarié de l’information spatiale car elle cherche à minimiser la variation au sein des classes tout en maximisant la variance entre les classes46.
Bifurcation du réseau
Alors que la taille du cours d’eau capture la variation longitudinale des fonctions écologiques le long du continuum d’un cours d’eau15, les jonctions et les divergences des affluents sont également importantes car elles créent des discontinuités dans les processus longitudinaux47. Les jonctions de cours d’eau, et plus particulièrement les tailles différentielles des cours d’eau qui composent les jonctions, ont une grande influence sur l’habitat et la diversité biologique48. En outre, la composition de la communauté écologique peut changer de façon spectaculaire en fonction de la proximité des jonctions de cours d’eau49. Pour saisir les différences dans les configurations de réseau et les situations de divergence, nous avons créé deux classes de bifurcation. Premièrement, nous avons créé des classes qui représentent des combinaisons de tailles différentes d’affluents formant une confluence à l’extrémité amont de chaque tronçon de cours d’eau. Deuxièmement, nous avons développé des classes indiquant les tronçons de cours d’eau en tant que canaux principaux ou secondaires en dessous des divergences et où les cours d’eau recevaient le débit des divergences en amont.
La plupart des tronçons de cours d’eau individuels dans l’ensemble de données NHDplus V2 représentent des caractéristiques hydrologiques distinctes des réseaux fluviaux définis par les origines des cours d’eau, les confluences des affluents et les intersections avec les lacs et les réservoirs50. Les relations topologiques entre les tronçons de cours d’eau du NHDplus V2 sont fournies dans un tableau » from-to » qui définit les tronçons en amont qui contribuent à un tronçon donné (i.e., from) et le tronçon en aval qui reçoit le débit (i.e., to). En utilisant le tableau « from-to », les combinaisons de différents ordres de cours d’eau de Strahler à l’extrémité amont de chaque portée ont été combinées pour créer une combinaison tributaire-tronc principal. Par exemple, la confluence d’un affluent de 1er ordre et d’un affluent de 2e ordre à l’extrémité amont d’un système de 2e ordre donnerait la classe suivante : 2.12 (Fig. 1a). Dans la majorité des cas, seuls 2 affluents se trouvent en amont. Cependant, dans de rares cas ou situations de divergence, 3 affluents ou plus fusionnent en amont d’un bief et nous avons inclus jusqu’à quatre ordres amont (par exemple, Fig. 1b, 5.511). Dans certains cas, les tronçons de cours d’eau reçoivent un débit provenant de multiples divergences de canaux en amont, c’est-à-dire de la division d’un tronçon en deux canaux ou plus en direction de l’aval (Fig. 1c). Parce que ces canaux reçoivent un ordre de passage et créent des jonctions qui imitent les confluences d’affluents, la classification de la bifurcation du réseau nécessite l’inclusion des divergences de canaux comme type de confluence. Dans les cas de divergence de canaux, le NHDplus V2 désigne les tronçons comme des canaux principaux (D1) ou secondaires (D2) (Fig. 1c). Nous avons utilisé le tableau de » de à » pour identifier les tronçons de cours d’eau qui se trouvaient immédiatement en dessous des confluences de divergences de canaux (DU), afin de les distinguer des confluences d’affluents. Après avoir pris en compte ces divergences, nous avons observé des situations de jonctions d’affluents non sensées (p. ex., 5_5.5) qui se sont produites parce que le NHDplus V2 ne désignait pas de manière appropriée toutes les situations de divergence de chenaux. Comme il était difficile de déterminer si chacun de ces tronçons était un chenal divergent ou un tronçon recevant un débit de chenaux divergents, nous avons attribué ces tronçons à une classe de divergence générique (D).
Bien que la plupart des jonctions d’affluents dans NHDPlus V2 soient hydrologiquement pertinentes, un sous-ensemble de jonctions de biefs a été divisé à des points non significatifs, tels que les limites de cartes quadrangulaires, pendant la numérisation50 (Fig. 1d). Dans le cas des classes de bifurcation et des divergences, ces scissions conduiraient à des jonctions non sensées. Pour corriger ces cas, Wieferich et al.51 ont produit un tableau d’identification des tronçons écologiques qui attribue les tronçons divisés à des identificateurs écologiques communs. Dans ces cas, nous avons attribué à tous les tronçons appartenant à la même unité écologique la classe de bifurcation et de divergence du tronçon le plus en amont (Fig. 1d).
Confinement des vallées
Le degré auquel les vallées contrôlent la migration latérale des chenaux fluviaux est indicatif de la force de l’interaction entre les rivières et leur plaine d’inondation. Nous avons délimité des fonds de vallée non contraints (c.-à-d. des polygones) pour tous les tronçons de cours d’eau NHDPlus V2 à l’aide de l’outil Valley Confinement Algorithm (VCA)52 dans ArcMap 10.3. L’ACV estime la profondeur du lit du cours d’eau en utilisant une fonction empirique basée sur les données de précipitations régionales (http://www.prism.oregonstate.edu/normals) et la zone de drainage pour chaque tronçon de cours d’eau53. Nagle et al.52 ont suggéré de multiplier par 5 la profondeur de débordement pour déterminer la hauteur de la crue, ce que nous avons également jugé approprié compte tenu de la résolution spatiale du NHDplus et des données DEM de 30 m (https://nationalmap.gov/elevation.html) pour la topographie environnante. Sur la base du terrain environnant caractérisé par les MNE, le programme VCA a utilisé un algorithme pour croiser la hauteur de crue avec la pente des collines environnantes. Les plans d’eau ont été utilisés pour éviter la délimitation des fonds de vallée dans les zones inondées.
Une fois que les fonds de vallée ont été délimités, des seuils sont nécessaires pour classer les tronçons de cours d’eau comme non confinés, confinés ou un niveau intermédiaire. Par exemple, il se peut qu’un fond de vallée n’englobe pas la totalité d’un tronçon de cours d’eau ou qu’il ne s’étende pas latéralement sur une distance suffisante au-delà des berges du cours d’eau pour être classé comme non confiné. Cela nécessite une estimation de la largeur de la rivière pour chaque tronçon de cours d’eau. Nous avons compilé les observations in situ sur le terrain et les observations par télédétection de >52 000 sites afin de développer un modèle empirique pour prédire la largeur de la rivière pour tous les tronçons de cours d’eau dans le CONUS. Les observations sur le terrain de la largeur des cours d’eau ont été dérivées de l’évaluation nationale des rivières et des ruisseaux de l’Agence de protection de l’environnement (n = 852) (https://www.epa.gov/national-aquatic-resource-surveys/nrsa), d’une revue de la littérature sur la largeur des cours d’eau (n = 243)29, et de l’ensemble de données sur la largeur des cours d’eau nord-américains (n = 50 230) (http://gaia.geosci.unc.edu/NARWidth/). Cependant, ces ensembles de données ne comprennent pas les petits cours d’eau de tête et les systèmes intermittents. Pour s’assurer que nous avons correctement estimé la largeur de ces types de cours d’eau, les tronçons de cours d’eau ont été stratifiés par taille (voir Classification par taille) et un sous-ensemble aléatoire (n = 407) a été sélectionné à partir de l’ensemble des tronçons de cours d’eau américains. L’imagerie aérienne a été utilisée pour estimer la largeur des cours d’eau au milieu, en amont et en aval de chaque tronçon, puis pour calculer une largeur moyenne. Des modèles de forêt aléatoire ont été utilisés pour prédire la largeur de la rivière et extrapoler les estimations à tous les tronçons de cours d’eau. Les estimations de la largeur de la rivière ont ensuite été utilisées pour générer des tampons de polygones autour de tous les tronçons de cours d’eau.
Nous avons superposé les largeurs de rivière et les fonds de vallée pour déterminer le statut de contrainte de la vallée. Hall et al.53 ont considéré que les tronçons de cours d’eau n’étaient pas confinés si la largeur de la vallée de la plaine d’inondation était au moins quatre fois supérieure à la largeur, alors que les canaux de cours d’eau avec une interaction modérée avec la plaine d’inondation ont des rapports de largeur de la plaine d’inondation à la largeur de la vallée >24. Au-delà de l’étendue latérale des plaines d’inondation, notre évaluation du confinement a également nécessité l’examen de la longueur de chaque tronçon de cours d’eau couverte par les fonds de vallée. Les tronçons de cours d’eau ont été classés comme « non confinés » si un fond de vallée couvrait au moins 50% de la longueur du tronçon de cours d’eau et avait une largeur au moins quatre fois supérieure à celle de la rivière. Les tronçons de cours d’eau » modérément confinés » avaient des fonds de vallée dont la largeur était >4 fois celle de la rivière, mais qui ne couvraient que 25 à 50 % de la longueur du tronçon de cours d’eau, ou si la couverture était supérieure à 50 % de la longueur du cours d’eau, les fonds de vallée avaient des rapports plaine d’inondation:largeur de la rivière compris entre 2 et 4. Tous les autres tronçons de cours d’eau ont été définis comme « confinés ».