Übersicht über den Ansatz
Im SCS werden die Lebensraumbausteine der Fließgewässer als eine Reihe von Schichten dargestellt, von denen jede verschiedene Kategorien physikalischer Merkmale (z. B. Größe, Gefälle) repräsentiert. Jede Schicht besteht aus mehreren Klassen (z. B. Oberwasser, Bach, geringes Gefälle, hohes Gefälle). Die Schichten wurden mit induktiven Ansätzen auf der Grundlage von Mustern in empirischen Daten erstellt, im Gegensatz zu deduktiven Ansätzen, die sich auf die Regionalisierung der Landschaft stützen. Die Quellen der empirischen Daten, die zur Ableitung der Fließgewässerklassen verwendet wurden, sind in Tabelle 1 aufgeführt. Auf der Grundlage früherer Überprüfungen und einer Befragung von Naturschützern und Fließgewässerökologen6,25 wählten wir sechs Fließgewässerlebensraumschichten aus, die auf der Ebene von Fließgewässerabschnitten kartiert werden konnten und von denen angenommen wurde, dass sie die ökologische Funktion und die Zusammensetzung der ökologischen Gemeinschaften stark beeinflussen. Dazu gehörten (in der Reihenfolge abnehmender ökologischer Bedeutung): Größe, Gefälle, Hydrologie, Temperatur, Verzweigung des Fließgewässernetzes und Taleingrenzung.
Eine wichtige Überlegung bei der Auswahl der Schichten und der Festlegung von Unterteilungen zwischen den Klassen war die Verfügbarkeit von dokumentierten Methoden für Klassifizierungsansätze und Schwellenwerte zwischen den Klassen. Daher wählten wir bevorzugt Ebenen aus, die durch bereits vorhandene und veröffentlichte Klassifizierungen unterstützt wurden, oder, wenn frühere Klassifizierungen nicht verfügbar waren, verließen wir uns auf die Literatur, um Brüche und Schwellenwerte zu bestimmen, um Werte (z. B. Gradient) in Klassen aufzuteilen, sofern verfügbar. Da die Klassifizierungsergebnisse durch den gewählten Ansatz beeinflusst werden, haben wir bei der Entwicklung von Klassen innerhalb von Schichten mehrere alternative Ansätze verwendet, sofern verfügbar.
Zusammenstellung von Vorhersagevariablen
Die Informationen zu Größe, Gradient und Netzwerkverzweigung wurden aus dem NHDPlus V2-Datensatz abgeleitet. Die diskreten In-situ-Beobachtungen der Hydrologie, der Temperatur und der Eigenschaften des Flusskanals (Taleingrenzung) erforderten jedoch die Entwicklung von Modellen zur Extrapolation dieser Klassen auf die Ebene der Fließgewässerabschnitte. Insgesamt wurden 66 Landschafts-, Klima-, topografische und Bodenvariablen für die Einzugsgebiete, die zu jeder Flussmessstation beitragen, und für das gesamte Einzugsgebietsnetz flussaufwärts jedes Flusses in den USA zusammengestellt (Tabelle 2 (nur online verfügbar)). Davon wurden 44 aus der Stream Cat-Datenbank26 (https://www.epa.gov/national-aquatic-resource-surveys/streamcat), 21 aus dem NHDPlus V2-Datensatz und eine aus WorldClim (http://worldclim.org/version2) bereitgestellt (Tabelle 2 (nur online verfügbar)). Bei etwa 2 % der Beobachtungen fehlten Werte für Variablen, die für die Entwässerungsnetze oberhalb der einzelnen Fließgewässerabschnitte zusammengefasst wurden (hauptsächlich StreamCat-Daten). Wir verwendeten das Paket Multivariate Imputation by Chained Equation (MICE) in der R-Programmierumgebung27 , um die wahrscheinlichsten Werte für fehlende Variablen auf der Grundlage der für andere Variablen vorhandenen Werte zu schätzen. Für jede Variable mit fehlenden Werten gaben wir eine binäre Matrix an, die angibt, welche Untergruppe von Prädiktoren zur Schätzung fehlender Werte während der Imputation verwendet werden sollte. Für jede unvollständige Variable wurden separate Predictive Mean Matching-Modelle entwickelt27.
Größe
Im Vergleich zu anderen Klassen stützte sich die Entwicklung von Klassifizierungsschemata für Größe und Gradient nicht auf In-situ-Beobachtungen oder die Entwicklung prädiktiver Modelle (z. B. Hydrologie). Wir verwendeten zwei größenrelevante Variablen, die über den NHDPlus V2-Datensatz verfügbar sind, um alternative Klassifizierungen der Fließgewässergröße zu erstellen: Strahler-Bachordnung und mittlerer jährlicher Abfluss (repräsentativ für Bedingungen mit minimalem menschlichen Einfluss). Die Ordnung der Fließgewässer stellt die dendritische Natur der Fließgewässerumgebungen dar28 und wird üblicherweise verwendet, um die Häufigkeitsverteilung der Fließgewässergrößen über große Regionen oder weltweit zu charakterisieren29. Die Grenzen der Ordnung von Fließgewässern liegen jedoch darin, dass die Ordnung durch den Maßstab der kartierten Hydrographie beeinflusst werden kann30 und dass die Abflüsse in den verschiedenen Klimaregimen für eine bestimmte Ordnung stark variieren können. Ebenso kann die Verwendung des Einzugsgebiets zur Charakterisierung der Größe problematisch sein, da der Abfluss pro Flächeneinheit in Regionen mit sehr unterschiedlichen klimatischen Bedingungen ebenfalls stark schwankt30. Alternativ kann die Größe eines Fließgewässers durch den Abfluss charakterisiert werden, den es führt. Dies erfordert jedoch die Festlegung eines standardisierten Ansatzes zur Unterteilung von Klassen auf der Grundlage des Abflusses. Da die geometrischen Gesetze, die die Organisation von Fließgewässern regeln (z. B. Häufigkeit, Fließgewässerlänge, Einzugsgebiet), auf der Ordnung der Fließgewässer beruhen31 , bietet die Ordnung eine universelle physikalische Vorlage für die Unterteilung der großen kontinentalen Abflussschwankungen auf der Grundlage einheitlicher Schwellenwerte. Zur Entwicklung einer abflussbasierten Größenklassifizierung berechneten wir den mittleren Abfluss für alle NHDPlus V2-Flussabschnitte gemäß der Strahler-Flussordnung und verwendeten dann die Mittelwerte zwischen diesen Werten, um Abflussunterbrechungen als Größenklassenschwellenwerte zu erstellen. (Hinweis: Die in der hydrologischen Klassifizierung verwendeten Variablen sind durch den mittleren jährlichen Abfluss standardisiert und werden daher nicht durch die Flussgröße beeinflusst).
Gefälle
Gefällewerte (d. h. die Neigung des Flussbetts) wurden ebenfalls als Attribut der NHDPlus V2-Fließstrecken bereitgestellt. Das Gefälle eines Flusses wurde für jede Fließlinie als Anteil des Höhenanstiegs an der Fließlinienentfernung gemessen32. Die geglätteten Höhendaten wurden aus digitalen 10-m-Höhenmodellen (DEMs) für das gesamte Land abgeleitet. Die maximalen und minimalen Erhebungen wurden zur Bestimmung des Anstiegs verwendet, der durch die Gesamtlänge der Fließlinie geteilt wurde. Die unseres Wissens am häufigsten verwendeten Schwellenwerte für das Gefälle stammen von Rosgen4, der die Gerinnemorphologie anhand des Gefälles, des Verhältnisses von Breite zu Tiefe, der Verankerung und der Gewundenheit unterscheidet. Mehrere Bemühungen zur Klassifizierung von Fließgewässern haben sich ebenfalls auf diese Gradientenschwellenwerte gestützt, um Klassen zu unterteilen6,9,25. Wir haben diese Schwellenwerte übernommen, um Gradiententypen zu entwickeln und diese den Fließgewässerabschnitten zuzuordnen.
Hydrologie
In den letzten zwei Jahrzehnten wurden zahlreiche hydrologische Klassifizierungen auf regionaler bis globaler Ebene aus diskreten Beobachtungen von Fließgewässermessstationen entwickelt2,18,33. Im Allgemeinen erfordert die Entwicklung induktiver hydrologischer Klassifizierungen die Zusammenstellung von In-situ-Beobachtungen des Abflusses, die Zusammenfassung des Abflusses zu hydrologischen Statistiken und die anschließende Gruppierung der Beobachtungen auf der Grundlage ähnlicher hydrologischer Eigenschaften22. Kürzlich haben McManamay et al.34 eine hydrologische Klassifizierung für die gesamten USA entwickelt, die auf den natürlichen Abflussmustern an 2.600 Flussmessstationen des US Geological Survey (USGS) basiert, wobei die flussaufwärts gelegenen Wassereinzugsgebiete den am wenigsten gestörten Zustand für ihre jeweilige Region darstellen. Nach der Zerlegung von 110 hydrologischen Statistiken in 13 Komponentenscores mit Hilfe der Hauptkomponentenanalyse (PCA) wurden die Pegelstationen mit Hilfe optimaler Gauß’scher Mischmodell-Clusteralgorithmen, die mit Hilfe der Bayes’schen Inferenz34 ermittelt wurden, probabilistisch einer von 15 hydrologischen Klassen zugeordnet. Diese Klassen repräsentieren Variationen in hydrologischen Mustern im Gegensatz zu Variationen im Abflussvolumen, da alle magnitudenbezogenen hydrologischen Statistiken vor der PCA und dem Clustering durch den mittleren täglichen Abfluss standardisiert wurden.
Diese unscharfe Art der Klassifizierung (d.h. Soft Clustering) ist flexibel, da sie Bäche als theoretisch zu vielen Clustern gehörend charakterisiert33,35. Im Gegensatz dazu sind „harte“ Clustering-Techniken, wie z. B. abstandsbasierte hierarchische agglomerative Methoden (z. B. die Ward-Methode)36, relativ unkompliziert, leichter zu verstehen und führen zu verschachtelten und eindeutigen Mitgliedschaften22. Daher verwendeten wir die agglomerative Methode von Ward, um die 2600 USGS-Pegelstationen anhand der 13 PC-Scores zu clustern, und ermittelten dann eine Reihe optimaler Clusterzahlen auf der Grundlage einer visuellen Prüfung des Dendrogramms.
Alle USGS-Pegelstationen wurden räumlich mit den NHDPlus-V2-Bachabschnitten verbunden. Unter Verwendung der Prädiktorvariablen in Tabelle 2 (nur online verfügbar) haben wir in der R-Programmierumgebung Random-Forest-Klassifikationsmodelle37 erstellt, um die Zugehörigkeit zu einer hydrologischen Klasse vorherzusagen, und dann die hydrologischen Klassen auf alle NHDPlus-V2-Bachabschnitte extrapoliert.
Temperatur
Im Vergleich zur Hydrologie sind Temperaturklassifikationen weniger verbreitet3,38,39, was möglicherweise auf knappere Temperaturdaten im Vergleich zum Abfluss zurückzuführen ist. Kürzlich haben Maheu et al.3 etwa 130 Messstationen (repräsentativ für die Referenzbedingungen) in den USA auf der Grundlage mehrerer Statistiken, die Größe und Variation beschreiben, in verschiedene Arten von Temperaturregimen eingeteilt. Dieser multivariate Ansatz bietet eine multivariate Alternative zu den univariaten Sommertemperaturklassen, die wir erstellt haben. Die Standorte der in der Klassifizierung von Maheu et al. verwendeten Pegel wurden von den Autoren beschafft und räumlich mit den NHDPlus V2-Bachabschnitten verbunden. Unter Verwendung von 65 Prädiktorvariablen entwickelten wir ein Random-Forest-Modell, mit dem wir die Klassen von Maheu et al. den Flussabschnitten in den USA zuordneten. Da die Temperatur eine Funktion der Flussgröße ist, schlossen wir Qwsa aus dem Modell aus (d. h. den mittleren jährlichen Durchfluss geteilt durch das Einzugsgebiet).
Als Alternative entwickelten wir eine einfache Temperaturklassifizierung auf der Grundlage der natürlich vorkommenden durchschnittlichen Sommerwassertemperaturen. Mehrere Studien deuten darauf hin, dass die unterschiedlichen Wärmeregime in Fließgewässern in erster Linie durch natürliche Schwankungen der sommerlichen Temperaturwerte (Juli-August-Mittelwerte) beeinflusst werden3,40,41. Außerdem gehören die sommerlichen Temperaturwerte zu den am leichtesten verfügbaren Daten aus öffentlichen und nicht-öffentlichen Quellen. Wir haben Wassertemperaturdaten für 5.907 Standorte aus verschiedenen Quellen zusammengestellt, darunter Deweber & Wagner41 (n = 2893), Hill et al.40 (n = 566), USGS-Messgeräte mit täglichen Aufzeichnungen (n = 2184), saisonale USGS-Feldüberwachung (n = 240) und andere Temperaturdaten von Loggern, die von Behörden eingesetzt wurden (n = 24) (Tabelle 1). Bei der Bestimmung einer angemessenen Aufzeichnungslänge für Temperaturdaten musste ein Gleichgewicht zwischen der Minimierung der Unsicherheit in den Juli-August-Durchschnittswerten und einer zu geringen Anzahl von Proben für eine angemessene regionale Darstellung gefunden werden. Jones und Schmidt42 gaben beispielsweise Empfehlungen für die Länge der Aufzeichnungen, die erforderlich sind, um die Unsicherheit bei der Schätzung von Kenngrößen des Wärmeregimes angemessen zu minimieren; die Befolgung dieses Leitfadens hätte jedoch allein die oben genannten USGS-Aufzeichnungen (n = 2424) um 70 bis 90 % reduziert. Darüber hinaus umfasste die Bewertung von Jones und Schmidt monatliche Maxima, Minima und Schwankungsbreiten, während sich unsere Analyse auf einen gröberen zweimonatlichen Durchschnittswert (Juli-August) stützte, der unseres Erachtens weniger anfällig für Schwankungen von Jahr zu Jahr ist als Temperaturextreme (Ergänzungsdatei 1). Anhand von 22 USGS-Messstationen in den USA und den Konfidenzbereichen von Jones und Schmidt schätzen wir, dass die mittleren Juli-August-Temperaturen bei einer Konfidenz von 80 % bzw. 90 % mit 1-2 Jahreszeiten zuverlässig auf 1 °C geschätzt werden können (Ergänzungsdatei 1). Wir überprüften die Messstellen, um sicherzustellen, dass der Aufzeichnungszeitraum zwischen 1995 und 2015 lag und Daten für mindestens 60 aufeinanderfolgende Tage im Juli und August verfügbar waren.
Alle Temperaturmessstellen wurden räumlich mit NHDPlus-V2-Bachabschnitten verbunden. Anschließend wurden die Referenzbedingungen für die Messstellen anhand von Indikatoren für Landstörungen und stromaufwärts gelegene Staudammregulierungen bestimmt. Landstörungen wurden anhand der Habitatbewertung der National Fish Habitat Partnership (NFHP) von 2015 bewertet, die Lebensraumbeeinträchtigungen innerhalb der NHDPlus-Flussabschnitte mit Werten von „sehr gering“ bis „sehr hoch“ bewertet43. Wir bewerteten den Grad der Regulierung flussaufwärts durch Stauanlagen anhand des Regulierungsgrads (DOR) (% des jährlichen Abflusses, der von flussaufwärts gelegenen Dämmen gespeichert wird)44 , der von StreamCat bereitgestellt wird. Temperaturmessstationen mit einer Risikobewertung von „sehr niedrig“ oder „niedrig“ und einem DOR < 4 % (was auf einen geringen Einfluss von Stauseen hindeutet44,45) wurden als repräsentativ für die Referenzbedingungen eingestuft, was zu 1764 Messstellen führte, die auch unsere Kriterien für die Aufzeichnungslänge erfüllten. Davon stammten 70 % der Beobachtungen von Deweber & Wagner41 (n = 1211) oder Hill et al.40 (n = 33). Von den verbleibenden 520 Beobachtungen verfügten 71,7 % über mindestens zwei Jahreszeiten an Daten.
Unter Verwendung desselben Prädiktoren-Ensembles wie oben haben wir Zufallswälder entwickelt, um die Sommertemperaturen für Referenzstandorte vorherzusagen, und diese Werte dann auf alle NHD-Bachabschnitte extrapoliert. Wir nutzten Brüche in der Häufigkeitsverteilung der US-Wassertemperaturen, um die Sommertemperaturen in Klassen einzuteilen. Anhand der geschätzten Sommertemperaturwerte für alle Fließgewässerabschnitte haben wir die Temperaturen mit dem Verfahren der Jenks Natural Breaks46 in 2 bis 20 Klassen eingeteilt und uns dann auf die optimale Anpassungsgüte und Tabellengenauigkeit verlassen, um die am besten geeignete Anzahl von Klassen zu ermitteln, die den Großteil der Informationen erklären. In Ermangelung eines gerechtfertigten Ansatzes für eine physikalisch begründete Aufteilung der Klassen ist die Jenks-Methode optimal für die univariate Clusterung räumlicher Informationen, da sie darauf abzielt, die Variation innerhalb der Klassen zu minimieren und gleichzeitig die Varianz zwischen den Klassen zu maximieren46.
Netzwerkverzweigung
Während die Bachgröße die longitudinale Variation ökologischer Funktionen entlang des Kontinuums eines Baches erfasst15, sind Nebenflusskreuzungen und Bachdivergenzen ebenfalls wichtig, da sie Diskontinuitäten in longitudinalen Prozessen schaffen47. Fließgewässerverzweigungen, insbesondere die unterschiedlichen Größen der Fließgewässer, die diese Verzweigungen bilden, haben einen großen Einfluss auf den Lebensraum und die biologische Vielfalt48. Darüber hinaus kann sich die Zusammensetzung der ökologischen Gemeinschaften in der Nähe von Flussverzweigungen drastisch verändern49. Um Unterschiede in den Netzwerkkonfigurationen und Divergenzsituationen zu erfassen, haben wir zwei Verzweigungsklassen gebildet. Erstens haben wir Klassen gebildet, die verschiedene Größenkombinationen von Nebenflüssen berücksichtigen, die am stromaufwärts gelegenen Ende eines jeden Baches zusammenfließen. Zweitens haben wir Klassen entwickelt, die Fließgewässerabschnitte als Haupt- oder Nebenkanäle unterhalb von Abzweigungen kennzeichnen und in denen Fließgewässer Abfluss von flussaufwärts gelegenen Abzweigungen erhalten.
Die meisten einzelnen Fließgewässerabschnitte innerhalb des NHDplus-V2-Datensatzes stellen eindeutige hydrologische Merkmale von Flussnetzwerken dar, die durch Fließgewässerursprünge, Nebenflusseinmündungen und Überschneidungen mit Seen und Stauseen definiert sind50. Die topologischen Beziehungen zwischen den NHDplus V2-Fließgewässerabschnitten werden in einer „von-bis“-Tabelle dargestellt, in der die Oberläufe, die zu einem bestimmten Abschnitt beitragen (d. h. von), und der Unterlauf, der den Abfluss erhält (d. h. bis), definiert sind. Anhand der „von-bis“-Tabelle wurden die Kombinationen verschiedener Strahler-Stromordnungen am stromaufwärts gelegenen Ende jedes Bereichs zu einer Nebenfluss-Hauptfluss-Kombination kombiniert. Der Zusammenfluss eines Nebenflusses 1. Ordnung und eines Nebenflusses 2. Ordnung am stromaufwärts gelegenen Ende eines Systems 2: 2.12 (Abb. 1a). In der Mehrzahl der Fälle traten nur 2 Nebenflüsse flussaufwärts auf. In seltenen Fällen oder bei Divergenzen fließen jedoch drei oder mehr Nebenflüsse oberhalb eines Abschnitts zusammen, und wir haben bis zu vier flussaufwärts gerichtete Ordnungen berücksichtigt (z. B. Abb. 1b, 5.511). In einigen Fällen werden Fließgewässerabschnitte von mehreren stromaufwärts gelegenen Gerinnedivergenzen durchflossen, d. h. von Aufspaltungen eines Abschnitts in zwei oder mehr Gerinne in stromabwärtiger Richtung (Abb. 1c). Da diesen Kanälen eine Fließrichtung zugewiesen wird und sie Kreuzungen bilden, die Nebenflusseinmündungen imitieren, müssen bei der Klassifizierung von Netzverzweigungen auch Kanaldivergenzen als eine Art von Einmündungen berücksichtigt werden. In Fällen von Kanalverzweigungen bezeichnet NHDplus V2 die Strecken als Haupt- (D1) oder Nebenkanäle (D2) (Abb. 1c). Anhand der Von-Bis-Tabelle haben wir Fließgewässerabschnitte identifiziert, die unmittelbar unterhalb von Einmündungen von Gerinnedivergenzen (DU) liegen, um diese von Einmündungen von Nebenflüssen zu unterscheiden. Nach Berücksichtigung dieser Divergenzen beobachteten wir Situationen mit unsinnigen Nebenflusseinmündungen (z. B. 5_5.5), die dadurch entstanden, dass NHDplus V2 nicht alle Situationen von Gerinnendivergenzen angemessen bezeichnete. Da es schwierig war, festzustellen, ob es sich bei jedem dieser Abschnitte um divergierende Gerinne oder um Abschnitte handelt, die von divergierenden Gerinnen durchflossen werden, haben wir diese Abschnitte einer allgemeinen Divergenzklasse (D) zugeordnet.
Obwohl die meisten Nebenflussabzweigungen in NHDPlus V2 hydrologisch relevant sind, wurde eine Teilmenge von Streckenabzweigungen während der Digitalisierung an nicht aussagekräftigen Punkten, wie z. B. Quadrangle Map Boundaries, aufgespalten50 (Abb. 1d). Im Falle von Verzweigungsklassen und Divergenzen würden diese Aufspaltungen zu unsinnigen Abzweigungen führen. Um diese Fälle zu korrigieren, erstellten Wieferich et al.51 eine Ecological Reach Identification Table (Tabelle zur Identifizierung ökologischer Reichweiten), in der die geteilten Reichweiten gemeinsamen ökologischen Identifikatoren zugeordnet wurden. In diesen Fällen ordneten wir alle Strecken, die zur gleichen ökologischen Einheit gehören, der Verzweigungs- und Divergenzklasse der stromaufwärts gelegenen Strecke zu (Abb. 1d).
Taleinschränkung
Das Ausmaß, in dem Täler die laterale Migration von Flussläufen kontrollieren, ist ein Indikator für die Stärke der Interaktion zwischen Flüssen und ihren Auen. Mit Hilfe des Valley Confinement Algorithm (VCA)-Werkzeugs52 in ArcMap 10.3 wurden für alle NHDPlus V2-Bachabschnitte uneingeschränkte Talsohlen (d. h. Polygone) abgegrenzt. VCA schätzt die Überflutungstiefe des Fließgewässers mit Hilfe einer empirischen Funktion, die auf regionalen Niederschlagsdaten (http://www.prism.oregonstate.edu/normals) und dem Einzugsgebiet für jeden Fließgewässerabschnitt basiert53. Nagle et al.52 schlugen die 5-fache Überflutungstiefe zur Bestimmung der Hochwasserhöhe vor, was wir angesichts der räumlichen Auflösung von NHDplus und 30-m-DEM-Daten (https://nationalmap.gov/elevation.html) für die umliegende Topografie ebenfalls für angemessen hielten. Auf der Grundlage des durch die DEMs charakterisierten umliegenden Geländes verwendete das VCA-Programm einen Algorithmus, um die Überschwemmungshöhe mit dem umliegenden Berghang zu schneiden. Um die Abgrenzung von Talsohlen in Überschwemmungsgebieten zu vermeiden, wurden Wasserkörper verwendet.
Nach der Abgrenzung von Talsohlen sind Schwellenwerte erforderlich, um Fließgewässerabschnitte als nicht eingeengt, eingeengt oder eine Zwischenstufe zu klassifizieren. Beispielsweise kann eine Talsohle nicht die gesamte Fließstrecke umfassen oder sich nicht weit genug über die Ufer hinaus erstrecken, um als nicht eingeengt eingestuft zu werden. Dies erfordert eine Schätzung der Flussbreite für jeden Flussabschnitt. Wir haben sowohl In-situ-Feldbeobachtungen als auch Fernerkundungsdaten von >52.000 Standorten zusammengetragen, um ein empirisches Modell zur Vorhersage der Flussbreite für alle Flussabschnitte in den USA zu entwickeln. Feldbeobachtungen der Flussbreite wurden aus dem National Rivers and Streams Assessment (n = 852) (https://www.epa.gov/national-aquatic-resource-surveys/nrsa) der Environmental Protection Agency, einer Literaturübersicht über Flussbreiten (n = 243)29 und dem North American River Width Data Set (n = 50.230) (http://gaia.geosci.unc.edu/NARWidth/) abgeleitet. In diesen Datensätzen fehlten jedoch weitgehend kleine Oberwasserbäche und intermittierende Systeme. Um sicherzustellen, dass wir die Breite dieser Fließgewässertypen richtig einschätzen, wurden die Fließgewässer nach ihrer Größe geschichtet (siehe Größenklassifizierung) und eine zufällige Teilmenge (n = 407) aus der gesamten US-Fließgewässerpopulation ausgewählt. Anhand von Luftbildern wurde die Flussbreite in der Mitte sowie an den stromaufwärts und stromabwärts gelegenen Enden der einzelnen Abschnitte geschätzt und anschließend die durchschnittliche Breite berechnet. Mit Hilfe von Random-Forest-Modellen wurde die Flussbreite vorhergesagt und die Schätzungen auf alle Flussabschnitte extrapoliert. Die geschätzten Flussbreiten wurden dann zur Erstellung von Polygonpuffern um alle Stromlinien verwendet.
Wir überlagerten Flussbreiten und Talsohlen, um den Status der Taleinschränkung zu bestimmen. Hall et al.53 betrachteten Fließgewässer als nicht eingeengt, wenn die Breite des Auentals mindestens das Vierfache der Breite beträgt, während Fließgewässer mit mäßiger Aueninteraktion ein Verhältnis von Auen- zu Uferbreite von >24 aufweisen. Abgesehen von der seitlichen Ausdehnung der Auen musste bei der Bewertung der Enge auch die Länge der einzelnen Bachabschnitte untersucht werden, die von Talsohlen bedeckt sind. Bachabschnitte wurden als „nicht eingeengt“ eingestuft, wenn eine Talsohle mindestens 50 % der Länge des Bachabschnitts bedeckte und mindestens viermal so breit war wie die Flussbreite. „Mäßig eingeschränkte“ Fließgewässerabschnitte hatten Talsohlen mit einer Breite >4x der Flussbreite, die aber nur 25-50% der Länge des Fließgewässerabschnitts bedeckten, oder, wenn sie mehr als 50% der Fließgewässerlänge bedeckten, hatten die Talsohlen ein Verhältnis von Auen- zu Flussbreite zwischen 2 und 4. Alle anderen Flussabschnitte wurden als „begrenzt“ definiert.