Overzicht van de aanpak
In de SCS worden de bouwstenen van de stroomhabitat voorgesteld als een reeks lagen, die elk verschillende categorieën van fysische kenmerken vertegenwoordigen (b.v. grootte, gradiënt). Elke laag bestaat uit meerdere klassen (bijv. bovenloop, beek, geringe gradiënt, sterke gradiënt). De lagen werden samengesteld met behulp van inductieve benaderingen gebaseerd op patronen in empirische gegevens, in tegenstelling tot deductieve benaderingen die berusten op regionalisering van het landschap. Bronnen van empirische gegevens die zijn gebruikt om stroomklassen af te leiden zijn te vinden in tabel 1. Op basis van eerdere beoordelingen en een verzoek van een groep natuurbeschermers en beekecologen6,25 hebben we zes stroomhabitatlagen geselecteerd die in kaart konden worden gebracht op het niveau van het stroomgebied en waarvan werd verondersteld dat ze een sterke invloed hadden op het ecologisch functioneren en de samenstelling van ecologische gemeenschappen. Deze lagen omvatten (in volgorde van afnemend ecologisch belang): grootte, gradiënt, hydrologie, temperatuur, splitsing van het stroomnetwerk en valleigebieden.
Een belangrijke overweging bij het selecteren van lagen en het bepalen van de verdeling tussen klassen was de beschikbaarheid van gedocumenteerde methoden voor classificatiebenaderingen en drempelwaarden tussen klassen. Daarom hebben we bij voorkeur lagen geselecteerd die worden ondersteund door reeds bestaande en gepubliceerde classificaties of, indien eerdere classificaties niet beschikbaar waren, hebben we ons gebaseerd op de literatuur om breuken en drempels te bepalen om waarden (bv. gradiënt) in klassen te verdelen, indien beschikbaar. Omdat de resultaten van de classificatie worden beïnvloed door de gekozen aanpak, hebben we bij het ontwikkelen van klassen binnen lagen meerdere alternatieve benaderingen gebruikt, indien beschikbaar.
Samenstelling van voorspellende variabelen
Informatie over grootte, gradiënt, en bifurcatie van het netwerk werd afgeleid uit de NHDPlus V2-dataset. Echter, voor discrete in situ waarnemingen van hydrologie, temperatuur, en riviergeul karakteristieken (vallei begrenzing) moesten we modellen ontwikkelen om deze klassen te extrapoleren naar het stroombereik niveau. Een totaal van 66 landschaps-, klimaat-, topografische- en bodemvariabelen werden verzameld voor afwateringsbekkens die bijdragen aan elk stroommeetstation en voor het gehele afwateringsnetwerk stroomopwaarts van elk stroomgebied in de VS (tabel 2 (alleen online beschikbaar)). Hiervan werden er 44 geleverd door Stream Cat database26 (https://www.epa.gov/national-aquatic-resource-surveys/streamcat), 21 uit de NHDPlus V2 dataset, en één van WorldClim (http://worldclim.org/version2) (Tabel 2 (alleen online beschikbaar)). In ongeveer 2% van de waarnemingen ontbraken waarden voor variabelen die waren samengevat voor drainagenetwerken boven elk stroombereik (voornamelijk StreamCat gegevens). We gebruikten het Multivariate Imputation by Chained Equation (MICE) pakket in de R programmeeromgeving27 om de meest waarschijnlijke waarden voor ontbrekende variabelen te schatten op basis van waarden aanwezig voor andere variabelen. Voor elke variabele met ontbrekende waarden specificeerden we een binaire matrix die aangaf welke subset van voorspellers moest worden gebruikt om ontbrekende waarden te schatten tijdens de imputatie. Afzonderlijke Predictive Mean Matching-modellen werden ontwikkeld voor elke onvolledige variabele27.
Grootte
In vergelijking met andere klassen was de ontwikkeling van classificatieschema’s voor grootte en gradiënt niet afhankelijk van in situ waarnemingen of de ontwikkeling van voorspellende modellen (bv. hydrologie). We hebben twee variabelen gebruikt die relevant zijn voor de omvang, en die beschikbaar zijn via de NHDPlus V2 dataset om alternatieve classificaties voor de omvang van beken te maken: Strahler stroomorde en gemiddelde jaarlijkse afvoer (representatief voor omstandigheden met minimale menselijke invloed). Stroomorde geeft het dendritische karakter van stroomomgevingen weer28 en wordt vaak gebruikt om de frequentieverdeling van stroomgrootten over grote regio’s of wereldwijd te karakteriseren29. De beperkingen van stroomorden zijn echter dat de orde kan worden beïnvloed door de schaal van de in kaart gebrachte hydrografie30 en dat de afvoer voor een bepaalde orde sterk kan variëren tussen klimatologische regimes. Ook het gebruik van drainagegebied om de grootte te karakteriseren kan problematisch zijn, aangezien de afvoer per oppervlakte-eenheid ook sterk kan variëren in regio’s met sterk uiteenlopende klimatologische omstandigheden30. Een andere mogelijkheid is de omvang van een stroom te bepalen aan de hand van het debiet. Dit vereist echter een gestandaardiseerde aanpak voor het indelen van klassen op basis van afvoer. Omdat de geometrische wetten die de organisatie van stromen bepalen (b.v. frequentie, stroomlengte, afwateringsgebied) gebaseerd zijn op de orde van de stromen31 , biedt orde een universeel fysisch sjabloon om continentale grote variatie in afvoer te verdelen op basis van consistente drempels. Om een op afvoer gebaseerde grootte-indeling te ontwikkelen, berekenden we de mediane afvoer voor alle NHDPlus V2 stroomgebieden volgens Strahler stroomvolgorde en gebruikten vervolgens middenpunten tussen deze waarden om afvoerbreedtes te creëren als drempels voor grootteklassen. (Opmerking: variabelen die worden gebruikt in de hydrologische classificatie zijn gestandaardiseerd op basis van de gemiddelde jaarlijkse afvoer en worden dus niet beïnvloed door de riviergrootte).
Gradiënt
Gradiëntwaarden (d.w.z. de helling van de stroombedding) werden ook verstrekt als een attribuut van NHDPlus V2 stroomlijnen. Stream hellingen werden gemeten voor elke stroomlijn als de verhouding van de stijging van de hoogte over stroomlijn afstand32. Afgevlakte hoogtedata werden afgeleid van 10-m digitale hoogtemodellen (DEMs) voor het land. De maximum- en minimumhoogte werden gebruikt om de stijging te bepalen, die werd gedeeld door de totale lengte van de stroomlijn. Voor zover wij weten zijn de meest gebruikte gradiëntdrempels die van Rosgen4, die kanaalmorfologieën onderscheidt op basis van gradiënt, breedte-diepte verhoudingen, ingraving, en sinuositeit. Meerdere stroomclassificaties hebben zich ook gebaseerd op deze gradiëntdrempels om klassen in te delen6,9,25. In de afgelopen twee decennia zijn talrijke hydrologische classificaties op regionale tot mondiale schaal ontwikkeld op basis van discrete waarnemingen van meetstations voor stroomafvoer2,18,33. In het algemeen vereist het ontwikkelen van inductieve hydrologische classificaties het verzamelen van in situ waarnemingen van afvoer, het samenvatten van afvoer in hydrologische statistieken, en vervolgens het clusteren van waarnemingen op basis van overeenkomsten in hydrologische eigenschappen22. Recentelijk hebben McManamay et al.34 een hydrologische classificatie ontwikkeld voor de gehele VS op basis van natuurlijke stroompatronen bij 2.600 USGS-stations (USGS Geological Survey), waarbij de stroomopwaarts gelegen stroomgebieden de minst verstoorde toestand voor hun respectieve regio’s vertegenwoordigen. Na decompositie van 110 hydrologische statistieken in 13 componentenscores met behulp van Principale Componenten Analyse (PCA), werden de stroommeetpunten waarschijnlijk toegewezen aan 1 van de 15 hydrologische klassen met behulp van optimale Gaussische gemengde model clustering algoritmen bepaald met behulp van Bayesiaanse gevolgtrekking34. Deze klassen vertegenwoordigen variatie in hydrologische patronen in tegenstelling tot variatie in afvoervolume, aangezien alle magnitude-gerelateerde hydrologische statistieken werden gestandaardiseerd door gemiddelde dagelijkse afvoer voorafgaand aan PCA en clustering.
Deze fuzzy-stijl van classificatie (d.w.z. zachte clustering) is flexibel in die zin dat het stromen karakteriseert als stromen die theoretisch lidmaatschap delen tussen vele clusters33,35. Daarentegen zijn “harde” clusteringstechnieken, zoals hiërarchische agglomeratieve methoden op basis van afstand (b.v. Ward’s methode)36 , relatief eenvoudig, gemakkelijker te begrijpen, en leveren geneste en scherpe lidmaatschappen op22. Daarom hebben we de agglomeratieve methode van Ward gebruikt om de 2600 USGS-meetpunten te clusteren met behulp van de 13 PC-scores en vervolgens een reeks optimale aantallen clusters bepaald op basis van visueel onderzoek van het dendrogram.
Alle USGS-stroommeetpunten werden ruimtelijk samengevoegd met NHDPlus V2 stroomgebieden. Met behulp van voorspellende variabelen in tabel 2 (alleen online beschikbaar), construeerden we random forest classificatiemodellen37 in de R-programmeeromgeving om het lidmaatschap van hydrologische klassen te voorspellen en vervolgens extrapoleerden we hydrologische klassen naar alle NHDPlus V2 stroomgebieden.
Temperatuur
Vergeleken met hydrologie zijn temperatuurclassificaties minder gebruikelijk3,38,39, mogelijk als gevolg van schaarsere temperatuurgegevens in vergelijking met afvoer. Onlangs hebben Maheu et al.3 ongeveer 130 meetstations (representatief voor de referentieomstandigheden) in de VS gegroepeerd in verschillende types van thermische regimes op basis van een aantal statistieken die de grootte en de variatie beschrijven. Deze multivariate benadering biedt een multivariaat alternatief voor de univariate zomertemperatuurklassen die wij hebben gegenereerd. De locaties van de meetpunten die zijn gebruikt in de Maheu et al. classificatie zijn verkregen van de auteurs en zijn ruimtelijk gekoppeld aan NHDPlus V2 stroomgebieden. Met behulp van 65 van de voorspellende variabelen, ontwikkelden we een random forest model om Maheu et al. klassen te koppelen aan stroomgebieden in de VS. Omdat temperatuur een functie is van de grootte van de rivier, hebben we Qwsa niet in het model opgenomen (d.w.z. gemiddeld jaarlijks debiet gedeeld door afwateringsgebied).
Als alternatief hebben we een eenvoudige temperatuurclassificatie ontwikkeld op basis van natuurlijk voorkomende gemiddelde zomerwatertemperatuurwaarden. Meerdere studies suggereren dat uiteenlopende thermische regimes in beken voornamelijk worden beïnvloed door natuurlijke variatie in zomertemperatuurwaarden (juli-augustus gemiddelden)3,40,41. Bovendien behoren de waarden van de zomertemperatuur tot de meest direct beschikbare gegevens uit openbare en niet-openbare bronnen. Wij verzamelden gegevens over de watertemperatuur op 5.907 locaties uit verschillende bronnen, waaronder Deweber & Wagner41 (n = 2893), Hill et al.40 (n = 566), USGS-peilbuizen met dagelijkse registraties (n = 2184), USGS-seizoensgebonden veldmonitoring (n = 240), en andere temperatuurgegevens van loggers die door instanties zijn geplaatst (n = 24) (Tabel 1). Om een geschikte recordlengte voor temperatuurgegevens te bepalen, moest een evenwicht worden gevonden tussen het minimaliseren van de onzekerheid in juli-augustusgemiddelden en het hebben van te weinig monsters voor een adequate regionale vertegenwoordiging. Jones en Schmidt42 hebben bijvoorbeeld aanbevelingen gedaan voor recordlengtes die nodig zijn om de onzekerheid bij het schatten van thermische regimes op adequate wijze te minimaliseren; het volgen van deze richtsnoeren zou echter alleen al de bovengenoemde USGS-records (n = 2424) met 70 tot 90% hebben verminderd. Bovendien omvatte de beoordeling van Jones en Schmidt maandelijkse maxima, minima en waarden, terwijl onze analyse gebaseerd was op een grover tweemaandelijks gemiddelde (juli-augustus), dat wij minder gevoelig achten voor jaar-tot-jaar variatie dan temperatuurextremen (Supplementary File 1). Op basis van 22 USGS-meetpunten in de VS en de betrouwbaarheidsintervallen van Jones en Schmidt schatten we dat met 1 tot 2 seizoenen gegevens de gemiddelde temperatuur in juli-augustus betrouwbaar kan worden geschat binnen 1 °C met een betrouwbaarheid van respectievelijk 80% en 90% (Supplementary File 1). We hebben locaties gescreend om er zeker van te zijn dat de registratieperiode binnen 1995 tot 2015 viel en dat gegevens beschikbaar waren voor ten minste 60 opeenvolgende dagen in juli en augustus.
Alle temperatuurlocaties werden ruimtelijk verbonden met NHDPlus V2 stroomgebieden. Vervolgens bepaalden we referentieomstandigheden voor meetlocaties aan de hand van indicatoren van landverstoring en stroomopwaartse regulering van dammen. Landverstoring werd geëvalueerd met behulp van de National Fish Habitat Partnership (NFHP) 2015 habitat beoordeling, die habitat degradatie scores geeft variërend van “zeer laag” tot “zeer hoog” verstoring binnen NHDPlus stroomgebied segmenten43. We hebben de mate van stroomopwaartse regulering door opstuwingen geëvalueerd met behulp van de mate van regulering (DOR) (% van de jaarlijkse afvoer opgeslagen door stroomopwaartse dammen)44, verstrekt door StreamCat. Stations met een risicobeoordeling als “zeer laag” of “laag” en een DOR < 4% (wat wijst op een geringe invloed van stuwmeren44,45) werden representatief bevonden voor de referentieomstandigheden, wat resulteerde in 1764 locaties die ook voldeden aan onze criteria voor recordlengte. Hiervan werd 70% van de waarnemingen verkregen van Deweber & Wagner41 (n = 1211) of Hill et al.40 (n = 33). Van de overige 520 waarnemingen had 71,7% ten minste 2 seizoenen gegevens.
Gebruik makend van hetzelfde voorspellende ensemble als hierboven, ontwikkelden we willekeurige bossen om zomertemperaturen voor referentielocaties te voorspellen en vervolgens extrapoleerden we die waarden naar alle NHD stroomgebieden. We gebruikten breuken in de frequentieverdeling van de watertemperaturen in de VS om de zomertemperaturen in klassen in te delen. Met behulp van geschatte zomertemperaturen voor alle stroomgebieden, gebruikten we een Jenks Natural Breaks46 procedure om temperaturen in te delen in 2 tot 20 klassen en vervolgens vertrouwden we op een optimale goodness-of-fit en tabelnauwkeurigheid om het meest parsimonieuze aantal klassen te bepalen dat het merendeel van de informatie verklaarde. Bij gebrek aan een gerechtvaardigde benadering voor een op fysische gegevens gebaseerde verdeling van klassen, is de Jenks-methode optimaal voor univariate clustering van ruimtelijke informatie, aangezien zij ernaar streeft de variatie binnen klassen te minimaliseren en tegelijkertijd de variantie tussen klassen te maximaliseren.46
Network Bifurcation
Terwijl de grootte van een stroom de longitudinale variatie van ecologische functies langs het continuüm van een stroom vastlegt15, zijn knooppunten van zijrivieren en divergenties van stromen ook belangrijk, aangezien zij discontinuïteiten in longitudinale processen creëren47. Beekknooppunten, met name de verschillende groottes van de stromen die knooppunten vormen, hebben grote invloeden op de habitat en de biologische diversiteit48. Bovendien kan de samenstelling van ecologische gemeenschappen drastisch veranderen in de nabijheid van stroomknooppunten49. Om verschillen in netwerkconfiguraties en situaties van divergentie vast te leggen, hebben we twee bifurcatieklassen gecreëerd. Ten eerste hebben we klassen gecreëerd die rekening hielden met verschillende groottecombinaties van zijrivieren die een confluentie vormen aan het stroomopwaartse einde van elk stroombereik. De meeste individuele stroombereiken in de NHDplus V2-dataset vertegenwoordigen afzonderlijke hydrologische kenmerken van riviernetwerken die worden gedefinieerd door de oorsprong van de beken, de samenvloeiing van zijrivieren en de kruising met meren en reservoirs50. Topologische relaties tussen NHDplus V2 stroomgebieden worden verstrekt in een “van-tot” tabel die de stroomopwaartse bereiken definieert die bijdragen aan een bepaald bereik (d.w.z. van) en het stroomafwaartse bereik dat stroom ontvangt (d.w.z. tot). Met behulp van de “van-tot” tabel werden de combinaties van verschillende Strahler stroomordes aan het bovenstroomse einde van elk bereik gecombineerd tot een combinatie van zijrivier en hoofdstroom. Bijvoorbeeld, de samenvloeiing van een zijrivier van de 1e orde en een zijrivier van de 2e orde aan het stroomopwaartse uiteinde van een systeem van de 2e orde zou de volgende klasse opleveren: 2.12 (Fig. 1a). In de meeste gevallen kwamen stroomopwaarts slechts 2 zijrivieren voor. In zeldzame gevallen of situaties van divergentie komen echter 3 of meer zijrivieren bovenstrooms boven een bereik samen en hebben we tot vier stroomopwaartse orden opgenomen (bijv. Fig. 1b, 5.511). In sommige gevallen ontvangen stroomgebieden stroom van meerdere stroomopwaartse kanaal divergenties, d.w.z. splitsingen van een bereik in twee of meer kanalen in de stroomafwaartse richting (Fig. 1c). Omdat aan deze kanalen een stroomvolgorde wordt toegekend en er knooppunten ontstaan die lijken op samenvloeiingen van zijrivieren, vereist de classificatie van bifurcatie van het netwerk dat kanaal divergenties worden meegenomen als een type samenvloeiing. In geval van kanaal divergentie, duidt NHDplus V2 gebieden aan als hoofd (D1) of secundaire (D2) kanalen (Fig. 1c). We gebruikten de van-tot-tabel om de stroomgebieden te identificeren die onmiddellijk onder de samenvloeiingen van kanaal divergenties (DU) lagen, om deze te onderscheiden van zijrivier samenvloeiingen. Nadat we rekening hadden gehouden met deze divergenties, hebben we situaties waargenomen van niet-sensitieve zijrivier kruisingen (b.v. 5_5.5) die ontstonden omdat NHDplus V2 niet alle situaties van kanaal divergentie correct had aangeduid. Omdat het moeilijk was om te bepalen of elk van deze gebieden divergerende kanalen waren of gebieden die stroom ontvingen van divergerende kanalen, hebben we deze gebieden toegewezen aan een generieke divergentie klasse (D).
Hoewel de meeste zijrivierkruispunten in NHDPlus V2 hydrologisch relevant zijn, is een deel van de knooppunten tijdens het digitaliseren gesplitst op niet-wezenlijke punten, zoals de grenzen van vierhoekskaarten.50 (Fig. 1d). In het geval van bifurcatieklassen en divergenties zouden deze splitsingen leiden tot niet-zinvolle knooppunten. Om deze gevallen te corrigeren, stelden Wieferich et al.51 een Ecological Reach Identification Table op, die gesplitste gebieden toewijst aan gemeenschappelijke ecologische identifiers. In deze gevallen hebben wij aan alle bereiken die tot dezelfde ecologische eenheid behoren de bifurcatie- en divergentieklasse van het meest bovenstrooms gelegen bereik toegekend (Fig. 1d).
Vallei begrenzing
De mate waarin valleien de laterale migratie van rivierkanalen beheersen is indicatief voor de sterkte van de interactie tussen rivieren en hun uiterwaarden. We hebben voor alle stroomgebieden van NHDPlus V2 onbeperkte dalbodems (d.w.z. polygonen) afgebakend met behulp van het Valley Confinement Algorithm (VCA)-hulpmiddel52 in ArcMap 10.3. VCA schat de diepte van de oever van het stroomkanaal met behulp van een empirische functie op basis van regionale neerslaggegevens (http://www.prism.oregonstate.edu/normals) en drainagegebied voor elk stroomgebied53. Nagle et al.52 stelden 5X de oeverdiepte voor om de overstromingshoogte te bepalen, wat wij ook geschikt vonden gezien de ruimtelijke resolutie van NHDplus en 30-m DEM gegevens (https://nationalmap.gov/elevation.html) voor de omliggende topografie. Op basis van het via DEM’s gekarakteriseerde omringende terrein gebruikte het VCA-programma een algoritme om de overstromingshoogte te kruisen met de omringende helling. Waterlichamen werden gebruikt om de begrenzing van dalbodems in overstroomde gebieden te vermijden.
Als dalbodems eenmaal zijn begrensd, zijn drempels nodig om stroomgebieden te classificeren als niet-overstroomd, overstroomd, of een tussenliggend niveau. Het is bijvoorbeeld mogelijk dat een dalbodem niet het hele stroomgebied omvat of zich niet voldoende ver buiten de oevers uitstrekt om als niet-ingesloten te worden geclassificeerd. Dit vereist een schatting van de rivierbreedte voor elk stroomgebied. Wij hebben zowel veldwaarnemingen als waarnemingen via teledetectie van >52.000 locaties verzameld om een empirisch model te ontwikkelen waarmee de rivierbreedte voor alle stroomgebieden in de CONUS kan worden voorspeld. Veldwaarnemingen van de rivierbreedte werden afgeleid van de National Rivers and Streams Assessment van de Environmental Protection Agency (n = 852) (https://www.epa.gov/national-aquatic-resource-surveys/nrsa), een literatuurstudie van rivierbreedtes (n = 243)29, en de North American River Width Data Set (n = 50.230) (http://gaia.geosci.unc.edu/NARWidth/). Deze gegevensverzamelingen misten echter grotendeels kleine hoofdwaterstromen en intermitterende systemen. Om er zeker van te zijn dat we de breedte voor deze stroomtypes goed hebben geschat, zijn stroomgebieden gestratificeerd naar grootte (zie Grootte-indeling) en is een willekeurige subset (n = 407) geselecteerd uit de gehele Amerikaanse populatie stroomgebieden. Luchtfoto’s werden gebruikt om de rivierbreedte te schatten in het midden, aan de stroomopwaartse en aan de stroomafwaartse uiteinden van elk bereik, om vervolgens een gemiddelde breedte te berekenen. Random forest modellen werden gebruikt om de rivierbreedte te voorspellen en de schattingen te extrapoleren naar alle stroomgebieden. Ramingen van de rivierbreedte werden vervolgens gebruikt om veelhoekige buffers rond alle stroomlijnen te genereren.
We legden rivierbreedten en valleibodems over elkaar om de valleibeperking te bepalen. Hall et al.53 beschouwden stroomgebieden als niet-geconfundeerd als de breedte van de uiterwaardvallei ten minste vier keer zo groot is, terwijl stroomgeulen met matige uiterwaardinteractie uiterwaard-bodembreedteverhoudingen >24 hebben. Naast de laterale omvang van de uiterwaarden, was voor onze beoordeling van de insluiting ook een onderzoek nodig van de lengte van elk stroomgebied dat door een dalbodem wordt bedekt. Stroomgebieden werden geclassificeerd als “niet ingesloten” als een dalbodem tenminste 50% van de lengte van het stroomgebied besloeg en een breedte had van tenminste vier maal die van de rivierbreedte. “Matig begrensde” stroomgebieden hadden dalbodems met een breedte >4X de rivierbreedte, maar bedekten slechts 25-50% van de lengte van het stroomgebied, of als ze meer dan 50% van de lengte van de stroom bedekten, hadden dalbodems uiterwaard/rivierbreedte verhoudingen tussen 2 en 4. Alle andere stroomgebieden werden gedefinieerd als “begrensd.”