Översikt över tillvägagångssättet
I SCS representeras byggstenar för vattendragsbiotoper som en serie skikt, som var och en representerar olika kategorier av fysiska egenskaper (t.ex. storlek, lutning). Varje skikt består av flera klasser (t.ex. huvudvatten, bäck, låg gradient, hög gradient). Skikten konstruerades med hjälp av induktiva metoder baserade på mönster i empiriska data, i motsats till deduktiva metoder baserade på landskapsregionalisering. Källor till de empiriska data som använts för att ta fram vattendragsklasser finns i tabell 1. Genom tidigare granskningar och förfrågningar från en grupp naturvårdare och bäckekologer6,25 valde vi ut sex lager av livsmiljöer i vattendrag som kunde kartläggas med en upplösning på vattendragssträckan och som antogs ha en stark inverkan på den ekologiska funktionen och sammansättningen av ekologiska samhällen. Dessa omfattade (i ordning av avtagande ekologisk betydelse): storlek, gradient, hydrologi, temperatur, bäcknätverkets förgrening och dalens begränsning.
Ett viktigt övervägande när det gällde att välja skikt och fastställa partitioner mellan klasser var att det fanns tillgång till dokumenterade metoder för klassificering och tröskelvärden mellan klasser. Därför valde vi företrädesvis lager som stöds av redan existerande och publicerade klassificeringar, eller om tidigare klassificeringar inte fanns tillgängliga, förlitade vi oss på litteraturen för att bestämma brytpunkter och tröskelvärden för att dela upp värden (t.ex. gradient) i klasser när sådana fanns tillgängliga. Eftersom klassificeringsresultaten påverkas av det valda tillvägagångssättet använde vi flera alternativa tillvägagångssätt, om de var tillgängliga, när vi utvecklade klasser inom lager.
Prediktorvariabelsammanställning
Information om storlek, gradient och nätverksbifurkation hämtades från NHDPlus V2-dataset. Diskreta in situ-observationer av hydrologi, temperatur och flodkanalens egenskaper (dalsluttning) krävde dock att vi utvecklade modeller för att extrapolera dessa klasser till bäcksträckans nivå. Totalt 66 landskaps-, klimat-, topografiska och markvariabler sammanställdes för de avrinningsområden som bidrar till varje mätstation för vattendrag och för hela avrinningsnätet uppströms varje vattendragssträcka i USA (tabell 2 (endast tillgänglig online)). Av dessa tillhandahölls 44 från Stream Cat-databasen26 (https://www.epa.gov/national-aquatic-resource-surveys/streamcat), 21 från NHDPlus V2-dataset och en från WorldClim (http://worldclim.org/version2) (tabell 2 (endast tillgänglig online)). I ungefär 2 % av observationerna saknades värden för variabler som sammanfattades för dräneringsnätverk ovanför varje vattendragssträcka (främst StreamCat-data). Vi använde paketet Multivariate Imputation by Chained Equation (MICE) i programmeringsmiljön R27 för att uppskatta de mest sannolika värdena för saknade variabler utifrån de värden som finns för andra variabler. För varje variabel med saknade värden angav vi en binär matris som anger vilken delmängd av prediktorer som ska användas för att uppskatta saknade värden under imputeringen. Separata Predictive Mean Matching-modeller utvecklades för varje ofullständig variabel27.
Storlek
I jämförelse med andra klasser var utvecklingen av klassificeringsscheman för storlek och lutning inte beroende av in situ-observationer eller utveckling av prediktiva modeller (t.ex. hydrologi). Vi använde två storleksrelevanta variabler som är tillgängliga genom NHDPlus V2-datasetet för att tillhandahålla alternativa klassificeringar av vattendragens storlek: Strahler-strömordning och genomsnittligt årligt flöde (representativt för förhållanden med minimal mänsklig påverkan). Strömningsordningen beskriver den dendritiska karaktären hos strömningsmiljöer28 och används vanligen för att karakterisera frekvensfördelningen av strömningsstorlekar över stora regioner eller globalt29. Begränsningar med vattendragsordning är dock att ordningen kan påverkas av skalan på den kartlagda hydrografin30 och att avrinningen kan variera kraftigt mellan olika klimatregimer för en viss ordning. På samma sätt kan det vara problematiskt att använda avrinningsområdet för att karakterisera storleken, eftersom avrinningen per ytenhet också kommer att variera dramatiskt i regioner med mycket varierande klimat30. Alternativt kan ett vattendrags storlek karakteriseras av det flöde som det transporterar. Detta kräver dock att man fastställer ett standardiserat tillvägagångssätt för att dela upp klasser baserat på flödet. Eftersom de geometriska lagar som styr vattendragens organisation (t.ex. frekvens, vattendragslängd, avrinningsområde) är baserade på vattendragets ordning31 , ger ordningen en universell fysisk mall för att dela upp kontinentala stora variationer i avrinning på grundval av konsekventa tröskelvärden. För att utveckla en avrinningsbaserad storleksklassificering beräknade vi medianavrinningen för alla vattendragssträckor i NHDPlus V2 i enlighet med Strahlers vattendragsordning och använde sedan medelpunkterna mellan dessa värden för att skapa avbrott i avrinningen som tröskelvärden för storleksklasserna. (Observera: de variabler som används i den hydrologiska klassificeringen standardiseras av den årliga medelavrinningen och påverkas således inte av flodstorleken).
Gradient
Värden för gradient (dvs. lutning av vattendragets botten) tillhandahölls också som ett attribut för NHDPlus V2-flödessträckor. Bäckens lutning mättes för varje flödeslinje som andelen höjdökning i förhållande till flödeslinjens avstånd32. Utjämnade höjddata hämtades från 10 meters digitala höjdmodeller (DEM) för landet. Maximal och minimal höjd användes för att bestämma höjningen, som dividerades med flödeslinjens totala längd. Såvitt vi vet är de mest använda tröskelvärdena för gradienterna Rosgen4 , som skiljer kanalmorfologier åt baserat på gradient, förhållandet mellan bredd och djup, fördjupning och sinuositet. Flera försök till klassificering av vattendrag har också förlitat sig på dessa gradienttrösklar för att dela upp klasser6,9,25. Vi antog dessa brytningar för att utveckla gradienttyper och kartlade dessa till vattendragssträckor.
Hydrologi
Under de senaste två decennierna har ett flertal hydrologiska klassificeringar på regional till global skala utvecklats från diskreta observationer av övervakningsstationer för vattendragsflöden2,18,33. I allmänhet kräver utvecklingen av induktiva hydrologiska klassificeringar att man samlar in situ-observationer av avrinning, sammanfattar avrinningen i hydrologisk statistik och sedan grupperar observationerna på grundval av likheter i hydrologiska egenskaper22. Nyligen utvecklade McManamay et al.34 en hydrologisk klassificering för hela USA baserad på naturliga flödesmönster vid 2 600 mätstationer från US Geological Survey (USGS) med vattendrag uppströms som representerar det minst störda tillståndet för respektive region. Efter att 110 hydrologiska statistiska uppgifter hade dekomponerats i 13 komponentpoäng med hjälp av PCA (Principal Components Analysis), tilldelades vattendragsdatastationer på ett sannolikhetsmässigt sätt en av 15 hydrologiska klasser med hjälp av optimala klusteralgoritmer för Gaussiska blandmodeller, som bestämdes med hjälp av Bayesiansk inferens34. Dessa klasser representerar variation i hydrologiska mönster i motsats till variation i utflödesvolym, eftersom all storleksrelaterad hydrologisk statistik standardiserades med genomsnittligt dagligt flöde före PCA och klusterindelning.
Denna fuzzy-klassificering (dvs. mjuk klusterindelning) är flexibel eftersom den karaktäriserar vattendrag som teoretiskt sett delar medlemskap i många kluster33,35. Däremot är ”hårda” klustertekniker, t.ex. avståndsbaserade hierarkiska agglomerativa metoder (t.ex. Wards metod)36, relativt enkla, lättare att förstå och ger inbäddade och skarpa medlemskap22. Därför använde vi Wards agglomerativa metod för att klustra de 2600 USGS-räcken med hjälp av de 13 PC-poängen och fastställde sedan en rad optimala antal kluster baserat på en visuell granskning av dendrogrammet.
Alla USGS-räcken för vattendrag kopplades rumsligt samman med NHDPlus V2-strömsträckor. Med hjälp av prediktorvariabler i tabell 2 (endast tillgänglig online) konstruerade vi klassificeringsmodeller med slumpmässig skog37 i programmeringsmiljön R för att förutsäga medlemskap i hydrologiska klasser och extrapolerade sedan hydrologiska klasser till alla NHDPlus V2-strömsträckor.
Temperatur
I jämförelse med hydrologi är temperaturklassificeringar mindre vanliga3,38,39 , vilket möjligen beror på att det finns färre temperaturdata än om avrinning. Nyligen grupperade Maheu et al.3 cirka 130 mätstationer (representativa för referensförhållanden) över hela USA i olika typer av termiska regimer på grundval av ett flertal statistiska uppgifter som beskriver omfattning och variation. Detta multivariata tillvägagångssätt ger ett multivariat alternativ till de univariata sommartemperaturklasser som vi genererade. Platserna för de mätstationer som användes i Maheu et al:s klassificering erhölls från författarna och kopplades rumsligt till vattendragssträckor i NHDPlus V2. Med hjälp av 65 av prediktorvariablerna utvecklade vi en slumpmässig skogsmodell för att Maheu et al.s klasser för vattendragssträckor i hela USA. Eftersom temperaturen är en funktion av flodstorleken uteslöt vi Qwsa från modellen (dvs. genomsnittligt årligt flöde dividerat med avrinningsområdet).
Som ett alternativ utvecklade vi en enkel temperaturklassificering baserad på naturligt förekommande medelvärden för sommarens vattentemperatur. Flera studier tyder på att divergerande termiska regimer i vattendrag främst påverkas av den naturliga variationen i värdena för sommartemperaturen (medelvärden för juli-augusti)3,40,41. Dessutom är sommartemperaturvärdena bland de mest lättillgängliga uppgifterna från offentliga och icke-offentliga källor. Vi sammanställde uppgifter om vattenflödestemperatur för 5 907 platser från flera källor, inklusive Deweber & Wagner41 (n = 2893), Hill et al.40 (n = 566), USGS mätare med dagliga registreringar (n = 2184), USGS säsongsmässiga fältövervakning (n = 240) och andra temperaturuppgifter från loggare som satts ut av myndigheter (n = 24) (tabell 1). För att fastställa lämplig registerlängd för temperaturdata var det nödvändigt att hitta en balans mellan att minimera osäkerheten i juli-augusti-genomsnittet och att ha för få prover för att få en adekvat regional representation. Jones och Schmidt42 gav t.ex. rekommendationer om hur långa registreringar som krävs för att minimera osäkerheten vid uppskattning av termiska regimmetriker. Om man följde denna vägledning skulle dock enbart de ovannämnda USGS-registreringarna (n = 2424) ha minskat med 70-90 %. Vidare omfattade Jones och Schmidts bedömning månatliga maxima, minima och intervallmått, medan vår analys förlitade sig på ett grövre tvåmånadersgenomsnittsmått (juli-augusti), som vi anser vara mindre känsligt för variationer från år till år än temperaturextremer (kompletterande fil 1). Med hjälp av 22 USGS-räknare över hela USA och konfidensband från Jones och Schmidt uppskattar vi att man med data från 1-2 säsonger på ett tillförlitligt sätt kan uppskatta medeltemperaturen i juli-augusti inom 1 °C med en konfidens på 80 % respektive 90 % (kompletterande fil 1). Vi granskade platserna för att säkerställa att registreringsperioden låg mellan 1995 och 2015 och att data fanns tillgängliga under minst 60 dagar i följd i juli och augusti.
Alla temperaturplatser var rumsligt kopplade till NHDPlus V2-strömsträckor. Vi fastställde sedan referensförhållanden för övervakningsplatserna med hjälp av indikatorer på markstörning och reglering av dammar uppströms. Markstörningar utvärderades med hjälp av National Fish Habitat Partnership (NFHP) 2015 habitatbedömning, som ger poäng för försämring av livsmiljöer som sträcker sig från ”mycket låg” till ”mycket hög” störning inom segment av NHDPlus-strömsträckor43. Vi utvärderade graden av reglering uppströms av dammar med hjälp av regleringsgraden (DOR) (% av det årliga utflödet som lagras av dammar uppströms)44 , som tillhandahålls av StreamCat. Temperaturövervakningsstationer med riskbedömningspoäng som ”mycket låg” eller ”låg” och DOR < 4 % (vilket indikerar liten påverkan av reservoarer44,45) fastställdes vara representativa för referensförhållanden, vilket resulterade i 1764 platser som också uppfyllde våra kriterier för rekordlängd. Av dessa erhölls 70 % av observationerna från Deweber & Wagner41 (n = 1211) eller Hill et al.40 (n = 33). Av de återstående 520 observationerna hade 71,7 % minst två säsonger med data.
Med hjälp av samma prediktorensemble ovan utvecklade vi slumpmässiga skogar för att förutsäga sommartemperaturer för referensplatser och extrapolerade sedan dessa värden till alla NHD-strömsträckor. Vi använde oss av brytningar i frekvensfördelningen av amerikanska vattentemperaturer för att dela upp sommartemperaturer i klasser. Med hjälp av uppskattade sommartemperaturvärden för alla vattendragssträckor använde vi ett Jenks Natural Breaks46 -förfarande för att dela upp temperaturen i 2 till 20 klasser och förlitade oss sedan på optimal anpassning och noggrannhet i tabellerna för att fastställa det mest sparsamma antalet klasser som förklarar majoriteten av informationen. I avsaknad av ett motiverat tillvägagångssätt för fysikbaserad partitionering av klasser är Jenks-metoden optimal för univariat klustring av rumslig information eftersom den syftar till att minimera variationen inom klasser samtidigt som den maximerar variansen mellan klasser46.
Nätverksbifurkation
När bäckens storlek fångar upp den longitudinella variationen av ekologiska funktioner längs ett bäckkontinuum15 är biflödesförgreningar och bäckdivergenser också viktiga eftersom de skapar diskontinuiteter i longitudinella processer47. Bäcksförgreningar, särskilt de olika storlekar på bäckar som utgör förgreningar, har stor inverkan på livsmiljöer och biologisk mångfald48. Dessutom kan sammansättningen av ekologiska samhällen förändras dramatiskt med närhet till vattendragskorsningar49. För att fånga skillnader i nätverkskonfigurationer och divergenssituationer skapade vi två bifurkationsklasser. För det första skapade vi klasser som tog hänsyn till olika stora kombinationer av biflöden som bildar en sammanflöde i uppströms änden av varje vattendragssträcka. För det andra utvecklade vi klasser som anger vattendragssträckor som huvud- eller sekundärkanaler nedanför divergenser och där vattendrag tar emot flöde från divergenser uppströms.
De flesta enskilda vattendragssträckor inom NHDplus V2-dataset representerar distinkta hydrologiska funktioner i flodnätverk som definieras av vattendragens ursprung, biflödeskonfusioner och skärningspunkter med sjöar och reservoarer50. De topologiska relationerna mellan NHDplus V2-sträckor tillhandahålls i en ”från-till”-tabell som definierar de uppströmssträckor som bidrar till en viss sträcka (dvs. från) och den nedströmssträcka som tar emot flödet (dvs. till). Med hjälp av ”från-till”-tabellen kombinerades kombinationerna av olika Strahler-strömmar i uppströms änden av varje sträcka för att skapa en kombination av biflöde och huvudfåra. Till exempel skulle sammanflödet av ett biflöde av första ordningen och ett biflöde av andra ordningen i uppströms änden av ett system av andra ordningen ge följande klass: 2.12 (fig. 1a). I de flesta fall förekommer endast två biflöden uppströms. I sällsynta fall eller i situationer med divergenser går dock tre eller fler biflöden samman uppströms ovanför ett område, och då inkluderade vi upp till fyra ordningar uppströms (t.ex. Fig. 1b, 5.511). I vissa fall får vattendragssträckor flöde från flera uppströms liggande kanaldivergenser, dvs. uppdelning av en sträcka i två eller flera kanaler i nedströms riktning (fig. 1c). Eftersom dessa kanaler tilldelas en strömordning och skapar korsningar som efterliknar sammanflöden av biflöden, kräver klassificering av nätverksförgreningar att man inkluderar kanaldivergenser som en typ av sammanflöde. I fall av kanaldivergenser betecknar NHDplus V2 sträckor som huvudkanaler (D1) eller sekundära kanaler (D2) (fig. 1c). Vi använde från-till-tabellen för att identifiera vattendragssträckor som låg omedelbart under sammanflöden av kanalavvikelser (DU), för att skilja dessa från sammanflöden av biflöden. Efter att ha tagit hänsyn till dessa divergenser observerade vi situationer med icke meningsfulla biflöden (t.ex. 5_5.5) som uppstod på grund av att NHDplus V2 inte på ett lämpligt sätt betecknade alla situationer med kanaldivergenser. Eftersom det var svårt att avgöra om vart och ett av dessa avsnitt var divergerande kanaler eller avsnitt som tog emot flöde från divergerande kanaler, placerade vi dessa avsnitt i en generisk divergensklass (D).
Och även om de flesta biflödesförgreningar i NHDPlus V2 är hydrologiskt relevanta, delades en delmängd av stråkförgreningar upp vid icke meningsfulla punkter, som t.ex. gränser för fyrhörniga kartor, under digitaliseringen50 (fig. 1d). När det gäller bifurkationsklasser och divergenser skulle dessa uppdelningar leda till icke meningsfulla förgreningar. För att korrigera dessa fall tog Wieferich et al.51 fram en tabell för identifiering av ekologiska sträckor som tilldelade delade sträckor gemensamma ekologiska identifierare. I dessa fall tilldelade vi alla sträckor som tillhör samma ekologiska enhet bifurkations- och divergensklassen för den sträckan längst uppströms (fig. 1d).
Valley Confinement
Den grad i vilken dalarna kontrollerar flodkanalernas laterala vandring är en indikation på styrkan i samspelet mellan floderna och deras översvämningslandskap. Vi avgränsade obegränsade dalbottnar (dvs. polygoner) för alla NHDPlus V2-strömsträckor med hjälp av verktyget Valley Confinement Algorithm (VCA)52 i ArcMap 10,3. VCA uppskattar bäckkanalens bankfull djup med hjälp av en empirisk funktion baserad på regionala nederbördsdata (http://www.prism.oregonstate.edu/normals) och avrinningsområde för varje vattendragssträcka53. Nagle et al.52 föreslog 5X bankfull depth för att bestämma översvämningshöjden, vilket vi också ansåg lämpligt med tanke på den rumsliga upplösningen i NHDplus och 30 m DEM-data (https://nationalmap.gov/elevation.html) för omgivande topografi. Baserat på den omgivande terrängen som karakteriseras via DEM:er använde VCA-programmet en algoritm för att skärma översvämningshöjden med den omgivande bergssluttningen. Vattenförekomster användes för att undvika avgränsning av dalbottnar i översvämmade områden.
När dalbottnarna har avgränsats krävs tröskelvärden för att klassificera vattendragssträckor som oinskränkta, inskränkta eller en mellannivå. Det kan till exempel hända att en dalbotten inte omfattar hela vattendragssträckan eller att den inte sträcker sig i sidled tillräckligt långt utanför vattendragsbankarna för att klassificeras som obegränsad. Detta kräver en uppskattning av flodbredden för varje vattendragssträcka. Vi sammanställde både fältobservationer in situ och fjärranalysobservationer från >52 000 platser för att utveckla en empirisk modell för att förutsäga flodbredden för alla vattendragssträckor i CONUS. Fältobservationer av flodbredden hämtades från Environmental Protection Agency’s National Rivers and Streams Assessment (n = 852) (https://www.epa.gov/national-aquatic-resource-surveys/nrsa), en litteraturgenomgång av flodbredder (n = 243)29 och North American River Width Data Set (n = 50 230) (http://gaia.geosci.unc.edu/NARWidth/). I dessa dataset saknades dock i stor utsträckning små huvudvattenbäckar och intermittenta system. För att säkerställa att vi korrekt uppskattade bredden för dessa typer av vattendrag stratifierades vattendragssträckor efter storlek (se Klassificering av storlek) och en slumpmässig delmängd (n = 407) valdes ut från hela den amerikanska populationen av vattendragssträckor. Flygbilder användes för att uppskatta flodbredden i mitten, uppströms och nedströms av varje sträcka och sedan beräkna en genomsnittlig bredd. Modeller med slumpmässig skog användes för att förutsäga flodbredden och extrapolera uppskattningarna till alla vattendragssträckor. Uppskattningar av flodbredden användes sedan för att generera polygonbuffertar runt alla vattendragssträckor.
Vi överlagrade flodbredder och dalbottnar för att bestämma statusen för dalbegränsning. Hall et al.53 betraktade vattendragssträckor som obegränsade om bredden på översvämningsdalen är minst fyra gånger bredden, medan vattendragskanaler med måttlig interaktion med översvämningsdalen har förhållanden mellan översvämningsdalen och bankens fulla bredd >24. Utöver översvämningsområdenas sidoutbredning krävde vår bedömning av begränsning också att vi undersökte längden av varje vattendragssträcka som täcktes av dalbottnar. Vattendragssträckor klassificerades som ”obegränsade” om en dalbotten täckte minst 50 % av vattendragssträckans längd och hade en bredd som var minst fyra gånger större än flodens bredd. ”Måttligt begränsade” vattendragssträckor hade dalbottnar med en bredd på >4X flodens bredd men täckte endast 25-50 % av vattendragssträckans längd, eller om de täckte mer än 50 % av vattendragssträckans längd hade dalbottnarna ett förhållande mellan översvämningsyta och flodbredd på mellan 2 och 4. Alla andra vattendragssträckor definierades som ”begränsade”
.