Přehled přístupu
V rámci SCS jsou stavební bloky stanovišť toků reprezentovány jako řada vrstev, z nichž každá představuje různé kategorie fyzikálních charakteristik (např. velikost, sklon). Každá vrstva je tvořena několika třídami (např. pramenná oblast, potok, nízký sklon, vysoký sklon). Vrstvy byly konstruovány pomocí induktivních přístupů založených na vzorcích v empirických datech, na rozdíl od deduktivních přístupů závislých na regionalizaci krajiny. Zdroje empirických dat použitých k odvození tříd toků jsou uvedeny v tabulce 1. Na základě předchozích přehledů a žádostí od skupiny ochránců přírody a ekologů toků6,25 jsme vybrali šest vrstev stanovišť toků, které bylo možné mapovat s rozlišením na dosah toku a o nichž se předpokládalo, že silně ovlivňují ekologické funkce a složení ekologických společenstev. Patřily mezi ně (v pořadí podle klesajícího ekologického významu): velikost, sklon, hydrologie, teplota, rozvětvení říční sítě a sevřenost údolí.
Důležitým hlediskem při výběru vrstev a určování rozdělení mezi třídami byla dostupnost zdokumentovaných metod klasifikačních přístupů a prahových hodnot mezi třídami. Proto jsme přednostně vybírali vrstvy podpořené již existujícími a publikovanými klasifikacemi, nebo pokud předchozí klasifikace nebyly k dispozici, spoléhali jsme se na literaturu pro určení zlomů a prahů pro rozdělení hodnot (např. spádu) do tříd, pokud byly k dispozici. Protože výsledky klasifikace jsou ovlivněny zvoleným přístupem, použili jsme při vytváření tříd v rámci vrstev více alternativních přístupů, pokud byly k dispozici.
Sestavení proměnných prediktorů
Informace o velikosti, gradientu a rozvětvení sítě byly získány z datové sady NHDPlus V2. Diskrétní in situ pozorování hydrologie, teploty a charakteristik říčního koryta (sevřenost údolí) však vyžadovala, abychom vyvinuli modely pro extrapolaci těchto tříd na úroveň dosahu toku. Celkem 66 krajinných, klimatických, topografických a půdních proměnných bylo sestaveno pro povodí přispívající ke každé měřící stanici toku a pro celou síť povodí před každým tokem v USA (tabulka 2 (dostupná pouze online)). Z nich 44 bylo poskytnuto z databáze Stream Cat26 (https://www.epa.gov/national-aquatic-resource-surveys/streamcat), 21 z datové sady NHDPlus V2 a jedna z databáze WorldClim (http://worldclim.org/version2) (tab. 2 (dostupná pouze online)). Přibližně ve 2 % pozorování chyběly hodnoty proměnných sumarizovaných pro odtokové sítě nad jednotlivými toky (především data StreamCat). K odhadu nejpravděpodobnějších hodnot chybějících proměnných na základě hodnot přítomných u jiných proměnných jsme použili balíček Multivariate Imputation by Chained Equation (MICE) v programovacím prostředí R27 . Pro každou proměnnou s chybějícími hodnotami jsme zadali binární matici určující, která podmnožina prediktorů má být použita k odhadu chybějících hodnot při imputaci. Pro každou neúplnou proměnnou byly vytvořeny samostatné modely Predictive Mean Matching27.
Velikost
V porovnání s ostatními třídami se vývoj klasifikačních schémat pro velikost a sklon nespoléhal na pozorování in situ nebo vývoj predikčních modelů (např. hydrologie). Použili jsme dvě velikostně relevantní proměnné dostupné prostřednictvím datové sady NHDPlus V2, abychom poskytli alternativní klasifikace velikosti toků: Strahlerovo pořadí toku a průměrný roční průtok (reprezentativní pro podmínky minimálního vlivu člověka). Řád toku zobrazuje dendritickou povahu prostředí toku28 a běžně se používá k charakterizaci frekvenčního rozložení velikostí toků ve velkých regionech nebo globálně29. Omezení řádu toků však spočívají v tom, že řád může být ovlivněn měřítkem mapované hydrografie30 a odtok se může v jednotlivých klimatických režimech pro daný řád značně lišit. Podobně může být problematické i použití plochy povodí k charakterizování velikosti, protože odtok na jednotku plochy se také dramaticky liší v regionech s velmi rozdílným klimatem30. Alternativně lze velikost toku charakterizovat průtokem, který přenáší. To však vyžaduje stanovení standardizovaného přístupu k rozdělení tříd na základě odtoku. Protože geometrické zákony, jimiž se řídí organizace toku (např. frekvence, délka toku, plocha povodí), jsou založeny na řádu toku31 , poskytuje řád univerzální fyzikální šablonu pro rozdělení kontinentálních velkých rozdílů ve vypouštění na základě konzistentních prahových hodnot. Abychom vytvořili velikostní klasifikaci založenou na výtoku, vypočítali jsme medián výtoku pro všechny úseky toku NHDPlus V2 podle Strahlerova řádu toku a poté jsme použili střední body mezi těmito hodnotami k vytvoření zlomů výtoku jako prahových hodnot velikostních tříd. (Poznámka: proměnné použité v hydrologické klasifikaci jsou standardizovány podle průměrného ročního průtoku, a nejsou tedy ovlivněny velikostí řeky).
Hradient
Hradientní hodnoty (tj. sklon koryta toku) byly rovněž uvedeny jako atribut linií toku NHDPlus V2. Sklony toku byly měřeny pro každou linii toku jako podíl stoupání nadmořské výšky nad vzdáleností linie toku32. Vyhlazené údaje o nadmořské výšce byly odvozeny z 10m digitálních výškových modelů (DEM) pro celou zemi. Maximální a minimální nadmořské výšky byly použity k určení stoupání, které bylo vyděleno celkovou délkou linie toku. Pokud je nám známo, nejpoužívanější prahové hodnoty spádu poskytuje Rosgen4 , který rozlišuje morfologii koryta na základě spádu, poměru šířky a hloubky, zahloubení a sinuozity. O tyto gradientové prahy se při rozdělování tříd opírá i řada snah o klasifikaci toků6,9,25. Tato rozdělení jsme převzali pro vytvoření typů spádů a ty jsme zmapovali na úseky toků.
Hydrologie
V posledních dvou desetiletích bylo na základě diskrétních pozorování monitorovacích stanic na tocích vytvořeno mnoho hydrologických klasifikací v regionálním až globálním měřítku2,18,33 . Vypracování induktivních hydrologických klasifikací obecně vyžaduje sestavení pozorování odtoku in situ, shrnutí odtoku do hydrologické statistiky a následné seskupení pozorování na základě podobnosti hydrologických vlastností22. Nedávno McManamay a kol.34 vypracovali hydrologickou klasifikaci pro celé USA na základě přirozených odtokových poměrů na 2 600 měřících stanicích US Geological Survey (USGS), přičemž povodí na horním toku představují nejméně narušený stav pro příslušný region. Po rozkladu 110 hydrologických statistik do 13 komponentních skóre pomocí analýzy hlavních komponent (PCA) byly říční stanice pravděpodobnostně zařazeny do 1 z 15 hydrologických tříd pomocí optimálních algoritmů shlukování Gaussova smíšeného modelu určených pomocí Bayesovské inference34. Tyto třídy reprezentují variabilitu hydrologických vzorců na rozdíl od variability objemu výtoku, protože všechny hydrologické statistiky související s velikostí byly před PCA a shlukováním standardizovány podle průměrného denního průtoku.
Tento fuzzy styl klasifikace (tj. měkké shlukování) je flexibilní v tom, že charakterizuje toky jako teoreticky sdílející příslušnost k mnoha shlukům33,35 . Naproti tomu „tvrdé“ techniky shlukování, jako jsou hierarchické aglomerativní metody založené na vzdálenosti (např. Wardova metoda)36 , jsou relativně přímočaré, srozumitelnější a vytvářejí vnořená a ostrá členství22. Proto jsme použili Wardovu aglomerativní metodu ke shlukování 2600 stanic USGS pomocí 13 PC skóre a poté jsme na základě vizuálního zkoumání dendrogramu určili řadu optimálních počtů shluků.
Všechny stanice USGS na tocích byly prostorově připojeny k tokům NHDPlus V2. Pomocí predikčních proměnných uvedených v tabulce 2 (dostupné pouze online) jsme v programovacím prostředí R sestavili klasifikační modely náhodného lesa37 pro predikci příslušnosti k hydrologickým třídám a poté extrapolovali hydrologické třídy na všechny úseky toku NHDPlus V2.
Teplotní klasifikace
V porovnání s hydrologií je teplotní klasifikace méně častá3,38,39, což je pravděpodobně způsobeno vzácnějšími údaji o teplotě ve srovnání s výtokem. Nedávno Maheu a spol.3 seskupili přibližně 130 měřicích stanic (reprezentativních pro referenční podmínky) v USA do různých typů teplotních režimů na základě několika statistik popisujících velikost a variabilitu. Tento vícerozměrný přístup poskytuje vícerozměrnou alternativu k jednorozměrným třídám letních teplot, které jsme vytvořili my. Lokality měřicích stanic použitých v klasifikaci Maheu et al. byly získány od autorů a byly prostorově spojeny s úseky toků NHDPlus V2. Pomocí 65 prediktivních proměnných jsme vytvořili model náhodného lesa k třídám Maheu et al. k dosahům toků v USA. Protože teplota je funkcí velikosti řeky, vyloučili jsme z modelu Qwsa (tj. průměrný roční průtok dělený plochou povodí).
Jako alternativu jsme vytvořili jednoduchou klasifikaci teploty na základě přirozeně se vyskytujících průměrných hodnot letní teploty vody. Z řady studií vyplývá, že divergentní teplotní režimy v tocích jsou ovlivněny především přirozenou variabilitou hodnot letní teploty (červencové-srpnové průměry)3,40,41 . Navíc hodnoty letní teploty patří k nejsnáze dostupným údajům z veřejných i neveřejných zdrojů. Shromáždili jsme údaje o teplotě vody v tocích pro 5907 lokalit z různých zdrojů, včetně Dewebera & Wagnera41 (n = 2893), Hilla et al.40 (n = 566), měřidel USGS s denními záznamy (n = 2184), sezónního terénního monitoringu USGS (n = 240) a dalších údajů o teplotě ze záznamníků rozmístěných agenturami (n = 24) (tab. 1). Určení přiměřené délky záznamu teplotních dat vyžadovalo nalezení rovnováhy mezi minimalizací nejistoty v červencových a srpnových průměrech a příliš malým počtem vzorků pro odpovídající regionální zastoupení. Například Jones a Schmidt42 poskytli doporučení pro délku záznamů potřebnou k adekvátní minimalizaci nejistoty při odhadu metrik teplotního režimu; dodržení těchto pokynů by však samotné výše uvedené záznamy USGS (n = 2424) zkrátilo o 70 až 90 %. Jonesovo a Schmidtovo hodnocení navíc zahrnovalo měsíční maxima, minima a metriky rozsahu, zatímco naše analýza se opírala o hrubší dvouměsíční průměrnou metriku (červenec-srpen), kterou považujeme za méně náchylnou k meziročním výkyvům než teplotní extrémy (Supplementary File 1). Na základě 22 měřicích stanic USGS v USA a pásem spolehlivosti podle Jonese a Schmidta jsme odhadli, že 1-2 sezóny dat by mohly spolehlivě odhadnout průměrné teploty v červenci a srpnu v rozmezí 1 °C s 80%, resp. 90% spolehlivostí (Supplementary File 1). Prověřili jsme lokality, abychom se ujistili, že období záznamu spadá do let 1995 až 2015 a data jsou k dispozici alespoň 60 po sobě jdoucích dnů v červenci a srpnu.
Všechny teplotní lokality byly prostorově spojeny s úseky toků NHDPlus V2. Poté jsme určili referenční podmínky pro monitorovací lokality pomocí ukazatelů narušení půdy a regulace hrází na horním toku. Narušení půdy bylo hodnoceno pomocí hodnocení biotopů National Fish Habitat Partnership (NFHP) 2015, které poskytuje skóre degradace biotopů v rozmezí od „velmi nízkého“ po „velmi vysoké“ narušení v rámci segmentů toku NHDPlus43. Stupeň regulace horního toku přehradami jsme hodnotili pomocí stupně regulace (DOR) (% ročního průtoku zadrženého přehradami na horním toku)44 , který poskytuje StreamCat. Teplotní monitorovací stanice s hodnocením rizika jako „velmi nízké“ nebo „nízké“ a DOR < 4 % (což naznačuje malý vliv nádrží44,45) byly určeny jako reprezentativní pro referenční podmínky, což vedlo k 1764 lokalitám, které rovněž splňovaly naše kritéria délky záznamu. Z nich 70 % pozorování bylo získáno od Dewebera & Wagnera41 (n = 1211) nebo Hilla et al.40 (n = 33). Ze zbývajících 520 pozorování mělo 71,7 % alespoň 2 sezóny údajů.
Pomocí stejného souboru prediktorů jako výše jsme vytvořili náhodné lesy pro předpověď letních teplot pro referenční lokality a poté jsme tyto hodnoty extrapolovali na všechny úseky toku NHD. K rozdělení letních teplot do tříd jsme použili zlomy v rozdělení četností teplot vody v USA. Na základě odhadovaných hodnot letních teplot pro všechny úseky toku jsme použili postup Jenks Natural Breaks46 k rozdělení teplot do 2 až 20 tříd a poté jsme se spolehli na optimální shodu a tabulkovou přesnost, abychom určili nejjednodušší počet tříd vysvětlujících většinu informací. Vzhledem k tomu, že neexistuje odůvodněný přístup pro fyzikálně založené rozdělení tříd, je Jenksova metoda optimální pro jednorozměrné shlukování prostorové informace, protože se snaží minimalizovat variabilitu uvnitř tříd a zároveň maximalizovat variabilitu mezi třídami46.
Síťová bifurkace
Pokud velikost toku zachycuje podélnou variabilitu ekologických funkcí podél kontinua toku15, jsou důležité také přítokové křižovatky a rozvodí toku, protože vytvářejí diskontinuity v podélných procesech47. Soutoky toků, konkrétně rozdílné velikosti toků, které tvoří soutoky, mají velký vliv na stanoviště a biologickou rozmanitost48. Kromě toho se složení ekologických společenstev může dramaticky měnit s blízkostí říčních křižovatek49. Abychom zachytili rozdíly v konfiguraci sítě a situace divergence, vytvořili jsme dvě třídy bifurkací. Nejprve jsme vytvořili třídy, které zohledňovaly různé kombinace velikostí přítoků tvořících soutok na horním konci každého toku. Za druhé jsme vytvořili třídy označující úseky toků jako hlavní nebo vedlejší koryta pod divergencemi a kde toky přijímaly průtok z divergencí na horním toku.
Většina jednotlivých úseků toků v rámci datové sady NHDplus V2 představuje odlišné hydrologické rysy říčních sítí definované počátky toků, soutoky přítoků a křížení s jezery a nádržemi50. Topologické vztahy mezi povodími NHDplus V2 jsou uvedeny v tabulce „od-do“, která definuje horní povodí přispívající k danému povodí (tj. od) a dolní povodí přijímající průtok (tj. do). Pomocí tabulky „od-do“ byly kombinace různých Strahlerových pořadí toků na horním konci každého toku zkombinovány tak, aby vznikla kombinace přítoku a hlavního toku. Například soutok přítoků 1. řádu a 2. řádu na horním konci soustavy 2. řádu by dal následující třídu: 2.12 (obr. 1a). Ve většině případů se na horním toku vyskytovaly pouze 2 přítoky. V ojedinělých případech nebo v situacích divergence se však nad určitým tokem spojují 3 a více přítoků a my jsme zahrnuli až čtyři pořadí proti proudu (např. obr. 1b, 5.511). V některých případech se do úseků toku dostává průtok z více rozvodnic proti proudu, tj. rozdělení jednoho úseku toku na dva nebo více kanálů směrem po proudu (obr. 1c). Protože těmto kanálům je přiřazeno pořadí toku a vytvářejí křižovatky, které napodobují soutoky přítoků, vyžaduje klasifikace bifurkace sítě zahrnutí rozvodí kanálů jako typu soutoku. V případech divergence kanálů označuje NHDplus V2 úseky jako hlavní (D1) nebo vedlejší (D2) kanály (obr. 1c). K identifikaci úseků toku, které se nacházely bezprostředně pod soutoky kanálových divergencí (DU), jsme použili tabulku od-do, abychom je odlišili od soutoků přítoků. Po započtení těchto divergencí jsme zaznamenali situace nesmyslných soutoků přítoků (např. 5_5,5), které vznikly tím, že NHDplus V2 neoznačil vhodně všechny situace divergence kanálů. Protože bylo obtížné určit, zda každý z těchto úseků byl divergentním korytem nebo úsekem přijímajícím průtok z divergentních koryt, přiřadili jsme tyto úseky do obecné třídy divergence (D).
Ačkoli většina přítokových soutoků v NHDPlus V2 je hydrologicky relevantní, část úseků soutoků byla během digitalizace rozdělena na nevýznamných místech, jako jsou hranice čtyřúhelníkových map50 (obr. 1d). V případě bifurkačních tříd a divergencí by tato rozdělení vedla k nesmyslným soutokům. Pro nápravu těchto případů vytvořili Wieferich et al.51 tabulku pro identifikaci ekologických dosahů, která přiřadila rozdělené dosahy k běžným ekologickým identifikátorům. V těchto případech jsme všem úsekům patřícím do stejné ekologické jednotky přiřadili třídu bifurkace a divergence nejhořejšího úseku proti proudu (obr. 1d).
Údolní sevření
Míra, do jaké údolí řídí laterální migraci říčních koryt, vypovídá o síle interakce mezi řekami a jejich nivou. Pro všechny úseky toku NHDPlus V2 jsme vymezili neomezená dna údolí (tj. polygony) pomocí nástroje Valley Confinement Algorithm (VCA)52 v aplikaci ArcMap 10.3. Vymezení dna údolí bylo provedeno pomocí nástroje VCA. VCA odhaduje plnou hloubku koryta toku pomocí empirické funkce založené na regionálních údajích o srážkách (http://www.prism.oregonstate.edu/normals) a ploše povodí pro každý úsek toku53. Nagle a kol.52 navrhli 5násobnou hloubku břehu pro určení výšky povodně, což jsme také považovali za vhodné vzhledem k prostorovému rozlišení NHDplus a 30m dat DEM (https://nationalmap.gov/elevation.html) pro okolní topografii. Na základě okolního terénu charakterizovaného pomocí DEM použil program VCA algoritmus pro průnik výšky povodně s okolním svahem. Aby se zabránilo vymezení dna údolí v inundačních oblastech, byly použity vodní plochy.
Po vymezení dna údolí je třeba stanovit prahové hodnoty pro klasifikaci toků jako neohraničené, ohraničené nebo přechodné úrovně. Například dno údolí nemusí zahrnovat celý úsek toku nebo nemusí přesahovat bočně dostatečnou vzdálenost za břehy toku, aby mohlo být klasifikováno jako neohraničené. To vyžaduje odhad šířky řeky pro každý úsek toku. Shromáždili jsme terénní pozorování in situ i pozorování dálkového průzkumu z >52 000 lokalit a vyvinuli empirický model pro předpověď šířky řeky pro všechny úseky toků v CONUS. Terénní pozorování šířky řek byla získána z Národního hodnocení řek a potoků Agentury pro ochranu životního prostředí (n = 852) (https://www.epa.gov/national-aquatic-resource-surveys/nrsa), z literárního přehledu šířky toků (n = 243)29 a ze souboru dat o šířce řek v Severní Americe (n = 50 230) (http://gaia.geosci.unc.edu/NARWidth/). V těchto souborech dat však z velké části chyběly malé pramenné toky a občasné systémy. Abychom zajistili správný odhad šířky těchto typů toků, byly toky rozvrstveny podle velikosti (viz klasifikace velikosti) a z celé populace toků v USA byla vybrána náhodná podmnožina (n = 407). Letecké snímky byly použity k odhadu šířky řeky v polovině, na horním a dolním konci každého toku a následnému výpočtu průměrné šířky. K předpovědi šířky řeky a extrapolaci odhadů na všechny úseky toku byly použity modely náhodného lesa. Odhady šířky řeky pak byly použity k vytvoření polygonových nárazníků kolem všech úseků toku.
Překryli jsme šířky řek a dna údolí, abychom určili stav omezení údolí. Hall et al.53 považovali úseky toků za neomezené, pokud je šířka údolní nivy alespoň čtyřnásobná, zatímco koryta toků s mírnou interakcí s údolní nivou mají poměr šířky údolní nivy k šířce údolní nivy >24. Kromě laterálního rozsahu záplavových území vyžadovalo naše hodnocení uzavřenosti také zkoumání délky každého úseku toku pokrytého údolními nivami. Úseky toku byly klasifikovány jako „neohraničené“, pokud dno údolí pokrývalo alespoň 50 % délky úseku toku a mělo šířku alespoň čtyřikrát větší než šířka řeky. „Mírně omezené“ úseky toku měly dna údolí o šířce >4x šířka řeky, ale pokrývaly pouze 25-50 % délky úseku toku, nebo pokud pokrývaly více než 50 % délky toku, měla dna údolí poměr šířky nivy k šířce řeky mezi 2 a 4. V případě, že dna údolí pokrývala více než 50 % délky toku, měla dna údolí poměr šířky řeky k šířce nivy. Všechny ostatní úseky toku byly definovány jako „omezené“
.