A megközelítés áttekintése
A SCS-ben a patakok élőhelyének építőelemeit rétegek sorozataként ábrázolják, amelyek mindegyike a fizikai jellemzők különböző kategóriáit képviseli (pl. méret, lejtés). Minden réteg több osztályból áll (pl. forrásvíz, patak, kis lejtésű, nagy lejtésű). A rétegeket az empirikus adatok mintáin alapuló induktív megközelítéssel építették fel, szemben a deduktív megközelítéssel, amely a táj regionalizálására támaszkodik. A patakosztályok levezetéséhez használt empirikus adatok forrásait az 1. táblázat tartalmazza. Korábbi felülvizsgálatok és a természetvédők és patakökológusok6,25 kérése alapján kiválasztottunk hat olyan patakélőhelyi réteget, amelyek a patakmeder felbontásában feltérképezhetők, és amelyekről feltételeztük, hogy erősen befolyásolják az ökológiai funkciót és az ökológiai közösségek összetételét. Ezek közé tartoztak (csökkenő ökológiai fontossági sorrendben): méret, lejtés, hidrológia, hőmérséklet, patakhálózati elágazás és völgyzáródás.
A rétegek kiválasztásánál és az osztályok közötti felosztások meghatározásánál fontos szempont volt az osztályozási megközelítésekre és az osztályok közötti küszöbértékekre vonatkozó dokumentált módszerek rendelkezésre állása. Ezért előnyben részesítettük a már létező és közzétett osztályozások által támogatott rétegeket, vagy ha korábbi osztályozások nem álltak rendelkezésre, akkor a szakirodalomra támaszkodtunk az értékek (pl. gradiens) osztályok közötti felosztásához szükséges törések és küszöbértékek meghatározásához, amennyiben ezek rendelkezésre álltak. Mivel az osztályozás eredményeit befolyásolja az alkalmazott megközelítés, ha rendelkezésre állt, több alternatív megközelítést használtunk a rétegeken belüli osztályok kialakításához.
Prediktorváltozók összeállítása
A méretre, a gradiensre és a hálózat elágazására vonatkozó információkat az NHDPlus V2 adatállományból nyertük. A hidrológia, a hőmérséklet és a folyócsatorna jellemzőire (völgyzáródás) vonatkozó diszkrét in situ megfigyelések azonban szükségessé tették, hogy modelleket dolgozzunk ki ezen osztályok patakmeder szintre történő extrapolálására. Összesen 66 táji, éghajlati, topográfiai és talajváltozót állítottunk össze az egyes patakmegfigyelő állomásokhoz hozzájáruló vízgyűjtő medencékre és az Egyesült Államokban minden patakfolyásnál a teljes vízgyűjtő hálózatra (2. táblázat (csak online elérhető)). Ezek közül 44-et a Stream Cat adatbázis26 (https://www.epa.gov/national-aquatic-resource-surveys/streamcat), 21-et az NHDPlus V2 adatállomány, egyet pedig a WorldClim (http://worldclim.org/version2) szolgáltatott (2. táblázat (csak online elérhető)). A megfigyelések körülbelül 2%-ában hiányoztak az értékek az egyes patakfolyások feletti lefolyóhálózatokra összegzett változók esetében (elsősorban StreamCat-adatok). Az R programozási környezetben27 a Multivariate Imputation by Chained Equation (MICE) csomagot használtuk a hiányzó változók legvalószínűbb értékeinek becsléséhez a többi változóra vonatkozó értékek alapján. Minden egyes hiányzó értékkel rendelkező változóhoz megadtunk egy bináris mátrixot, amely jelezte, hogy az imputálás során a hiányzó értékek becsléséhez a prediktoroknak melyik részhalmazát kell használni. Minden egyes hiányos változóra külön Predictive Mean Matching modelleket fejlesztettünk ki27.
Méret
A többi osztályhoz képest a méretre és a gradiensre vonatkozó osztályozási sémák kidolgozása nem támaszkodott in situ megfigyelésekre vagy prediktív modellfejlesztésre (pl. hidrológia). Az NHDPlus V2 adatállományon keresztül elérhető két méret szempontjából releváns változót használtunk fel a patakok méretének alternatív osztályozásához: Strahler-patakrend és az átlagos éves lefolyás (a minimális emberi hatásra jellemző körülményekre jellemző). A patakok rendje a patakok környezetének dendritikus jellegét mutatja28 , és általában arra használják, hogy jellemezzék a patakméretek gyakorisági eloszlását nagy régiókban vagy globálisan29. A patakok rendezettségének azonban az a korlátja, hogy a rendezettséget befolyásolhatja a feltérképezett vízrajz léptéke30 , és a lefolyás nagymértékben változhat az egyes éghajlati rendszerekben egy adott rend esetében. Hasonlóképpen, a vízgyűjtő terület használata a méret jellemzésére szintén problematikus lehet, mivel az egységnyi területre jutó vízhozam szintén drámai mértékben változik a nagymértékben eltérő éghajlatú régiókban30. Alternatív megoldásként egy patak mérete az általa szállított vízhozam alapján is jellemezhető. Ehhez azonban meg kell határozni egy szabványosított megközelítést az osztályok vízhozam alapján történő felosztására. Mivel a patakok szerveződését szabályozó geometriai törvények (pl. gyakoriság, patakhossz, vízgyűjtő terület) a patakok rendezettségén alapulnak31 , a rendezettség univerzális fizikai sablont biztosít a kontinensek nagy eltéréseinek egységes küszöbértékek alapján történő felosztásához. A vízhozam-alapú méretosztályozás kialakításához kiszámítottuk az összes NHDPlus V2 vízfolyás medián vízhozamát a Strahler-patak rendje szerint, majd az ezen értékek közötti középpontokat használtuk a vízhozam-áttörések mint méretosztály-küszöbértékek létrehozásához. (Megjegyzés: a hidrológiai osztályozásban használt változókat az átlagos éves lefolyással szabványosítottuk, így a folyóméret nem befolyásolja őket.)
Gradient
A gradiens értékeket (azaz a patakmeder meredekségét) szintén az NHDPlus V2 áramvonalainak attribútumaként adtuk meg. A patak meredekségét minden egyes áramvonal esetében a magassági emelkedés és a patakvonal távolságának arányaként mértük32. A simított magassági adatokat az ország 10 méteres digitális magassági modelljeiből (DEM) származtatták. A legnagyobb és legkisebb magasságokat használták az emelkedés meghatározásához, amelyet elosztottak az áramlási vonal teljes hosszával. Tudomásunk szerint a legszélesebb körben használt lejtési küszöbértékeket Rosgen4 adja meg, aki a lejtés, a szélesség-mélység arány, a süllyedés és a kanyargás alapján különbözteti meg a csatornamorfológiákat. Több patakosztályozási kísérlet is ezekre a gradiens küszöbértékekre támaszkodott az osztályok felosztásakor6,9,25. Mi ezeket a töréseket vettük át a gradiens típusok kialakításához, és ezeket térképeztük fel a patakfolyásokhoz.
Hidrológia
Az elmúlt két évtizedben számos hidrológiai osztályozást dolgoztak ki regionális és globális léptékben a patakok vízhozamát figyelő állomások diszkrét megfigyeléseiből2,18,33. Általában az induktív hidrológiai osztályozások kidolgozásához össze kell állítani a vízhozam helyszíni megfigyeléseit, a vízhozamot hidrológiai statisztikákba kell foglalni, majd a megfigyeléseket a hidrológiai tulajdonságok hasonlóságai alapján csoportosítani kell22. A közelmúltban McManamay és munkatársai34 az USA egész területére hidrológiai osztályozást dolgoztak ki a US Geological Survey (USGS) 2600 patakgyűjtő állomásán mért természetes vízhozam-mintázatok alapján, ahol a felsőbb vízgyűjtők az adott régió legkevésbé zavart állapotát képviselik. A 110 hidrológiai statisztika 13 komponensre bontását követően a főkomponens-elemzés (Principal Components Analysis, PCA) segítségével a patakvízmérőket valószínűségi alapon 15 hidrológiai osztályba sorolták a Bayes-féle következtetés segítségével meghatározott optimális Gauss-féle kevert modell klaszterezési algoritmusok segítségével34. Ezek az osztályok a hidrológiai mintázatok változását képviselik, nem pedig a lefolyás mennyiségének változását, mivel a PCA és a klaszterezés előtt minden nagyságrenddel kapcsolatos hidrológiai statisztikát a napi középárammal standardizáltak.
Az osztályozásnak ez a homályos stílusa (azaz a lágy klaszterezés) rugalmas, mivel a patakokat úgy jellemzi, mint amelyek elméletileg több klaszterhez is tartoznak33,35 . Ezzel szemben a “kemény” klaszterezési technikák, például a távolságalapú hierarchikus agglomeratív módszerek (pl. Ward módszere)36 viszonylag egyszerűek, könnyebben érthetőek, és egymásba ágyazott és éles tagozásokat eredményeznek22. Ezért a Ward-féle agglomeratív módszert használtuk a 2600 USGS-patakmérő klaszterezésére a 13 PC-pontszám alapján, majd a dendrogram vizuális vizsgálata alapján egy sor optimális klaszterszámot határoztunk meg.
Az összes USGS-patakmérőt térbelileg összekapcsoltuk az NHDPlus V2 patakfolyókkal. A 2. táblázatban szereplő (csak online elérhető) prediktorváltozók segítségével véletlen erdő osztályozási modelleket37 készítettünk az R programozási környezetben a hidrológiai osztályhoz tartozás előrejelzésére, majd a hidrológiai osztályokat extrapoláltuk az összes NHDPlus V2 patakmederre.
Hőmérséklet
A hidrológiához képest a hőmérsékleti osztályozások kevésbé gyakoriak3,38,39, valószínűleg a vízhozamhoz képest ritkább hőmérsékleti adatok miatt. A közelmúltban Maheu és munkatársai3 az Egyesült Államokban mintegy 130 (a referenciaállapotokat reprezentáló) mérőállomást csoportosítottak különböző típusú hőmérsékleti rezsimekbe több, a nagyságrendet és a változásokat leíró statisztika alapján. Ez a többváltozós megközelítés többváltozós alternatívát nyújt az általunk létrehozott egyváltozós nyári hőmérsékleti osztályokhoz képest. A Maheu et al. osztályozásban használt mérőműszerek helyét a szerzőktől szereztük be, és térbelileg összekapcsoltuk az NHDPlus V2 folyamszakaszokkal. A 65 prediktor változót használva véletlen erdőmodellt dolgoztunk ki a Maheu et al. osztályokhoz a patakfolyásokhoz az Egyesült Államokban. Mivel a hőmérséklet a folyó méretének függvénye, kizártuk a Qwsa-t a modellből (azaz az átlagos éves vízhozamot osztva a vízgyűjtő területtel).
Alternatívaként egy egyszerű hőmérsékleti osztályozást dolgoztunk ki a természetben előforduló nyári átlagos vízhőmérsékleti értékek alapján. Több tanulmány is arra utal, hogy a patakok eltérő hőmérsékleti rendszereit elsősorban a nyári hőmérsékleti értékek (júliusi-augusztusi átlagok) természetes változása befolyásolja3,40,41 . Emellett a nyári hőmérsékleti értékek a legkönnyebben hozzáférhető adatok közé tartoznak a nyilvános és nem nyilvános forrásokból. Összegyűjtöttük a patakok vízhőmérsékleti adatait 5907 helyszínre vonatkozóan több forrásból, beleértve a Deweber & Wagner41 (n = 2893), Hill et al.40 (n = 566), az USGS napi feljegyzésekkel rendelkező mérőműszerei (n = 2184), az USGS szezonális terepi megfigyelése (n = 240), valamint az ügynökségek által telepített loggerekből származó egyéb hőmérsékleti adatok (n = 24) (1. táblázat). A hőmérsékleti adatok megfelelő rekordhosszának meghatározásához egyensúlyt kellett teremteni a július-augusztusi átlagok bizonytalanságának minimalizálása és a megfelelő regionális reprezentációhoz szükséges túl kevés minta között. Jones és Schmidt42 például ajánlásokat adott a hőháztartási rendszer mérőszámainak becsléséhez szükséges bizonytalanság megfelelő minimalizálásához szükséges rekordhosszra vonatkozóan; ennek az iránymutatásnak a követése azonban csak a fenti USGS rekordokat (n = 2424) 70-90%-kal csökkentette volna. Továbbá Jones és Schmidt értékelése havi maximumokat, minimumokat és tartományi mérőszámokat tartalmazott, míg a mi elemzésünk egy durvább kéthavi átlagos mérőszámra támaszkodott (július-augusztus), amelyet kevésbé tartunk érzékenynek az évenkénti ingadozásokra, mint a hőmérsékleti szélsőértékeket (Supplementary File 1). Az Egyesült Államokban található 22 USGS-mérőállomás, valamint a Jones és Schmidt-féle megbízhatósági sávok felhasználásával úgy becsüljük, hogy 1-2 évszak adatai megbízhatóan, 80%-os, illetve 90%-os megbízhatósággal 1 °C-on belül becsülhetik meg a július-augusztusi átlaghőmérsékletet (Supplementary File 1). Átvizsgáltuk a helyszíneket, hogy megbizonyosodjunk arról, hogy a nyilvántartási időszak 1995 és 2015 közé esik, és az adatok legalább 60 egymást követő júliusi és augusztusi napra rendelkezésre állnak.
Minden hőmérsékleti helyszínt térben összekapcsoltunk az NHDPlus V2 patakmedrekkel. Ezután meghatároztuk a megfigyelési helyek referenciafeltételeit a földterületek zavarásának és a felső folyásirányú gátszabályozásnak a mutatói alapján. A szárazföldi zavarást a National Fish Habitat Partnership (NFHP) 2015-ös élőhelyértékelésének segítségével értékeltük, amely az NHDPlus patakmeder szakaszain belül az élőhely romlását a “nagyon alacsony” és a “nagyon magas” zavarás közötti pontszámokkal értékeli43. A duzzasztógátak által a folyásirány feletti szabályozás mértékét a StreamCat által megadott szabályozás mértékének (DOR) (a folyásirány feletti gátak által tárolt éves vízhozam %-ának)44 segítségével értékeltük. A “nagyon alacsony” vagy “alacsony” kockázatértékelési pontszámmal és DOR < 4%-kal (ami a tározók csekély befolyását jelzi44,45) rendelkező hőmérséklet-monitorozó állomásokat a referenciaállapotok szempontjából reprezentatívnak határoztuk meg, ami 1764 olyan helyet eredményezett, amelyek szintén megfeleltek a rekordhosszúsági kritériumainknak. Ezek közül a megfigyelések 70%-a Deweber & Wagner41 (n = 1211) vagy Hill et al.40 (n = 33) megfigyeléseiből származott. A fennmaradó 520 megfigyelés 71,7%-a rendelkezett legalább 2 évszakra vonatkozó adatokkal.
A fenti prediktoregyüttes felhasználásával véletlen erdőket alakítottunk ki a referenciahelyek nyári hőmérsékletének előrejelzésére, majd ezeket az értékeket extrapoláltuk az összes NHD patakmederre. Az amerikai vízhőmérsékletek gyakorisági eloszlásának töréseit használtuk a nyári hőmérsékletek osztályokra történő felosztásához. Az összes patakmederre vonatkozó becsült nyári hőmérsékleti értékek felhasználásával a Jenks-féle Natural Breaks46 eljárást alkalmaztuk a hőmérséklet 2-20 osztályra történő felosztására, majd az optimális illeszkedés és a táblázatos pontosság alapján határoztuk meg az információk többségét magyarázó legegyszerűbb osztályok számát. Az osztályok fizikai alapú felosztására szolgáló indokolt megközelítés hiányában a Jenks-módszer optimális a térbeli információk egyváltozós klaszterezéséhez, mivel az osztályokon belüli variáció minimalizálására törekszik, miközben maximalizálja az osztályok közötti varianciát46.
Hálózati elágazás
Mivel a patakméret az ökológiai funkciók hosszirányú változását ragadja meg a patak kontinuuma mentén15 , a mellékfolyók csomópontjai és a patakok eltérései is fontosak, mivel ezek a hosszirányú folyamatokban szakadásokat hoznak létre47. A patakok csomópontjai, különösen a csomópontokat alkotó patakok eltérő mérete nagy hatással van az élőhelyekre és a biológiai sokféleségre48. Emellett az ökológiai közösségek összetétele drámaian megváltozhat a patakok csomópontjainak közelségével49. A hálózati konfigurációk és az eltérési helyzetek különbségeinek megragadására két elágazási osztályt hoztunk létre. Először olyan osztályokat hoztunk létre, amelyek figyelembe vették az egyes folyamszakaszok felső végén összefolyást alkotó mellékfolyók különböző méretű kombinációit. Másodszor, olyan osztályokat hoztunk létre, amelyek jelzik, hogy a patakszakaszok fő- vagy másodlagos csatornának minősülnek az elválások alatt, és ahol a patakok áramlást kapnak a feljebb lévő elválásokból.
A legtöbb egyedi patakszakasz az NHDplus V2 adatállományban a folyóhálózatoknak a patakok eredete, a mellékfolyók összefolyásai, valamint a tavakkal és víztározókkal való kereszteződések által meghatározott külön hidrológiai jellemzőit képviseli50. Az NHDplus V2 folyamszakaszok közötti topológiai kapcsolatokat egy “from-to” táblázat tartalmazza, amely meghatározza az adott szakaszhoz hozzájáruló felső folyásirányt (azaz from) és az áramlást fogadó alsó folyásirányt (azaz to). A “from-to” táblázat segítségével a különböző Strahler-folyórendek kombinációit az egyes folyók folyásirány felöli végén kombinálták, hogy egy mellékfolyó-főfolyó kombinációt hozzanak létre. Például egy 1. rendű és egy 2. rendű mellékfolyó összefolyása egy 2. rendű rendszer felső folyásirányú végén a következő osztályt eredményezi: 2.12 (1a. ábra). Az esetek többségében csak 2 mellékfolyó fordult elő a folyásirányban. Ritka esetekben vagy divergenciahelyzetekben azonban 3 vagy több mellékfolyó egyesül egy folyószakasz fölött a folyásirányban, és ilyenkor akár négy, a folyásirányban felfelé haladó rendet is figyelembe vettünk (pl. 1b. ábra, 5.511). Néhány esetben a patakfolyásokba több, a folyásirányban felfelé haladó csatornadivergenciából érkezik áramlás, azaz egy folyószakasz két vagy több csatornára válik szét a folyásirányban (1c. ábra). Mivel ezek a csatornák patakrendet kapnak, és olyan csomópontokat hoznak létre, amelyek a mellékfolyók összefolyásait utánozzák, a hálózati elágazások osztályozása megköveteli, hogy a csatornadivergenciákat az összefolyások egyik típusának tekintsük. A csatornák szétágazása esetén az NHDplus V2 fő- (D1) vagy másodlagos (D2) csatornaként jelöli ki a szakaszokat (1c. ábra). A csatornadivergenciák (DU) összefolyásai alatt közvetlenül elhelyezkedő patakszakaszok azonosítására a “from-to” táblázatot használtuk, hogy megkülönböztessük ezeket a mellékfolyók összefolyásaitól. Miután figyelembe vettük ezeket az eltéréseket, megfigyeltük a nem értelmes mellékfolyó-összefutási helyzeteket (pl. 5_5.5), amelyek azért keletkeztek, mert az NHDplus V2 nem jelölte megfelelően a csatornadivergenciák minden helyzetét. Mivel nehéz volt meghatározni, hogy az egyes ilyen szakaszok divergens csatornák vagy divergens csatornákból áramlást fogadó szakaszok voltak-e, ezeket a szakaszokat egy általános divergens osztályba (D) soroltuk.
Bár az NHDPlus V2-ben a legtöbb mellékfolyó-csomópont hidrológiailag releváns, a folyók csomópontjainak egy része a digitalizálás során nem értelmes pontokon, például a négyszögtérképek határainál szétvált50 (1d. ábra). A bifurkációs osztályok és divergenciák esetében ezek a felosztások nem értelmes csomópontokhoz vezetnének. Ezen esetek korrigálására Wieferich és munkatársai51 elkészítettek egy ökológiai szakaszazonosító táblázatot, amely a felosztott szakaszokat közös ökológiai azonosítókhoz rendelte. Ezekben az esetekben az azonos ökológiai egységhez tartozó összes folyószakaszt a legfeljebb fekvő folyószakasz bifurkációs és divergencia osztályával jelöltük ki (1d. ábra).
Völgyzáródás
A folyók és árterük közötti kölcsönhatás erősségét jelzi, hogy a völgyek milyen mértékben szabályozzák a folyócsatornák oldalirányú vándorlását. Az ArcMap 10.3 programban a Valley Confinement Algorithm (VCA) eszköz52 segítségével az összes NHDPlus V2 patakmederre vonatkozóan lehatároltuk a nem korlátozott völgyfenékeket (azaz poligonokat). A VCA egy empirikus függvény segítségével becsüli meg a patakmeder teljes mélységét, amely a regionális csapadékadatokon (http://www.prism.oregonstate.edu/normals) és a vízgyűjtő területen alapul minden egyes patakmeder esetében53. Nagle et al.52 az árvízmagasság meghatározásához az 5x-es partteljesítési mélységet javasolta, amit mi is megfelelőnek tartottunk, tekintettel az NHDplus térbeli felbontására és a környező domborzatra vonatkozó 30 m-es DEM-adatokra (https://nationalmap.gov/elevation.html). A DEM-ek segítségével jellemzett környező domborzat alapján a VCA program egy algoritmust használt az árvízmagasság és a környező domboldal metszésére. A víztesteket használták, hogy elkerüljék a völgytalpak lehatárolását az elöntött területeken.
Ahol a völgytalpak lehatárolásra kerültek, küszöbértékek szükségesek a patakok szakaszainak nem korlátozott, korlátozott vagy köztes szintre történő besorolásához. Előfordulhat például, hogy egy völgytalp nem öleli fel a teljes patakszakaszt, vagy oldalirányban nem terjed ki eléggé a patakpartokon túl ahhoz, hogy a völgytalp nem zártnak minősüljön. Ehhez a folyó szélességének becslésére van szükség minden egyes patakszakasz esetében. Összegyűjtöttük mind a helyszíni terepi, mind a távérzékelési megfigyeléseket >52 000 helyszínről, hogy empirikus modellt dolgozzunk ki a folyószélesség előrejelzésére az összes folyószakaszra a kontinentális államokban. A folyószélesség helyszíni megfigyeléseit az Environmental Protection Agency’s National Rivers and Streams Assessment (n = 852) (https://www.epa.gov/national-aquatic-resource-surveys/nrsa), a patakszélességek irodalmi áttekintése (n = 243)29 és a North American River Width Data Set (n = 50 230) (http://gaia.geosci.unc.edu/NARWidth/) adataiból nyertük. Ezek az adatkészletek azonban nagyrészt kihagyták a kis forrásvizű patakokat és az időszakos rendszereket. Annak biztosítása érdekében, hogy e pataktípusok szélességét megfelelően becsüljük meg, a patakmedreket méret szerint rétegeztük (lásd: méret szerinti osztályozás), és egy véletlenszerű részhalmazt (n = 407) választottunk ki az USA teljes patakmeder-populációjából. Légi felvételek segítségével becsültük meg a folyó szélességét az egyes szakaszok középpontjában, felfelé és lefelé eső végein, majd kiszámítottuk az átlagos szélességet. Véletlen erdőmodelleket használtak a folyószélesség előrejelzésére és a becsléseknek az összes folyószakaszra való extrapolálására. A folyószélesség becsléseket ezután poligonpufferek létrehozására használtuk az összes patakvonal körül.
A folyók szélességét és a völgyfenékeket egymásra helyeztük, hogy meghatározzuk a völgyek korlátozottsági állapotát. Hall et al.53 a patakmedreket korlátlannak tekintette, ha az árterületi völgy szélessége legalább négyszerese az árterületi szélességnek, míg a mérsékelt árterületi kölcsönhatással rendelkező patakcsatornáknál az árterületi és a teljes folyómeder szélességének aránya >24. Az árterek oldalirányú kiterjedésén túlmenően a bezártság értékeléséhez a völgytalpak által lefedett patakmedrek hosszának vizsgálatára is szükség volt. A patakszakaszokat akkor minősítettük “nem korlátozottnak”, ha a patakszakasz hosszának legalább 50%-át völgytalp borította, és szélessége legalább négyszerese volt a folyó szélességének. A “mérsékelten korlátozott” patakszakaszok olyan völgytalpakkal rendelkeztek, amelyek szélessége >4x a folyó szélessége, de csak a patakszakasz hosszának 25-50%-át fedték le, vagy ha a patak hosszának több mint 50%-át fedték le, a völgytalpak árterület:folyó szélesség aránya 2 és 4 között volt. Az összes többi patakszakaszt “szűknek” minősítették.