Overview of approach
Within the SCS, stream habitat building blocks are represented as a series of layers, each of which represent different categories of physical characteristics (e.g., size, gradient). Każda warstwa składa się z wielu klas (np. wody źródłowe, potoki, niski gradient, wysoki gradient). Warstwy zostały skonstruowane przy użyciu podejścia indukcyjnego opartego na wzorcach w danych empirycznych, w przeciwieństwie do podejścia dedukcyjnego opartego na regionalizacji krajobrazu. Źródła danych empirycznych wykorzystanych do określenia klas strumieni podano w Tabeli 1. Dzięki wcześniejszym analizom i zapytaniom ze strony konserwatorów i ekologów strumieni6,25, wybraliśmy sześć warstw siedliska strumienia, które można odwzorować z rozdzielczością zasięgu strumienia i które, jak się przypuszcza, wywierają silny wpływ na funkcję ekologiczną i skład zbiorowisk ekologicznych. Należały do nich (w kolejności malejącego znaczenia ekologicznego): wielkość, gradient, hydrologia, temperatura, rozwidlenie sieci strumieni i ograniczenie doliny.
Głównym czynnikiem branym pod uwagę przy wyborze warstw i określaniu podziałów między klasami była dostępność udokumentowanych metod podejścia do klasyfikacji i progów między klasami. Dlatego preferencyjnie wybieraliśmy warstwy wspierane przez wcześniej istniejące i opublikowane klasyfikacje lub, jeśli wcześniejsze klasyfikacje były niedostępne, opieraliśmy się na literaturze w celu określenia przerw i progów podziału wartości (np. gradientu) na klasy, jeśli były dostępne. Ponieważ na wyniki klasyfikacji ma wpływ zastosowane podejście, użyliśmy wielu alternatywnych podejść, jeśli były dostępne, do opracowania klas w obrębie warstw.
Kompilacja zmiennych predykcyjnych
Informacje o wielkości, gradiencie i rozwidleniu sieci zostały zaczerpnięte ze zbioru danych NHDPlus V2. Jednak dyskretne obserwacje in situ dotyczące hydrologii, temperatury i charakterystyki koryta rzeki (ograniczenie doliny) wymagały opracowania modeli ekstrapolacji tych klas na poziom zasięgu strumienia. Zebrano łącznie 66 zmiennych krajobrazowych, klimatycznych, topograficznych i glebowych dla zlewni zasilających każdą stację pomiarową strumienia oraz dla całej sieci zlewni przed każdym zasięgiem strumienia w USA (Tabela 2 (dostępna tylko online)). Spośród nich 44 pochodziły z bazy danych Stream Cat26 (https://www.epa.gov/national-aquatic-resource-surveys/streamcat), 21 ze zbioru danych NHDPlus V2, a jedna z WorldClim (http://worldclim.org/version2) (Tabela 2 (dostępna tylko online)). W około 2% obserwacji brakowało wartości dla zmiennych podsumowanych dla sieci drenażowych powyżej każdego zasięgu strumienia (głównie dane StreamCat). Wykorzystaliśmy pakiet Multivariate Imputation by Chained Equation (MICE) w środowisku programistycznym R27 do oszacowania najbardziej prawdopodobnych wartości dla brakujących zmiennych na podstawie wartości obecnych dla innych zmiennych. Dla każdej zmiennej z brakującymi wartościami określiliśmy macierz binarną wskazującą, który podzbiór predyktorów powinien być użyty do oszacowania brakujących wartości podczas imputacji. Dla każdej niekompletnej zmiennej opracowano oddzielne modele Predictive Mean Matching27.
Rozmiar
W porównaniu z innymi klasami, opracowanie schematów klasyfikacji dla rozmiaru i gradientu nie opierało się na obserwacjach in situ lub opracowaniu modeli predykcyjnych (np. hydrologicznych). Wykorzystaliśmy dwie zmienne związane z wielkością, dostępne w zestawie danych NHDPlus V2, aby zapewnić alternatywne klasyfikacje wielkości strumienia: rząd strumienia Strahlera i średni roczny wypływ (reprezentatywny dla warunków minimalnego wpływu człowieka). Rzędność strumienia obrazuje dendrytyczny charakter środowisk strumieni28 i jest powszechnie stosowana do charakteryzowania rozkładu częstotliwości wielkości strumieni w dużych regionach lub globalnie29. Ograniczenia kolejności strumieni polegają jednak na tym, że na kolejność może wpływać skala odwzorowania hydrograficznego30 , a przepływy mogą być bardzo zróżnicowane w różnych reżimach klimatycznych dla danej kolejności. Podobnie, wykorzystanie obszaru zlewni do scharakteryzowania wielkości może być również problematyczne, ponieważ wielkość zrzutu na jednostkę powierzchni również będzie się drastycznie różnić w regionach o bardzo zróżnicowanym klimacie30. Alternatywnie, wielkość strumienia można scharakteryzować na podstawie przenoszonego przez niego przepływu. Wymaga to jednak określenia standardowego podejścia do podziału klas na podstawie przepływu. Ponieważ prawa geometryczne rządzące organizacją strumienia (np. częstotliwość, długość strumienia, obszar zlewni) opierają się na porządku strumienia31 , porządek stanowi uniwersalny fizyczny wzorzec podziału kontynentalnej dużej zmienności przepływu w oparciu o spójne wartości progowe. Aby opracować klasyfikację wielkości opartą na wyładowaniach, obliczyliśmy medianę wyładowań dla wszystkich osiągnięć strumieni NHDPlus V2 zgodnie z kolejnością strumieni Strahlera, a następnie użyliśmy punktów środkowych pomiędzy tymi wartościami do utworzenia przerw w wyładowaniach jako progów klasy wielkości. (Uwaga: zmienne używane w klasyfikacji hydrologicznej są standaryzowane przez średni roczny wypływ, a zatem nie ma na nie wpływu wielkość rzeki).
Gradient
Wartości gradientu (tj. nachylenia dna strumienia) zostały również dostarczone jako atrybut linii przepływu NHDPlus V2. Nachylenie strumienia zmierzono dla każdej linii przepływu jako stosunek wzrostu wysokości do odległości linii strumienia32. Wygładzone dane wysokościowe uzyskano z 10-m cyfrowych modeli wysokości (DEM) dla całego kraju. Maksymalne i minimalne wysokości zostały wykorzystane do określenia wzrostu, który został podzielony przez całkowitą długość linii przepływu. Zgodnie z naszą wiedzą, najszerzej stosowane progi gradientu zostały podane przez Rosgena4, który rozróżnia morfologie koryt na podstawie gradientu, stosunku szerokości do głębokości, zakorzenienia i sinusoidy. Wiele prób klasyfikacji strumieni również opierało się na tych progach gradientu w celu podzielenia klas6,9,25. Przyjęliśmy te podziały, aby opracować typy gradientów i zmapowaliśmy je do zasięgu strumienia.
Hydrologia
W ciągu ostatnich dwóch dekad liczne klasyfikacje hydrologiczne w skalach od regionalnej do globalnej zostały opracowane na podstawie dyskretnych obserwacji stacji monitorowania przepływu strumienia2,18,33. Ogólnie rzecz biorąc, opracowanie indukcyjnych klasyfikacji hydrologicznych wymaga zebrania obserwacji in situ dotyczących wypływu, podsumowania wypływu w statystykach hydrologicznych, a następnie zgrupowania obserwacji na podstawie podobieństw właściwości hydrologicznych22. Niedawno McManamay et al.34 opracowali klasyfikację hydrologiczną dla całych Stanów Zjednoczonych w oparciu o naturalne wzorce przepływu strumieni w 2600 stacjach pomiarowych strumieni US Geological Survey (USGS), przy czym zlewnie górnego biegu reprezentowały najmniej zaburzone warunki dla danego regionu. Po dekompozycji 110 statystyk hydrologicznych na 13 składowych wyników przy użyciu analizy głównych składowych (PCA), stacje pomiarowe strumienia zostały przyporządkowane probabilistycznie do jednej z 15 klas hydrologicznych przy użyciu optymalnych algorytmów grupowania gaussowskich modeli mieszanych określonych przy użyciu wnioskowania bayesowskiego34. Klasy te reprezentują zmienność w schematach hydrologicznych, w przeciwieństwie do zmienności w wielkości wyładowań, ponieważ wszystkie statystyki hydrologiczne związane z wielkością zostały znormalizowane przez średni przepływ dzienny przed PCA i grupowaniem.
Ten rozmyty styl klasyfikacji (tj. miękkie grupowanie) jest elastyczny w tym sensie, że charakteryzuje strumienie jako teoretycznie dzielące przynależność do wielu klastrów33,35. W przeciwieństwie do tego, „twarde” techniki klasteryzacji, takie jak oparte na odległości hierarchiczne metody aglomeracyjne (np. metoda Warda)36 , są stosunkowo proste, łatwiejsze do zrozumienia i dają zagnieżdżone i wyraźne członkostwo22. W związku z tym zastosowaliśmy metodę aglomeracyjną Warda do pogrupowania 2600 pomiarów USGS przy użyciu 13 wyników PC, a następnie określiliśmy serię optymalnych liczb klastrów w oparciu o wizualne badanie dendrogramu.
Wszystkie pomiary strumieni USGS zostały przestrzennie połączone z zasięgami strumieni NHDPlus V2. Wykorzystując zmienne predykcyjne z Tabeli 2 (dostępnej tylko online), skonstruowaliśmy modele klasyfikacyjne lasu losowego37 w środowisku programistycznym R, aby przewidzieć przynależność do klasy hydrologicznej, a następnie ekstrapolowaliśmy klasy hydrologiczne do wszystkich sięgaczy NHDPlus V2.
Temperatura
W porównaniu z hydrologią, klasyfikacje temperatury są mniej powszechne3,38,39, prawdopodobnie ze względu na rzadsze dane dotyczące temperatury w porównaniu z wyładowaniami. Ostatnio Maheu et al.3 pogrupowali około 130 stacji pomiarowych (reprezentatywnych dla warunków referencyjnych) na terenie USA w różne rodzaje reżimów termicznych na podstawie kilku statystyk opisujących wielkość i zmienność. To wielowymiarowe podejście stanowi wielowymiarową alternatywę dla jednoczynnikowych klas temperatury letniej, które wygenerowaliśmy. Lokalizacje punktów pomiarowych użytych w klasyfikacji Maheu et al. zostały uzyskane od autorów i połączone przestrzennie z zasięgami cieków NHDPlus V2. Używając 65 zmiennych predykcyjnych, stworzyliśmy model lasu losowego, aby klasy Maheu et al. dopasować do zasięgu potoku w całych Stanach Zjednoczonych. Ponieważ temperatura jest funkcją wielkości rzeki, wyłączyliśmy z modelu Qwsa (tj. średni roczny przepływ podzielony przez obszar zlewni).
Jako alternatywę, opracowaliśmy prostą klasyfikację temperatury opartą na naturalnie występujących średnich letnich wartościach temperatury wody. Liczne badania sugerują, że na rozbieżne reżimy termiczne w strumieniach wpływa przede wszystkim naturalna zmienność letnich wartości temperatury (średnie z lipca i sierpnia)3,40,41. Ponadto, wartości temperatury w okresie letnim należą do najłatwiej dostępnych danych ze źródeł publicznych i niepublicznych. Zebraliśmy dane dotyczące temperatury wody w strumieniu dla 5 907 miejsc z wielu źródeł, w tym Deweber & Wagner41 (n = 2893), Hill et al.40 (n = 566), przyrządy pomiarowe USGS z zapisami dziennymi (n = 2184), sezonowy monitoring terenowy USGS (n = 240) i inne dane temperaturowe z rejestratorów rozmieszczonych przez agencje (n = 24) (Tabela 1). Określenie odpowiedniej długości zapisu dla danych temperatury wymagało znalezienia równowagi między minimalizacją niepewności w średnich lipcowo-sierpniowych a zbyt małą liczbą próbek dla odpowiedniej reprezentacji regionalnej. Na przykład, Jones i Schmidt42 przedstawili zalecenia dotyczące długości zapisów wymaganych do odpowiedniego zminimalizowania niepewności w szacowaniu metryk reżimu termicznego; jednak zastosowanie się do tych wskazówek spowodowałoby zmniejszenie powyższych zapisów USGS (n = 2424) o 70 do 90%. Ponadto, ocena Jonesa i Schmidta obejmowała miesięczne maksima, minima i zakresy, podczas gdy nasza analiza opierała się na grubszej metryce średniej dwumiesięcznej (lipiec-sierpień), którą uważamy za mniej podatną na zmienność z roku na rok niż ekstrema temperatury (Dodatkowy Plik 1). Korzystając z 22 pomiarów USGS w USA i przedziałów ufności Jonesa i Schmidta, szacujemy, że 1-2 sezony danych mogą wiarygodnie oszacować średnie temperatury lipca-sierpnia w granicach 1°C przy 80% i 90% pewności, odpowiednio (Dodatkowy Plik 1). Sprawdziliśmy miejsca, aby upewnić się, że okres zapisu przypadł na lata 1995-2015, a dane były dostępne przez co najmniej 60 kolejnych dni w lipcu i sierpniu.
Wszystkie miejsca pomiaru temperatury zostały przestrzennie połączone z zasięgiem strumienia NHDPlus V2. Następnie określiliśmy warunki referencyjne dla miejsc monitorowania przy użyciu wskaźników zaburzeń terenu i regulacji zapór w górnym biegu rzeki. Zaburzenia terenu zostały ocenione przy użyciu oceny siedlisk National Fish Habitat Partnership (NFHP) z 2015 roku, która dostarcza oceny degradacji siedlisk w zakresie od „bardzo niskich” do „bardzo wysokich” zaburzeń w segmentach zasięgu cieków NHDPlus43. Oceniliśmy stopień regulacji w górnym biegu rzeki przez zbiorniki retencyjne, wykorzystując stopień regulacji (DOR) (% rocznego przepływu zmagazynowanego przez tamy w górnym biegu rzeki)44 , dostarczony przez StreamCat. Stacje monitorowania temperatury z oceną ryzyka jako „bardzo niskie” lub „niskie” i DOR < 4% (wskazujące niewielki wpływ zbiorników44,45) zostały uznane za reprezentatywne dla warunków referencyjnych, co dało 1764 miejsca, które również spełniały nasze kryteria długości rekordu. Spośród nich, 70% obserwacji uzyskano od Dewebera & Wagnera41 (n = 1211) lub Hilla et al.40 (n = 33). Z pozostałych 520 obserwacji, 71,7% miało co najmniej 2 sezony danych.
Używając tego samego zespołu predyktorów powyżej, opracowaliśmy lasy losowe do przewidywania temperatur letnich dla miejsc referencyjnych, a następnie ekstrapolowaliśmy te wartości na wszystkie cieki NHD. Wykorzystaliśmy przerwy w rozkładzie częstotliwości temperatur wody w USA, aby podzielić temperatury letnie na klasy. Używając oszacowanych wartości temperatury w okresie letnim dla wszystkich cieków, użyliśmy procedury Jenksa Natural Breaks46 , aby podzielić temperatury na 2 do 20 klas, a następnie oparliśmy się na optymalnej dobroci dopasowania i dokładności tabelarycznej, aby określić najbardziej symetryczną liczbę klas wyjaśniających większość informacji. W przypadku braku uzasadnionego podejścia do fizycznego podziału klas, metoda Jenksa jest optymalna dla jednoczynnikowego grupowania informacji przestrzennej, ponieważ dąży do minimalizacji wariancji w obrębie klas przy jednoczesnej maksymalizacji wariancji między klasami46.
Bifurkacja sieci
Whereas stream size capttures the longitudinal variation of ecological functions along a stream’s continuum15 , tributary junctions and stream divergences are also important as they create discontinuities in longitudinal processes47. Połączenia strumieni, a zwłaszcza zróżnicowane rozmiary strumieni, które tworzą połączenia, mają duży wpływ na siedlisko i różnorodność biologiczną48. Ponadto skład zbiorowisk ekologicznych może się drastycznie zmieniać w zależności od bliskości węzłów potoków49. Aby uchwycić różnice w konfiguracji sieci i sytuacje rozbieżności, stworzyliśmy dwie klasy bifurkacji. Po pierwsze, stworzyliśmy klasy, które uwzględniały różne kombinacje wielkości dopływów tworzących konfluencję na górnym końcu każdego zasięgu strumienia. Po drugie, stworzyliśmy klasy wskazujące zasięgi potoków jako główne lub wtórne kanały poniżej rozejść i gdzie potoki otrzymały przepływ z rozejść w górę rzeki.
Większość pojedynczych zasięgów potoków w zbiorze danych NHDplus V2 reprezentuje odrębne cechy hydrologiczne sieci rzecznych określonych przez początki potoków, zbiegi dopływów i skrzyżowania z jeziorami i zbiornikami50. Topologiczne relacje między zasięgami strumieni NHDplus V2 są przedstawione w tabeli „od-do”, definiującej zasięg w górę rzeki przyczyniający się do danego zasięgu (tj. od) i zasięg w dół rzeki odbierający przepływ (tj. do). Korzystając z tabeli „od-do”, kombinacje różnych rzędów strumieni Strahlera w górnym końcu każdego zasięgu zostały połączone w celu utworzenia kombinacji dopływ – główny ciek. Na przykład połączenie dopływów 1. rzędu i 2. rzędu na górnym końcu systemu 2. rzędu dałoby następującą klasę: 2.12 (ryc. 1a). W większości przypadków w górnym biegu rzeki występowały tylko dwa dopływy. Jednak w rzadkich przypadkach lub sytuacjach rozbieżności, 3 lub więcej dopływów łączy się w górę rzeki powyżej zasięgu i uwzględniliśmy do czterech rzędnych w górę rzeki (np. Rys. 1b, 5.511). W niektórych przypadkach cieki otrzymują przepływ z wielu rozgałęzień kanałów w górę rzeki, tj. podziałów jednego cieku na dwa lub więcej kanałów w kierunku w dół rzeki (Ryc. 1c). Ponieważ kanały te mają przypisany rząd strumienia i tworzą skrzyżowania, które naśladują zbiegi dopływów, klasyfikacja rozwidlenia sieci wymaga uwzględnienia rozejść kanałów jako rodzaju zbiegu. W przypadkach rozbieżności kanałów, NHDplus V2 wyznacza się jako kanały główne (D1) lub drugorzędne (D2) (Ryc. 1c). Wykorzystaliśmy tabelę od-do do zidentyfikowania cieków, które znajdowały się bezpośrednio poniżej zbiegu rozbieżności kanałów (DU), aby odróżnić je od zbiegu dopływów. Po uwzględnieniu tych rozbieżności, zaobserwowaliśmy sytuacje bezsensownych połączeń dopływów (np. 5_5.5), które powstały, ponieważ NHDplus V2 nie oznaczył odpowiednio wszystkich sytuacji rozbieżności kanałów. Ponieważ trudno było określić, czy każdy z tych dopływów był rozbieżnym kanałem, czy też dopływem otrzymującym przepływ z rozbieżnych kanałów, przypisaliśmy te dopływy do ogólnej klasy rozbieżności (D).
Pomimo, że większość węzłów dopływów w NHDPlus V2 jest istotna hydrologicznie, podzbiór węzłów zasięgu został rozdzielony podczas digitalizacji w nieistotnych punktach, takich jak granice map kwadrantowych50 (Ryc. 1d). W przypadku klas bifurkacji i dywergencji, podziały te doprowadziłyby do powstania niesensownych węzłów. Aby skorygować te przypadki, Wieferich et al.51 stworzyli Ecological Reach Identification Table, która przypisała rozdzielone sięgacze do wspólnych identyfikatorów ekologicznych. W tych przypadkach przypisaliśmy wszystkim sięgnięciom należącym do tej samej jednostki ekologicznej klasę bifurkacji i dywergencji najbardziej wysuniętego w górę rzeki sięgnięcia (Ryc. 1d).
Valley Confinement
Stopień, w jakim doliny kontrolują boczną migrację koryt rzecznych, wskazuje na siłę interakcji między rzekami a ich terenami zalewowymi. Wyznaczyliśmy nieograniczone dna dolin (tj. wielokąty) dla wszystkich wyciąganych cieków NHDPlus V2 za pomocą narzędzia Valley Confinement Algorithm (VCA)52 w ArcMap 10.3. VCA szacuje głębokość brzegową koryta strumienia przy użyciu funkcji empirycznej opartej na regionalnych danych o opadach (http://www.prism.oregonstate.edu/normals) i obszarze zlewni dla każdego cieku53. Nagle et al.52 zasugerowali 5X głębokość brzegową w celu określenia wysokości powodzi, co również uznaliśmy za właściwe, biorąc pod uwagę rozdzielczość przestrzenną NHDplus i 30-m dane DEM (https://nationalmap.gov/elevation.html) dla otaczającej topografii. W oparciu o otaczający teren scharakteryzowany za pomocą DEM, program VCA użył algorytmu do przecięcia wysokości zalewu z otaczającym zboczem wzgórza. W celu uniknięcia wyznaczania dna doliny na obszarach zalewowych wykorzystano cieki wodne.
Po wyznaczeniu dna doliny wymagane są progi w celu sklasyfikowania biegu strumienia jako niezamkniętego, zamkniętego lub na poziomie pośrednim. Na przykład, dno doliny może nie obejmować całego biegu strumienia lub może nie rozciągać się na wystarczającą odległość poza brzegi strumienia, aby zostać sklasyfikowane jako niezamknięte. Wymaga to oszacowania szerokości rzeki dla każdego cieku. Zebraliśmy zarówno obserwacje terenowe in situ, jak i obserwacje teledetekcyjne z >52 000 miejsc, aby opracować model empiryczny do przewidywania szerokości rzeki dla wszystkich cieków w USA. Obserwacje terenowe szerokości rzek pochodzą z National Rivers and Streams Assessment Agencji Ochrony Środowiska (n = 852) (https://www.epa.gov/national-aquatic-resource-surveys/nrsa), przeglądu literatury na temat szerokości strumieni (n = 243)29 oraz North American River Width Data Set (n = 50 230) (http://gaia.geosci.unc.edu/NARWidth/). Jednak te zbiory danych w dużej mierze nie uwzględniały małych strumieni w wodach śródlądowych i systemów przerywanych. Aby upewnić się, że prawidłowo oszacowaliśmy szerokość dla tych typów strumieni, zasięgi strumieni zostały rozwarstwione według wielkości (patrz Klasyfikacja wielkości), a losowy podzbiór (n = 407) został wybrany z całej populacji zasięgów strumieni w USA. Zdjęcia lotnicze wykorzystano do oszacowania szerokości rzeki w środkowym punkcie, w górnym i dolnym biegu każdego cieku, a następnie do obliczenia średniej szerokości. Modele lasu losowego zostały wykorzystane do przewidywania szerokości rzeki i ekstrapolacji szacunków na wszystkie cieki. Szacunki szerokości rzeki zostały następnie wykorzystane do wygenerowania wielokątnych buforów wokół wszystkich linii potoków.
Nałożyliśmy na siebie szerokości rzek i dna dolin w celu określenia statusu ograniczenia doliny. Hall et al.53 uznali zasięg strumienia za nieograniczony, jeśli szerokość doliny zalewowej jest co najmniej czterokrotnie większa od szerokości, podczas gdy kanały strumieniowe o umiarkowanej interakcji z terenem zalewowym mają stosunek szerokości terenu zalewowego do szerokości dna doliny >24. Oprócz bocznego zasięgu terenów zalewowych, nasza ocena ograniczenia wymagała także zbadania długości każdego biegu strumienia pokrytego dnem doliny. Koryto strumienia sklasyfikowano jako „nie ograniczone”, jeśli dno doliny pokrywało co najmniej 50% długości koryta i miało szerokość co najmniej czterokrotnie większą od szerokości rzeki. „W przypadku umiarkowanie ograniczonych cieków dna dolin miały szerokość >4X szerokości rzeki, ale pokrywały tylko 25-50% długości cieku lub, jeśli pokrywały ponad 50% długości cieku, stosunek szerokości dna doliny do szerokości rzeki wynosił od 2 do 4. Wszystkie pozostałe odcinki potoków określono jako „ograniczone”.