Overview of approach
SCSでは、河川生息地の構成要素を一連の層として表現し、各層は異なるカテゴリーの物理特性(例:サイズ、傾斜)を表現しています。 各層は複数のクラス(例:水源地、小川、低勾配、高勾配)で構成されている。 層は、景観の地域化に依存する演繹的アプローチとは対照的に、経験的データのパターンに基づく帰納的アプローチによって構築された。 河川クラスを導き出すために使用した経験的データの出典は、表1に記載されています。 自然保護活動家や河川生態学者による過去のレビューや意見募集を通じて6,25、我々は、河川到達点の分解能でマッピングでき、生態系機能と生態系コミュニティ構成に強い影響を及ぼすと仮定される6つの河川生息地層を選択した。 これらは、(生態学的重要性の低い順に)サイズ、勾配、水文学、温度、ストリームネットワークの分岐、および谷の閉じ込めである。 したがって、既存の公開された分類によってサポートされている層を優先的に選択するか、または以前の分類が利用できない場合、利用可能な場合は、クラスに値 (例えば、勾配) を分割するための区切りおよび閾値を決定するために文献に依存しました。
予測変数のコンパイル
サイズ、勾配、ネットワークの分岐に関する情報は、NHDPlus V2データセットから得たものである。 しかし、水文学、気温、河道の特性(谷の閉じ込め)については、その場での個別の観測により、これらのクラスをストリームリーチレベルに外挿するためのモデルを開発する必要があった。 各河川ゲージングステーションに寄与する流域と、米国内のすべての河川到達点の上流にある流域ネットワーク全体について、合計66の景観、気候、地形、土壌変数を収集した(表2(オンライン版のみ))。 このうち44件はStream Catデータベース26 (https://www.epa.gov/national-aquatic-resource-surveys/streamcat)から、21件はNHDPlus V2データセットから、1件はWorldClim (http://worldclim.org/version2)から提供された(表2(オンライン版のみ))。 約2%の観測値において、各河川到達点より上の排水ネットワークについてまとめた変数の値が欠落していた(主にStreamCatデータ)。 我々は,Rプログラミング環境27のMultivariate Imputation by Chained Equation(MICE)パッケージを使用して,他の変数に存在する値に基づいて欠損変数の最確値を推定した. 欠損値を持つ各変数について,インピュテーションの際に欠損値を推定するために予測変数のどのサブセットを使用すべきかを示すバイナリ行列を指定した.
Size
他のクラスと比較して、サイズと傾斜の分類スキームの開発は、現場観測や予測モデルの開発(例えば、水文学)に依存していない。 NHDPlus V2データセットで利用可能なサイズに関連する2つの変数を使用して、河川サイズの代替分類を提供した。 ストレーラー流路次数と平均年間流出量(人的影響が最小である場合の代表値)である。 河川次数は、河川環境の樹枝状構造を表すものであり28 、広い地域または地球規模での河川規模の頻度分布の特徴を示すために一般的に用いられている29 。 しかし、流路次数の限界は、次数が地図上の水路図形の規模に影響される可能性があること30、および流出量が、ある次数の気候レジームによって大きく変化する可能性があることである。 同様に、単位面積当たりの流出量も、気候が大きく変化する地域間で大きな幅があるため、流域面積を使用して規模を特徴付けることも問題がある30。 代替案として、河川の規模は、流下する流量によって特徴づけることができる。 しかし、この場合、流出量に基づいてクラスを分割するための標準的なアプローチを決 定する必要がある。 河川の構成(頻度、流路長、流域面積など)を支配する幾何学的法則は、河川 の秩序に基づいているため31 、秩序は、一貫した閾値に基づいて大陸の様々な流量を分割 するための普遍的な物理テンプレートとなる。 流量に基づくサイズ分類を開発するために、NHDPlus V2のすべての流域の流量中央値をStrahlerの流路順序に従って計算し、これらの値の中点をサイズクラスの閾値として流量の区切りを作成する。 (
Gradient
勾配値(すなわち、河床勾配)もNHDPlus V2流線の属性として提供された。 勾配は、流線距離に対する標高の上昇の割合として、各流線について測定された32。 標高データは、全国の10mデジタル標高モデル(DEM)を用いて平滑化した。 最大標高と最小標高から上昇量を求め、これを流線の全長で割った。 私たちの知る限り、最も広く使用されている勾配の閾値は、Rosgen4が提供するもので、彼は、勾配、幅と深さの比、くぼみ、および洞察力に基づいて河道の形態を区別しています。 複数の河川分類の取り組みも、同様にクラスを分割するためにこれらの勾配閾値に依存している6,9,25。 2197>
水文学
過去20年間に、地域から地球規模まで、多くの水文学的分類が、河川流量モニタリングステーションによる個別の観測から開発されてきた2,18,33。 一般に、帰納的水文学分類の開発には、流量の原位置観測を集め、流量を水文学的統計量に要約し、水文学的特性の類似性に基づいて観測をクラスタリングすることが必要である22。 最近、McManamayら34 は、米国地質調査所(USGS)の2,600箇所の河川ゲージングステーションにおける自然流量のパターンに基づき、米国全体の水文学的分類を作成した。 主成分分析(PCA)を用いて110の水文統計量を13の成分スコアに分解した後、ベイズ推定34を用いて決定した最適なガウス混合モデルクラスター化アルゴリズムを用いて、河川ゲージを15の水文クラスのうちの1つに確率的に割り当てた。 これらのクラスは、流出量の変動とは対照的に、水文学的パターンの変動を表しており、すべてのマグニチュード関連の水文学的統計量は、PCAとクラスタリングの前に日平均流量で標準化されている。 対照的に、距離ベースの階層的凝集法(例えばWardの方法)36などの「ハード」クラスタリング技術は、比較的簡単で理解しやすく、入れ子で鮮明なメンバーシップを生成します22。 そこで、Wardの凝集法を用いて、13のPCスコアを用いて2600のUSGSゲージをクラスタリングし、デンドログラムの目視調査に基づいて一連の最適なクラスタ数を決定した
すべてのUSGS河川ゲージをNHDPlus V2流域と空間的に結合した。 表2(オンラインのみ)の予測変数を用いて、Rプログラミング環境でランダムフォレスト分類モデル37を構築し、水文クラスを予測し、すべてのNHDPlus V2ストリームリーチに水文クラスを外挿した。 最近、Maheuら3は、大きさと変動を記述するいくつかの統計に基づいて、米国内の約130のゲージ場(参照条件の代表)を異なるタイプの温度体制にグループ化した。 この多変量解析手法は、我々が作成した夏季の一変量気温分類に代わる多変量解析手法である。 Maheuらの分類に使用されたゲージの位置は著者から入手し、NHDPlus V2流域と空間的に結合した。 65の予測変数を用いて、ランダムフォレストモデルを開発し、Maheuらの分類をアメリカ全土の河川区間に適用した。 温度は河川規模の関数であるため、Qwsa(平均年間流量を流域面積で割ったもの)をモデルから除外した。
代替案として、自然に発生する夏の平均水温値に基づいて単純な温度分類を作成した。 複数の研究が、河川における多様な温度体制は、主に夏の水温(7-8月の平均)値の自然変動に影響されることを示唆している3,40,41。 さらに、夏季の水温値は、公的・非公的な情報源から最も容易に入手できるデータの一つである。 我々は、Deweber & Wagner41 (n = 2893), Hill et al.40 (n = 566), 日記録を持つUSGSゲージ (n = 2184), USGS季節フィールドモニタリング (n = 240), および機関が配置したロガーからのその他の温度データ (n = 24) など、複数のソースから5907サイトの河川水温データをまとめた(表 1)。 気温データの適切な記録長を決定するには、7~8月平均の不確実性を最小化することと、地域代表として適切なサンプル数を確保することの間でバランスを取る必要があった。 例えば、Jones and Schmidt42は、熱体制指標の推定における不確実性を適切に最小化するために必要な記録長に関する勧告を行ったが、この指針に従えば、上記のUSGSの記録(n = 2424)だけでも70~90%減少することになった。 さらに、JonesとSchmidtの評価では、月別の最大値、最小値、および範囲の測定基準が含まれていましたが、我々の分析では、より粗い2ヶ月ごとの平均測定基準(7-8月)に依存しており、気温の極値よりも年変動による影響を受けにくいと考えています(補足ファイル1)。 全米の22のUSGSゲージとJones and Schmidtの信頼帯を用いると、1-2シーズンのデータで7-8月の平均気温を1℃以内の信頼度でそれぞれ80%、90%推定できると考えられる(補足ファイル1)。 記録期間が1995年から2015年の間であり、7月と8月に少なくとも60日間連続してデータが得られていることを確認するため、サイトをスクリーニングした。 次に、土地の攪乱と上流のダム規制の指標を用いてモニタリング地点の参照条件を決定した。 土地の撹乱は、NHDPlusの河川区間内の「非常に低い」から「非常に高い」撹乱までの生息地劣化スコアを提供する、全米魚類生息地パートナーシップ(NFHP)2015生息地評価を用いて評価した43。 貯水池による上流調節の程度は、StreamCatが提供する調節度(DOR)(上流ダムの年間貯水量に対する割合)44を使用して評価した。 リスク評価スコアが「非常に低い」または「低い」、DOR < 4%(貯水池の影響がほとんどないことを示す)の温度モニタリングステーションは、基準条件を代表していると判断され、記録長の基準も満たす1764地点となった。 このうち、Deweber & Wagner41 (n = 1211) または Hill et al.40 (n = 33) から得られた観測値が70%であった。 残りの520の観測のうち、71.7%は少なくとも2シーズンのデータがあった。
上記の同じ予測因子アンサンブルを用いて、参照サイトの夏の気温を予測するためにランダムフォレストを開発し、その値をすべてのNHD流域に外挿した。 米国の水温の頻度分布の切れ目を利用して、夏季の気温をクラスに分割した。 全流域の夏季の推定水温値を用いて、Jenks Natural Breaks46法により2~20のクラスに分割し、最適適合度と表の正確性に基づいて、情報の大部分を説明する最も簡素なクラス数を決定した。 物理学に基づくクラス分割のための正当なアプローチがない場合、Jenks法はクラス間の分散を最大化しながらクラス内の変動を最小化しようとするため、空間情報の一変量クラスタリングに最適である46.
Network Bifurcation
流れの大きさが流れの連続体に沿った生態系機能の縦方向の変動を捉えるのに対し15、支流の分岐と流れの分岐も縦方向のプロセスにおける不連続を作り出すので重要である47. 支流の分岐点、特に分岐点を構成する河川の大きさの違いは、生息域と生物多様性に 大きな影響を与える48 。 さらに、生態学的群集の構成は、合流点の近接度によって劇的に変化する可能性がある49。 ネットワーク構成の違いや分岐の状況を把握するために、2つの分岐クラスを作成した。 まず、各流域の上流端で合流を形成する支流の大きさが異なるクラスを作成した。
NHDplus V2データセット内の個々の河川区間のほとんどは、河川の起点、支流の合流点、湖や貯水池との交差点によって定義される河川ネットワークの明確な水文学的特徴を表している50。 NHDplus V2の流域間の地形的な関係は、ある流域に寄与する上流の流域(すなわちfrom)と、流れを受け取る下流の流域(すなわちto)を定義する「from-to」表として提供される。 from-to」表を用いて、各流域の上流端における異なるStrahler流路の組み合わせは、支流と本流の組み合わせを作成するために結合された。 例えば、2次系の上流端で1次と2次の支流が合流すると、次のような級になる。 2.12 (図1a)。 多くの場合、上流には2つの支流しか存在しない。 しかし、稀なケースや分岐の状況では、3つ以上の支流がリーチの上流で合流し、最大で4つの上流オーダーを含んでいる(例:図1b、5.511)。 場合によっては、上流の複数の支流の分岐、すなわち1つの支流が下流方向に2つ以上の支流に分かれている支流から流れを受けることがある(図1c)。 これらの流路には流路順位が付与され、支流合流を模倣した分岐点が形成されるため、ネットワークの分岐を分類するには、流路分岐を合流の一種として含める必要がある。 NHDplus V2は、支流が分岐している場合、その区間を主流路(D1)または副流路(D2)として指定します(図1c)。 また、支流との合流地点と区別するために、流路分岐点(DU)の直下にある河川区間をFrom-to表で特定した。 これらの分岐を考慮した後、NHDplus V2がすべての流路分岐の状況を適切に指定しなかったために、非意味的な支流合流(例えば、5_5.5)の状況が発生することが確認された。 これらの区間は、分岐した河道なのか、分岐した河道からの流れを受ける河道なのかを判断することが困難であったため、一般的な分岐クラス(D)に割り振った。