用量設定試験における投与回数と投与間隔の検討。 図2(a)の用量はMTDを推定するには低すぎるが、図2(b)の用量は高すぎる。 図2(c)では、目標投与量は2つの投与量の間にあるので、患者は過量投与と過小投与のレベルに交互に割り当てられ、最終的なMTDはこれらのレベルのいずれかになると思われる。 図2(d)は、MTDの領域でいくつかの用量レベルが利用可能な状況を示している。 例えば経口薬の場合、錠剤の数によって投与量が増えることがある。 治療薬が試験のために特別に製造される場合(first-in-man試験のように)、財政的に製造できる用量レベルの数が制限される場合がある。 しかし、アロメトリック・スケーリングのような技法は、どの用量を研究すべきかを選択するために用いることができる。 1997年から2008年にかけて発表された197の第I相試験のレビューでは、検討された用量レベルの数の中央値は5(範囲2-12)でした。 TTLは、疾患、研究中の治療法、代替治療法の有無、患者のパフォーマンス状態、DLTの定義に含まれる関連有害事象の可能性によって異なる。 TTLは、臨床の専門知識、過去の研究からの証拠、試験の統計学者からの指導によって決定される。 7050>
Dose-toxicity model
用量とDLTのリスクの関係をどのようにモデル化するかを記述する必要がある。 用量-毒性モデルは、ある患者がある用量でDLTを経験する確率(用量-毒性関係)を記述するものです。 このモデルは、投与量に対して単調増加する、すなわち、投与量が増加するにつれて、DLTを観察する確率も増加する固定数学関数である。 ここで、F(-,-)は選択された用量-毒性関数(表1参照)、βは用量-毒性関係の形状を変える1つ以上のパラメータのベクトル、dは特定の薬剤用量の用量表示である。 図2は、関数の選択とパラメータ値を変えた場合のいくつかの用量-毒性関係を示しています。
の用量-毒性モデルおよび結果の用量ラベルに対する共通の選択肢
用量毒性スケルトン
用量毒性関係に対するモデルの選択は最初は難しく思えるかもしれない。 しかし、骨格を指定することにより、選択したモデルが関心のある線量レベルにわたって賢明な形状をしていることを確認することができます。 骨格とは、対象となる投与量における予想されるDLT確率の集合であり、臨床試験の前に1人または複数の臨床医によって指定されるものである。 k個の投与量レベルの試験において、臨床チームは各投与量におけるDLTの確率の事前平均推定値を指定する。 これらはここではp1, …, pk(骨格)と表記され、単調増加で互いに異なるという制約があるのみである。 用量毒性モデルF(-,-)の場合、i番目の用量の用量ラベルは、次に、pi = F(β*, di)のようにdiとなる。 ここで,β*は,モデルパラメータβの事前平均値または中央値である.用量ラベルを用いることで,治験の前にモデルが骨格によく適合するようになる. 一般的なモデルの選択、事前参照値、および結果の用量ラベルは表1に示されています。 薬剤特異的用量から用量ラベルへの変換例を図3に示す(計算は表A1(追加ファイル1:付録A)に示す)
結局、用量毒性モデルと骨格の異なる組み合わせは、与えられた一連の観察後に同一の用量漸増勧告につながることがあるので、モデルや骨格の選択は一意ではありません . 1パラメータロジスティックモデルに関しては、固定切片の値(表1では3に設定)は、用量-毒性モデルの形状に影響を与えません。 しかし、固定切片の値は、結果として得られる用量表示と信頼区間に影響を及ぼします。 進行乳癌患者におけるカペシタビンとエピルビシン及びシクロホスファミドの併用療法の試験デザインにおいて、森田は、切片の値を変えることにより、DLTリスクの最大の不確実性が最低用量から最高用量に移行することを示した。 7050>
いくつかの論文で、モデルパラメータの数がCRMデザインの理論的特性や運用特性にどのような影響を与えるかが検討されており、各用量をMTDと推定する確率、各用量レベルに割り当てる患者の割合、平均サンプルサイズ、DLTを経験する患者の平均割合などが挙げられています。 1パラメータモデルまたは2パラメータモデルの使用は、低用量におけるデータが次の用量の選択に与える影響の強さに影響します。 1パラメータモデルの場合、投与量を早く増やすような推奨をする可能性が高く、試験の効率は上がりますが、被験者がDLTを経験するリスクは高くなります。 2パラメータモデルは、用量-毒性関係全体の形状をよりよく推定できると思われるが、MTDを特定する効率は低い。2つのパラメータを推定しなければならないので、MTDに達するまでに時間がかかるかもしれないし、モデルの適合やモデルパラメータの一貫した推定値を得るのが難しいかもしれない。 確かに1パラメータモデルであれば、遠方の用量の推定値が不正確であっても、MTD(およびそのDLT確率)の信頼できる推定値に到達します。 この結果は、使用するモデルや投与量ラベルには影響されませんが、スケルトン確率は適度に間隔を空ける必要があります。 事前のDLT確率が近すぎるスケルトンは、投与量の増加が遅くなり、事前のDLT確率が離れすぎているスケルトンは、MTDへの収束が悪くなります 。 LeeとCheungは、TTLと無関心区間を指定してスケルトンを選択することを提案した。 これは、臨床医がMTDのDLT確率が下がっても良いと思う確率区間である。 例えば、TTLが25%であれば、無差別区間は5%となる。 無差別区間アプローチによるスケルトンの選択例は、Additional file 1: Appendix Bに記載されている。
推論
発生した試験データとその他の証拠を組み合わせて意思決定を行うには、モデルパラメータ、つまり各用量における推定DLT確率について、どのように統計的推論を行うつもりなのかを示さなければなりません。 主要な統計ソフトはすべてこれらの解析を行うことができる。 最尤法は、異種応答データ(すなわち、少なくとも1つのDLTと1つの非DLT応答)を用いてのみ、パラメータ推定値を計算することができる。 異質な反応データを得るために、デザインは2段階に分けられる。 個々の患者または患者の小規模コホートは、最初のDLTが観察されるまで、順次投与量を増やして割り当てる。 モデルパラメータの最尤推定値は、推定されたDLT確率を更新するために使用される。 これは、各用量におけるDLTの確率に事前の確信(とある程度の不確実性)を割り当てることになる。 事前確信と不確実性は、前臨床試験、臨床意見、過去の試験のデータなど、様々な情報源から導き出すことができる。 関連する事前データが入手できない場合は、適切な曖昧な事前分布を使用することができる。 7050>
臨床試験の患者からのデータは、モデルパラメータの事前分布を更新するために使用され、モデルパラメータの事後分布が得られ、したがって各用量におけるDLTの確率の事後確信が得られます。 これらの事後確率は、投与量の増量を決定するために使用される。 様々なシナリオで特定の事前分布を用いたデザインの運用特性を評価することにより、モデルが用量漸増とMTDについて試験チームが満足する推奨を行うまで、事前分布を再キャリブレーションすることができます。 7050>
決定ルール
CRMアプローチでは、現在の用量レベルでDLTを起こした患者の割合だけに基づいて、次の患者を用量レベルに割り当てることはありません。 モデルを使用することで、投与量レベルを超えて情報を借用することができます。 蓄積されたデータに基づいて、他の投与量レベルの毒性リスクを知ることができ、試験の効率が向上する。 尤度法であれベイズ法であれ、各用量レベルでのDLTの確率を推定し、特定の決定ルールを用いて用量レベルを選択することにより、次の患者やコホートに対する用量を適合させることができる。 可能な決定規則には、DLTの推定確率がTTLに最も近い用量を選択すること、あるいは、より保守的に、DLTの推定確率がTTLに最も近く、かつTTLを超えない用量を選択することが含まれる。 最初の選択肢は、真のMTDに向けたより迅速なエスカレーションを可能にするが、より多くの患者を過量投与にさらす可能性がある。 7050>
サンプルサイズとコホートサイズ
第I相試験における計画サンプルサイズは、一般に、タイプIエラー率や特定の仮説を検証するための最小検出力に関連した統計的制約ではなく、施設数、予測される募集率、用量レベルの数などの実用的制約によって決定される。 Cheung氏は、MTDを正しく選択できる平均的な割合(例えば、50%の確率)を用いて、試験のサンプルサイズの下限を求める公式を提案した。 そして、シミュレーションにより、サンプルサイズをこの下限値に固定した場合のデザインの運用特性を評価し、必要に応じてサンプルサイズを修正することができます。
一旦、妥当なサンプルサイズが特定されると、研究者は用量漸増の決定がなされる前に、各推奨用量で何人の患者に投与すべきかを決定することができる。 1人の患者からなるコホートサイズは、ある用量で複数の患者を同時に投与するよりも優れた運用特性が得られるが、後者の方が試験期間を短縮でき、3 + 3デザインよりもなお良い結果を得ることができる。 規制上の要件もコホートサイズに影響を与える可能性があります。 例えば、最初の患者の安全性データを確認してから、そのコホート内の他の患者を投与するよう要求されることがあります。 TeGenero社のモノクローナル抗体TGN1412とBial社の脂肪酸アミドヒドロラーゼ阻害剤BIA 10-2474の最近の第1相試験の失敗を受けて、2人以上の患者のコホートを使用する場合は、患者を監視する手段を講じなければなりません」
Safety modifications
試験デザインと用量漸増ルールに修正を加え、患者の過剰投与防止と試験デザインの賢明な運用特性を確実に行うことが容易になります。 例えば、当初のCRMアプローチでは、最初の患者を事前のMTDの推測値で投与することを提案していたが、多くの治験責任者は最初の患者をこれより低いレベル(場合によっては最低値)で投与することを提案している。 同種幹細胞移植後の再発急性骨髄性白血病患者を対象に、レナリドミドとアザシチジンの MTD を求めるために CRM を使用した Viola 試験では、7 つの投与量のうち中央(4 番目)を事前 MTD と見なしました。 しかし、研究チームは、このレベルより下の用量(3番目)から開始することを選択しました。 毒性のある用量にさらされる患者を減らすために、エスカレーションする際に未試験の用量レベルをスキップしないことを提案する人もいます。 Fariesはまた、首尾一貫した用量漸増を強制した。最後の患者がDLTを起こした場合、次の患者は、たとえモデルがそれを推奨したとしても、最後の患者の用量より高い用量を受けることはないだろう。 7050>
停止ルール
最大数の患者が治療される前に試験を停止する基準を明記する必要があります。 MTDが計画された投与量の範囲外であると判断された場合(すなわち、すべての投与量が毒性が高すぎるか、すべての投与量がTTLを大幅に下回るDLTの確率を持つ場合)、または試験に患者を追加しても現在のMTD推定値を変更する情報が得られそうにない場合には、早期終了が検討されうる。 一定数の患者が一つの用量レベルで連続投与された場合;全ての用量レベルのDLT率がTTL以上(または以下)である確率が90%以上である場合;MTDの尤度信頼区間またはベイズ信頼区間の幅が特定のレベルに達した場合;観察されたDLT結果にかかわらず、試験で次に投与されるm人の患者が同じ用量レベルを与えられる確率があるレベル(例えば、90%)を超えた場合;あるいはこれらの任意の組み合わせの場合には試験を中止できる. 例えば、10人の患者が連続して同じ用量を受けた場合、現在の用量がMTDであることが少なくとも90%確実である。 したがって、早期終了のために確率的アプローチを用いること、あるいは確率を用いて他の停止規則を正当化することが推奨される。 Viola試験では、最低用量でのDLTリスクがTTLを10%以上上回る確率が72%を超えた場合、毒性で早期に試験を中止することになりました。 これは、試験統計家が各シナリオの下で多くの試験をシミュレートすることによって達成されるのが最善である。 これらのシミュレーション研究の目的は、以下の通りである。
-
デザインが治験チームの基準で満足できる運用特性を有することを実証する、あるいは治験チームがデザインを議論し修正するために使用できる結果を得る。
-
3+3デザインやベンチマークデザインを含む代替デザインを包括的に比較検討する。
-
最適なパラメータ選択を明確にする;
-
サンプルサイズを正当化する;
-
助成金申請およびプロトコルに使用する情報を提供する。
評価する運用特性には、各用量をMTDとして選択する確率、各用量を投与した患者の数/割合、用量ごとおよび合計のDLT数、予想サンプルサイズ、予想試験期間などが含まれる必要があります。
シミュレーション研究で使用する用量毒性シナリオには、各用量が実際にMTDであるシナリオ、最低用量がMTD以上、最高用量がMTD未満という2つの極端なシナリオ、その他臨床医がもっともらしいと考えるシナリオを含める必要があります。 可能性は低いが極端なシナリオ(例えば、最初の数回の投与がMTDをはるかに下回り、次の最高用量がMTDをはるかに上回る)を検討して、試験デザインがどのような挙動を示すかを確認することは価値がある。 Frangou らは CHARIOT 試験のデザインに際して、6 つの用量レベル(スケジュール)にわたる真の用量-毒性曲線を考慮し、25%の TTL が正確な用量で見出されるシナリオや、2 つの用量スケジュールの間に位置するシナリオを含め、検討した。 また、Brock らは、Matchpoint 試験の試験前シミュレーションを行う際に、4 つの用量レベルに渡る 6 つの用量毒性シナリオを検討し、その中には、MTD (DLT の期待リスクが 40%となる用量)が 2 つの用量レベルの間にあるシナリオも含まれていた(図 1)。 7050>
試験前のシミュレーション研究は、推奨されるベストプラクティスに従って実施されるべきである:
-
予想されるセットアップ時間、必要なリソース、結果を得るために必要な全体時間など、詳細なシミュレーション計画を作成する。
-
再現できるよう、使用したランダムシードを記録しておく。
-
調査するために幅広いシナリオを生成する;
-
動作特性の変動を減らすために必要なシミュレーションの反復回数を特定する。 理想的な数はありませんが、シミュレーションの数が多いほど結果のばらつきが小さくなります。
-
すべてのシミュレーションシナリオで競合するデザイン(3+3デザインを含む)を実行し、関心のある動作特性を比較します。
シミュレーションに加えて、考えられる試験データのセットに基づいてモデルの推奨事項を評価することが可能です。 これは用量遷移経路と呼ばれるもので、次の数回のコホートで患者のDLT/非DLT反応が異なる場合に生じる、あらゆる実行可能な投与順序を事前に計算することができます。 治験チームは、用量遷移経路を生成して、低用量で過剰な毒性が観察されても治験を中止しないなど、デザインが好ましくない挙動を示すかどうかを確認することができます。 そして、臨床医と臨床試験チームが満足する用量遷移経路を提供するために、デザインを再キャリブレーションすることができる。 Yapらは、Viola試験のデザインに用量遷移経路をどのように使用したかについて述べている。 図5は、臨床試験のデザインプロセスの全体像である。 反復構造は、デザインの様々な側面を決定するために必要な議論と、それらをいつどのように評価すべきかを示している
デザインの最終決定
試験デザインが合意したら、試験前のシミュレーションはセットアップ仕様、どのデザインをどのシナリオで比較したか、デザインの主要機能の容易に解釈できる要約を詳述して、ドキュメント化する必要があります。 この報告書はプロトコールの付録や統計解析計画に含めることもできるし、プロトコールや統計解析計画で正式に認められ、試験のマスターファイルに保存される別の報告書とすることも可能である。 試験プロトコルで使用できるCRMの一般的な説明を、Additional file 1: Appendix Cに記載した。 シミュレーション報告書の対象者は、社内のプロジェクトチームと研究倫理委員会である。 用量設定試験によっては、シミュレーション報告書を規制当局に提出する必要がある場合がある。
試験の実施
試験デザインが確定し、試験が開始されると、次の患者に対する推奨用量が以下のように決定される。
- i)
現在試験中の患者に関する利用可能なデータを入手する。
- ii)
モデルを用いて各用量における推定DLT確率を更新する。
- iii)
モデルの推奨用量と、すべての用量における推定DLT確率やその他の関心量について詳細に報告書に記載する。 7050>
- iv)
必要に応じて用量設定委員会(DSC)または安全性評価委員会(SRC)を開催し、モデルの推奨量を使用するか、(非DLT毒性の追加データに基づき)別の用量を推奨するかを正式に決定する。 DSCは、研究者、臨床医、試験管理グループのメンバーで構成されています。 委員は直接またはテレビ会議で用量決定会議に出席し、試験中に得られた安全性データに基づいて、試験をどのように進めるべきかを助言する。 7050>
DSCの意思決定を支援するために、中間試験の結果を報告する必要がある。 対象となる結果は、各患者が経験した有害事象のグレードや種類、DLTに分類される有害事象の数などの観察された試験データ、および用量-毒性モデルから推測される確率的結果の2つに分けられる。
報告内容
観察された試験データの結果は、単純な度数表で示すことが可能だ。 すべての観察された有害事象を行に、毒性グレードを列にした表には、特定のグレードの各有害事象を経験した患者数を記入する必要があります。 例えば、米国国立がん研究所の有害事象に関する共通用語基準(NCI CTCAE)等級分類システムを使用する場合、低等級(例えば、1および2)を組み合わせることができ、例えば、等級3以上の有害事象がDLTとして分類される場合は、高等級(3および4)を組み合わせることができます。 グレード5の有害事象に分類される死亡例が観察された場合は、個別に報告する必要があります。 試験発表の中には、これらのデータを用量別に分け、どの用量で有害事象が観察されたかをより正確に分類しているものもあります。 7050>
モデル更新及び報告書作成用ソフトウェア
ルールベースデザイン及びCRMを用いた用量設定試験のデザイン、実施及び解析のためのソフトウェアパッケージがいくつか開発されている(表2)。 これらのソフトウェアには、一般的な統計プログラム(例えば、RやStata)のソフトウェアパッケージや、ポイント&クリックのユーザーインターフェースを持つスタンドアロンプログラムがあり、その一部はオンラインで自由に利用することが可能である。 これらのパッケージの多くには、様々な用量毒性モデルの下でスケルトンや用量表示を生成するツールや、尤度法やベイズ法を用いた試験のシミュレーションや実施に必要なツールが含まれています。