Hier werden die wichtigsten Parameter beschrieben und diskutiert, die für den Aufbau und die Durchführung einer CRM-Studie erforderlich sind. Diese sind: Anzahl der Dosen; Toxizitätszielwert; Dosis-Toxizitäts-Modell; Dosis-Toxizitäts-Skelett; Methode der Inferenz; Entscheidungsregeln; Stichprobengröße und Kohortengröße; Sicherheitsmodifikationen; und Abbruchregeln.
- Anzahl der Dosen
- Target toxicity level
- Dosis-Toxizitäts-Modell
- Dosis-Toxizitäts-Skelett
- Inferenz
- Entscheidungsregeln
- Stichprobengröße und Kohortengröße
- Änderungen der Sicherheit
- Abbruchregeln
- Evaluierung von Versuchsplänen durch Simulation
- Festlegung des Versuchsplans
- Studiendurchführung
- Inhalt des Berichts
- Software für die Aktualisierung von Modellen und die Erstellung von Berichten
Anzahl der Dosen
Statistische und praktische Überlegungen liegen der Wahl zugrunde, wie viele und welche Dosen untersucht werden sollen. Die wichtigste statistische Überlegung ist, ob die untersuchten Dosen und Dosisbereiche eine genaue MTD-Schätzung ermöglichen. Abbildung 1 zeigt, wie sich die Wahl verschiedener Dosisbereiche auf die Auswahl der MTD bei gleichem Dosis-Toxizitäts-Verhältnis auswirkt. Zu wenige Dosen können bedeuten, dass die MTD schlecht geschätzt wird, wohingegen zu viele Dosen eine Dosiseskalation in Richtung der MTD behindern können.
Welche Dosen in einer Studie untersucht werden, wird häufig durch praktische Einschränkungen bestimmt. Bei oralen Behandlungen zum Beispiel kann die Dosis je nach Anzahl der Tabletten steigen. Wenn die Behandlung speziell für die Studie hergestellt wird (wie bei First-in-Man-Studien), können die Finanzen die Anzahl der herstellbaren Dosisstufen begrenzen. Techniken wie die allometrische Skalierung können jedoch verwendet werden, um zu entscheiden, welche Dosen untersucht werden sollen. Bei einer Überprüfung von 197 Phase-I-Studien, die zwischen 1997 und 2008 veröffentlicht wurden, lag die durchschnittliche Anzahl der untersuchten Dosisstufen bei fünf (Spanne 2-12).
Target toxicity level
Die akzeptable Wahrscheinlichkeit, dass ein Patient eine DLT erleidet (die TTL), muss vor Beginn der Studie festgelegt werden. Die TTL hängt von der Krankheit, der untersuchten Behandlung, der Verfügbarkeit alternativer Behandlungsmöglichkeiten, dem Leistungsstatus des Patienten und den wahrscheinlichen Nebenwirkungen ab, die in der Definition der DLT enthalten sind. Die TTL wird auf der Grundlage von klinischem Fachwissen, Erkenntnissen aus früheren Studien und Hinweisen des Prüfstatistikers festgelegt. Häufig wird die TTL zwischen 20 und 35 % festgelegt, aber in einigen Studien wurde die TTL auf bis zu 40 % festgelegt.
Dosis-Toxizitäts-Modell
Wir müssen angeben, wie wir die Beziehung zwischen der Dosis und dem Risiko, eine DLT zu beobachten, modellieren werden. Das Dosis-Toxizitäts-Modell beschreibt die Wahrscheinlichkeit, dass ein Patient bei einer bestimmten Dosis eine DLT erleidet (die Dosis-Toxizitäts-Beziehung). Das Modell ist eine feste mathematische Funktion, die mit der Dosis monoton ansteigt, d. h. mit zunehmender Dosis steigt auch die Wahrscheinlichkeit, eine DLT zu beobachten. Das Modell wird als F(β, d) geschrieben, wobei F(-,-) die gewählte Dosis-Toxizitäts-Funktion ist (siehe Tabelle 1), β ist ein Vektor aus einem oder mehreren Parametern, der die Form der Dosis-Toxizitäts-Beziehung verändert, und d ist die Dosisbezeichnung für eine bestimmte Medikamentendosis. Abbildung 2 zeigt einige Dosis-Toxizitäts-Beziehungen für verschiedene Funktionswahlen und Parameterwerte.
Dosis-Toxizitäts-Skelett
Die Auswahl eines Modells für die Dosis-Toxizitäts-Beziehung kann zunächst entmutigend erscheinen. Wir können jedoch sicherstellen, dass das von uns gewählte Modell eine vernünftige Form über die interessierenden Dosisstufen hat, indem wir ein Skelett angeben. Das Skelett ist die Menge der erwarteten DLT-Wahrscheinlichkeiten bei den interessierenden Dosisstufen und wird von einem oder mehreren Klinikern vor der Studie festgelegt. Für eine klinische Prüfung mit k Dosisstufen gibt das klinische Team eine vorherige durchschnittliche Schätzung für die Wahrscheinlichkeit einer DLT bei jeder Dosis an. Diese werden hier als p1, …, pk (das Skelett) bezeichnet und müssen nur monoton ansteigend und voneinander verschieden sein. Für das Dosis-Toxizitäts-Modell F(-,-) ist die Dosisbezeichnung für die i-te Dosis dann di, so dass pi = F(β*, di). Die Verwendung von Dosisbezeichnungen stellt sicher, dass das Modell vor der Studie gut an das Gerüst angepasst ist; die tatsächliche Dosierung des Arzneimittels spielt keine Rolle. In Tabelle 1 sind gängige Modellwahlen, vorherige Referenzwerte und die daraus resultierenden Dosisbezeichnungen aufgeführt. Ein Beispiel für die Umwandlung von arzneimittelspezifischen Dosen in Dosisbezeichnungen ist in Abb. 3 dargestellt (Berechnungen in Tabelle A1 (Additional file 1: Appendix A)).
Die Wahl des Modells und des Skeletts sind nicht eindeutig, da verschiedene Paarungen von Dosis-Toxizitäts-Modell und Skelett zu identischen Dosis-Eskalationsempfehlungen nach einer gegebenen Folge von Beobachtungen führen können. Beim einparametrigen logistischen Modell hat der Wert des festen Intercepts (in Tabelle 1 auf 3 gesetzt) keinen Einfluss auf die Form des Dosis-Toxizitäts-Modells. Der Wert des festen Achsenabschnitts wirkt sich jedoch auf die sich ergebenden Dosisangaben und die Glaubwürdigkeitsintervalle aus. Bei der Planung einer Studie zu Capecitabin in Kombination mit Epirubicin und Cyclophosphamid bei Patienten mit fortgeschrittenem Brustkrebs zeigte Morita, dass sich durch die Änderung des Abschnittswertes die größte Unsicherheit beim DLT-Risiko von der niedrigsten zur höchsten Dosis verschob. Daher kann bei Verwendung des logistischen Ein-Parameter-Modells der Achsenabschnitt so gewählt werden, dass die Unsicherheiten im Bereich der Dosisstufen den klinischen Erwartungen entsprechen.
In mehreren Arbeiten wurde untersucht, wie sich die Anzahl der Modellparameter auf die theoretischen Eigenschaften und die Betriebsmerkmale eines ZRM-Designs auswirkt, einschließlich der Wahrscheinlichkeit, dass jede Dosis als MTD geschätzt wird, des Prozentsatzes der Patienten, die jeder Dosisstufe zugewiesen werden, des durchschnittlichen Stichprobenumfangs und des durchschnittlichen Anteils der Patienten, bei denen eine DLT auftritt. Die Verwendung eines Ein- oder Zweiparametermodells wirkt sich darauf aus, wie stark die Daten zu niedrigeren Dosen die Wahl der nächsten Dosis beeinflussen. Bei einem Ein-Parameter-Modell ist es wahrscheinlicher, dass Empfehlungen ausgesprochen werden, die zu einer schnelleren Eskalation der Dosen führen, was eine effizientere Studie zur Folge hat, aber die Teilnehmer einem höheren Risiko von DLTs aussetzt. Ein Zwei-Parameter-Modell schätzt wahrscheinlich die Form der gesamten Dosis-Toxizitäts-Beziehung besser ab, ermittelt aber die MTD weniger effizient; es kann länger dauern, die MTD zu erreichen, da zwei Parameter geschätzt werden müssen, und es kann Schwierigkeiten bei der Anpassung des Modells oder beim Erhalt konsistenter Schätzungen der Modellparameter geben.
Auch wenn wir die wahre Form der Dosis-Toxizitäts-Beziehung nicht kennen können, werden sich die nach jeder Kohorte ausgesprochenen Dosisempfehlungen der MTD annähern. Mit einem Ein-Parameter-Modell erreichen wir mit Sicherheit eine zuverlässige Schätzung der MTD (und ihrer DLT-Wahrscheinlichkeit), selbst wenn unsere Schätzungen für weiter entfernte Dosen ungenau sind. Dieses Ergebnis ist unempfindlich gegenüber dem verwendeten Modell und den Dosisbezeichnungen, obwohl die Skelettwahrscheinlichkeiten in einem angemessenen Abstand zueinander stehen sollten. Ein Skelett mit zu dicht beieinander liegenden DLT-Wahrscheinlichkeiten führt zu einer langsameren Dosiseskalation, und ein Skelett mit zu weit auseinander liegenden DLT-Wahrscheinlichkeiten führt zu einer schlechten Konvergenz zur MTD. Lee und Cheung und Cheung schlugen vor, ein Skelett durch Angabe der TTL und eines Indifferenzintervalls auszuwählen. Dabei handelt es sich um ein Wahrscheinlichkeitsintervall, in das der Kliniker die DLT-Wahrscheinlichkeit der MTD fallen lassen möchte. Beispielsweise ergibt eine TTL von 25 %, plus/minus 5 %, ein Indifferenzintervall von . Ein Beispiel für die Auswahl eines Skeletts unter Verwendung des Indifferenzintervall-Ansatzes findet sich in Zusatzdatei 1: Anhang B.
Wenn die Anzahl der Dosisstufen, die TTL, das Dosis-Toxizitäts-Modell und das Skelett festgelegt sind, können andere Komponenten des Versuchsplans erörtert werden.
Inferenz
Um Entscheidungen zu treffen, indem die anfallenden Studiendaten und andere Nachweise kombiniert werden, muss angegeben werden, wie statistische Schlussfolgerungen zu den Modellparametern und damit zur geschätzten DLT-Wahrscheinlichkeit bei jeder Dosis gezogen werden sollen.
Es kann ein auf Likelihood basierender Ansatz verwendet werden; die Modellparameter (zuvor mit β bezeichnet) werden durch Anwendung von Maximum-Likelihood-Methoden auf die Studiendaten geschätzt. Alle gängigen statistischen Softwarepakete können diese Analysen durchführen. Maximum-Likelihood-Methoden können nur mit heterogenen Response-Daten (d. h. mindestens eine DLT- und eine Nicht-DLT-Response) zur Berechnung von Parameterschätzungen verwendet werden. Um heterogene Responsedaten zu erhalten, wird das Design in zwei Stufen aufgeteilt. Einzelne Patienten oder kleine Patientenkohorten werden nacheinander steigenden Dosen zugewiesen, bis die erste DLT beobachtet wird. Dann wird das auf dem Likelihood-Modell basierende Design übernommen; eine Maximum-Likelihood-Schätzung der Modellparameter wird verwendet, um die geschätzten DLT-Wahrscheinlichkeiten zu aktualisieren.
Ein anderer Ansatz ist die Bayes’sche Inferenz. Den Modellparametern wird eine vorherige Wahrscheinlichkeitsverteilung zugewiesen, was bedeutet, dass der Wahrscheinlichkeit einer DLT bei jeder Dosis eine vorherige Überzeugung (und eine gewisse Unsicherheit) zugewiesen wird. Vorannahmen und Unsicherheiten können aus verschiedenen Informationsquellen abgeleitet werden, z. B. aus präklinischen Arbeiten, klinischen Meinungen und Daten aus früheren Studien. Stehen keine relevanten Vorabdaten zur Verfügung, können geeignete vage Vorannahmen verwendet werden. Wenn jede Dosis vor der Studie als gleich wahrscheinlich als MTD angesehen wird, kann ein „am wenigsten informativer“ Prior ermittelt werden, der diese Annahme widerspiegelt.
Daten von Patienten in der Studie werden verwendet, um die Prioritätsverteilung für den/die Modellparameter zu aktualisieren, woraus sich dann eine Posterior-Verteilung für den/die Modellparameter und somit Posterior-Annahmen für die Wahrscheinlichkeit einer DLT bei jeder Dosis ergeben. Diese posterioren Wahrscheinlichkeiten werden verwendet, um Entscheidungen zur Dosiseskalation zu treffen. Durch die Bewertung der Betriebscharakteristika eines Versuchsplans mit einem bestimmten Prior in einer Vielzahl von Szenarien kann die Prior-Verteilung neu kalibriert werden, bis das Modell Empfehlungen für Dosissteigerungen und die MTD abgibt, mit denen das Versuchsteam zufrieden ist. Dieser iterative Prozess trägt dazu bei, dass das Design für die Studie angemessen konfiguriert ist.
Entscheidungsregeln
Bei einem CRM-Ansatz werden die nächsten Patienten nicht nur auf der Grundlage des Anteils der Patienten mit DLTs auf der aktuellen Dosisstufe einer Dosisstufe zugeordnet. Die Verwendung eines Modells ermöglicht die Aufnahme von Informationen über die verschiedenen Dosisstufen hinweg. Wir erfahren mehr über das Toxizitätsrisiko anderer Dosisstufen auf der Grundlage der gesammelten Daten, was die Effizienz der Studie verbessert. Wir können die Dosis für den nächsten Patienten oder die nächste Kohorte anpassen, indem wir die Wahrscheinlichkeit einer DLT für jede Dosisstufe schätzen, sei es auf der Grundlage eines Likelihood-basierten oder eines Bayes’schen Ansatzes, und dann die Dosisstufe anhand einer bestimmten Entscheidungsregel auswählen. Mögliche Entscheidungsregeln sind die Wahl der Dosis mit einer geschätzten DLT-Wahrscheinlichkeit, die am nächsten an der TTL liegt, oder, konservativer, die Wahl der Dosis mit einer geschätzten DLT-Wahrscheinlichkeit, die am nächsten an der TTL liegt, aber nicht höher ist als diese. Die erste Option ermöglicht eine schnellere Eskalation in Richtung der tatsächlichen MTD, setzt aber möglicherweise mehr Patienten einer Überdosierung aus. Die zweite Option verringert das Risiko einer Überdosierung, aber es kann länger dauern, bis die tatsächliche MTD erreicht ist.
Stichprobengröße und Kohortengröße
Die geplante Stichprobengröße in Phase-I-Studien wird im Allgemeinen durch praktische Zwänge bestimmt, wie die Anzahl der Zentren, die geplanten Rekrutierungsraten und die Anzahl der Dosisstufen, und nicht durch statistische Zwänge in Bezug auf die Fehlerrate vom Typ I oder die Mindeststärke zur Prüfung einer bestimmten Hypothese. Cheung schlug Formeln vor, bei denen ein angestrebter durchschnittlicher Prozentsatz der korrekten Auswahl der MTD (z. B. 50 % der Zeit) verwendet wird, um eine untere Grenze für den Stichprobenumfang der Studie zu erhalten. Mit Hilfe von Simulationen können wir dann die Betriebseigenschaften des Versuchsplans bewerten, wenn der Stichprobenumfang auf diese untere Grenze festgelegt ist, und den Stichprobenumfang bei Bedarf anpassen. Wir schlagen vor, eine untere Grenze auf der Grundlage von Cheungs Arbeit und eine praktische obere Grenze in Förderanträgen und Studienprotokollen festzulegen.
Wenn eine vernünftige Stichprobengröße festgelegt wurde, können die Prüfer entscheiden, wie viele Patienten mit jeder empfohlenen Dosis behandelt werden sollten, bevor eine Entscheidung über eine Dosis-Eskalation getroffen wird; dies wird als Kohortengröße bezeichnet. Eine Kohortengröße von einem Patienten bietet bessere Betriebsmerkmale als die gleichzeitige Verabreichung mehrerer Patienten in einer Dosisstufe, obwohl letztere die Studiendauer verkürzen kann und immer noch besser ist als das 3 + 3-Design. Auch regulatorische Anforderungen können die Kohortengrößen beeinflussen. So kann zum Beispiel verlangt werden, dass wir die Sicherheitsdaten des ersten Patienten beobachten, bevor wir andere Patienten in dieser Kohorte dosieren. Nach den jüngsten Katastrophen der Phase-I-Studien mit dem monoklonalen Antikörper TGN1412 von TeGenero und dem Fettsäureamidhydrolase-Inhibitor BIA 10-2474 von Bial müssen Maßnahmen zur Überwachung der Patienten getroffen werden, wenn Kohorten von zwei oder mehr Patienten verwendet werden.
Änderungen der Sicherheit
Änderungen des Studiendesigns und der Dosis-Eskalationsregeln können leicht vorgenommen werden, um eine Überdosierung von Patienten zu verhindern und sicherzustellen, dass ein Studiendesign vernünftige Betriebsmerkmale aufweist. Der ursprüngliche CRM-Ansatz schlug beispielsweise vor, den ersten Patienten mit der zuvor geschätzten MTD zu dosieren, aber viele Studienteilnehmer schlagen vor, den ersten Patienten mit einer niedrigeren Dosis zu behandeln (möglicherweise sogar mit der niedrigsten). Bei der Viola-Studie, die das CRM zur Ermittlung der MTD von Lenalidomid und Azacitidin bei Patienten mit rezidivierender akuter myeloischer Leukämie nach allogener Stammzelltransplantation einsetzte, wurde die mittlere (vierte) von sieben möglichen Dosierungen als vorherige MTD betrachtet. Das Studienteam entschied sich jedoch dafür, mit der Dosis unterhalb dieses Niveaus (dritte) zu beginnen. Einige haben vorgeschlagen, bei der Eskalation keine ungetesteten Dosisstufen zu überspringen, um die Zahl der Patienten zu verringern, die toxischen Dosen ausgesetzt sind. Faries setzte auch eine kohärente Dosis-Eskalation durch: Wenn der letzte Patient eine DLT hatte, erhielt der nächste Patient keine höhere Dosis als der letzte Patient, selbst wenn das Modell dies empfahl. Bei den meisten Versuchsaufbauten des ZRM ist die Kohärenz garantiert, obwohl dies in Simulationen überprüft werden sollte.
Abbruchregeln
Wir müssen Kriterien für den Abbruch des Versuchs angeben, bevor die maximale Anzahl von Patienten behandelt worden ist. Eine vorzeitige Beendigung kann in Betracht gezogen werden, wenn die MTD außerhalb der geplanten Dosis liegt (d. h. alle Dosen sind zu toxisch oder alle Dosen haben eine Wahrscheinlichkeit für eine DLT, die deutlich unter der TTL liegt) oder wenn es unwahrscheinlich ist, dass die Aufnahme weiterer Patienten in die Prüfung Informationen liefert, die die aktuelle MTD-Schätzung ändern würden. Die Prüfer können eine Prüfung abbrechen, wenn entweder: eine feste Anzahl von Patienten nacheinander mit einer Dosisstufe behandelt wurde; die geschätzte Wahrscheinlichkeit, dass bei allen Dosisstufen die DLT-Rate über (oder unter) der TTL liegt, mindestens 90 % beträgt; die Breite des auf Wahrscheinlichkeit basierenden Konfidenzintervalls oder des Bayes’schen Glaubwürdigkeitsintervalls für die MTD einen bestimmten Wert erreicht; die Wahrscheinlichkeit, dass die nächsten m Patienten, die in der Prüfung behandelt werden, unabhängig von den beobachteten DLT-Ergebnissen dieselbe Dosisstufe erhalten, einen bestimmten Wert (z. B. 90 %) übersteigt; oder eine beliebige Kombination dieser Faktoren. Wenn eine Prüfung nach einer bestimmten Anzahl von Patienten abgebrochen wird, sollte die Anzahl auf der Grundlage eines probabilistischen Kriteriums gewählt werden, z. B. wenn 10 aufeinanderfolgende Patienten die gleiche Dosis erhalten, dann sind wir zu mindestens 90 % sicher, dass die aktuelle Dosis die MTD ist. Daher wird die Verwendung probabilistischer Ansätze für die vorzeitige Beendigung oder die Begründung anderer Abbruchregeln durch Wahrscheinlichkeiten empfohlen. In der Viola-Studie wurde die Studie wegen Toxizität vorzeitig abgebrochen, wenn die Wahrscheinlichkeit, dass das DLT-Risiko bei der niedrigsten Dosis mindestens 10 % über der TTL lag, 72 % überstieg; dies wurde auf der Grundlage des Wunsches der Kliniker zugeschnitten, die Studie zu beenden, wenn sie eine unerwartete Anzahl von DLTs bei der niedrigsten Dosis sahen.
Evaluierung von Versuchsplänen durch Simulation
Nachdem eine anfängliche Einrichtung für den Versuchsplan gemäß den oben genannten Parametern festgelegt wurde, müssen wir die Betriebseigenschaften eines Versuchsplans unter verschiedenen Dosis-Toxizitäts-Szenarien verstehen. Dies lässt sich am besten dadurch erreichen, dass der Prüfstatistiker viele Prüfungen unter jedem Szenario simuliert. Die Ziele dieser Simulationsstudien sind:
-
nachzuweisen, dass ein Versuchsplan nach den Maßstäben des Prüfungsteams zufriedenstellende Betriebseigenschaften aufweist, oder Ergebnisse zu liefern, die das Prüfungsteam nutzen kann, um den Versuchsplan zu erörtern und zu ändern;
-
einen umfassenden Vergleich alternativer Versuchspläne zu erstellen, einschließlich des 3 + 3 Versuchsplans und eines Benchmark-Versuchsplans;
-
die besten Parameter zu identifizieren;
-
den Stichprobenumfang zu begründen; und
-
Informationen für die Verwendung in Förderanträgen und im Protokoll zu geben.
Die bewerteten Betriebsmerkmale sollten die Wahrscheinlichkeit der Auswahl jeder Dosis als MTD, die Anzahl/Anteil der Patienten, die jede Dosis erhalten, die Anzahl der DLTs pro Dosis und insgesamt, den erwarteten Stichprobenumfang und die erwartete Studiendauer umfassen.
Die in der Simulationsstudie verwendeten Dosis-Toxizitäts-Szenarien sollten Folgendes umfassen: Szenarien, bei denen jede Dosis tatsächlich die MTD ist; zwei Extremszenarien, bei denen die niedrigste Dosis über der MTD und die höchste Dosis unter der MTD liegt; und alle anderen, die die Kliniker für plausibel halten. Es lohnt sich, unwahrscheinliche, aber extreme Szenarien in Betracht zu ziehen (z. B. die ersten paar Dosen liegen weit unter der MTD, die nächsthöhere weit über der MTD), um zu sehen, wie sich das Studiendesign verhält. Bei der Planung der CHARIOT-Studie berücksichtigten Frangou et al. echte Dosis-Toxizitäts-Kurven über sechs Dosisstufen (Schemata), die Szenarien einschlossen, bei denen die TTL von 25 % bei einer exakten Dosis gefunden wurde oder zwischen zwei Dosisschemata lag. Brock et al. untersuchten bei der Durchführung von Simulationen im Vorfeld der Matchpoint-Studie sechs Dosis-Toxizitäts-Szenarien über vier Dosisstufen; dazu gehörten zwei Szenarien, bei denen die MTD (die Dosis mit einem erwarteten DLT-Risiko von 40 %) zwischen zwei Dosisstufen lag (Abb. 4).
Die Simulationsstudien im Vorfeld der Studie sollten nach den empfohlenen bewährten Verfahren durchgeführt werden:
-
Erstellen Sie einen detaillierten Simulationsplan, einschließlich der erwarteten Einrichtungszeit, der erforderlichen Ressourcen und der Gesamtzeit, die für die Erzielung der Ergebnisse erforderlich ist;
-
Erfassen Sie den verwendeten Zufallskeim, um eine Replikation zu ermöglichen;
-
Erstellen Sie ein breites Spektrum an zu untersuchenden Szenarien;
-
Bestimmen Sie die Anzahl der Simulationswiederholungen, die erforderlich sind, um die Variabilität der Betriebsmerkmale zu verringern. Obwohl es keine ideale Anzahl gibt, ist die Variabilität der Ergebnisse umso geringer, je größer die Anzahl der Simulationen ist;
-
Führen Sie alle konkurrierenden Designs (einschließlich eines 3+3-Designs) in allen Simulationsszenarien durch, um die interessierenden Betriebsmerkmale zu vergleichen.
Neben den Simulationen können wir die Modellempfehlungen auf der Grundlage eines möglichen Satzes von Versuchsdaten bewerten. Wir können im Voraus jede mögliche Abfolge von Dosen berechnen, die sich aus verschiedenen DLT/Non-DLT-Reaktionen von Patienten in den nächsten Kohorten ergeben; diese werden als Dosisübergangspfade bezeichnet. Das Studienteam kann Dosisübergangspfade generieren, um festzustellen, ob das Design ein unerwünschtes Verhalten zeigt, z. B. dass die Studie nicht abgebrochen wird, obwohl eine übermäßige Toxizität bei niedrigen Dosen beobachtet wurde. Das Design kann dann neu kalibriert werden, um Dosisübergangspfade zu erhalten, mit denen die Kliniker und das Prüfungsteam zufrieden sind. Yap et al. beschreiben, wie sie Dosisübergangspfade zur Planung der Viola-Studie verwendet haben. Abbildung 5 veranschaulicht den gesamten Prozess der Studienplanung. Die iterative Struktur zeigt die Diskussionen, die erforderlich sind, um über die verschiedenen Aspekte des Designs zu entscheiden, und wie und wann sie bewertet werden sollten.
Festlegung des Versuchsplans
Nach der Festlegung des Versuchsplans sollten die Simulationen vor dem Versuch dokumentiert werden, wobei die Spezifikationen des Versuchsaufbaus, die unter welchen Szenarien verglichenen Versuchspläne und eine leicht zu interpretierende Zusammenfassung der wichtigsten Merkmale des Versuchsplans anzugeben sind. Dieser Bericht kann in den Anhang zum Prüfplan oder in den statistischen Analyseplan aufgenommen werden, oder er kann ein separater Bericht sein, der im Prüfplan und im statistischen Analyseplan formell anerkannt und in der Stammdatei der Prüfung gespeichert wird. Eine allgemeine Beschreibung des ZRM, das in Prüfplänen verwendet werden kann, finden Sie in Zusatzdatei 1: Anhang C. Die Zielgruppen für den Simulationsbericht sind interne Projektteams und die Ethikkommission. Bei einigen Dosisfindungsversuchen müssen die Simulationsberichte möglicherweise den Aufsichtsbehörden vorgelegt werden.
Studiendurchführung
Wenn das Studiendesign bestätigt wurde und die Studie begonnen hat, wird die empfohlene Dosis für den nächsten Patienten wie folgt festgelegt:
- i)
Beschaffung der verfügbaren Daten über die Patienten, die sich derzeit in der Studie befinden;
- ii)
Aktualisierung der geschätzten DLT-Wahrscheinlichkeiten bei jeder Dosis unter Verwendung des Modells;
- iii)
Verfassen eines kurzen Berichts, in dem die Dosisempfehlung des Modells zusammen mit den geschätzten DLT-Wahrscheinlichkeiten bei allen Dosen und anderen Größen von Interesse aufgeführt ist; und
- iv)
bei Bedarf eine Sitzung des Dosisfestsetzungsausschusses (DSC) oder des Sicherheitsüberprüfungsausschusses (SRC) abhalten, um formell zu entscheiden, ob die Empfehlung des Modells übernommen oder eine andere Dosis (auf der Grundlage zusätzlicher Daten zur Nicht-DLT-Toxizität) empfohlen werden soll. Das DSC setzt sich aus Forschern, Klinikern und Mitgliedern der Studienleitung zusammen. Die Mitglieder des Ausschusses nehmen persönlich oder per Telefonkonferenz an Sitzungen zur Dosisentscheidung teil und beraten auf der Grundlage der während der Studie gewonnenen Sicherheitsdaten, wie die Studie fortgesetzt werden soll. Dosisübergangspfade können für eine oder mehrere künftige Kohorten berechnet werden, um das DSC bei seinen Empfehlungen zu unterstützen.
Zwischenergebnisse der Prüfung sollten gemeldet werden, um das DSC bei der Entscheidungsfindung zu unterstützen. Die Ergebnisse, die von Interesse sind, lassen sich in zwei Kategorien einteilen: beobachtete Studiendaten, wie z. B. der Grad und die Art der unerwünschten Ereignisse, die bei jedem Patienten aufgetreten sind, und die Anzahl der unerwünschten Ereignisse, die als DLT eingestuft werden, sowie probabilistische Ergebnisse, die aus dem Dosis-Toxizitäts-Modell abgeleitet werden.
Inhalt des Berichts
Die Ergebnisse der beobachteten Studiendaten können in einfachen Häufigkeitstabellen dargestellt werden. Eine Tabelle mit allen beobachteten unerwünschten Ereignissen als Zeilen und den Toxizitätsgraden als Spalten sollte mit der Anzahl der Patienten gefüllt werden, bei denen jedes unerwünschte Ereignis eines bestimmten Grades auftrat. Wird beispielsweise das Bewertungssystem des National Cancer Institute’s Common Terminology Criteria for Adverse Events (NCI CTCAE) verwendet, können niedrige Grade (z. B. 1 und 2) zusammengefasst werden, ebenso wie höhere Grade (3 und 4), wenn z. B. jedes unerwünschte Ereignis des Grades 3 oder höher als DLT eingestuft wird. Alle beobachteten Todesfälle, die als unerwünschte Ereignisse des Grades 5 eingestuft werden, müssen gesondert angegeben werden. In einigen Studienveröffentlichungen werden diese Daten nach Dosisstufen aufgeschlüsselt, so dass eine genauere Aufschlüsselung möglich ist, bei welchen Dosen unerwünschte Ereignisse beobachtet wurden. Bei probabilistischen Ergebnissen wird empfohlen, die geschätzte (mittlere/mittlere) Wahrscheinlichkeit einer DLT pro Dosisstufe mit einem Maß für die Variation oder das Konfidenz- bzw. Glaubwürdigkeitsintervall entweder in einer Tabelle oder in einem Diagramm anzugeben.
Software für die Aktualisierung von Modellen und die Erstellung von Berichten
Es wurden mehrere Softwarepakete für den Entwurf, die Durchführung und die Analyse von Dosisfindungsstudien unter Verwendung regelbasierter Designs und des ZRM entwickelt (Tabelle 2). Dazu gehören Softwarepakete für gängige Statistikprogramme (z. B. R und Stata) sowie eigenständige Programme mit Point-and-Click-Benutzeroberflächen, von denen einige online frei verfügbar sind. Viele dieser Pakete enthalten Tools für die Erstellung von Skeletten und Dosisbeschriftungen unter verschiedenen Dosis-Toxizitäts-Modellen und für die Simulation und Durchführung von Versuchen mit Likelihood-basierten und Bayes’schen Methoden. Für alle Programme stehen Hilfedateien zur Verfügung, und die meisten sind mit Beispielen versehen.