Qui descriviamo e discutiamo i parametri chiave che sono necessari per impostare ed eseguire uno studio CRM. Questi sono: Numero di dosi; Livello di tossicità obiettivo; Modello di dose-tossicità; Schema di dose-tossicità; Metodo di inferenza; Regole di decisione; Dimensione del campione e dimensione della coorte; Modifiche di sicurezza e regole di arresto.
- Numero di dosi
- Livello di tossicità obiettivo
- Modello dose-tossicità
- Scheletro dose-tossicità
- Inferenza
- Regole decisionali
- Dimensione del campione e dimensione della coorte
- Modifiche alla sicurezza
- Regole di arresto
- Valutazione dei progetti tramite simulazione
- Finire il disegno
- Conduzione della sperimentazione
- Contenuti della relazione
- Software per aggiornare i modelli e produrre rapporti
Numero di dosi
Considerazioni statistiche e pratiche sono alla base della scelta di quante e quali dosi studiare. La considerazione statistica più importante è se le dosi e l’intervallo di dosi in esame sono in grado di consentire una stima accurata della MTD. La Figura 1 mostra come le diverse scelte dell’intervallo di dosi influenzino la selezione della MTD nella stessa relazione dose-tossicità. Troppe poche dosi possono significare che la MTD sarà stimata male, mentre troppe dosi possono ostacolare l’escalation della dose verso la MTD.
Quali dosi vengono studiate in un trial è spesso determinato da restrizioni pratiche. Per i trattamenti orali, per esempio, i livelli di dose possono aumentare in base al numero di compresse. Se il trattamento è prodotto specificamente per lo studio (come negli studi first-in-man), le finanze possono limitare quanti livelli di dose possono essere prodotti. Tuttavia, tecniche come la scala allometrica possono essere utilizzate per scegliere quali dosi dovrebbero essere studiate. In una revisione di 197 studi di fase I pubblicati tra il 1997 e il 2008, il numero mediano di livelli di dose esplorati è stato di cinque (range 2-12).
Livello di tossicità obiettivo
La probabilità accettabile che un paziente sperimenti una DLT (il TTL) deve essere stabilita prima dell’inizio dello studio. Il TTL dipende dalla malattia, dal trattamento in esame, dalla disponibilità di opzioni di trattamento alternative, dal performance status dei pazienti e dai probabili eventi avversi associati inclusi nella definizione di DLT. Il TTL è determinato dall’esperienza clinica, dall’evidenza di studi precedenti e dalla guida dello statistico dello studio. Spesso il TTL è fissato tra il 20 e il 35%, ma alcuni studi hanno fissato il TTL fino al 40%.
Modello dose-tossicità
Dobbiamo dichiarare come modelleremo la relazione tra la dose e il rischio di osservare una DLT. Il modello dose-tossicità descrive la probabilità che un paziente sperimenti una DLT ad una data dose (la relazione dose-tossicità). Il modello è una funzione matematica fissa che aumenta monotonicamente con la dose, cioè all’aumentare della dose aumenta anche la probabilità di osservare una DLT. Il modello è scritto come F(β, d), dove F(-,-) è la funzione dose-tossicità scelta (vedi Tabella 1), β è un vettore di uno o più parametri che altera la forma della relazione dose-tossicità, e d è l’etichetta della dose per una particolare dose di farmaco. La Figura 2 mostra alcune relazioni di dose-tossicità per diverse scelte di funzioni e valori di parametri.
Scheletro dose-tossicità
Selezionare un modello per la relazione dose-tossicità può sembrare scoraggiante all’inizio. Tuttavia, possiamo assicurarci che il modello scelto abbia una forma sensata sui livelli di dose di interesse specificando uno scheletro. Lo scheletro è l’insieme delle probabilità di DLT attese ai livelli di dose di interesse e viene specificato da uno o più medici prima della sperimentazione. Per uno studio con k livelli di dose, il team clinico specifica una stima media a priori per la probabilità di DLT ad ogni dose. Queste sono qui indicate come p1, …, pk (lo scheletro), e sono solo vincolate ad essere monotonicamente crescenti e distinte le une dalle altre. Per il modello di dose-tossicità F(-,-), l’etichetta della dose per l’iesima dose è quindi di, tale che pi = F(β*, di). Qui, β* può essere la media o la mediana a priori del parametro β del modello. L’uso delle etichette di dose assicura che il modello si adatti bene allo scheletro prima della sperimentazione; la scala reale della dose del farmaco non ha importanza. Le scelte comuni del modello, i valori di riferimento a priori e le etichette di dose risultanti sono date nella tabella 1. Un esempio di trasformazione dalle dosi specifiche del farmaco alle etichette di dose è mostrato nella Fig. 3 (i calcoli sono riportati nella Tabella A1 (File aggiuntivo 1: Appendice A)).
In definitiva, la scelta del modello e dello scheletro non sono unici, poiché diversi accoppiamenti di modello di dose-tossicità e scheletro possono portare a raccomandazioni identiche di riduzione della dose dopo una data sequenza di osservazioni . Per quanto riguarda il modello logistico a un parametro, il valore dell’intercetta fissa (impostato su 3 nella tabella 1) non influenza la forma del modello di dose-tossicità. Tuttavia, il valore dell’intercetta fissa influenza le etichette di dose risultanti e gli intervalli credibili. Nel progettare uno studio sulla capecitabina in combinazione con epirubicina e ciclofosfamide in pazienti con cancro al seno avanzato, Morita ha dimostrato che cambiando il valore dell’intercetta si spostava la maggiore incertezza nel rischio di DLT dalla dose più bassa alla dose più alta. Pertanto, se si utilizza il modello logistico a un parametro, l’intercetta può essere scelta per dare incertezze precedenti intorno ai livelli di dose che corrispondono alle aspettative cliniche.
Diversi articoli hanno studiato come il numero di parametri del modello influenzi le proprietà teoriche e le caratteristiche operative di un disegno CRM, compresa la possibilità di stimare ogni dose come MTD, la percentuale di pazienti assegnati a ciascun livello di dose, la dimensione media del campione e la percentuale media di pazienti che sperimenteranno una DLT. L’utilizzo di un modello a uno o due parametri influisce sulla forza con cui i dati a dosi inferiori influenzano la scelta della dose successiva. Un modello a un parametro ha maggiori probabilità di formulare raccomandazioni che portano a un’escalation più veloce attraverso le dosi, con il risultato di uno studio più efficiente, ma mette i partecipanti a un rischio più elevato di sperimentare DLT. Un modello a due parametri è probabile che stimi meglio la forma dell’intera relazione dose-tossicità, ma identifica in modo meno efficiente la MTD; può richiedere più tempo per raggiungere la MTD dal momento che due parametri devono essere stimati, e ci possono essere difficoltà nell’adattare il modello o ottenere stime coerenti dei parametri del modello.
Anche se non possiamo conoscere la vera forma della relazione dose-tossicità, le raccomandazioni di dose fatte dopo ogni coorte si avvicinano alla MTD. Certamente con un modello a un parametro, raggiungeremo una stima affidabile della MTD (e la sua probabilità di DLT), anche se le nostre stime per le dosi più lontane sono imprecise. Questo risultato è insensibile al modello e alle etichette di dose utilizzate, anche se le probabilità dello scheletro dovrebbero essere ragionevolmente ben distanziate. Uno scheletro con probabilità DLT a priori troppo vicine tra loro porterà a un’escalation della dose più lenta, e uno scheletro con probabilità DLT a priori troppo distanti tra loro porterà a una scarsa convergenza verso la MTD. Lee e Cheung e Cheung hanno proposto di scegliere uno scheletro specificando il TTL e un intervallo di indifferenza. Questo è un intervallo di probabilità entro il quale il clinico è felice che la probabilità di DLT della MTD cada. Per esempio, un TTL del 25%, più o meno il 5%, dà un intervallo di indifferenza di . Un esempio di scelta di uno scheletro usando l’approccio dell’intervallo di indifferenza è dato nel file aggiuntivo 1: Appendice B.
Una volta che il numero di livelli di dose, il TTL, il modello di dose-tossicità e lo scheletro sono stati specificati, possono essere discussi altri componenti del disegno della sperimentazione.
Inferenza
Per prendere decisioni combinando i dati dei trial in corso e altre prove, dobbiamo indicare come intendiamo fare inferenze statistiche sui parametri del modello, e quindi sulla probabilità di DLT stimata ad ogni dose.
Si può usare un approccio basato sulla verosimiglianza; i parametri del modello (indicati precedentemente con β) sono stimati applicando metodi di massima verosimiglianza ai dati del trial. Tutti i principali pacchetti di software statistici possono eseguire queste analisi. I metodi di massima verosimiglianza possono essere utilizzati solo con dati di risposta eterogenei (cioè, almeno una risposta DLT e una non DLT) per calcolare le stime dei parametri. Per ottenere dati di risposta eterogenei, il progetto è diviso in due fasi. I singoli pazienti, o piccole coorti di pazienti, vengono assegnati in modo sequenziale a livelli di dose crescenti fino a quando non si osserva la prima DLT. A questo punto subentra il disegno basato sul modello di verosimiglianza; una stima di massima verosimiglianza del parametro del modello viene utilizzata per aggiornare le probabilità di DLT stimate. Una distribuzione di probabilità a priori viene assegnata ai parametri del modello, il che si traduce nell’assegnazione di una credenza a priori (e qualche incertezza) alla probabilità di DLT ad ogni dose. Le credenze a priori e le incertezze possono essere derivate da diverse fonti di informazione, come il lavoro pre-clinico, l’opinione clinica e i dati di studi precedenti. Se non sono disponibili dati anteriori rilevanti, si possono usare appropriati priori vaghi. Se ogni dose è considerata ugualmente probabile essere la MTD prima della sperimentazione, un priore “meno informativo” può essere ottenuto per riflettere questa convinzione.
I dati dai pazienti nella sperimentazione sono utilizzati per aggiornare la distribuzione priore sul parametro(i) del modello, che poi dà una distribuzione posteriore per il parametro(i) del modello e quindi credenze posteriori per la probabilità di DLT ad ogni dose. Queste probabilità posteriori sono utilizzate per prendere decisioni di aumento della dose. Valutando le caratteristiche operative di un progetto con un priore specifico in una varietà di scenari, la distribuzione del priore può essere ricalibrata fino a quando il modello fornisce raccomandazioni per le escalation di dose e la MTD di cui il team della sperimentazione è soddisfatto. Questo processo iterativo aiuta a garantire che il progetto sia configurato in modo appropriato per la sperimentazione.
Regole decisionali
Con un approccio CRM, non assegniamo il paziente successivo (o i pazienti) a un livello di dose basato solo sulla proporzione di pazienti con DLT al livello di dose corrente. L’uso di un modello permette di prendere in prestito le informazioni attraverso i livelli di dose. Impariamo di più sul rischio di tossicità di altri livelli di dose sulla base dei dati accumulati, il che migliora l’efficienza della sperimentazione. Possiamo adattare la dose per il prossimo paziente o coorte stimando la probabilità di DLT per ogni livello di dose, con un approccio basato sulla verosimiglianza o bayesiano, e poi scegliere il livello di dose usando una regola decisionale specifica. Le regole decisionali possibili includono la scelta della dose con una probabilità stimata di DLT più vicina al TTL o, più conservativamente, la scelta della dose con una probabilità stimata di DLT più vicina, ma non superiore, al TTL. La prima opzione permette un’escalation più rapida verso la vera MTD, ma può esporre più pazienti a sovradosaggi. La seconda opzione riduce la possibilità di sovradosaggio dei pazienti, ma può richiedere più tempo per l’escalation verso la vera MTD.
Dimensione del campione e dimensione della coorte
Le dimensioni del campione pianificate negli studi di fase I sono generalmente dettate da vincoli pratici, come il numero di centri, i tassi di reclutamento previsti e il numero di livelli di dose, piuttosto che da vincoli statistici relativi al tasso di errore di tipo I o alla potenza minima per testare un’ipotesi specifica. Cheung ha proposto formule che utilizzano una percentuale media di selezione corretta della MTD (ad esempio, il 50% delle volte) per ottenere un limite inferiore per la dimensione del campione di prova. Possiamo poi usare le simulazioni per valutare le caratteristiche operative del progetto con la dimensione del campione fissata a questo limite inferiore, e rivedere la dimensione del campione se necessario. Suggeriamo di specificare un limite inferiore basato sul lavoro di Cheung e un limite superiore pratico nelle domande di sovvenzione e nei protocolli di sperimentazione.
Una volta che è stata specificata una dimensione ragionevole del campione, gli investigatori possono decidere quanti pazienti dovrebbero essere dosati ad ogni dose raccomandata prima che venga presa una decisione sull’aumento della dose; questa è chiamata dimensione della coorte. Una dimensione della coorte di un paziente fornirà migliori caratteristiche operative rispetto al dosaggio di diversi pazienti contemporaneamente a un livello di dose, anche se quest’ultimo può ridurre la durata della sperimentazione e ancora eseguire meglio del disegno 3 + 3 . I requisiti normativi possono anche influenzare le dimensioni della coorte. Per esempio, ci può essere richiesto di osservare i dati di sicurezza del primo paziente prima di dosare altri pazienti in quella coorte. A seguito dei recenti disastri della sperimentazione di fase I dell’anticorpo monoclonale TGN1412 di TeGenero e dell’inibitore dell’idrolasi dell’ammide degli acidi grassi BIA 10-2474 di Bial, le misure per il monitoraggio dei pazienti devono essere in atto se vengono utilizzate coorti di due o più pazienti.
Modifiche alla sicurezza
Possono essere facilmente apportate modifiche ai disegni di sperimentazione e alle regole di escalation della dose per prevenire il sovradosaggio dei pazienti e garantire un disegno di sperimentazione con caratteristiche operative ragionevoli. Per esempio, l’approccio CRM originale proponeva di dosare il primo paziente alla MTD ipotizzata in precedenza, ma molti sperimentatori propongono di dosare il primo paziente a un livello inferiore a questo (eventualmente anche il più basso). Per lo studio Viola, che ha utilizzato il CRM per trovare la MTD di lenalidomide e azacitidina in pazienti con leucemia mieloide acuta recidivata dopo il trapianto allogenico di cellule staminali, la metà (quarta) delle sette dosi possibili è stata considerata la MTD precedente. Tuttavia, il team dello studio ha scelto di iniziare con la dose inferiore a questo livello (terza). Alcuni hanno suggerito di non saltare i livelli di dose non testati durante l’escalation per ridurre il numero di pazienti esposti a dosi tossiche. Faries ha anche imposto una dose-escalation coerente: se l’ultimo paziente ha avuto una DLT, il paziente successivo non avrebbe ricevuto una dose superiore a quella dell’ultimo paziente, anche se il modello lo raccomandava. Nella maggior parte delle configurazioni di prova del CRM, la coerenza è garantita, anche se questo dovrebbe essere verificato nelle simulazioni.
Regole di arresto
Dobbiamo dichiarare i criteri per fermare la prova prima che il numero massimo di pazienti sia stato trattato. La terminazione anticipata può essere considerata se la MTD è giudicata al di fuori dell’insieme di dosi pianificate (cioè, tutte le dosi sono troppo tossiche o tutte le dosi hanno una probabilità di una DLT ben al di sotto del TTL), o se è improbabile che l’aggiunta di altri pazienti nello studio produca informazioni che cambierebbero la stima corrente della MTD. Gli sperimentatori possono interrompere una sperimentazione se: un numero fisso di pazienti è stato dosato consecutivamente a un livello di dose; la probabilità stimata di tutti i livelli di dose con un tasso di DLT superiore (o inferiore) al TTL è almeno del 90%; l’ampiezza dell’intervallo di confidenza basato sulla probabilità o dell’intervallo credibile bayesiano per la MTD raggiunge un livello particolare; la probabilità che i prossimi m pazienti da dosare nella sperimentazione ricevano lo stesso livello di dose, indipendentemente dai risultati di DLT osservati, supera un certo livello (ad esempio, il 90%); o qualsiasi combinazione di questi. Se si arresta uno studio dopo un numero fisso di pazienti, il numero dovrebbe essere scelto in base a qualche criterio probabilistico, ad esempio se 10 pazienti consecutivi ricevono lo stesso livello di dose, allora siamo sicuri almeno al 90% che la dose corrente è la MTD. Pertanto, l’utilizzo di approcci probabilistici per la cessazione anticipata, o la giustificazione di altre regole di arresto utilizzando le probabilità, è incoraggiato. Nello studio Viola, lo studio sarebbe stato interrotto precocemente per tossicità se la probabilità che il rischio di DLT alla dose più bassa fosse almeno del 10% superiore al TTL superava il 72%; questo è stato adattato in base ai desideri dei clinici di interrompere lo studio se avessero visto un numero inaspettato di DLT alla dose più bassa.
Valutazione dei progetti tramite simulazione
Una volta che una configurazione iniziale del progetto è stata specificata secondo i parametri di cui sopra, abbiamo bisogno di capire le caratteristiche operative di un progetto sotto diversi scenari di dose-tossicità. Questo si ottiene al meglio con la simulazione da parte dello statistico di molti studi per ogni scenario. Gli obiettivi di questi studi di simulazione sono:
-
dimostrare che un disegno ha caratteristiche operative soddisfacenti per gli standard del team di sperimentazione, o fornire risultati che il team di sperimentazione può utilizzare per discutere e modificare il disegno;
-
formare un confronto completo di disegni alternativi, compreso il disegno 3 + 3 e un disegno di riferimento;
-
identificare chiaramente le migliori scelte dei parametri;
-
giustificare la dimensione del campione; e
-
fornire informazioni da usare nelle domande di sovvenzione e nel protocollo.
Le caratteristiche operative valutate dovrebbero includere la probabilità di selezionare ogni dose come MTD, il numero/proporzione di pazienti che ricevono ogni dose, il numero di DLT per dose e in totale, la dimensione prevista del campione e la durata prevista dello studio.
Gli scenari di dose-tossicità usati nello studio di simulazione dovrebbero includere: scenari in cui ogni dose è di fatto la MTD; due scenari estremi, in cui la dose più bassa è al di sopra della MTD e la dose più alta è al di sotto della MTD; e qualsiasi altro scenario che i clinici ritengano plausibile. Vale la pena considerare scenari improbabili ma estremi (ad esempio, le prime dosi sono molto al di sotto della MTD, poi le successive molto al di sopra della MTD) per vedere come si comporta il disegno dello studio. Per la progettazione dello studio CHARIOT, Frangou et al. hanno considerato curve dose-tossicità reali su sei livelli di dose (programmi), che includevano scenari in cui il TTL del 25% si trovava ad una dose esatta, o si trovava tra due programmi di dose. Brock et al. , nel condurre le simulazioni pre-test per lo studio Matchpoint, hanno esaminato sei scenari di dose-tossicità su quattro livelli di dose; questi includevano due scenari in cui la MTD (la dose con un rischio atteso di DLT pari al 40%) era situata tra due livelli di dose (Fig. 4).
Gli studi di simulazione pre-prova dovrebbero essere condotti seguendo le migliori pratiche raccomandate:
-
Creare un piano di simulazione dettagliato, compreso il tempo previsto per l’installazione, le risorse necessarie e il tempo complessivo necessario per ottenere risultati ;
-
Registrare il seme casuale utilizzato, per consentire la replica;
-
Generare una vasta gamma di scenari da studiare;
-
Specificare il numero di repliche di simulazione necessarie per ridurre la variabilità delle caratteristiche operative. Sebbene non esista un numero ideale, maggiore è il numero di simulazioni, minore è la variabilità dei risultati;
-
Eseguire tutti i disegni concorrenti (compreso un disegno 3 + 3) attraverso tutti gli scenari di simulazione per confrontare le caratteristiche operative di interesse.
Oltre alle simulazioni, possiamo valutare le raccomandazioni del modello sulla base di un possibile insieme di dati di prova. Possiamo calcolare in anticipo ogni sequenza fattibile di dosi risultanti da diverse risposte DLT/non-DLT dei pazienti nelle coorti successive; questi sono noti come percorsi di transizione della dose. Il team di sperimentazione può generare percorsi di transizione della dose per vedere se il progetto mostra un comportamento indesiderato, come ad esempio non fermare la sperimentazione nonostante l’osservazione di un’eccessiva tossicità a basse dosi. Il progetto può quindi essere ricalibrato per fornire percorsi di transizione della dose che soddisfino i medici e il team dello studio. Yap et al. descrivono come hanno usato i percorsi di transizione della dose per progettare lo studio Viola. La figura 5 illustra il processo di progettazione dello studio nella sua interezza. La struttura iterativa mostra le discussioni che sono necessarie per decidere i diversi aspetti del disegno, e come e quando dovrebbero essere valutati.
Finire il disegno
Una volta concordato il disegno della sperimentazione, le simulazioni pre-prova dovrebbero essere documentate, dettagliando le specifiche di set-up, quali disegni sono stati confrontati in quali scenari, e un riassunto facilmente interpretabile delle caratteristiche principali del disegno. Questo rapporto può essere incluso nell’appendice del protocollo o nel piano di analisi statistica, o può essere un rapporto separato che è formalmente riconosciuto nel protocollo e nel piano di analisi statistica e memorizzato nel file principale dello studio. Forniamo una descrizione generale del CRM che può essere usato nei protocolli di sperimentazione nel file aggiuntivo 1: Appendice C. I destinatari del rapporto di simulazione sono i team interni del progetto e il comitato etico della ricerca. Per alcuni studi di dosaggio, i rapporti di simulazione potrebbero dover essere presentati alle autorità di regolamentazione.
Conduzione della sperimentazione
Una volta che il disegno della sperimentazione è stato confermato e la sperimentazione è iniziata, il livello di dose raccomandato per il paziente successivo è determinato come segue:
- i)
Ottenere i dati disponibili sui pazienti attualmente in studio;
- ii)
Aggiornare le probabilità DLT stimate ad ogni dose usando il modello;
- iii)
Scrivere un breve rapporto dettagliando la raccomandazione della dose del modello, insieme alle stime delle probabilità DLT a tutte le dosi e qualsiasi altra quantità di interesse; e
- iv)
Se necessario, tenere una riunione del comitato di definizione della dose (DSC), o del comitato di revisione della sicurezza (SRC), per decidere formalmente se utilizzare la raccomandazione del modello o raccomandare una dose diversa (basata su ulteriori dati di tossicità non DLT). Il DSC è composto da ricercatori, clinici e membri del gruppo di gestione dello studio. I membri del comitato partecipano alle riunioni di decisione sulla dose di persona o in teleconferenza, e consigliano come la sperimentazione dovrebbe procedere sulla base dei dati di sicurezza maturati durante la sperimentazione. I percorsi di transizione della dose possono essere calcolati per una o più coorti future per aiutare il DSC nelle sue raccomandazioni.
I risultati dello studio intermedio dovrebbero essere riportati per assistere il DSC nel processo decisionale. I risultati di interesse rientrano in due categorie: i dati osservati dello studio, come i gradi e i tipi di eventi avversi sperimentati da ciascun paziente e il numero di eventi avversi classificati come DLT; e i risultati probabilistici dedotti dal modello di dose-tossicità.
Contenuti della relazione
I risultati dei dati osservati dello studio possono essere presentati in semplici tabelle di frequenza. Una tabella di tutti gli eventi avversi osservati come righe, con i gradi di tossicità come colonne, dovrebbe essere popolata dal numero di pazienti che hanno sperimentato ogni evento avverso di un particolare grado. Per esempio, se si usa il sistema di classificazione Common Terminology Criteria for Adverse Events (NCI CTCAE) del National Cancer Institute, i gradi bassi (per esempio, 1 e 2) possono essere combinati, così come i gradi più alti (3 e 4) se, per esempio, ogni evento avverso di grado 3 o superiore è classificato come DLT. Qualsiasi fatalità osservata, classificata come evento avverso di grado 5, deve essere riportata separatamente. Alcune pubblicazioni di trial dividono questi dati tra i livelli di dose, fornendo una ripartizione più accurata delle dosi a cui sono stati osservati gli eventi avversi. Per i risultati probabilistici, si raccomanda di fornire la probabilità stimata (media/mediana) di DLT per livello di dose con qualche misura di variazione o intervallo di confidenza/credibilità, in una tabella o in un grafico.
Software per aggiornare i modelli e produrre rapporti
Sono stati sviluppati diversi pacchetti software per progettare, condurre e analizzare studi di determinazione della dose usando disegni basati su regole e il CRM (Tabella 2). Questi includono pacchetti software per programmi statistici popolari (per esempio, R e Stata), così come programmi autonomi con interfacce utente point-and-click, alcuni dei quali sono liberamente disponibili online. Molti di questi pacchetti includono strumenti per generare scheletri ed etichette di dose in diversi modelli di dose-tossicità e per simulare e condurre studi usando metodi basati sulla verosimiglianza e bayesiani. I file di aiuto sono disponibili per tutti i programmi, e la maggior parte sono forniti di esempi.