Que doses são investigadas em um estudo é frequentemente determinada por restrições práticas. Para tratamentos orais, por exemplo, os níveis de dose podem aumentar com base no número de comprimidos. Se o tratamento for produzido especificamente para o estudo (como em estudos realizados em primeira mão), as finanças podem limitar quantos níveis de dose podem ser fabricados. No entanto, técnicas como a escalada alométrica podem ser usadas para escolher quais doses devem ser estudadas. Em uma revisão de 197 ensaios fase I publicada entre 1997 e 2008, o número médio de níveis de dose explorados foi cinco (intervalo 2-12) .
A chance aceitável de um paciente experimentar um DLT (o TTL) deve ser definida antes do início do ensaio. A TTL depende da doença, do tratamento sob investigação, da disponibilidade de opções de tratamento alternativas, do desempenho dos pacientes e dos prováveis eventos adversos associados incluídos na definição de DLT. A LDT é determinada pela experiência clínica, evidências de estudos anteriores e orientação do estatístico do estudo. Muitas vezes a LTT é definida entre 20 e 35%, mas alguns estudos definiram a LTT como sendo de 40% .
Precisamos afirmar como iremos modelar a relação entre a dose e o risco de observar uma LTTL. O modelo de dose-toxicity descreve a probabilidade de um paciente experimentar uma DLT em uma determinada dose (a relação dose-toxicity). O modelo é uma função matemática fixa que aumenta monotonicamente na dose, ou seja, à medida que a dose aumenta, aumenta também a probabilidade de se observar uma DLT. O modelo está escrito como F(β, d), onde F(-,-) é a função dose-toxicidade escolhida (ver Tabela 1), β é um vetor de um ou mais parâmetros que altera a forma da relação dose-toxicidade, e d é o rótulo de dose para uma determinada dose de droga. A Figura 2 mostra algumas relações dose-toxicidade para diferentes escolhas de funções e valores de parâmetros.
Tabela 1 Escolhas comuns para modelos de dose-toxicidade e rótulos de dose resultante para o CRM
>
Fig. 2
>
Relações de dose-toxicidade para diferentes funções de dose-toxicidade com valores variáveis de parâmetros
>
>
Esqueleto de dose-toxicidade
>
Selecionar um modelo para a relação dose-toxicidade pode parecer assustador no início. Contudo, podemos assegurar que o modelo escolhido tem uma forma sensata sobre os níveis de dose de interesse, especificando um esqueleto. O esqueleto é o conjunto de probabilidades esperadas de DLT nos níveis de dose de interesse e é especificado por um ou mais clínicos antes do ensaio. Para um estudo com níveis de dose k, a equipe clínica especifica uma estimativa média prévia para a probabilidade de DLT em cada dose. Estes são indicados aqui como p1, …, pk (o esqueleto), e são apenas limitados a serem monotonicamente crescentes e distintos uns dos outros. Para o modelo de toxicidade dose-F(-,-), a etiqueta de dose para a dose ith é então di, tal que pi = F(β*, di). Aqui, β* pode ser a média ou mediana prévia do parâmetro do modelo β. O uso de rótulos de dose garante que o modelo se encaixa no esqueleto bem antes do ensaio; a escala de dose real do medicamento não importa. As escolhas de modelo comuns, os valores de referência anteriores e os rótulos de dose resultantes são apresentados na Tabela 1. Um exemplo de transformação de doses específicas do medicamento em rótulos de dose é mostrado na Fig. 3 (cálculos apresentados na Tabela A1 (arquivo adicional 1: Apêndice A)).
Fig. 3 >
>
Exemplo de transformação de doses específicas do medicamento em rótulos de dose usando probabilidades anteriores do esqueleto de risco de DLT. Modelo logístico de dois parâmetros com valores médios prévios de parâmetros β1 = 2 e β2 = 1 (ver Tabela A1 no arquivo adicional 1: Apêndice A para cálculos).
Ultimamente, a escolha do modelo e do esqueleto não é única, pois diferentes paramentos de modelo de dose-toxicidade e esqueleto podem levar a recomendações idênticas de dose-escalonamento após uma determinada sequência de observações . Em relação ao modelo logístico de um parâmetro, o valor da intercepção fixa (definida como 3 na Tabela 1) não afecta a forma do modelo de toxicidade dose-dosagem. No entanto, o valor da intercepção fixa afecta os rótulos de dose resultantes e os intervalos credíveis. Ao desenhar um ensaio de capecitabina em combinação com epirubicina e ciclofosfamida em pacientes com câncer de mama avançado, Morita mostrou que a alteração do valor da interceptação mudou a maior incerteza no risco de DLT da dose mais baixa para a dose mais alta. Portanto, se utilizar o modelo logístico de um parâmetro, a intercepção pode ser escolhida para dar incertezas prévias em torno dos níveis de dose que correspondem às expectativas clínicas.
Disposições transversais investigaram como o número de parâmetros do modelo afeta as propriedades teóricas e características operacionais de um projeto de CRM, incluindo a chance de estimar cada dose como a DTM, porcentagem de pacientes alocada para cada nível de dose, tamanho médio da amostra e proporção média de pacientes que experimentarão uma DLT . O uso de um modelo de um ou dois parâmetros afeta o quão fortemente os dados em doses mais baixas influenciam a próxima escolha de dose. Um modelo de um parâmetro tem maior probabilidade de fazer recomendações que levem a um aumento mais rápido das doses, resultando em um estudo mais eficiente, mas colocando os participantes em maior risco de experimentar DLTs. Um modelo de dois parâmetros provavelmente estimará melhor a forma de toda a relação dose-toxicidade, mas menos eficientemente identificará a DTM; pode levar mais tempo para atingir a DTM, já que dois parâmetros devem ser estimados, e pode haver dificuldades para adequar o modelo ou obter estimativas consistentes dos parâmetros do modelo .
Embora não possamos conhecer a verdadeira forma da relação dose-toxicidade, as recomendações de dose feitas após cada coorte se aproximarão mais da DTM. Certamente com um modelo de um parâmetro, chegaremos a uma estimativa confiável do MTD (e sua probabilidade de DLT), mesmo que nossas estimativas de doses mais distantes sejam imprecisas. Este resultado é insensível ao modelo e às etiquetas de dose utilizadas, embora as probabilidades do esqueleto devam estar razoavelmente bem espaçadas. Um esqueleto com probabilidades anteriores de DLT muito próximas entre si levará a um escalonamento mais lento da dose, e um esqueleto com probabilidades anteriores de DLT muito distantes levará a uma convergência pobre em direção ao MTD . Lee e Cheung e Cheung propuseram a escolha de um esqueleto especificando o TTL e um intervalo de indiferença. Este é um intervalo de probabilidade dentro do qual o clínico está feliz por a probabilidade DLT do MTD cair. Por exemplo, uma TTL de 25%, dar ou receber 5%, dá um intervalo de indiferença de . Um exemplo de escolha de um esqueleto usando a abordagem de intervalo de indiferença é dado no arquivo adicional 1: Apêndice B.
Após o número de níveis de dose, a TTL, o modelo de toxicidade da dose e o esqueleto terem sido especificados, outros componentes do desenho do estudo podem ser discutidos.
Inferência
Para tomar decisões combinando os dados do estudo e outras evidências, devemos declarar como pretendemos fazer inferências estatísticas sobre o(s) parâmetro(s) do modelo e, portanto, a probabilidade DLT estimada em cada dose.
Uma abordagem baseada em probabilidade pode ser usada; o(s) parâmetro(s) do modelo (indicado(s) β anteriormente) são estimados através da aplicação de métodos de máxima probabilidade aos dados do estudo. Todos os principais pacotes de software estatístico podem realizar essas análises. Métodos de máxima verosimilhança só podem ser usados com dados de resposta heterogêneos (isto é, pelo menos uma resposta DLT e uma não DLT) para calcular estimativas de parâmetros . Para obter dados de resposta heterogêneos, o projeto é dividido em dois estágios. Pacientes individuais, ou pequenas coortes de pacientes, são atribuídos sequencialmente a níveis de dose crescentes até que a primeira DLT seja observada. O desenho baseado no modelo de verosimilhança assume então o controle; uma estimativa de máxima verosimilhança do parâmetro do modelo é usada para atualizar as probabilidades de DLT estimadas .
Uma outra abordagem é usar a inferência Bayesiana. Uma distribuição de probabilidade prévia é atribuída ao(s) parâmetro(s) do modelo, o que se traduz em atribuir uma crença prévia (e alguma incerteza) à probabilidade de DLT em cada dose. Crenças prévias e incertezas podem ser derivadas de diferentes fontes de informação, tais como trabalho pré-clínico, opinião clínica e dados de estudos anteriores . Quando dados anteriores relevantes não estão disponíveis, podem ser usados antecedentes vagos apropriados. Se cada dose for considerada igualmente provável que seja a DTM antes do estudo, um “menos informativo” anterior pode ser obtido para refletir esta crença .
Dados de pacientes no estudo são usados para atualizar a distribuição anterior no(s) parâmetro(s) modelo(s), que então dá uma distribuição posterior para o(s) parâmetro(s) modelo(s) e, portanto, crenças posteriores para a probabilidade de DLT em cada dose. Estas probabilidades posteriores são usadas para tomar decisões de escalonamento de dose. Ao avaliar as características operacionais de um desenho com um a priori específico numa variedade de cenários, a distribuição prévia pode ser recalibrada até que o modelo faça recomendações de escalonamento de dose e o MTD que a equipe do estudo esteja satisfeita com . Este processo iterativo ajuda a garantir que o desenho seja configurado apropriadamente para o ensaio.
Regras de decisão
A partir de uma abordagem de CRM, não atribuímos o(s) próximo(s) paciente(s) a um nível de dose baseado apenas na proporção de pacientes com DLTs no nível de dose atual. O uso de um modelo permite o empréstimo de informações através dos níveis de dose. Aprendemos mais sobre o risco de toxicidade de outros níveis de dose com base em dados acumulados, o que melhora a eficiência do estudo. Podemos adaptar a dose para o próximo paciente ou coorte, estimando a probabilidade de DLT para cada nível de dose, seja a partir de uma abordagem baseada em probabilidade ou Bayesiana, e depois escolher o nível de dose usando uma regra de decisão especificada. As possíveis regras de decisão incluem a escolha da dose com uma probabilidade estimada de DLT mais próxima da TTL ou, de forma mais conservadora, a escolha da dose com uma probabilidade estimada de DLT mais próxima da TTL, mas não maior que esta. A primeira opção permite um escalonamento mais rápido em direção à DTM verdadeira, mas pode expor mais pacientes a overdoses. A segunda opção reduz a probabilidade de sobredosagem dos pacientes, mas pode demorar mais tempo a escalar para o verdadeiro MTD.
tamanho da amostra e tamanho da coorte
tamanho das amostras planeadas nos ensaios da fase I são geralmente ditados por restrições práticas, tais como o número de centros, taxas de recrutamento projectadas e número de níveis de dose, em vez de restrições estatísticas relacionadas com a taxa de erro do tipo I ou potência mínima para testar uma hipótese específica. Cheung propôs fórmulas que utilizam uma porcentagem média alvo de seleção correta do MTD (digamos, 50% do tempo) para obter um limite inferior para o tamanho da amostra do estudo. Podemos então usar simulações para avaliar as características operacionais do projeto com o tamanho da amostra fixado nesse limite inferior e revisar o tamanho da amostra, se necessário. Sugerimos especificar um limite inferior com base no trabalho de Cheung e um limite superior prático nos pedidos de subsídio e protocolos de estudo.
Após a especificação de um tamanho de amostra razoável, os investigadores podem decidir quantos pacientes devem ser dosados em cada dose recomendada antes de uma decisão de dosagem ser tomada; isto é chamado tamanho da coorte. Um tamanho de coorte de um paciente proporcionará melhores características operacionais do que a dosagem de vários pacientes simultaneamente a um nível de dose, embora este último possa reduzir a duração do estudo e ainda ter um desempenho melhor do que o desenho 3 + 3 . Os requisitos regulamentares também podem afetar o tamanho da coorte. Por exemplo, podemos ser obrigados a observar os dados de segurança do primeiro paciente antes de dosear outros pacientes da coorte. Após os recentes desastres da fase I do ensaio do anticorpo monoclonal TGN1412 de TeGenero e do inibidor de amida de ácido gordo Bial BIA 10-2474, as medidas para monitorizar os doentes devem estar em vigor se forem utilizados coortes de dois ou mais doentes .
Modificações de segurança
Modificações nos desenhos de ensaio e nas regras de escalada de dosagem podem ser facilmente feitas para prevenir a sobredosagem de doentes e assegurar que um desenho de ensaio tem características operacionais sensatas. Por exemplo, a abordagem original de CRM propôs a dosagem do primeiro paciente na suposição MTD anterior, mas muitos experimentadores propõem a dosagem do primeiro paciente em um nível inferior a este (possivelmente até o mais baixo). Para o estudo Viola , que utilizou o MRC para encontrar o MTD de lenalidomida e azacitidina em pacientes com leucemia mielóide aguda recidivante após o transplante alogênico de células-tronco, a dose média (quarta) de sete doses possíveis foi considerada como o MTD prévio. No entanto, a equipa do estudo optou por começar na dose abaixo deste nível (terceiro) . Alguns sugeriram não saltar os níveis de dose não testados ao aumentar para reduzir o número de pacientes expostos a doses tóxicas . A variação também forçou uma dosagem coerente: se o último paciente tivesse uma DLT, o próximo paciente não receberia uma dose maior do que a do último paciente, mesmo que o modelo o recomendasse. Sob a maioria das configurações do CRM, a coerência é garantida, embora isso deva ser verificado em simulações.
Regras de interrupção do estudo
Precisamos de estabelecer critérios para interromper o estudo antes que o número máximo de pacientes tenha sido tratado. O término antecipado pode ser considerado se o MTD for julgado fora do conjunto de doses planejadas (ou seja, todas as doses são muito tóxicas ou todas as doses têm uma probabilidade de um DLT bem abaixo da TTL), ou se a adição de mais pacientes ao estudo dificilmente produzirá informações que alterem a estimativa MTD atual. Os investigadores podem interromper um estudo se: um número fixo de pacientes tiver sido dosado consecutivamente a um nível de dose; a probabilidade estimada de todos os níveis de dose terem uma taxa de DLT acima (ou abaixo) da LDT for pelo menos 90%; a largura do intervalo de confiança baseado na probabilidade ou o intervalo Bayesiano credível para a DTM atingir um determinado nível; a probabilidade de que os próximos m pacientes a serem dosados no estudo recebam a mesma dose, independentemente dos resultados de DLT observados, exceder algum nível (por exemplo, 90%); ou qualquer combinação destes . Se parar um estudo após um número fixo de pacientes, o número deve ser escolhido com base em algum critério probabilístico, por exemplo, se 10 pacientes consecutivos receberem a mesma dose, então estamos pelo menos 90% certos de que a dose atual é a DTM. Portanto, é encorajado o uso de abordagens probabilísticas para terminar antecipadamente, ou a justificação de outras regras de parada usando probabilidades. No ensaio Viola, o ensaio seria interrompido mais cedo por toxicidade se a hipótese de que o risco de DLT na dose mais baixa fosse pelo menos 10% acima da TTL excedesse 72%; isto foi adaptado com base no desejo dos clínicos de interromper o ensaio se vissem um número inesperado de DLT na dose mais baixa .
Avaliação dos desenhos por simulação
A partir do momento em que uma configuração inicial para o desenho tenha sido especificada de acordo com os parâmetros acima, precisamos compreender as características operacionais de um desenho sob diferentes cenários de toxicidade da dose. Isto é melhor alcançado pelo estatístico do estudo simulando muitos estudos sob cada cenário. Os objetivos destes estudos de simulação são os seguintes:
demonstrar que um desenho tem características operacionais satisfatórias pelos padrões da equipe do estudo, ou dar resultados que a equipe do estudo pode usar para discutir e modificar o desenho;
formar uma comparação abrangente de desenhos alternativos, incluindo o desenho 3 + 3 e um desenho de referência ;
identificar claramente as melhores escolhas de parâmetros;
justificar o tamanho da amostra; e
dar informações para uso em pedidos de subsídios e no protocolo.
As características operacionais avaliadas devem incluir a probabilidade de selecionar cada dose como MTD, número/proporção de pacientes dada cada dose, número de DLTs por dose e, no total, tamanho de amostra esperado e duração esperada do estudo.
Os cenários de dose-toxicidade utilizados no estudo de simulação devem incluir: cenários em que cada dose é de facto o MTD; dois cenários extremos, em que a dose mais baixa está acima do MTD e a dose mais alta está abaixo do MTD; e quaisquer outros que os clínicos acreditem ser plausíveis. Vale a pena considerar cenários improváveis mas extremos (por exemplo, as primeiras doses estão muito abaixo do MTD, depois a próxima dose mais alta está muito acima do MTD) para ver como o desenho do estudo se comporta. Para o desenho do ensaio CHARIOT, Frangou et al. consideraram as verdadeiras curvas de toxicidade de dose em seis níveis de dose (cronogramas), que incluíram cenários em que a TTL de 25% foi encontrada numa dose exata, ou foi localizada entre dois cronogramas de dose. Brock et al., ao realizar simulações pré-julgamento do estudo Matchpoint, observaram seis cenários de dose-toxicidade em quatro níveis de dose; estes incluíram dois cenários onde a MTD (dose com risco esperado de DLT igual a 40%) estava localizada entre dois níveis de dose (Fig. 4).
Fig. 4
Cenários de toxicidade por dose explorados no ensaio Matchpoint. A linha vermelha indica TTL de 40%
Os estudos de simulação pré-julgamento devem ser conduzidos seguindo as melhores práticas recomendadas :
Criar um plano de simulação detalhado, incluindo tempo de preparação esperado, recursos necessários e tempo total necessário para obter resultados ;
Recordar a semente aleatória utilizada, para permitir a replicação;
Gerar uma ampla gama de cenários para investigar;
Especificar o número de replicações de simulação necessárias para reduzir a variabilidade nas características operacionais. Embora não haja um número ideal, quanto maior o número de simulações, menor a variabilidade nos resultados;
Executar todos os projetos concorrentes (incluindo um projeto 3 + 3) em todos os cenários de simulação para comparar as características operacionais de interesse;
Além das simulações, podemos avaliar as recomendações do modelo com base em um possível conjunto de dados de teste. Podemos calcular antecipadamente cada seqüência viável de doses resultantes de diferentes respostas DLT/não-DLT dos pacientes nas próximas coortes; estas são conhecidas como vias de transição de dose. A equipe do estudo pode gerar vias de transição de dose para ver se o desenho exibe comportamento indesejável, como não interromper o estudo apesar de observar toxicidade excessiva em doses baixas. O desenho pode então ser recalibrado para fornecer vias de transição de dose que os clínicos e a equipe do estudo estejam satisfeitos. Yap et al. descrevem como eles usaram as vias de transição de dose para desenhar o estudo Viola. A Figura 5 ilustra o processo de desenho do estudo em sua totalidade. A estrutura iterativa mostra as discussões necessárias para decidir sobre diferentes aspectos do desenho, e como e quando eles devem ser avaliados.
Fig. 5
>
Flowchart do processo de desenho do estudo usando o CRM
>
>
>
Finalizar o desenho
>
Após o desenho do estudo ter sido acordado, as simulações pré-julgamento devem ser documentadas, detalhando as especificações de configuração, quais desenhos foram comparados sob quais cenários, e um resumo facilmente interpretável das principais características do desenho. Este relatório pode ser incluído no apêndice do protocolo ou no plano de análise estatística, ou pode ser um relatório separado que é formalmente reconhecido no protocolo e no plano de análise estatística e armazenado no arquivo mestre do estudo. Fornecemos uma descrição geral do CRM que pode ser usado nos protocolos do estudo no arquivo adicional 1: Apêndice C. Os públicos-alvo para o relatório de simulação são as equipes internas do projeto e o comitê de ética da pesquisa. Para alguns ensaios de dose-finding, os relatórios de simulação podem precisar ser submetidos aos reguladores.
Condução do estudo
Após o desenho do estudo ter sido confirmado e o estudo ter começado, o nível de dose recomendado para o próximo paciente é determinado da seguinte forma:
i)
Obter dados disponíveis sobre os pacientes atualmente no estudo;
ii)
Atualizar as probabilidades estimadas de DLT em cada dose usando o modelo;
iii)
Escrever um breve relatório detalhando a recomendação da dose do modelo, juntamente com estimativas das probabilidades de DLT em todas as doses e quaisquer outras quantidades de interesse; e
iv)
Se necessário, realize uma reunião do comitê de ajuste de dose (DSC), ou comitê de revisão de segurança (SRC), para decidir formalmente se deve usar a recomendação do modelo ou recomendar uma dose diferente (com base em dados adicionais de toxicidade não-DLT). O DSC é composto por investigadores, clínicos e membros do grupo de gestão do ensaio. Os membros do comité participam pessoalmente ou por teleconferência em reuniões de decisão de dose, e aconselham como o ensaio deve prosseguir com base nos dados de segurança acumulados durante o ensaio. As vias de transição de dose podem ser computadas para um ou mais futuros coortes para ajudar o DSC em suas recomendações.
Os resultados dos ensaios intermédios devem ser relatados para ajudar o DSC na tomada de decisões. Os resultados de interesse dividem-se em duas categorias: dados de estudos observados, tais como as notas e tipos de eventos adversos experimentados por cada paciente e o número de eventos adversos que são classificados como DLT; e resultados probabilísticos inferidos a partir do modelo de dose-toxicidade.
Conteúdo do relatório
Os resultados dos dados de estudos observados podem ser apresentados em tabelas de frequência simples. Uma tabela de todos os eventos adversos observados como linhas, com graus de toxicidade como colunas, deve ser preenchida com o número de pacientes que experimentaram cada evento adverso de um determinado grau. Por exemplo, se for utilizado o sistema de classificação do National Cancer Institute’s Common Terminology Criteria for Adverse Events (NCI CTCAE) , notas baixas (por exemplo, 1 e 2) podem ser combinadas, assim como notas mais altas (3 e 4) se, digamos, qualquer evento adverso de grau 3 ou mais alto for classificado como um DLT. Qualquer fatalidade observada, classificada como evento adverso de grau 5, deve ser relatada separadamente. Algumas publicações de estudos dividem esses dados em níveis de dose, fornecendo uma discriminação mais precisa de quais doses de eventos adversos foram observadas. Para resultados probabilísticos, recomendamos fornecer a probabilidade estimada (média/mediana) de DLT por nível de dose com alguma medida de variação ou intervalo de confiança/credibilidade, seja em uma tabela ou gráfico.
Software para atualização de modelos e produção de relatórios
Os pacotes de software Several foram desenvolvidos para projetar, conduzir e analisar estudos de dose-finding usando desenhos baseados em regras e o CRM (Tabela 2). Estes incluem pacotes de software para programas estatísticos populares (por exemplo, R e Stata), bem como programas autônomos com interfaces de usuário do tipo apontar e clicar, alguns dos quais estão disponíveis gratuitamente online. Muitos destes pacotes incluem ferramentas para gerar esqueletos e rótulos de dose sob diferentes modelos de toxicidade de dose e para simular e conduzir testes usando métodos baseados em probabilidade e Bayesianos. Arquivos de ajuda estão disponíveis para todos os programas, e a maioria é fornecida com exemplos.
Table 2 Software para projetar, simular e conduzir testes de dosagem usando desenhos baseados em regras e o CRM