Her beskriver og diskuterer vi de nøgleparametre, der er nødvendige for at oprette og gennemføre et CRM-forsøg. Disse er: Antal doser; Måltoksicitetsniveau; Dosis-toksicitetsmodel; Dosis-toksicitetsskelet; Inferensmetode; Beslutningsregler; Prøvestørrelse og kohortestørrelse; Sikkerhedsændringer; og Stopregler.
- Antal doser
- Måltoksicitetsniveau
- Dosis-toksicitetsmodel
- Dose-toksicitetsskelet
- Inferens
- Beslutningsregler
- Stikprøvestørrelse og kohortestørrelse
- Sikkerhedsændringer
- Stopregler
- Evaluering af design ved simulering
- Finalisering af designet
- Vejledning af forsøget
- Rapportens indhold
- Software til opdatering af modeller og udarbejdelse af rapporter
Antal doser
Statistiske og praktiske overvejelser ligger til grund for valget af, hvor mange og hvilke doser der skal undersøges. Den vigtigste statistiske overvejelse er, om de doser og det dosisinterval, der undersøges, sandsynligvis vil gøre det muligt at foretage et nøjagtigt MTD-estimat. Figur 1 viser, hvordan forskellige valg af dosisintervaller påvirker valget af MTD under samme dosis-toksicitetsforhold. For få doser kan betyde, at MTD’en vil blive dårligt estimeret, mens for mange doser kan hindre dosiseskalering mod MTD’en.
Hvilke doser, der undersøges i et forsøg, er ofte bestemt af praktiske begrænsninger. For orale behandlinger kan dosisniveauer f.eks. øges på grundlag af antallet af tabletter. Hvis behandlingen fremstilles specifikt til undersøgelsen (som i first-in-man-undersøgelser), kan økonomien begrænse, hvor mange dosisniveauer der kan fremstilles. Der kan dog anvendes teknikker som f.eks. allometrisk skalering til at vælge, hvilke doser der skal undersøges . I en gennemgang af 197 fase I-forsøg, der blev offentliggjort mellem 1997 og 2008, var det gennemsnitlige antal dosisniveauer, der blev undersøgt, fem (interval 2-12) .
Måltoksicitetsniveau
Den acceptable chance for, at en patient oplever en DLT (TTL), skal fastsættes, før forsøget påbegyndes. TTL afhænger af sygdommen, den behandling, der undersøges, tilgængeligheden af alternative behandlingsmuligheder, patienternes præstationsstatus og sandsynlige associerede uønskede hændelser, der indgår i definitionen af DLT. TTL fastsættes på grundlag af klinisk ekspertise, dokumentation fra tidligere undersøgelser og vejledning fra forsøgsstatistikeren. Ofte fastsættes TTL mellem 20 og 35 %, men i nogle undersøgelser er TTL fastsat så højt som 40 % .
Dosis-toksicitetsmodel
Vi skal angive, hvordan vi vil modellere forholdet mellem dosis og risikoen for at observere en DLT. Dosis-toksicitetsmodellen beskriver sandsynligheden for, at en patient oplever en DLT ved en given dosis (dosis-toksicitetsforholdet). Modellen er en fast matematisk funktion, der er monotont stigende med dosis, dvs. at sandsynligheden for at observere en DLT stiger i takt med at dosis stiger. Modellen skrives som F(β, d), hvor F(-,-) er den valgte dosis-toksicitetsfunktion (se tabel 1), β er en vektor med en eller flere parametre, der ændrer dosis-toksicitetsrelationens form, og d er dosismærket for en bestemt lægemiddeldosis. Figur 2 viser nogle dosis-toksicitetsrelationer for forskellige valg af funktioner og parameterværdier.
Dose-toksicitetsskelet
Valg af en model for dosis-toksicitetsrelationen kan i første omgang virke skræmmende. Vi kan imidlertid sikre, at vores valgte model har en fornuftig form over de dosisniveauer, der er af interesse, ved at angive et skelet. Skelettet er det sæt af forventede DLT-sandsynligheder ved de relevante dosisniveauer og specificeres af en eller flere klinikere før forsøget. For et forsøg med k dosisniveauer angiver det kliniske team et forudgående gennemsnitligt estimat for sandsynligheden for DLT ved hver dosis. Disse er her angivet som p1, …, pk (skelettet) og er kun begrænset til at være monotont stigende og forskellige fra hinanden. For dosis-toksicitetsmodellen F(-,-) er dosismærket for den i’te dosis derefter di, således at pi = F(β*, di). Her kan β* være den forudgående middelværdi eller medianen for modelparameteren β. Ved at anvende dosismærker sikres det, at modellen passer godt til skelettet før forsøget; lægemidlets faktiske dosisskala er ligegyldig. Almindelige modelvalg, forudgående referenceværdier og resulterende dosismærker er angivet i tabel 1. Et eksempel på transformation fra lægemiddelspecifikke doser til dosismærker er vist i fig. 3 (beregninger er angivet i tabel A1 (Additional file 1: Appendix A)).
I sidste ende er valget af model og skelet ikke entydigt, da forskellige parringer af dosis-toksicitetsmodel og skelet kan føre til identiske anbefalinger om dosis-eskalering efter en given sekvens af observationer . Med hensyn til den logistiske model med én parameter påvirker værdien af det faste intercept (sat til 3 i tabel 1) ikke formen af dosis-toksicitetsmodellen. Værdien af det faste intercept påvirker imidlertid de resulterende dosismærker og troværdighedsintervallerne. Ved udformningen af et forsøg med capecitabin i kombination med epirubicin og cyclophosphamid til patienter med fremskreden brystkræft viste Morita, at en ændring af interceptets værdi flyttede den største usikkerhed i DLT-risikoen fra den laveste dosis til den højeste dosis. Hvis man anvender den logistiske model med én parameter, kan interceptet derfor vælges for at give forudgående usikkerheder omkring dosisniveauer, der matcher de kliniske forventninger.
I flere artikler er det undersøgt, hvordan antallet af modelparametre påvirker et CRM-designs teoretiske egenskaber og driftskarakteristika, herunder chancen for at estimere hver dosis som MTD, procentdelen af patienter, der tildeles hvert dosisniveau, den gennemsnitlige stikprøvestørrelse og den gennemsnitlige andel af patienter, der vil opleve en DLT . Anvendelse af en model med én eller to parametre påvirker, hvor stærkt data ved lavere doser påvirker det næste dosisvalg. En model med én parameter er mere tilbøjelig til at fremsætte anbefalinger, der fører til hurtigere eskalering gennem doserne, hvilket resulterer i et mere effektivt forsøg, men giver deltagerne større risiko for at opleve DLT’er. En model med to parametre vil sandsynligvis bedre kunne estimere formen af hele dosis-toksicitetsforholdet , men mindre effektivt identificere MTD’en; det kan tage længere tid at nå MTD’en, da der skal estimeres to parametre, og der kan være vanskeligheder med at tilpasse modellen eller opnå konsistente estimater af modelparametre .
Og selv om vi ikke kan kende den sande form af dosis-toksicitetsforholdet, vil de dosisanbefalinger, der gives efter hver kohorte, komme tættere på MTD’en. Med en model med én parameter vil vi helt sikkert nå frem til et pålideligt estimat af MTD’en (og dens sandsynlighed for DLT), selv om vores estimater for doser længere væk er unøjagtige. Dette resultat er ufølsomt over for den anvendte model og de anvendte dosismærker , selv om skelet-sandsynlighederne bør have en rimelig stor afstand mellem hinanden. Et skelet med forudgående DLT-sandsynligheder for tæt på hinanden vil føre til langsommere dosiseskalering, og et skelet med forudgående DLT-sandsynligheder for langt fra hinanden vil føre til dårlig konvergens mod MTD . Lee og Cheung og Cheung og Cheung foreslog at vælge et skelet ved at angive TTL og et indifferensinterval. Dette er et sandsynlighedsinterval, inden for hvilket klinikeren er tilfreds med, at DLT-sandsynligheden for MTD’en skal falde. F.eks. giver en TTL på 25 %, plus/minus 5 %, et indifferensinterval på . Et eksempel på valg af et skelet ved hjælp af indifferensintervalmetoden findes i Additional file 1: Appendix B.
Når antallet af dosisniveauer, TTL, dosis-toksicitetsmodellen og skelet er blevet specificeret, kan andre komponenter af forsøgsdesignet diskuteres.
Inferens
For at træffe beslutninger ved at kombinere de tiltagende forsøgsdata og anden evidens skal vi angive, hvordan vi agter at foretage statistiske inferencer på modelparameter(e) og dermed den estimerede DLT-sandsynlighed ved hver dosis.
Der kan anvendes en sandsynlighedsbaseret tilgang; modelparameter(e) (tidligere betegnet β) estimeres ved at anvende maximum likelihood-metoder på forsøgsdataene. Alle større statistiske softwarepakker kan udføre disse analyser. Maximum likelihood-metoder kan kun anvendes med heterogene responsdata (dvs. mindst ét DLT- og ét ikke-DLT-respons) til beregning af parameterestimater . For at opnå heterogene responsdata opdeles designet i to faser. Individuelle patienter eller små kohorter af patienter tildeles sekventielt stigende dosisniveauer, indtil den første DLT er observeret. Det sandsynlighedsmodelbaserede design tager derefter over; et maximum likelihood-estimat af modelparameteren anvendes til at opdatere de estimerede DLT-sandsynligheder .
En anden tilgang er at anvende Bayesian inference . Der tildeles en forudgående sandsynlighedsfordeling til modelparametrene, hvilket betyder, at der tildeles en forudgående tro (og en vis usikkerhed) til sandsynligheden for DLT ved hver dosis. Prior beliefs og usikkerheder kan udledes af forskellige informationskilder, f.eks. præklinisk arbejde, kliniske udtalelser og data fra tidligere forsøg . Hvis der ikke foreligger relevante forudgående data, kan der anvendes passende vage prioriteter . Hvis hver dosis anses for lige sandsynligt at være MTD før forsøget, kan der opnås en “mindst informativ” prioritet, som afspejler denne overbevisning.
Data fra patienter i forsøget anvendes til at opdatere prioritetsfordelingen for modelparametrene, som derefter giver en efterfølgende fordeling for modelparametrene og dermed efterfølgende overbevisninger for sandsynligheden for DLT ved hver dosis. Disse posterior-sandsynligheder anvendes til at træffe beslutninger om dosisoptrapning. Ved at vurdere et designs funktionskarakteristika med en specifik prioritet i en række forskellige scenarier kan prioritetsfordelingen omkalibreres, indtil modellen giver anbefalinger om dosisoptrapning og MTD, som forsøgsteamet er tilfreds med . Denne iterative proces er med til at sikre, at designet er passende konfigureret til forsøget.
Beslutningsregler
Med en CRM-tilgang tildeler vi ikke de(n) næste patient(er) til et dosisniveau udelukkende på grundlag af andelen af patienter med DLT’er ved det aktuelle dosisniveau. Ved at bruge en model er det muligt at låne oplysninger på tværs af dosisniveauer. Vi lærer mere om toksicitetsrisikoen ved andre dosisniveauer på baggrund af akkumulerede data, hvilket forbedrer forsøgets effektivitet. Vi kan tilpasse dosen til den næste patient eller kohorte ved at estimere sandsynligheden for DLT for hvert dosisniveau, enten ud fra en sandsynlighedsbaseret eller Bayesiansk tilgang, og derefter vælge dosisniveauet ved hjælp af en specificeret beslutningsregel. Mulige beslutningsregler omfatter valg af dosis med en estimeret sandsynlighed for DLT, der ligger tættest på TTL, eller, mere konservativt, valg af dosis med en estimeret sandsynlighed for DLT, der ligger tættest på, men ikke er større end TTL. Den første mulighed giver mulighed for en hurtigere eskalering mod den sande MTD, men kan udsætte flere patienter for overdosering. Den anden mulighed reducerer risikoen for overdosering af patienter, men det kan tage længere tid at eskalere mod den sande MTD.
Stikprøvestørrelse og kohortestørrelse
De planlagte stikprøvestørrelser i fase I-forsøg er generelt dikteret af praktiske begrænsninger, såsom antallet af centre, forventede rekrutteringsrater og antallet af dosisniveauer, snarere end statistiske begrænsninger i forbindelse med type I-fejlprocent eller minimumseffekt til testning af en specifik hypotese. Cheung foreslog formler, der anvender en gennemsnitlig målprocent for korrekt valg af MTD (f.eks. 50 % af gangene) for at opnå en nedre grænse for forsøgets stikprøvestørrelse. Vi kan derefter bruge simuleringer til at vurdere designets funktionskarakteristika med en stikprøvestørrelse, der er fastsat til denne nedre grænse, og om nødvendigt revidere stikprøvestørrelsen. Vi foreslår, at der angives en nedre grænse baseret på Cheungs arbejde og en praktisk øvre grænse i ansøgninger om tilskud og forsøgsprotokoller.
Når en rimelig stikprøvestørrelse er blevet specificeret, kan investigatorerne beslutte, hvor mange patienter der skal doseres ved hver anbefalet dosis, før der træffes en beslutning om dosiseskalering; dette kaldes kohortestørrelsen. En kohortestørrelse på én patient vil give bedre driftsegenskaber end dosering af flere patienter samtidig på et dosisniveau, selv om sidstnævnte kan reducere forsøgets varighed og stadig give bedre resultater end 3 + 3-designet . Lovgivningsmæssige krav kan også påvirke kohortestørrelser. Det kan f.eks. være et krav, at vi skal observere sikkerhedsdata fra den første patient, før vi doserer andre patienter i den pågældende kohorte. Efter de nylige katastrofer i fase I-forsøg med TeGeneros monoklonale antistof TGN1412 og Bials fedtsyreamidhydrolasehæmmer BIA 10-2474 skal der træffes foranstaltninger til overvågning af patienterne, hvis der anvendes kohorter på to eller flere patienter .
Sikkerhedsændringer
Der kan let foretages ændringer i forsøgsdesign og dosiseskalationsregler for at forhindre overdosering af patienter og sikre, at et forsøgsdesign har fornuftige driftskarakteristika. I den oprindelige CRM-tilgang blev det f.eks. foreslået at dosere den første patient ved det forudgående MTD-gæt, men mange forsøgsledere foreslår at dosere den første patient ved et lavere niveau end dette (muligvis endda det laveste ). I Viola-forsøget , hvor CRM blev anvendt til at finde MTD for lenalidomid og azacitidin hos patienter med recidiverende akut myeloid leukæmi efter allogen stamcelletransplantation, blev den midterste (fjerde) af syv mulige doser anset for at være den forudgående MTD. Undersøgelsesholdet valgte imidlertid at starte ved den dosis, der ligger under dette niveau (tredje) . Nogle har foreslået, at man ikke må springe uprøvede dosisniveauer over ved eskalering for at reducere antallet af patienter, der udsættes for toksiske doser . Faries håndhævede også en sammenhængende dosiseskalering: Hvis den sidste patient havde en DLT, ville den næste patient ikke modtage en højere dosis end den sidste patient, selv om modellen anbefalede det. Under de fleste forsøgsopsætninger af CRM er kohærens garanteret , selv om dette bør kontrolleres i simuleringer.
Stopregler
Vi har brug for at angive kriterier for at stoppe forsøget, før det maksimale antal patienter er blevet behandlet. Tidlig afslutning kan overvejes, hvis MTD vurderes at være uden for det planlagte sæt af doser (dvs., alle doser er for toksiske eller alle doser har en sandsynlighed for en DLT langt under TTL), eller hvis tilføjelse af flere patienter i forsøget er usandsynligt at give oplysninger, der ville ændre den nuværende MTD estimat. Investigatorerne kan stoppe et forsøg, hvis enten: et fast antal patienter er blevet doseret i træk på et dosisniveau; den estimerede sandsynlighed for, at alle dosisniveauer har en DLT-rate over (eller under) TTL, er mindst 90 %; bredden af det sandsynlighedsbaserede konfidensinterval eller det Bayesianske troværdige interval for MTD’en når et bestemt niveau; sandsynligheden for, at de næste m patienter, der skal doseres i forsøget, vil få samme dosisniveau, uanset de observerede DLT-resultater, overstiger et vist niveau (f.eks. 90 %); eller en kombination af disse . Hvis et forsøg stoppes efter et fast antal patienter, bør antallet vælges på grundlag af et probabilistisk kriterium, f.eks. hvis 10 på hinanden følgende patienter får samme dosisniveau, er vi mindst 90 % sikre på, at den aktuelle dosis er MTD. Derfor opfordres der til at anvende probabilistiske metoder til tidlig afslutning eller til at begrunde andre stopregler ved hjælp af sandsynligheder. I Viola-forsøget ville forsøget blive stoppet tidligt på grund af toksicitet, hvis chancen for, at risikoen for DLT ved den laveste dosis var mindst 10 % over TTL, oversteg 72 %; dette blev skræddersyet på baggrund af klinikernes ønske om at stoppe forsøget, hvis de så et uventet antal DLT’er ved den laveste dosis .
Evaluering af design ved simulering
Når en indledende opsætning for designet er blevet specificeret i henhold til ovenstående parametre, skal vi forstå et designs funktionsegenskaber under forskellige dosis-toksicitetsscenarier. Dette opnås bedst ved, at forsøgsstatistikeren simulerer mange forsøg under hvert scenarie. Formålet med disse simuleringsundersøgelser er at:
-
påvise, at et design har tilfredsstillende driftsegenskaber efter forsøgsgruppens standarder, eller give resultater, som forsøgsgruppen kan bruge til at diskutere og ændre designet;
-
udarbejde en omfattende sammenligning af alternative designs, herunder 3 + 3-designet og et benchmark-design ;
-
klart identificere de bedste parametervalg;
-
begrunde stikprøvestørrelsen; og
-
give oplysninger til brug i ansøgninger om tilskud og i protokollen.
De vurderede operationskarakteristika bør omfatte sandsynligheden for at vælge hver dosis som MTD, antal/andel af patienter, der får hver dosis, antal DLT’er pr. dosis og i alt, forventet stikprøvestørrelse og forventet undersøgelsesvarighed.
De dosis-toksicitetsscenarier, der anvendes i simuleringsundersøgelsen, bør omfatte: scenarier, hvor hver dosis rent faktisk er MTD; to ekstreme scenarier, hvor den laveste dosis er over MTD og den højeste dosis er under MTD; og andre scenarier, som klinikerne mener er plausible. Det er værd at overveje usandsynlige, men ekstreme scenarier (f.eks. hvor de første få doser ligger langt under MTD, hvorefter den næste højeste dosis ligger langt over MTD) for at se, hvordan forsøgsdesignet opfører sig. Ved udformningen af CHARIOT-forsøget overvejede Frangou et al. sande dosis-toksicitetskurver over seks dosisniveauer (skemaer), som omfattede scenarier, hvor TTL på 25 % blev fundet ved en nøjagtig dosis eller lå mellem to dosisskemaer. Brock et al. undersøgte i forbindelse med simuleringer forud for Matchpoint-forsøget seks dosis-toksicitetsscenarier over fire dosisniveauer; disse omfattede to scenarier, hvor MTD (den dosis med en forventet risiko for DLT på 40 %) var placeret mellem to dosisniveauer (Fig. 4).
Simuleringsundersøgelserne forud for forsøget bør gennemføres efter anbefalet bedste praksis :
-
Opret en detaljeret simuleringsplan, herunder forventet opsætningstid, nødvendige ressourcer og den samlede tid, der er nødvendig for at opnå resultater ;
-
Registrér det anvendte tilfældige frø for at muliggøre gentagelse;
-
Generer en bred vifte af scenarier, der skal undersøges;
-
Specificer det antal simuleringsreplikationer, der er nødvendige for at reducere variabiliteten i driftskarakteristikaene. Selv om der ikke er noget ideelt antal, gælder det, at jo større antal simuleringer, jo lavere variabilitet i resultaterne;
-
Kør alle konkurrerende designs (herunder et 3 + 3-design) på tværs af alle simuleringsscenarier for at sammenligne de relevante driftsegenskaber.
Ud over simuleringer kan vi vurdere modelanbefalingerne på baggrund af et muligt sæt forsøgsdata. Vi kan på forhånd beregne hver mulig sekvens af doser, der er resultatet af forskellige DLT/ikke-DLT-svar fra patienter i de næste par kohorter; disse er kendt som dosisovergangsveje . Forsøgsteamet kan generere dosisovergangsforløb for at se, om designet udviser uønsket adfærd, f.eks. at forsøget ikke stoppes, selv om der konstateres overdreven toksicitet ved lave doser. Designet kan derefter omkalibreres, så det giver dosisovergangsforløb, som klinikere og forsøgsteam er tilfredse med. Yap et al. beskriver, hvordan de brugte dosisovergangsforløb til at designe Viola-forsøget. Figur 5 illustrerer forsøgsdesignprocessen i sin helhed. Den iterative struktur viser de diskussioner, der er nødvendige for at træffe beslutning om forskellige aspekter af designet, og hvordan og hvornår de skal evalueres.
Finalisering af designet
Når forsøgsdesignet er blevet aftalt, bør simuleringerne forud for forsøget dokumenteres, med detaljerede oplysninger om opsætningsspecifikationerne, hvilke designs der blev sammenlignet under hvilke scenarier, og et let fortolkeligt resumé af designets hovedtræk. Denne rapport kan indgå i protokolbilaget eller den statistiske analyseplan eller kan være en separat rapport, som formelt anerkendes i protokollen og den statistiske analyseplan og gemmes i forsøgets master file. Vi giver en generel beskrivelse af CRM, der kan anvendes i forsøgsprotokoller, i Additional file 1: Appendix C. Målgrupperne for simuleringsrapporten er interne projektteams og den forskningsetiske komité. For nogle dosisbestemmelsesforsøg kan det være nødvendigt at indsende simulationsrapporter til myndighederne.
Vejledning af forsøget
Når forsøgsdesignet er blevet bekræftet, og forsøget er startet, bestemmes det anbefalede dosisniveau for den næste patient på følgende måde:
- i)
Indhent tilgængelige data om de patienter, der i øjeblikket er i forsøget;
- ii)
opdatér de estimerede DLT-sandsynligheder ved hver dosis ved hjælp af modellen;
- iii)
skrive en kort rapport med en detaljeret beskrivelse af modellens dosisanbefaling sammen med estimater af DLT-sandsynlighederne ved alle doser og eventuelle andre størrelser af interesse; og
- iv)
Om nødvendigt afholdes der et møde i dosisfastsættelsesudvalget (DSC) eller sikkerhedsvurderingsudvalget (SRC) for formelt at beslutte, om modellens anbefaling skal anvendes eller om der skal anbefales en anden dosis (baseret på yderligere ikke-DLT-toksicitetsdata). DSC består af forskere, klinikere og medlemmer af forsøgsledelsesgruppen. Udvalgets medlemmer deltager personligt eller via telekonference i møder om dosisbeslutninger og rådgiver om, hvordan forsøget skal fortsætte på grundlag af de sikkerhedsdata, der er indsamlet i løbet af forsøget. Der kan beregnes dosisovergangsveje for en eller flere fremtidige kohorter for at hjælpe DSC med deres anbefalinger.
Interimforsøgsresultater bør indberettes for at hjælpe DSC med at træffe beslutninger. De interessante resultater falder i to kategorier: observerede forsøgsdata, f.eks. de grader og typer af bivirkninger, som hver patient har oplevet, og antallet af bivirkninger, der er klassificeret som DLT’er, og probabilistiske resultater, der er udledt af dosis-toksicitetsmodellen.
Rapportens indhold
Resultater af observerede forsøgsdata kan præsenteres i enkle hyppighedstabeller. En tabel med alle observerede bivirkninger som rækker, med toksicitetsgrader som kolonner, bør udfyldes med antallet af patienter, der oplevede hver enkelt bivirkning af en bestemt grad. Hvis man f.eks. anvender National Cancer Institutes Common Terminology Criteria for Adverse Events (NCI CTCAE) klassificeringssystem , kan lave grader (f.eks. 1 og 2) kombineres, ligesom højere grader (3 og 4) kan kombineres, hvis f.eks. enhver bivirkning af grad 3 eller højere klassificeres som en DLT. Eventuelle observerede dødsfald, der klassificeres som grad 5-bivirkninger, skal rapporteres særskilt. Nogle forsøgspublikationer opdeler disse data på tværs af dosisniveauer, hvilket giver en mere præcis opdeling af, ved hvilke doser der blev observeret bivirkninger. For probabilistiske resultater anbefaler vi, at man angiver den estimerede (middel/median) sandsynlighed for DLT pr. dosisniveau med en vis måling af variation eller konfidens/troværdigt interval, enten i en tabel eller graf.
Software til opdatering af modeller og udarbejdelse af rapporter
Der er udviklet flere softwarepakker til udformning, udførelse og analyse af doseringsundersøgelser ved hjælp af regelbaserede designs og CRM (tabel 2). Disse omfatter softwarepakker til populære statistiske programmer (f.eks. R og Stata) samt selvstændige programmer med peg-og-klik-brugergrænseflader, hvoraf nogle er frit tilgængelige online. Mange af disse pakker omfatter værktøjer til generering af skeletter og dosismærker under forskellige dosis-toksicitetsmodeller og til simulering og gennemførelse af forsøg ved hjælp af likelihood-baserede og bayesianske metoder. Der findes hjælpefiler til alle programmer, og de fleste er forsynet med eksempler.