
”Vi havde en helt klar antagelse om, at der ville være forskel på, hvilken effekt egnede og uegnede patienter havde af en given behandling. Så den del kom ikke bag på os. Det interessante lå for os i at afklare, hvor store forskellen var – og hvad der drev den. Det giver os et billede af, hvilke forventninger, vi kan have til outcomes, når vi implementerer behandlinger uden samme kriterier for selektion, der har været brugt i kliniske studier,” siger Mikkel Runason Simonsen.
Stærk selektion i kliniske studier skævvrider forventningerne til outcomes i klinisk praksis
Danske patienter med diffust storcellet B-cellelymfom (DLBCL) og follikulært lymfom (FL), som ikke opfylder inklusionskriterierne i de kliniske studier, kan forvente en betydeligt dårligere effekt af deres behandling med en samlet femårsoverlevelse, der ligger op imod 20 procent lavere end overlevelsen blandt de patienter, som opfylder kriterierne for inklusion.
Det viser to danske registerstudier, som har inkluderet behandlingskrævende lymfompatienter behandlet efter dansk førstelinje-standard. Studierne har undersøgt forskellen i overlevelse hos patienter, som opfyldte kriterierne for inklusion i de kliniske studier, der lå til grund for anvendelse af den pågældende behandling, og patienter, som ikke gjorde (uegnede patienter).
Resultaterne viser, at uegnede patienter havde en signifikant dårligere overlevelse end de patienter, der var inklusionsegnede. For DLBCL-patienter blev der observeret justerede absolutte forskelle i samlet overlevelse (OS) efter fem år på 9-15 procent, mens der for FL-patienter kunne observeres forskelle på 12-20 procent.
Det kommer ikke som en overraskelse, at patienter, som er sammenlignelige med de selekterede patienter i kliniske studier, har bedre effekt af en behandling, end patienter, der har en række karakteristika, som ville have diskvalificeret dem fra deltagelse i studierne. Det interessante ligger i, at de to danske studier bidrager med viden om, i hvor stort omfang forventningerne til effekten af medicinske behandlinger skal nedjusteres i klinisk praksis, lyder det fra forskerne bag.
”Vi havde en helt klar antagelse om, at der ville være forskel på, hvilken effekt egnede og uegnede patienter havde af en given behandling. Så den del kom ikke bag på os. Det interessante lå for os i at afklare, hvor store forskellen var – og hvad der drev den. Det giver os et billede af, hvilke forventninger, vi kan have til outcomes, når vi implementerer behandlinger uden samme kriterier for selektion, der har været brugt i kliniske studier,” siger Mikkel Runason Simonsen, statistiker ved Hæmatologisk Afdeling på Aalborg Universitetshospital og en af førsteforfatterne til begge studier.
Tine Litske Bennedsen, læge ved Hæmatologisk Afdeling på Aalborg Universitetshospital, og førsteforfatter til studiet omhandlende patienter med FL, supplerer:

”Vi kan bruge data til at skærpe vores information til patienterne, så de får en mere realistisk ide om, hvilken effekt de kan forvente af behandlingerne. Og så håber vi, at data kan bruges konstruktivt, når der i fremtiden skal designes kliniske studier. Det er tydeligt, at de mest syge patienter med den dårligste overlevelse ikke er repræsenteret i kliniske studier – og det betyder, at studierne langt fra afspejler den virkelighed, vi møder i klinisk praksis,” siger hun.
Forskellene er endnu større
Studierne har indsamlet data om voksne patienter med nydiagnosticeret behandlingskrævende FL og DLBCL. Data er indhentet via Dansk Lymfom Database (LYFO). De inkluderede patienter havde fået behandling med standard førstelinjeregimer i perioden 2000-2018. For patienter med FL dækkede standardbehandlinger over R-B (rituximab plus bendamustin), R-CVP (rituximab plus cyklofosfamid, vincristin og prednisolon) og R-CHOP (rituximab plus cyklofosfamid, doxorubicin, vincristin og prednisolon) med opstart senest 90 dage efter, at diagnosen var blevet stillet. DLBCL-patienterne havde modtaget CHOP med eller uden rituximab.
Outcomes for patienterne blev sammenholdt med outcomes i nyere randomiserede fase III-studier, som har undersøgt effekt og sikkerhed af medicinske behandlingsregimer, som i dag anvendes som standard til de to patientgrupper. Inklusions- og eksklusionskriterier for hvert enkelt studie blev registreret og kategoriseret, og patienterne blev efterfølgende fordelt efter, om de ville have været egnede eller uegnede til inklusion ud fra data om deres organfunktionspåvirkning og performancescore (PS). Kriterier for inklusion og eksklusion var stort set sammenlignelige i de inkluderede studier, hvorfor det lod sig gøre at udarbejde fælles kriterier.
”Det er langt fra alle de parametre, der anvendes i studierne, som vi registrerer i LYFO. Det betyder, at vi ikke én til én kan sige, at de patienter, der i vores studie kategoriseres som egnede, også ville være inkluderet i det kliniske studie. Men sådan er betingelserne, og vi har udvalgt de kriterier, som vi vurderede, var mest relevante og essentielle, og som kunne repliceres med danske registerdata,” siger Tine Litske Bennedsen.
Mikkel Runason Simonsen pointerer, at begrænsningerne ved de danske registerdata gør, at patienter, som blev vurderet egnede til inklusion i realiteten var mindre stærkt selekterede, end patienterne i de respektive kliniske studier, som blev forsøgt reproduceret. Det ændrer dog ikke ved studiernes konklusion – tværtimod.
”Med de tilgængelige registerdata har det ikke været muligt at replicere, hvor stærkt selekterede de kliniske studier i virkeligheden er. Vi kommer nok til at undervurdere selektionsstyrken, og det betyder, at forskellen i outcomes i realiteten formentlig er endnu større, end vi når frem til. Med andre ord: Havde vi været i stand til at efterligne selektionen helt præcist, så var vores konklusion blevet forstærket,” siger han.
Mere inkluderende studier
Studierne viser, at inklusionskriterier vedrørende PS var de vigtigste drivere for forskel i overlevelse mellem patienter, som var henholdsvis egnede og uegnede til inklusion.
For de i alt 4.083 patienter med DLBCL behandlet med R-CHOP gjaldt det således, at 18,6-29,3 procent var uegnede til inklusion. På tværs af alle studierne blev de højeste Shapley-værdier (indvirkningen af individuelle kriterier på den estimerede effekt red.) observeret for PS-baserede kriterier rangerende fra 3,69 til 5,87.
Mellem 4,7 og 16,1 procent af de i alt 1.183 FL-patienter behandlet i kliniske praksis var uegnede til inklusion i et klinisk studie. På tværs af de inkluderede kliniske studier var Shapley-værdierne højest for PS og kreatinin. Anvendelsen af disse kriterier medførte en stigning i den femårige begrænsede gennemsnitlige overlevelses-difference (RMSD) mellem egnede og uegnede pateinter på 5,25-9,89 for PS og 1,51-6,60 for kreatinin.
”Det giver rigtig god mening, at performancestatus er den faktor, som er stærkest associeret med forskelle i overlevelse. Det er en stærk prædiktiv markør for, hvordan patienterne klarer sig på en behandling. I kliniske studier inkluderer de i reglen alene patienter, som er i rigtig god almen tilstand,” siger Tine Litske Bennedsen.
”Fremadrettet ville mere inkluderende studier føre til hurtigere rekruttering og et fokus på at udvikle medicin til gruppen af patienter med den dårligste samlede overlevelse.”
Relevant for aktuel debat
Hæmatologisk Tidsskrift: Hvis man nu skulle lege djævlens advokat, kunne man så ikke bruge jeres konklusion til at advokere for, at vi Danmark burde blive bedre til at udvælge de rette patienter til den rette behandling – og ikke give medicin til patienter, som ikke opfylder inklusionskriterierne i de tilgrundliggende studier?
”Det tror jeg simpelthen ikke, er realistisk. Så ville vi stå tilbage med en betydelig andel patienter, vi ganske enkelt ikke havde behandlinger til. Det er langt fra alle patienter, der i praksis lever op til inklusionskriterierne i de kliniske studier. Der findes ikke studier henvendt til patienter med alskens komorbiditeter – populationerne ville hurtigt blive alt for små, og rekrutteringstiden meget lang,” siger Tine Litske Bennedsen.
Mikkel Runason Simonsen supplerer:
”Jeg synes snarere, at det handler om at få belyst, at kliniske studier er så stærkt selekterede, at den effekt, der vises, langt fra kan genfindes, når behandlingerne anvendes i klinisk praksis: Vi får ikke den effekt i den brede danske population, som studierne stillede i udsigt. Og principielt burde medicinalfirmaer vel ikke være interesserede i at udvikle studier, som ikke repræsenterer virkeligheden,” siger han.
I 2023 udgav Medicinrådet en ny vejledning for brug af real world evidence (RWE) henvendt til firmaer, der ansøger om vurdering af medicinske behandlinger. Heraf fremgår det, at RWE blandt andet kan inkluderes i en ansøgning for at understøtte vurderingen af lægemidlets effekt. Sidenhen har rådets tidligere forperson, Jørgen Schøler Kristensen, udtalt til Hæmatologisk Tidsskrift, at han havde en ambition om at gøre RWE-opfølgninger til et krav i alle anbefalinger fra Medicinrådet fremadrettet, og at han antog, at man herved ville øge antallet af nye behandlinger, der i første instans fik en blåstempling fra rådet.
”(…)jeg har en klar ambition om, at vi i fremtiden kommer til at følge op på alle nationale anbefalinger, vi laver i rådet. I dag bliver stadig flere lægemidler sendt på markedet på rekordtid og godkendt alene ud fra PFS-data – og det til trods for, at der er konsensus om, at OS er den gyldne standard. Det skærper behovet for at sikre, at behandlingerne så har den forventede effekt, når de når ud til patienterne i klinikken,” lød det.
Resultaterne fra de to danske registerstudier er relevante i den henseende, da de tydeliggør, at forventninger til en behandlings effekt bør justeres betydeligt, når behandlingen anvendes i klinisk praksis, hvor patienterne i reglen er mere syge, end de er i de kliniske studier.

”Det er en debat der er relevant for design af studier, men også for Medicinrådets ønske om opfølgning med real world evidence,” skriver Tarec Christoffer El-Galaly, klinisk professor ved Institut for Klinisk Medicin – Blodsygdomme på Aarhus Universitetshospital, forperson for Dansk Lymfom Gruppe (DLG) og sidsteforfatter til begge studier sammen med Lasse Hjort Jakobsen i en mail til Hæmatologisk Tidsskrift.
Han uddyber:
”Det er vigtigt at real world data ikke tages til indtægt for mere, end de kan bære. For eksempel er det nok ikke så afgørende, hvorvidt patienter, der ikke opfylder kriterierne til de kliniske studier, klarer sig ligeså godt som de patienter, der gør. For der er mange faktorer, der spiller ind – og mange af dem har intet med medicin at gøre. Det vigtige er, hvordan gruppen af uegnede patienter ville klare sig med alternativet: En 20 procent øget overlevelse ville være lige så værdifuld, hvis den gik fra 20 til 40 procent, som hvis den gik fra 40 til 60 procent. Der ville være lige mange patienter, der overlevede på grund af ny medicin.”
”Det er sat på spidsen, men det er blot for at lufte en bekymring om at bruge real world data til at konkludere, at en effekt ikke var som forventet. Samme bekymring gælder real world evidence-studier med manglende statistisk signifikant bedring, især hvis de er meget mindre i størrelse, end de kliniske studier de efterligner. For i de tilfælde har de ofte ikke power til at vise den forventede forskel.”
Gevinst ved bred inklusion
Som en del af DLBCL-studiet har forskerne mimeret et studie, der undersøger effekten af at tillægge rituximab til CHOP. Effektgevinsten blev opgjort som den femårige RMSD mellem CHOP (n=890) og R-CHOP (n=4.083) behandlede patienter.
Data viser, at indvirkningen af de individuelle eksklusionskriterier på den estimerede gevinst ved at tillægge rituximab til CHOP var lille. Ved at anvende færre kriterier for eksklusion var det muligt at udvide andelen af patienter, der var egnede til behandling med 16-38 procent. Udvidelsen betød, at den femårige RMSD steg med 0,7-3,1 måneder.
”Vi viser, at vi ved at lempe selektionskriterierne kunne øge antallet af potentielle studiepatienter uden at gå på kompromis med den estimerede effektivitet. Selvom patienterne var mindre højt selekterede, så vi stadig en fordel ved at tillægge rituximab til CHOP. Vi kunne altså have fået stort set samme resultat, og samtidig have inkluderet op mod 40 procent flere patienter,” siger Mikkel Runason Simonsen.
”Det er interessant – for det understøtter vores pointe om, at mere inkluderende studier er en vej frem. Ved at lempe lidt på eksklusionskriterierne kan man opnå stort set samme effektdata, og samtidig få outcomes, der er mere repræsentative og en fremskynde rekrutteringsprocessen, som jo ellers kan tage årevis.”
Det danske registerstudie om DLBCL er publiceret i tidsskriftet Leukemia & Lymphoma (link), mens FL-studiet er publiceret i European Journal of Haematology (link).