Skip to main content

Logo for hæmatologisk tidsskrift

”Helt overordnet finder vi, at vores model performer bedre. Når vi sammenligner den med NCCN IPI under rimelige betingelser, er den bedre til at skelne mellem patienter med og uden behandlingssvigt. Den har en høj grad af fleksibilitet, og kan tilpasses forskellige kliniske behov,” siger Mikkel Werling.

Dansk AI-model forbedrer risikostratificering og forudsigelse af behandlingssvigt ved DLBCL

En dansk udviklet AI-model er markant bedre end de klassiske prædiktive modeller til at risikostratificere og forudsige, om patienter med diffust storcellet B-cellelymfom (DLBCL) får behandlingssvigt. Den kan med stor præcision udpege patienter, der har brug for mere og andet end gængs førstelinjebehandling, og så estimerer den, at langt flere patienter end hidtil antaget, ser ud til at have lavrisikosygdom. 

I dag baseres risikovurdering og prognose-estimering ved DLBCL ofte på kliniske modeller, der forholder sig til få risikofaktorer. NCCN IPI er blandt de mest anvendte og bedst validerede modeller på området, og den estimerer prognosen ud fra fem risikofaktorer. Den nye danske maskinlærings (ML)-model har inkluderet 87 variable, og det resulterer i en mere præcis risikostratificering og forudsigelse af hvilke patienter, der vil få behandlingssvigt inden for de første to år efter opstart af førstelinjebehandling. 

Carsten Utoft Niemann

”Modellen har vist, at den er langt bedre til at selektere patienterne til de rigtige risikogrupper. Dermed gør den det muligt at finde de cirka 30 procent af patienterne, som ikke har tilstrækkelig effekt af den nuværende standardbehandling – og som derfor formentlig har brug for andet eller mere behandling for at undgå død eller tilbagefald af deres sygdom.” 

Sådan sagde Carsten Utoft Niemann, professor og overlæge ved Rigshospitalets afdeling for blodsygdomme og forsker hos Kræftens Bekæmpelse, da han i begyndelsen af maj afholdt sin tiltrædelsesforelæsning. Han har de senere år forsket i datadrevet kræftbehandling, og arbejdet med at integrere kliniske og genetiske data med det formål at fremme behandlingen af især hæmatologiske kræftsygdomme.   

Sammen med fire andre forskere er han forfatter til en artikel, der blev publiceret i HemaSphere i april i år, og beskriver, hvordan den nye ML-model med større præcision end nuværende prædiktive modeller kan risikostratificere og forudsige behandlingssvigt ved DLBCL.

Udviklet til at hjælpe læger

Mikkel Werling, der er forsker og ph.d.-studerende ved Afdeling for Blodsygdomme på Rigshospitalet, er førsteforfatter til artiklen. Som en del af sit ph.d.-projekt har han udviklet ML-modellen. Og det med ét klart mål for øje:

”Målet med at bruge maskinlæring og lave prædiktionsmodeller i sundhedsregi er, at vi ønsker at udvikle nye værktøjer, der kan hjælpe lægerne med at træffe de rigtige beslutninger. Modellerne skal være anvendelige og adressere nogle af de problemstillinger, som lægerne oplever i klinisk praksis,” siger Mikkel Werling.

Som udgangspunkt for modellen adspurgte forskerne lymfomlæger om, hvilke udfordringer de vurderede som mest præsente i den daglige kliniske praksis. De fremhævede især risikostratificering og identifikation af behandlingssvigt ved førstelinje fremhævet som relevante udfordringer.

”Helt overordnet finder vi, at vores model performer bedre. Når vi sammenligner den med NCCN IPI under rimelige betingelser, er den bedre til at skelne mellem patienter med og uden behandlingssvigt. Den har en høj grad af fleksibilitet, og kan tilpasses forskellige kliniske behov,” siger Mikkel Werling.

Arbejdet med at udvikle modellen skete parallelt med, at flere nye behandlinger blev udviklet mod lymfom, herunder CAR-T-celleterapi og bispecifikke antistoffer. 

”Det øger relevansen af en skærpet prædiktion – for nu har vi jo faktisk begyndende adgang til behandlinger, der kan noget andet og mere end de gængse standardbehandlinger, og som kan komme de patienter til gode, som ikke har tilstrækkelig effekt af CHOP eller et CHOP-lignende regime i første linje,” siger Mikkel Werling.

Brug for bedre værktøjer

Flere klinikere har de senere år sat ord på behovet for at få adgang til bedre prædiktionsværktøjer. Det gør sig blandt andet gældende i situationer, hvor standard førstelinjebehandlingen forsøges intensiveret ved at tillægge nye effektive behandlinger.

For eksempel havde Thomas Stauffer Larsen, professor og overlæge ved Hæmatologisk Afdeling X i Odense, følgende bemærkning til et igangværende fase II-studie, der afprøver det nye CAR-T-produkt rapcabtagene autoleucel i første linje ved højrisiko storcellet B-cellelymfom (LBCL). 

”Dilemmaet er, at vi har en ret god førstelinjestandard som helbreder 7 ud af 10 patienter. Det betyder, at vi skal være meget præcise i vores selektion af de patienter, som har brug for en mere intensiv behandling – for ellers risikerer vi at overbehandle patienter, der havde klaret det godt på den etablerede standard.”

Og videre:

”De studier, som undersøger CAR-T-celleterapi i første linje – inklusiv det nye studie her – forsøger naturligvis at risikostratificere og selektere de rigtige patienter til det intensiverede behandlingsforløb. Men problemet er, at de stratificeringsredskaber, vi har til rådighed i dag, har deres begrænsninger. IPI er det bedste værktøj vi har i dag, men dét differentierer patienterne ud fra simple kliniske parametre og fortæller reelt ikke noget om sygdommens underliggende biologi.”

NCCN-IPI, som er en videreudvikling af den klassiske IPI-model, ser på alder, sygdomsstadie, niveauet af LDH i blodet, almen tilstand og ekstranodal sygdom i forhold til at udregne en risikoscore og forventet overlevelse.

Mere nuanceret risikovurdering

NCCN IPI er designet til risikostratificering af tidsafhængige events såsom overlevelse (OS) og progressionsfri overlevelse (PFS). Herved er der betydelig risiko for, at alder vil vægte uforholdsmæssigt tungt i den samlede risikoscore, da patientens alder og risikoen for at dø naturligt er tæt korreleret.

Den nye ML-model er en tabulær model, der estimerer risiko for behandlingssvigt inden for et fast tidsvindue på to år efter førstelinjebehandling. Samtidig inddrager modellen et bredere klinisk billede fra patienternes forløb før behandlingsstart. Det kan ifølge Mikkel Werling give en mere nuanceret risikovurdering, hvor alder ikke i samme grad dominerer den samlede vurdering.

”Det interessante ved vores model er, at den ser ud til bedre at kunne skelne mellem patienter, hvor risikoen primært afspejler alder, og patienter hvor risikoen i højere grad afspejler sygdoms- og behandlingsrelaterede forhold,” siger Mikkel Werling. 

Data fra studiet viser således, at NCCN IPI-risikoscoren er stærkere korreleret med alder end ML-modellen (0,54 vs. 0,37). For patienter klassificeret som højrisiko gav ML-modellen en mere ensartet risikostratificering på tværs af de ældre aldersgrupper. Den toårige behandlingsfri overlevelse var 30 procent blandt patienter på 60-75 år og 29 procent hos patienter over 75 år. Med NCCN IPI var forskellen større (57 vs. 32 procent). Samtidig identificerede ML-modellen 160 lavrisikopatienter over 60 år i testsættet, mens NCCN IPI kun fandt én enkelt.

Her bliver det ifølge Mikkel Werling for alvor interessant – og klinisk relevant. 

”Hvis man bruger NCCN IPI alene, så risikerer man at overse mange patienter, i lav risiko for behandlingssvigt efter standardbehandling. Det kan blandt andet hænge sammen med, at alder vægter tungt i den klassiske risikoscore. NCCN IPI-scoren er et almindeligt deltagelseskriterie i kliniske studier, og her risikerer mange ellers egnede patienter at blive valgt fra med de nuværende prædiktionsværktøjer.”

Et område i rivende udvikling

Hæmatologisk Tidsskrift: Hvordan vil en mere præcis risikoprædiktion påvirke de behandlingsvalg, der træffes i klinisk praksis? I dag har lymfomlægerne jo ikke mulighed for at tilbyde andet end R-CHOP eller et lignende regime i første behandlingslinje?  

”Det er rigtigt, at vi lige nu og her ikke har adgang til mere intensive førstelinjeregimer – og derfor kommer modellen nok ikke til at ændre klinisk praksis i morgen. Men lymfom-området er i rivende udvikling, og nogle af de nye effektive behandlingsmodaliteter afprøves aktuelt helt fremme i første linje,” siger Mikkel Werling.  

”En model som vores kan bidrage til, at vi tidligere i forløbet identificerer de patienter, som har høj risiko for ikke at klare sig lige så godt som majoriteten, og dermed kan den på sigt blive et værktøj til mere målrettet risikovurdering og bedre udvælgelse til kliniske studier.” 

Han understreger, at ML-modellen ikke siger noget om, hvilken type behandling det er mest hensigtsmæssigt at give. Modellen er prognostisk, ikke kausal, og kan derfor ikke i sig selv afgøre, om en patient vil have gavn af en bestemt behandlingsintensivering.

Nye diskussioner venter forude

ML-modellen beskriver ikke i sig selv hvornår et behandlingssvigt vil opstå eller hvilke kausale mekanismer der ligger bag. Til gengæld kan modellen give indblik i hvilke variable, der bidrager mest til risikovurderingen.

Det næste skridt bliver ifølge Mikkel Werling at udvikle AI-modeller, som i højere grad udnytter det fulde tidsforløb i patienternes data. 

”I vores model bliver de longitudinelle data samlet til aggregerede variable inden for bestemte tidsvinduer. Det er en stærk og praktisk tilgang, men den kan miste noget af dynamikken i patientforløbet, for eksempel pludselige ændringer, trends eller variation over tid. Her kan deep learning-baserede sekvensmodeller potentielt åbne nye muligheder, fordi de kan arbejde direkte med patientforløb som tidslige sekvenser og eventuelt modellere flere kliniske outcomes samtidigt,” siger Mikkel Werling.

Men her dukker så en ny diskussion op: Deep learning-baserede sekvensmodeller kan potentielt udnytte patientforløb mere effektivt og på nye måder. Men i bytte herfor bliver forklarlighed og klinisk tillid ofte markant vanskeligere, lyder det fra Mikkel Werling. 

”Jo mere komplekse modeller, vi bruger, jo sværere bliver det for os at forstå, hvorfor modellen giver en bestemt risikovurdering. Der findes metoder, der kan hjælpe med at forklare modellens vurdering, men de giver ikke nødvendigvis en simpel forklaring eller en kausal mekanisme." 

”Når vi overgår til deep learning, så vil kompleksiteten af vores modeller stige. Det vil gøre det sværere for lægen at tage stilling til en models vurderinger. Ønsker vi det? Er forbedringen i nøjagtighed stor nok til, at vi vil ofre noget af forklarligheden?”

Stadig et stykke vej 

Hæmatologisk Tidsskrift: Hvornår kommer vi til at se jeres ML-model få en rolle i klinisk praksis?

”Indtil nu har vi kun udviklet og testet modellen på retrospektive data. Før den kan komme til at spille en rolle i klinisk praksis, skal den i hvert fald afprøves i en pseudo-prospektiv setting, hvor vi kan se, om den også fungerer på nye patienter og under skiftende datavilkår, der findes i en klinisk hverdag,” siger Mikkel Werling.  

”Vi vil gerne undersøge, om den kan levere pålidelige risikovurderinger i en nutidig klinisk kontekst – og så vi kan se, hvordan den performer over tid. Vi er især interesserede i, hvordan den bliver påvirket af manglende eller skiftende data. Det er langt sværere at få en model til at virke i praksis, end det er at udvikle den.”

Han tør ikke komme med et præcist bud på, hvornår modellen vil kunne implementeres i klinisk praksis, men han refererer til forløbet omkring CLL-TIM-modellen. Her tog det samlet cirka fem år at nå fra modeludvikling til klinisk afprøvning i randomiserede studier og teknisk implementering i Sundhedsplatformen. 

CLL-TIM er en ML-model, der kan identificere, hvilke patienter med nydiagnosticeret kronisk lymfatisk leukæmi (CLL), der er i høj risiko for at få alvorlige infektioner og/eller behov for behandling inden for de første to år efter diagnosetidspunktet. Det er Carsten Utoft Niemann og hans gruppe, der står bag modellen, som aktuelt afprøves i et randomiseret studie (PreVent-ACaLL). I studiet undersøger forskerne, om det er muligt at forebygge alvorlige infektioner og tidligt behandlingsbehov hos CLL-patienter ved at give målrettet behandling tidligere end ellers. 

Foreløbige data fra PreVent-ACaLL vil blive præsenteret på det forestående EHA-møde. 

Sådan er modellen udviklet

Den danske ML-model baserer sig på kliniske data og laboratoriedata fra 14.832 lymfompatienter, som blev startet op i førstelinjebehandling i perioden 2005-2021, hvilket sikrede mindst to års opfølgning. Kohorten blev opdelt i et træningssæt og et blindet testsæt, og data stratificeredes efter død, tilbagefald og subtype. For at evaluere modellen undersøgte forskerne videre de patienter i det blindede testsæt, som havde DLBCL, og som var blevet behandlet med CHOP eller et CHOP-lignende regime (herunder R-CHOP).

På tværs af otte nationale datakilder udledte forskerne lige under 4.000 kandidatvariable blandt oplysninger, der var registreret hos en tilstrækkelig stor andel af patienterne (>10 procent af patienterne). Variablene omfattede blandt andet medicinoplysninger, laboratorietests, procedurer, patologi- og diagnosekoder, mikrobiologi og kvalitetsregistre. Herefter blev LASSO-regression anvendt til at udvælge 87 variable, som den endelige ML-model blev trænet på.

Studiets primære analyse så på, hvordan ML-modellen performerede blandt DLBCL-patienter i testsættet, der fik CHOP eller CHOP-lignende regimer i første linje. Modellen blev både vurderet på evnen til at forudsige behandlingssvigt inden for to år samt som risikostratificeringsværktøjer. I den sidstnævnte analyse blev ML-modellens estimerede sandsynligheder omsat til fire risikogrupper, som så kunne sammenlignes direkte med NCCN IPI-modellens risikogrupper.

 

Tre forskellige modeller

For at teste, hvordan valg af variable og træningspopulation påvirkede den kliniske risikoforudsigelse udviklede forskerne tre ML-modeller med forskellig rækkevidde. Den første model (MLIPI) anvendte de fem variable fra NCCN-IPI i kontinuerlig form og fungerede som en enkel ML-baseret reference med samme kliniske informationsgrundlag som NCCN-IPI. Den anden model (MLDLBCL) anvendte alle 87 variable, men blev alene trænet på DLBCL-tilfælde. Den tredje model (MLALL) brugte de samme 87 variable, men blev trænet på tværs af alle aggressive lymfomsubtyper. For alle tre modeller blev NCCN-IPI brugt som primær komparator.

Samlet viste analyserne, at bedre risikoprædiktion især kom fra to ting: Mere information om patientens kliniske historik og muligheden for at lære på tværs af beslægtede lymfomsygdomme. En model baseret på de klassiske NCCN-IPI-variable klarede sig allerede bedre end NCCN-IPI, men den største forbedring kom med 87 variable fra flere datakilder. Samtidig viste fælles træning på tværs af lymfomsubtyper, at modellerne ofte kunne udnytte fælles prognostiske mønstre på tværs af sygdomme.

 

  • Chefredaktører

    Kristian Lund
    Denne e-mail adresse bliver beskyttet mod spambots. Du skal have JavaScript aktiveret for at vise den.

    Nina Vedel-Petersen
    Denne e-mail adresse bliver beskyttet mod spambots. Du skal have JavaScript aktiveret for at vise den.

    Bo Karl Christensen
    Denne e-mail adresse bliver beskyttet mod spambots. Du skal have JavaScript aktiveret for at vise den.

    Kommerciel direktør

    Marianne Østergaard Petersen
    Denne e-mail adresse bliver beskyttet mod spambots. Du skal have JavaScript aktiveret for at vise den.

    Adresse

    Schæffergården
    Jægersborg Alle 166
    2820 Gentofte
    CVR: 37 21 28 22

    Kontakt

    Annoncer
    Jobannoncer
    Kontaktinfo
    Abonnement, kontakt:
    Denne e-mail adresse bliver beskyttet mod spambots. Du skal have JavaScript aktiveret for at vise den.
    Denne e-mail adresse bliver beskyttet mod spambots. Du skal have JavaScript aktiveret for at vise den.

  • Journalister

    Helle Torpegaard - redaktionschef

    Charlotte Price Hoffmann - redaktør med udviklingsansvar
    Signe Juul Kraft - onkologi, hæmatologi
    Maiken Skeem – hjerte-kar, redaktør for printmagasiner
    Mads Moltsen - gastroenterologi, onkologi
    Henrik Reinberg Simonsen - almen praksis, oftalmologi, kultur

    Tilknyttede journalister

    Anne Mette Steen-Andersen – hæmatologi, onkologi
    Anne Westh - allround
    Natacha Houlind Petersen - allround
    Jette Marinus - respiratorisk
    Thomas Telving - allround
    Hani Abu-Khalil - allround
    Gurli Kløvedal, kultur
    Filip Granlie, kultur

  • Annoncekonsulent
    Malene Laursen
    Denne e-mail adresse bliver beskyttet mod spambots. Du skal have JavaScript aktiveret for at vise den.

    Webinarer
    Majbritt Laustrup
    Denne e-mail adresse bliver beskyttet mod spambots. Du skal have JavaScript aktiveret for at vise den.
    Nina Bro
    Denne e-mail adresse bliver beskyttet mod spambots. Du skal have JavaScript aktiveret for at vise den.

    Administrativ koordinator
    Anette Kjer Overgaard
    Denne e-mail adresse bliver beskyttet mod spambots. Du skal have JavaScript aktiveret for at vise den.

    Projektkoordinator
    Annette Svanemose
    Denne e-mail adresse bliver beskyttet mod spambots. Du skal have JavaScript aktiveret for at vise den.

    Assistent
    Emma Meisner
    Denne e-mail adresse bliver beskyttet mod spambots. Du skal have JavaScript aktiveret for at vise den.

    Research
    Birgitte Gether