Annonse

Om tilfeldige og ikke-tilfeldige resultater av behandling

Del:

Jeg inviterer herved leseren med på et lite tankeeksperiment:
Tenk deg at det kommer en ivrig 10-åring, som vi kaller Fredrik bort til deg med lurt smil om munnen og spør om du har lyst til å spille ludo.

Tekst: Henrik Sinding-Larsen
Opprinnelig publisert i Ryggstøtten 2006 nr 1

Ludo kan sterkt forenklet beskrives som et terningspill med brett og brikker hvor målet er å flytte egne brikker fortest mulig av start til mål. Brikkene flyttes et skritt for hvert øye på terningen som deltagerne kaster etter tur. Seksere er det beste man kan få av flere grunner. For det første gjør seksere at man får flytte seks skritt nærmere målet. For det andre får man et ekstra kast. Og sist men ikke minst, må man ha en sekser for i det hele tatt å få lov til å komme ut av startposisjonen. Det finnes også et element av strategi, men det er så lite at det helt vesentlige er hvor mye flaks man har med terningene. Og her er det antall seksere som er det mest avgjørende. Det kan være en av grunnene til at barn liker spillet. Det er alltid gøy når man får en sekser og barn får normalt like mange seksere som voksne.

Luringen Fredrik

Her kommer jeg tilbake til Fredrik med det lure smilet. Han insisterer nemlig på en høyst uvanlig betingelse. Han vil at dere skal spille med to terninger hvor han selv forbeholder seg retten til å spille med den ene mens du bare får kaste med den andre. Du blir med rette mistenksom på hvorfor det er så viktig for Fredrik å ha monopol på den ene terningen. Kunne det være at denne terningen ga flere seksere enn en normal terning? Mistanken var plantet selv om Fredrik bedyret at terningen var helt vanlig.

Spillet starter og etter at dere har slått seks ganger hver, viser det seg at du har fått en sekser mens Fredrik har fått to. Med andre ord har Fredrik fått dobbelt så mange seksere som det du har fått.

Tankeeksperiment

Her utvider vi tankeeksperimentet litt. Vi sier at dere spiller om et gullsmykke verd 100.000 kroner. Det er åpenbart at hvis Fredriks terning gir dobbelt så mange seksere som din, så har du i praksis ingen sjanse til å vinne gullsmykket. Nå er det Fredrik kommer med et tilbud: ”Det er greitt for meg å bytte terninger hvis jeg får 10.000 kroner.” Det kunne høres ut som et veldig godt tilbud. Hvis du betaler 10.000 kroner til Fredrik og etterpå vinner et smykke til en verdi av 100.000 så blir det jo 90.000 kroner i ren netto. Men det er også rom for tvil. Er det nå så sikkert at Fredriks terning virkelig gir flere seksere? Dere hadde tross alt bare kastet 6 kast hver. Det kunne jo være at hans to seksere og din ene var en tilfeldighet som ville jevne seg ut etter hvert som dere spilte videre. Du avslår tilbudet og spiller videre.

Etter at dere har slått terningen 6 kast til, har dere kommet opp i 12 kast hver. Resultatet nå er 4 seksere til Fredrik og 2 til deg. Med andre ord får Fredriks terning fremdeles dobbelt så mange seksere som din. Dette begynner å bli mystisk. Fredrik gjentar tilbudet om å bytte terninger mot at han får 10.000 kroner, og nå begynner du virkelig å lure på om ikke dette er et fantastisk godt tilbud.

Men du er av den forsiktige typen og sier du ikke kan bestemme deg før du har testet terningene mot hverandre ennå en tid. Men når dere har kastet 60 ganger hver og Fredriks terning gir 20 seksere mot 10 på din egen terning, er du ikke i tvil lenger. Her lønner det seg å bytte. Problemet er bare at nå har Fredrik økt prisen for å bytte til 90.000 kroner. Til tross for denne dramatiske prisstigningen, slår du til og føler deg rimelig sikker på at du har tjent 10.000 kroner på en lettvindt måte.

Ryggoperasjoner

Nå forandrer vi scenen til en beslutning om du skal opereres i ryggen eller ikke. Du er i tvil og spør kirurgen hvordan det har gått med andre pasienter med tilsvarende plager som deg. Legen kommer inn til deg med 6 pasienter som var blitt operert og 6 som ikke var blitt operert. Av dem som ble operert, var det 2 som var blitt helt friske og i gruppen av ikke-opererte var bare en som var blitt frisk. Han sier at resultatene viser at det er dobbelt så mange som blir helt friske av operasjon sammenlignet med dem som ikke ble operert.

Men du er ikke helt overbevist. Du ønsker å se så mange pasienter i de to gruppene at du føler deg trygg på at forskjellen ikke er tilfeldig. Først da vil du stole på resultatet som utgangpunkt for din egen avgjørelse. Det å se resultatene av mange behandlede ryggpasienter i de to gruppene opererte/ikke-opererte tilsvarer det å se resultatene av mange kast med de to terningene i ludo-eksempelet.

Sannsynlighetsberegning

Det finnes ikke noen absolutt grense for når et resultat er til å stole på. Men det har i medisinsk forskning blitt innført en praksis som mange følger, nemlig at når det er mindre enn 5% sannsynlighet for at resultatet er tilfeldig, så sier vi det er godt nok til å handle etter. Eller sagt på en annen måte. Hvis det er mer enn 95% sannsynlighet for at et resultat IKKE er tilfeldig, så sier vi at det er til å stole på. Når sannsynligheten for at et resultat er tilfeldig er tilstrekkelig lav, kaller man resultatet for statistisk signifikant. 

Når man forsker på effekten av en behandling, har man gjerne to i utgangspunktet like grupper pasienter: en gruppe som får behandling A og en som får behandling B. Hvis gruppen med behandling A blir bedre enn gruppen som får behandling B, kan det tyde på at A er en mer effektiv behandling enn B. Men det kan også være at forskjellen mellom de to gruppene er tilfeldig. Hvis forskjellen mellom bedringen i gruppe A og B er liten, er det mer sannsynlig at den er tilfeldig enn om forskjellen er stor. Men selv en liten forskjell kan være statistisk signifikant (dvs ikke tilfeldig) hvis gruppene består av mange nok pasienter. At en behandling har statistisk signifikant effekt forteller derfor ikke noe om hvor stor effekten er, bare hvor sikkert den kan knyttes til behandlingen og ikke til tilfeldigheter.

Mange nok

Det at forskjeller mellom pasienters bedring også kan skyldes tilfeldigheter, gjør det viktig at studier av effekt legges opp slik at det er mange nok pasienter til at de forskjellene man håper å finne kan bli statistisk signifikante. Behovet for at resultater må være statistisk signifikante er hovedårsaken til at enkeltskjebner er verdiløse som bevis på at en behandling virker. Allikevel finnes det mange som tror mer på ukeblader som forteller om fru Hansen i oppgang B som ble frisk av en eller annen mirakelkur (for eksempel en naturmedisin), enn de tror på store undersøkelser som viser at den samme mirakelmedisinen ikke produserer forskjeller mellom gruppe A som fikk kuren og gruppe B som ikke fikk den.

Det finnes flere ting å passe på når man skal forske på effekter av behandling, men denne teksten har forhåpentligvis gitt litt innsikt i betydningen av statistisk signifikans.