Aksjonsgrenser og diagnostisk nøyaktigheit

Aksjonsgrenser kan brukast til å skilja mellom ulike tilstandar, men det er ein generell risiko for feilklassifiseringar. Ved utrekning av sannsynet for at eit prøvesvar gjev korrekt klassifisering, må me ta omsyn til pretest-sannsynet for at pasienten har tilstanden ein undersøker for.

Alle laboratorieanalysar har eit formål, vanlegvis å bidra til ei klinisk avgjerd. Ei aksjonsgrense kan definerast som ein terskelverdi for kva klinisk avgjerd ein skal ta. Til dømes har HbA1c fleire ulike aksjonsgrenser:
  • HbA1c 42–47 mmol/mol tyder på høg risiko for (å utvikla) diabetes mellitus. 
  • HbA1c ≥ 48 mmol/mol i to prøvar er diagnostisk for diabetes mellitus.
  • HbA1c < 53 mmol/mol er eit vanleg behandlingsmål. 

Aksjonsgrensene kan vera relaterte til referansegrensene til komponenten, men treng ikkje vera det. Til dømes er HbA1c sitt referanseområde om lag 20–40 mmol/mol, altså eit stykke under aksjonsgrensene. Det er, som dømet ovanfor viser, mogleg å ha fleire aksjonsgrenser. Til dømes kan ein ha ei aksjonsgrense for å sikkert påvisa ein tilstand, ei aksjonsgrense for å sikkert utelukka tilstanden og eit gråsoneområde mellom aksjonsgrensene, der ein må gjera ytterlegare undersøkingar for å kunna konkludera.

Diagnostisk nøyaktigheit til ei aksjonsgrense

Når ei aksjonsgrense vert brukt til å skilja mellom sjuke og friske (eller personar som har eller ikkje har ein bestemt tilstand), er det fare for feilklassifiseringar. Ein risikerer både falske positive (friske som vert klassifiserte som sjuke) og falske negative (sjuke som vert klassifiserte som friske). I praksis må ein anten velja aksjonsgrenser som unngår anten falske positive eller falske negative (til dømes dersom testen skal brukast til å sikkert påvisa eller utelukka ein tilstand), eller ein må velja aksjonsgrenser som finn ein akseptabel balanse mellom førekomsten av falske positive og falske negative. Til dette må ein helst ta omsyn til fleire forhold, inkludert konsekvensar og kostnadar. Me skal her avgrensa oss til å gjera nokre enkle sannsynsvurderingar.

Me ser på eit fiktivt døme der ein (billig) test vert brukt til å skilja mellom sjuke og friske avhengig av om testresultatet er positivt eller negativt. Det finst ein (dyr) gullstandard som sikkert skil mellom friske og sjuke. Ein studie har samanlikna testen med gullstandarden og funne følgjande fordeling av testresultat:

Fordeling av test-resultat

Positiv test​
Negativ test​
​Sant sjuk
​43
5​
​Sant frisk
​12
124​
Me kan no rekna ut sensitivitet og spesifisitet, altså sannsyna for at dei som er respektive sjuke eller friske får korrekte prøveresultat (korrekt betyr her at prøvesvaret gjev rett klassifisering av pasienten). I dette tilfellet er begge om lag 90 %. Me kan ikkje utan vidare bruka desse tala til å rekna ut den prediktive verdien til prøvesvaret, altså sannsynet for at prøvesvaret er korrekt. Til det treng me også vita noko om pretest-sannsynet for at personen er sjuk. Dette kan til dømes vera prevalensen til sjukdommen i den populasjonen me undersøker eller ei sannsynsvurdering av kor rimeleg det er at pasienten er sjuk. 

Dersom det er svært sannsynleg at pasienten er sjuk, vil den prediktive verdien til eit positivt prøvesvar vera svært høg, medan den prediktive verdien til eit negativt prøvesvar vil vera relativt låg, sjølv om testen har god sensitivitet og spesifisitet. Det motsette gjeld dersom det er lite sannsynleg at pasienten er sjuk. Figuren under viser korleis den prediktive verdien avheng av pretest-sannsynet eller prevalensen i vårt døme:

Pretest

Utdjupande forklaringar

Sensitiviteten er sannsynet for at ein sjuk person får ein positiv test. Me kan rekna dette ut som P(positiv test|sjuk) = (tal på sjuke med positiv test)/(totalt tal på sjuke), som i vårt døme er 43/(43+5) ≈ 90%. Dette betyr at om lag 9 av 10 sjuke vil få ein positiv test, medan 1 av 10 sjuke vil vera falsk negative (feilaktig tolka som friske). 

Sensitiviteten vert ofte påstått å vera uavhengig av prevalensen til sjukdommen. Dette er ei halvsanning, for sjukdomsaktiviteten (graden av sjukdom) kan påverka sensitiviteten. Dette fordi prøvesvara vanlegvis er meir avvikande ved meir uttalt sjukdom enn ved mindre uttalt sjukdom. 

Spesifisiteten er sannsynet for at ein frisk person får ein negativ test. Me kan rekna dette ut som P(negativ test|frisk) = (tal på friske med negativ test)/(totalt tal på friske), som i vårt døme er 124/(124+12) ≈ 91%. Det betyr at om lag 9 av 10 friske vil få ein negativ test, medan 1 av 10 friske vil vera falsk positive (feilaktig tolka som sjuke).

Spesifisiteten vert ofte påstått å vera uavhengig av prevalensen til sjukdommen. Dette er ei halvsanning, for fordelinga av sjukdommar i populasjonen kan påverka spesifisiteten til testen. Anta at det finst ein tilstand «frisk nok» som også gjev positivt testresultat, men pasientar med «frisk nok» skal klassifiserast som friske. Då vil spesifisiteten til testen minka dersom prevalensen til «frisk nok» aukar.

Den positive prediktive verdien er sannsynet for at person som har fått ein positiv test er reelt sjuk. Me kan rekna dette ut som (#sjuke med positiv test)/(#positive testar), som i vårt døme er 43/(43+12) ≈ 78%. Nei, det er ikkje fullt så enkelt. Den prediktive verdien til eit testresultat avheng av pretest-sannsynet eller prevalensen til sjukdommen, og tabellen viser neppe korrekt prevalens. 

Dersom prevalensen (eller pretest-sannsynet) er 5%, vil 50 av 1000 personar vera sjuke og i dømet vårt har om lag 45 stykk positiv test. Av dei resterande 950 har om lag 84 stykk positiv test, så den positive prediktive verdien er 45/(45+84) ≈ 35%. Det betyr at omtrent 2 av 3 positive testar er ukorrekte! Dersom prevalensen (eller pretest-sannsynet) derimot er 75%, vil den positive prediktive verdien vera om lag 97%. 

Den negative prediktive verdien er sannsynet for at ein person som har fått ein negativ test er reelt frisk. Me kan rekna dette ut som (#friske med negativ test)/(#negative testar), som i vårt døme er 124/(124+5) ≈ 96%. Nei, det er ikkje fullt så enkelt. Den prediktive verdien til eit testresultat avheng av pretest-sannsynet eller prevalensen til sjukdommen, og tabellen viser neppe korrekt prevalens. 

Dersom prevalensen (eller pretest-sannsynet) er 5%, vil 50 av 1000 personar vera sjuke og i dømet vårt har om lag 5 stykk negativ test. Av dei resterande 950 har om lag 866 stykk negativ test, så den negative prediktive verdien er 866/(866+5) » 99%. Det betyr at nesten alle negative testar er korrekte. Dersom prevalensen (eller pretest-sannsynet) derimot er 75%, vil den negative prediktive verdien vera om lag 74%. 

Avgrensingar ved bruk av sensitivitet og spesifisitet

Ved bruk av sensitivitet og spesifisitet bør ein forsikra seg om at populasjonen som vert undersøkt er ganske lik populasjonen som vart undersøkt då sensitiviteten og spesifisiteten opphavleg vart bestemt. Dette fordi både graden av sjukdom og fordelinga av sjukdommar i populasjonen kan påverka sensitiviteten og spesifisiteten. 

Sensitivitet og spesifisitet føreset at det er samanlikna med ein gullstandard eller eit (hardt) endepunkt. Dersom gullstandarden er dårleg, kan ein god test paradoksalt verta klassifisert somt dårleg. Motsett, dersom testen er (eller inneheld) gullstandarden, kan den verta klassifisert som falsk god.

Sensitivitet og spesifisitet er estimerte sannsyn, og er hefta med usikkerheit. 

Sist oppdatert 23.05.2023