Læknablaðið - 15.05.2003, Side 85
UMRÆÐA & FRÉTTIR / FARALDSFRÆÐI 28
Faraldsfræði í dag
Réttmætí mælitækja
Þessum fjórða pistli um hugtakið réttmæti (validity)
verður varið til umræðu um þá þætti er geta haft áhrif
á réttmæti mælitækja sem notuð eru í faraldsfræði og
tölfræði. Jafnframt verður tæpt á þeim aðferðum er
beita má til að meta hvort aðferðir eða mælitæki eru
réttmæt í því þýði sem um ræðir hverju sinni. Til-
gangurinn er auðvitað ekki að gefa tæmandi yfirlit
um aðferðafræði við gerð og prófun mælitækja, held-
ur einungis að vekja athygli á helstu þáttum er huga
þarf að.
Algengustu mælitæki sem notuð eru í faraldsfræði
og sem grundvöllur tölfræðilegrar úrvinnslu eru senni-
lega ýmiss konar spurningalistar eða önnur sniðmát
til gagnasöfnunar. Slíkum tækjum er beint að sjúk-
lingum, aðstandendum, heilbrigðisstarfsfólki eða þau
eru notuð til að vinna gögn úr fyrirliggjandi skrám.
Réttmæti þeirra, eða hæfni til að mæla það sem á að
mæla, getur takmarkast af ýmsum þáttum og var
drepið á nokkra þeirra í síðasta pistli, svo sem óskýrt
eða óviðeigandi orðalag, ónákvæmar eða óviðeig-
andi spurningar og svo framvegis. Segja má að eitt
undirstöðuatriði þess að unnt sé að safna réttmætum
gögnum með spurningalista sé að hver spurning hafi
svarmöguleika, eða flokka, sem gera sérhverjum svar-
anda kleift að velja einn en aðeins einn þeirra. Á
ensku er talað um að svarmöguleikar verði að vera
„exhaustive and mutually exclusive“, það er að svar-
andi á að geta svarað sérhverri spurningu á viðeig-
andi hátt en aðeins einn kostur á að koma til greina.
Algengasta dæmið um misbresti á þessu er sennilega
þegar spurt er um atriði eins og aldur eða þyngd
þannig að bilin sem gefin eru upp sem svarmöguleik-
ar skarast svo hluti svarenda getur tilheyrt tveimur
bilum. Þetta gætu til dæmis verið aldursbilin 20-30 ár,
30-40 ár og svo framvegis. Hvort bilið, 20-30 eða 30-
40, á þrítugur maður að velja? Afleiðingar þessa eru
ónákvæmni í upplýsingum, eða rangflokkun (mis-
classification), sem almennt leiðir til þess að erfiðara
er að átta sig á hugsanlegum tengslum milli aldurs í
þessu tilviki og þeirra þátta sem taldir eru tengjast
aldri. Annað atriði er spillt getur réttmæti spurninga-
lista, og er í raun náskylt hinu fyrra, er ónákvæmni í
orðalagi þannig að erfitt er að svara spurningu af-
dráttarlaust. Þannig sá ég nýlega eftirfarandi spurn-
ingu í lista þar sem spurt var um reykingar: „Reykir
þú eða hefur þú einhvern tíma reykt?“ Hvernig á
maður að túlka neitandi svar við þessu? Þýðir það að
viðkomandi hafi aldrei snert sígarettur eða kannski
að hann sé nýhættur eftir stórfelldar reykingar til
margra ára? Orðalag spurningarinnar er slíkt að
þessi gögn eru í besta falli lítils virði en í versta falli
algerlega ónýt.
Ofantalin atriði snerta innra réttmæti mælitækja.
Þegar þeim er hins vegar beitt utan þess þýðis sem
þau voru upphaflega hönnuð fyrir og prófuð í geta
ýmsir þættir orðið til þess að skaða ytra réttmæti
þeirra eða gagnsemi þeirra til að mæla það sem átti
að mæla upphaflega en nú undir öðrum kringum-
stæðum. Augljós dæmi eru hlutir eins og mismunandi
málfar og málskilningur en aðrir þættir geta einnig
komið til. Þar má nefna atriði eins og skilgreiningar
svarmöguleika, viðhorf svarenda til þess sem spurt er
um og samræmi milli svarmöguleika og raunverulegr-
ar dreifingar þess sem spurt er um. Sem dæmi má
nefna spurningalista um hreyfingu sem hannaður er í
erlendri stórborg. Ef við höfum áhuga á að kanna
hreyfingu almennt, hvort sem hún á sér stað sem hluti
af daglegri vinnu, sem ferðamáti eða sem tómstunda-
iðja, er ekki víst að slíkur listi mæli nægilega vel
hreyfingu meðal íbúa okkar samfélags þar sem þættir
eins og almenningssamgöngur, veðurfar og atvinnu-
hættir geta verið verulega ólíkir því sem upphaflega
mælitækið miðaðist við.
Til að kanna réttmæti spurningalista og svipaðra
mælitækja er nauðsynlegt að mæla á einhvern hátt
fylgni eða tengsl svaranna við þær útkomur sem
mælitækið á að lýsa. Þá er nauðsynlegt að skilgreina
einhvers konar „gull standard“ eða kvarða sem mæli-
tækið er borið saman við. Innra réttmæti er þá metið
með því að leggja spurningalistann fyrir ákveðið úr-
tak einstaklinga og safna jafnframt gögnum um þau
atriði sem talin eru vera „gull standard". Þetta tvennt
er svo borið saman til að sjá hvort mælitækið gefur í
raun réttar upplýsingar um það sem á að mæla. Ef til
dæmis á að leggja fyrir almenning spurningalista um
heilsufar og sjúkdómsgreiningar mætti bera svörin
saman við gögn frá læknum og heilbrigðisstofnunum.
Slíkur samanburður krefst auðvitað verulegrar vinnu
en tilgangurinn er að staðfesta hvort mælitækið sé
nægilega gott til að nota megi það til gagnaöflunar
beint frá sjúklingum í stað þess að leita fanga inni í
heilbrigðiskerfinu. Til að meta ytra réttmæti slíks
tækis yrði á sama hátt að bera það saman við raun-
gögn viðkomandi þýðis.
María
Heimisdóttir
mariahei@landspitali. is
Læknablaðið 2003/89 457