Læknablaðið - 15.01.1997, Blaðsíða 39
LÆKNABLAÐIÐ 1997; 83
37
Samanburður og túlkun
Er ný meðferð við ákveðnum sjúkdómi betri
en hefðbundin meðferð? Þetta er athugað með
því að setja fram rannsóknartilgátu sem síðan
er prófuð með rannsókn á úrtakshópi sem end-
urspeglar þýði þeirra sem ályktun á að ná til.
Þegar unnið er úr niðurstöðum þá er sett fram
tölfræðileg tilgáta, nefnd núlltilgáta, um að
ekki sé munur á nýju og gömlu meðferðinni og
hún síðan prófuð tölfræðilega. Þegar núlltil-
gáta er rétt, mælist eingöngu „munur“ sem
verður fyrir tilviljun og þá er hægt að reikna
líkur þess að „munur“ mælist utan ákveðinna
marka. Við tilgátuprófun er athugað hvaða lík-
ur séu á að minnsta kosti þeirri breytingu sem
mælist í rannsókn, ef núlltilgátan væri rétt.
Við vitum yfirleitt ekki fyrirfram, hvort
breyting felur í sér hækkun eða lækkun miðað
við hefðbundna meðferð, því er tvíhliða próf
(two-tailed test) notað. Ef líkurnai eru minni
en 5% og notuð er 5% marktektarkrafa
(prófstig, significance level) þá er núlltilgátu
hafnað***. Með höfnun á núlltilgátu er sam-
þykkt önnur tilgáta (alternative hypothesis),
um að munur sé á nýju og hefðbundnu með-
ferðinni. Mikilvægt er að gefa öryggisbil, til
dæmis 95%, fyrir þeirri breytingu sem mælist.
Þetta bil inniheldur rétt gildi (population
value) með 95% öryggi.
Þegar miðað er við 5% marktektarkröfu eru
líkur á að hafna núlltilgátu sem er rétt (Type I
error) minni en 5%. Líkur þess að samþykkja
ranga núlltilgátu má oft reikna en þær eru háð-
ar fjölda þeirra sem rannsakaðir eru, dreifingu
mælinga og lágmarksbreytingu sem er áhuga-
verð. Ef þessar líkur eru litlar (Type II error)
er sagt að styrkur prófsins sé mikill. Sé styrkur
prófs lítill getur ómarktækur munur verið
áhugaverður. Marktæk breyting þarf hins veg-
ar ekki að vera klínískt áhugaverð, ef hún er
ekki nægilega mikil. Því er ekki ástæða til að
leita orsaka fyrir breytingu nema hún sé bæði
marktæk og „nægilega mikil“.
Eru niðurstöður rannsókna á tveimur hópum
sambœrilegar? Einungis sá þáttur sem rann-
sakaður er má hafa áhrif á samanburðinn
(mælast í samanburði). Athuga þarf því hvort
hóparnir séu nægilega einsleitir (homogen) til
dæmis hlutfall milli kynja í hvorum hópi og
*** Þótt tilgátunni sé ekki hafnað þýðir það ekki að hún sé
sönn, heldur einungis að þau gögn sem liggja fyrir séu ekki í
ósamræmi við tilgátuna.
aldursdreifing. Sé samsetning ólík þarf að at-
huga hvort það trufli (confounding) saman-
burð og leiðrétta slíkt ef hægt er, því hafi
ákveðnir sjúklingar valist frekar í annan hóp-
inn getur það skýrt að munur sé marktækur.
Einnig verða rannsóknaraðferðir á hópunum
að vera sambærilegar eins og reynt er að
tryggja með til dæmis tvíblindri (double-blind)
rannsókn og notkun á lyfleysu. Ef upplýsingar
skortir til að ganga úr skugga um þessi atriði er
samanburður ekki tímabær.
Við tilgátuprófun er reynt að velja tölfræði-
próf sem nýtir upplýsingar hvað best. Óstika-
bundið (nonparametric) próf er yfirleitt notað,
þegar ekki er forsenda fyrir stikabundnu prófi.
En þá er oftast ekki hægt að meta styrk prófs-
ins nema mjög gróft****. Einnig kemur til
greina að nota fleiri en eitt próf til prófunar á
sömu tilgátu. Eðlilegt er að kröfur um úr-
vinnslu séu að öðru leyti í samræmi við ná-
kvæmni mælinga.
Algeng tilvik, þar sem marktœkur munur
greinist (eða ekki), eru vegna:
Villu í innslætti, til dæmis tölur utan „eðli-
legra" marka (outliers).
Villu í reikniaðgerðum, til dæmis ef reikna á
í EXCEL meðaltal af 100 gildum en ekki
tveimur eins og gert er með því að nota
=average(Al;A100) í stað =average(Al:A
100).
Forsendur fyrir tölfræðiprófi eru ekki upp-
fylltar, til dæmis lúta mælingar ekki réttri dreif-
ingu.
Aðrar yfirsjónir svo sem „if you torture the
data long enough it will eventually confess! “
(9).
f þessari grein hefur verið stiklað á stóru og
nokkur atriði skoðuð, sem oft eru misskilin.
Þær ábendingar sem hér eru gefnar ættu að
gagnast við að svara spurningu eins og: Ef
munur er á tveimur hópum sem bornir eru
saman í rannsókn, er það þá vegna þess þáttar
sem rannsakaður er, eða þráttfyrir þann þátt?
HEIMILDIR
1. Altman DG. Practical Statistics for Medical Research.
London: Chapman & Hall, 1991.
2. Armitage P, Berry G. Statistical Methods in Medical
Research. 3rd ed. Oxford: Blackwell Scientific Publi-
cations, 1994.
**** Oft má hafa til hliðsjónar tölulegar rannsóknir hvað
þetta varðar.