Morgunblaðið - 23.04.1987, Page 28
28 C
MORGUNBLAÐIÐ, FIMMTUDAGUR 23. APRÍL 1987
URTAKSOVISSAI
SKOÐANAKÖNNUNUM
eftirHelga Þórsson
Undanfarið hefur mikið verið birt
af könnunum á fylgi stjómmála-
flokka. Þær eru gerðar til þess að
leita svara við þeirri spumingu sem
vekur hvað mestan áhuga almenn-
ings núna, hvemig fara kosningam-
ar. Svörin em birt sem hundraðs-
hlutar með einum eða tveimur
aukastöfum: Fylgi Sjálfstæðis-
flokksins mældist 29,6% í skoðana-
könnun Félagsvísindastofnunar
háskólans sem sagt var frá í Morg-
unblaðinu á skírdag. En gæti þetta
fylgi ekki verið 29,5% eða jafnvel
31%? Er víst að Borgaraflokkurinn
með sín 12,2% fái fleiri atkvæði en
Kvennalistinn með 12,1% eða jafn-
vel Alþýðubandalagið sem var með
11,9% í þessari könnun? Hvemig
skiptast þingsæti?
Hvernig er mælt?
Spumingar em lagðar fyrir hóp
fólks (úrtak) og ályktað um stærri
heild út frá svömnum. Fylgi
stjómmálaflokks getur verið
breytilegt milli aldurshópa, kynja
og landssvæða. Þess vegna verður
að styðjast við úrtak sem er dæmi-
gert fyrir alla kjósendur hvað
varðar þessi atriði. Ef hópurinn
sem svarar er frábmgðinn heild-
inni, t.d. að aldurssamsetningu,
væri hægt að rétta svörin af með
því að reikna hlutföll fyrir hvem
aldurshóp fyrir sig og taka vegið
meðaltal af þeim. Onnur atriði sem
geta tengst skoðunum fólks og
athöfnum (s.s. starf og tekjur) em
lítið þekkt og ekki aðstaða til þess
að meta úrtök með hliðsjón af
þeim.
Algengustu aðferðimar við að
velja úrtak em að nota þjóðskrána
eða símaskrána ef ætlunin er að
draga ályktanir um veralegan
hluta þjóðarinnar. Til þess að úr-
takið sé dæmigert þurfa allir
einstaklingar í heildinni að hafa
jafnar líkur á að vera með. Það
er tryggt með því að nota þjóð-
skrá. I símaskránni er hins vegar
sennilega tiltölulega lítið um giftar
konur yfír fímmtugu og um stálp-
uð eða uppkomin böm í foreldra-
húsum, og getur því farið óeðlilega
lítið fyrir þeim hópum í símaskrár-
úrtaki ef nöfn em valin úr skránni.
Ef símanúmerin ein era valin þarf
að nota einhveija aðferð til þess
að velja heimilismann af handa-
hófí. Svör sem fást með slíku
úrtaki verður að rétta af með tii-
liti til heimilisstærðar og aldurs-
skiptingar. Hins vegar er sími á
flestum heimilum, þ.a. lítil hætta
er á að símaskrárúrtak verði bjag-
að með tiiiiti til efnahags heimil-
anna.
Aðrar aðferðir við að velja úrtak
geta verið viðsjárverðar, s.s. að
spyija fólk sem gengur ákveðna
götu eða að tala við alla á ákveðn-
um vinnustað. Ýtrasta dæmi um
skekkju sem hiýst af þessu væri
að kanna hvað starfsmenn á skrif-
stofu einhvers stjómmálaflokks
ætla að kjósa.
Mæliskekkjur
Hvað á að gera við þann hluta
úrtaksins sem ekki svarar? Það
er bæði fólk sem ekki næst í, fólk
sem neitar að taka þátt í könnun-
inni og fólk sem kveðst ekki vita
hvaða flokk það muni kjósa. Ef
hlutfoli em eingöngu reiknuð fyrir
þá sem svara, og þau hlutföil al-
hæfð, er verið að gera ráð fyrir
að hópurinn sem ekki svarar,
brottfallið, sé^ eins og hópurinn
sem svarar. í stjómmálakönnun
er engin ástæða til þess að halda
að svo sé. Frægt dæmi er mismun-
ur á hlutfallslegu fylgi Sjálfstæðis-
flokksins í skoðanakönnunum og
kosningum. Til þess að meta hluta
af þessu brottfalli er hægt að
spyija þá óákveðnu hvort líklegra
sé að Jieir kjósi suma flokka en
aðra. I greinargerð með könnun-
inni sem birt var á skírdag er sagt
frá slíkum spumingum.
Önnur tegund af mæliskekkjum
er að sumir segja ekki rétt til um
hvað þeir muni kjósa, og aðrir eiga
eftir að skipta um skoðun fram
að kosningum. Ekki er hægt að
sjá við þeim vanda í einni könnun,
heldur era kannanir endurteknar
með öðm úrtaki.
Úrtaksóvissa
Úrtaksóvissa, eða tölfræðileg
óvissa, er óvissa sem stafar
beinlínis af því að ályktað er út
frá úrtaki í stað þess að rannsaka
alla heildina. Til þess að reikna
úrtaksóvissu skulum við gera ráð
fyrir að allir segi satt, úrtakið sé
dæmigert og samkomulag um
hvað eigi að gera við svör sem
vantar. Þá getur hver sem er
reiknað þessa tölfræðilegu óvissu
með reiknivéi sem hefur kvaðrat-
rót eða með töflureikni á einkat-
ölvu.
Hlutfallslegt fylgi
einstakra flokka
Vegna tilviljunar við val á úr-
taki er alls ekki tryggt að fylgi
hvers flokks fyrir sig hjá úrtakinu
verði hið sama og meðal allra kjós-
enda, hvað þá að tvö óháð (sjálf-
stæð), jafnstór úrtök sýni
nákvæmlega sama fylgi við hvem
flokk fyrir sig. Til þess að meta
hvaða frávik séu eðlileg er venju-
legast að reikna 95% öryggisbil
fyrir fylgi hvers flokks. Það er bil
sem við getum verið 95% öragg
um að innihaldi hið raunvemlega
fylgi. Þetta jafngildir því, að ef
mörg óháð úrtök væra skoðuð, þá
mundu 95 af hveijum 100 úrtök-
um gefa niðurstöðu innan öryggis-
bilsins.
Ef hlutfallslegt fylgi þess flokks
sem verið er að athuga er táknað
með p og ijöldi þeirra sem svara
(endanleg stærð úrtaksins) með
n, þá er 95% öiyggisbil fyrir fylg-
ið frá
p - 2 x kvaðratrót af
(p x (100-p) / n)
til
p + 2 x kvaðratrót af
(p x 100-p) / n)
í áðurgreindri könnun sögðu
917 manns af öllu landinu hvaða
lista þeir hygðust kjósa, 271 af
þeim ætluðu að lqósa Sjálfstæðis-
flokkinn. Þá er fylgi Sjálfstæðis-
flokksins (samkvæmt þessari
könnun):
p = 217 / 917 x 100 = 29,6% og
n = 917. Þá er 95% öryggi fyrir
því að raunveruiegt fylgi flokksins
liggi á bilinu frá 29,6% - 2 x k-
vaðratrót af (29,6% x 70,4% /
917)
= 29,6% - 3,0% = 26,6%
til
29,6% + 2 x kvaðratrót af
(29,6% x 70,4% / 917)
= 29,6% + 3,0% = 32,6%
Þessar tvær formúlur em gjam-
an skrifaðar í einu lagi sem
p +/ - 2 x kvaðratrót af
(p x (100-p) / n)
sem hér er 29,6% +/- 3,0%
Merkið +/- þýðir að út úr form-
úlunni komi tvær tölur, önnur ef
liðimir tveir era lagðir saman, hin
ef dregið er frá. Þær tölur era
endapunktar öryggisbilsins og
nefnast vikmörk. Sú tala sem
stendur aftan við +/- merkið kall-
ólíkum úrtökum er varla við því
að búast að nokkur flokkur fái
nákvæmlega sama fylgi í bæði
skiptin. En hve mikill munur er
skýranlegur með tilviljun við val
úrtaksins, án þess að gera þurfí
ráð fyrir að fylgið hafí raunvera-
lega breyst? Ef breyting hefur
orðið, hvað er hún þá mikil?
í desember birti Hagvangur
skoðanakönnun og er hér reiknuð
breyting á fylgi þeirra flokka sem
mældust með meira en 5% fylgi í
báðum könnununum:
hlíta reglu um hve stórt úrtak
skuli nota við kannanir á fylgi
flokkanna. Venjulegar kannanir
með 500 til 1000 svöram era
ágætar til þess að sýna stærstu
straumana, en ef mæla á svo ekki
skeiki nema broti úr prósenti verð-
ur að nota tíu sinnum stærri úrtök.
Könnun sem byggir á minna en
300 svöram er mjög ónákvæm.
Þar eð stærð úrtaksins er undir
kvaðratrót þegar óvissa er reiknuð
verður að fjórfalda úrtakið til þess
að helminga óvissuna. Til þess að
koma óvissunni á fylgi Sjálfstæðis-
flokksins úr 3% í 1,5% yrði að ná
í 4x917 = 3668 svör í stað 917.
Ekki er hægt að áætla af neinni
skynsemi út frá einni könnun
hvaða frambjóðendur nái kosn-
ingu. Ef til vill má giska á það
hveijir komist að á grandvelli
kannana og niðurstöðu seinustu
kosninga. Til þess að fá tilfínningu
fyrir ónákvæmni í slíkri ágiskun
Helgi Þórsson
„Ekki er unnt að setja
fram einhlíta reglu um
hve stórt úrtak skuli
nota við kannanir á
fylgi flokkanna. Venju-
iegar kannanir með 500
til 1000 svörum eru
ágætar til þess að sýna
stærstu straumana, en
ef mæla á svo ekki
skeiki nema broti úr
prósenti verður að nota
tíu sinnum stærri úrtök.
Könnun sem byggir á
minna en 300 svörum
er mjög ónákvæm.“
ast óvissan á matinu. Þegar gerð
er grein fyrir útkomum úr skoð-
anakönnun ættu vikmörk að fylgja
hveiju einasta svari.
Öiyggisbilið á að túlka þannig,
að eðlilegasta mat á fylgi Sjálf-
stæðisflokksins sé 29,6% (útkom-
an úr könnuninni). Einhveiju geti
þó skeikað, en 95% vissa sé fyrir
því að ekki skeiki meira en 3% upp
eða niður. Lítil frávik frá 29,6%
era líklegri en stór, þannig að
ekki má skilja öryggisbilið svo að
fylgið geti verið hvaða tala sem
er innan bilsins. Einnig era 5%
líkur (eða hætta) á að frávikið sé
meira en 3%.
Óvissan á fylgi þeirra flokka
sem fá meira en 5% atkvæða sam-
kvæmt könnun Félagsvísinda-
Þróun des.—apríl Des. 1986 Apríl 1987 Breytine: óvissa
svör hlutf. svör hlutf.
Alþýðuflokkur 111 22,2% 142 15,5% -6,7% 4,4%
Framsóknarflokkur 80 16,0% 134 14,6% -1,4% 4,0%
Sjálfstæðisflokkur 203 40,5% 271 29,6% -10,9% 5,3%
AJþýðubandalag 71 14,2% 109 11,9% -2,3% 3,8%
Kvennalisti 32 6,4% 111 12,1% 5,7% 3,1%
Aðrir 4 0,8% 150 16,4%
Samtals 501 100,0% 917 100,0%
Fylgi allra flokkanna virðist hafa
breyst, en ef reiknuð er óvissa á
breytingunni hjá hveijum flokki
fyrir sig sést að öryggisbilin fyrir
breytingu á fylgi Framsóknar-
flokksins og Alþýðubandalagsins
innihalda núll. Til dæmis er matið
á fylgisbreytingu Framsóknar-
flokksins -1,4%, þ.e. minnkun úr
16,0% í 14,6%. En óvissan á þessu
mati er 4,0%, sem þýðir að breyt-
ingin er (með 95% vissu) á bilinu
-5,4% til +2,6%. Þess vegna er
ekki marktæk breyting á fylgi
Framsóknarflokksins á þessu
tímabili og heldur ekki á fylgi
Alþýðubandalagsins. Hins vegar
hefur fylgi Alþýðuflokks og Sjálf-
stæðisflokks öragglega minnkað
og fylgi Kvennalistans aukist.
Matið sem hér fæst á breyting-
unni á fylgi hvers flokks er besta
mat sem unnt er að fá á þróun-
inni, útreikningamir sýna aðeins
að veraleg óvissa er á þessu mati.
Stærðfræðilegar
forsendur
Hve mikið öryggi?
Hér hefur verið talað um 95%
öryggisbil. Þó getur verið eðlilegt
að bregðast við vísbendingum sem
era veikari en 95% vissa, t.d.
vísbendingum um minnkandi kjör-
fylgi stjómmálaflokks. Breytingar
á kröfum um öryggi koma fram í
stuðlinum framan við kvaðratrót-
stofnunar er sem hér segir:
Fjöldi Hlut- Óvissa Neðri Efri
fall vikmörk vikmörk
Alþýðuflokkur 142 15,5% 2,4% 13,1% 17,9%
Framsóknarflokkur 134 14,6% 2,3% 12,3% 16,9%
Sjálfstæðisflokkur 271 29,6% 3,0% 26,6% 32,6%
Alþýðubandalag 109 11,9% 2,1% 9,8% 14,0%
Borgaraflokkur 112 12,2% 2,2% 10,0% 14,4%
Kvennalisti 111 12,1% 2,2% 9,9% 14,3%
Aðrir 38 4,1%
Samtals 917 100,0% 81,7% 110,1%
Vert er að vekja athygli á tveim-
ur atriðum varðandi þessar tölur.
í fyrsta lagi er hvert svar u.þ.b.
0,1% af heildinni, þannig að ekk-
ert vit er að reikna hlutföllin með
meira en einum aukastaf. í öðra
lagi kemur út tala sem er lægri
en 100% af öll neðri vikmörkin eru
lögð saman og hærri en 100% ef
öll efri vikmörkin era lögð saman.
Þetta minnir okkur á að matið á
fylgi hvers flokks er háð matinu
á fylgi hinna, útilokað er, að fylgi
þeirra allra sé samtímis við neðri
vikmörkin. Ef fylgi einhvers flokks
er ofmetið er einhver annar van-
metinn.
Breyting milli
tveggja kannana
Þegar fylgi flokkanna er kann-
að tvisvar með nokkra millibili og
ina, sem er 2 í formúlunum hér á
undan. Til þess að fá 99% öiyggis-
bil þarf að hækka stuðulinn upp
í 2,6, en ef 2/3 vissa (67%) nægir
er stuðullinn um 1. Þessir stuðlar
era sóttir í töflu um normaldreif-
ingu og eru ekki hámákvæmir,
gildið 2 sem notað er hér samsvar-
ar raunveralega 95,44% vissu, en
nákvæmara gildi varðandi 95%
vissu er 1,96.
Einnig mætti reikna á hinn veg-
inn: Hve miklar líkur eru á að fylgið
hafí aukist, eða jafnvel hve miklar
líkur era á að það hafí aukist um
a.m.k. 2%. Þeir útreikningar era
heldur flóknari og útheimta töl-
fræðitöflur eða sérstakt tölvuforrit
og verður ekki gerð grein fyrir þeim
hér.
Stærð úrtaks
Ekki er unnt að setja fram ein-
þarf einnig að gera tilraunir: Hvað
mundi gerast ef fylgi einstakra
flokka breyttist um 2%?
Formúlumar hér fyrir framan
byggjast á því að úrtakið sé óvera-
legur hluti heildarinnar, annars
sýndu þær of mikla óvissu. Þegar
úrtakið er innan við 1% af heild-
inni eins og í kosningakönnunum
hefur þessi þáttur áhrif á annan
aukastaf í óvissunni og er einfald-
lega sleppt. Smæð þjóðarinnar
minnkar því óvissuna ekkert.
Grófar viðmiðunar-
reglur um óvissu
Óvissa á fylgi einstakra flokka
er 2—4%. Hún er þeim mun meiri
sem stuðst er við færri svör, ef
aðeins er byggt á 100 svöram er
óvissan orðin 8%. Óvissan er held-
ur meiri á fylgi stórra flokka en
smárra.
Fylgismunur tveggja flokka
þarf að vera meiri en 3% til þess
að vera marktækur þegar stuðst
er við þúsund svör. Ef stuðst er
við 500 svör þarf munurinn að ná
4,5% til þess að vera marktækur.
Þegar munar innan við 1% á fylgi
tveggja flokka samkvæmt svona
könnun þýðir það aðeins að fylgi
þeirra er mjög líkt. Sama gildir
um breytingu á fylgi flokks milli
tveggja kannana.
Niðurlag
Hér hafa verið settar fram for-
múlur og sýnd dæmi um það
hvemig reikna skuli óvissu í skoð-
anakönnunum. Nauðsynlegt er að
tölur um óvissu séu birtar með
niðurstöðum. Tæknileg greinar-
gerð ætti því að innihalda eftirfar-
andi upplýsingar hið minnsta:
Hvaða heild á úrtakið að lýsa?
Hvað var úrtakið stórt og hvað
svöraðu margir?
Hvemig var úrtakið valið?
Hvemig var spurt og hvenær?
Kemur skiptingþeirra sem svör-
uðu, eftir kyni, aldri, hjúskapar-
stétt, búsetu, stöðu o.s.frv. heim
við samsvarandi skiptingu heildar-
innar?
Hvað er gert við svör sem ekki
fást? Er hugsanlegt að munur sé
á hópnum sem svarar og þeim sem
svara ekki?
Hvert var hlutfallslegt fylgi ein-
stakra flokka?
Öryggisbil fyrir fylgi hvers
flokks fyrir sig.
Öryggisbil fyrir fylgismun
flokka, eða a.m.k. hvort sá munur
sé marktækur.
Athugasemdir um spumingam-
ar, framkvæmd könnunarinnar og
einstakar niðurstöður.
Höfundur er sérfræðingur við
Reiknistofnun háskólans.