Neyslukönnun - 01.10.1997, Qupperneq 40
38
Neyslukönnun 1995
10. Áreiðanleiki
10. Reliability
Niðurstöður úr úrtakskönnunum eru alltaf háðar einhverri
óvissu vegna þess að einungis hluti af þýðinu er skoðaður.
Stærð úrtaks og úrtaksaðferð ræður miklu um tölfræðilega
marktækni. Því meira sem svör þátttakenda eru sundurliðuð,
t.d. eftir búsetu, heimilisgerð og tekjum, því stærra úrtak þarf
að liggja að baki til að niðurstöður geti talist marktækar.
Niðurstöður um útgjöld eru einnig misjafnlega áreiðanlegar
eftir því um hvaða tegund vöru og þjónustu er að ræða. Gera
má ráð fyrir að upplýsingar um útgjöld sem eru tíð séu
áreiðanlegri en um útgjöld sem eru sjaldgæf. Séu útgjöld
stopul geta tilvilj anakennd frávik ráðið miklu um niðurstöður.
I allmörgum útgjaldaflokkum eru flest heimili með engin
útgjöld en fáein heimili með mikil útgjöld. Þetta á t.d. við um
bílakaup og kaup á húsgögnum og heimilistækjum. Þegar
niðurstöðurnar eru síðan flokkaðar, t.d. eftir búsetu eða
heimilisgerð getur breytileiki orðið mikill og staðalskekkja
há. I niðurstöðutöflum eru fjárhæðir og hlutföll merkt með *
ef hlutfall staðalskekkju af meðaltali er yfir 20%.
Skekkjur í mælingum valda einnig óvissu. Skekkjur geta
verið tilviljunarkenndar eða kerfisbundnar. Ef skekkjur eru
miklar geta þær orðið til þess að könnun mælir ekki rétt það
sem henni er ætlað að mæla. Hér á eftir er fjallað um nokkrar
helstu skekkjur sem skipta máli við kannanir.
10.1 Skekkjur vegna þess að úrtak er skoðað
Urtaksskekkja. Urtak er valið tilviljunarkennt úr einhverri
skrá, t.d þjóðskrá eins og gert var í neyslukönnun. Ovissa sem
getur skapast við það er að úrtakið gefi ekki rétta mynd af
þýðinu. Niðurstöður könnunarinnar gefa þá ekki rétta mynd
af heildinni. Þar sem óvissan ræðst af tilviljun er hægt að
reikna öryggismörk fyrir ákveðnar mælistærðir. Þá skiptir
máli hvemig úrtakið er valið og hvaða mæliaðferðir em
notaðar. Urtaksskekkja er háð úrtaksaðferð og stærð úrtaks.
Þekjuskekkjur. Þekjuskekkjur verða til vegna þess að
skráin sem lögð er til grundvallar úrtakinu, úrtökuramminn,
hentar ekki fullkomlega. Þekjuskekkjum má skipta í tvennt.
Ojþekja: I úrtökurammanum em heimili sem ekki eiga að
vera þar. f þjóðskrá á þetta t.d. við um fólk sem er búsett í
útlöndum og hefur ekki tilkynnt lögheimilisflutnin^ eða býr
á stofnun og hefur lögheimili annars staðar. í neyslu-
könnuninni 1995 kom ekki í ljós fyrr en haft var samband við
heimilin hvort þau áttu að vera með í úrtakinu eða ekki. Þeim
heimilum sem ekki áttu að vera með í úrtakinu var sleppt úr
könnuninni. Þetta hafði því enga skekkju í för með sér.
Vanþekja: Heimili vantar í úrtökurammann og getur þar af
leiðandi ekki lent í úrtakinu. Ekki er ástæða til að ætla að í
þjóðskrá vanti fólk sem þar á að vera skráð.
Brottfallsskekkja. Yfirleitt fást ekki svör frá öllum sem
lenda í úrtaki í spumingakönnunum. Ef brottfallið dreifist
misjafnlega eftir hópum getur það valdið skekkju ef brottfalls-
hópurinnerfrábmgðinn svarendunum. Helstu ástæðurbrottfalls
em neitanir, að ekki næst samband við þátttakendur, veikindi
eða fötlun eða að svör em ófullnægjandi. Brottfall í neyslu-
könnunumeryfirleitt mikið miðaðviðþaðsemgeristí könnunum
almennt. Þátttaka í könnuninni krefst tals verðrar vinnu að hálfu
þátttakenda og því er erfitt að fá fólk til þátttöku. Þar sem
Results of sample surveys are always subject to some uncer-
tainty, since only part of the population is studied. The size
of sample and the sampling method have a large impact upon
their statistical significance. As responses are broken down
into increasing detail, for example according to residence,
type of household and income, a correspondingly larger
sample needs to be drawn in order for results to be considered
significant. Results on expenditures also vary in reliability
depending upon the type of good and service in question.
Thus data on regular expenditures may be expected to be
more reliable than those on infrequent ones. If expenditures
are intermittent, coincidental deviations may have a great
impact on the results. For a large number of categories, most
households recorded no expenditures, while a few recorded
very large ones. Examples are purchases of cars, and of
furnishings and household appliances. Subsequent classifi-
cation of results, for example according to residence or type
of household, can create a large variability and a high
standard error. In the tables of results, sums and percentages
are marked with an asterisk (*) if the relative standard error
is more than 20%.
Measurement errors also create uncertainty. The following
is an outline of the main errors which are important in
surveys.
10.1 Non-observational errors
Sampling errors. A sample is drawn at random from a
sample frame for example the National Register of Persons as
in the HBS. Uncertainty is inherent in all surveys, with the
risk that the sample does not present an accurate picture of the
population. Since this is a random probability error, confi-
dence limits for statistical significance can be calculated.
Sampling error is affected by method of sampling and sample
size.
Coverage errors. Coverage errors occur when the sample
frame is not perfectly suitable for the survey in question.
There are two kinds of coverage errors.
Over-coverage: In the sample frame are sample units that
do not fulfil the conditions of the sample. In the National
Register of Persons this applies to people living abroad but
who are still domiciled in Iceland in the National Register, or
people living in institutions without being domiciled there.
Over-coverage was not a risk in the HBS. Once households
had been contacted, it emerged whether or not they qualified
for inclusion, and those which did not were omitted.
Under-coverage: Sample units are missing from the sam-
ple frame and can therefore not be sampled. There are no
grounds for assuming that households are missing from the
National Register of Persons.
Non-response errors. Response is generally not received
from all those who are sampled in a survey. If non-response
is unevenly distributed by groups it can cause an error if those
who refuse to participate are different from those who agree.
Main reasons for non-response are refusals, non-contacts,
illness or inadequate data. Non-response in the HBS has to be
considered high. Participation in the survey involves a great
deal of effort for the respondents so it is difficult to induce