Orð og tunga - 01.06.2007, Page 28
18
Orð og tunga
og ekki fleiri. Þegar MerkOr finnur eingungis hluta þeirra merkingar-
vensla sem greind voru handvirkt en greinir þó ekkert rangt er um
ófullnægjandi greiningu að ræða. Samanlagt voru því 94,77% allra
greindra merkingarliða villulausir. Rangt greindur er hver sá merk-
ingarliður þar sem MerkOr greinir að minnsta kosti eitt rangt orð eða
röng merkingarvensl, jafnvel þó hluti greiningarinnar sé réttur. Þessi
aðferð prófimar var valin þar sem mikilvægt er fyrir höfunda ÍO að
vita hve hátt hlutfall merkingarliða gætu haft rangt greind merking-
arvensl til þess að meta hvort bæta eigi niðurstöðunum hráum inn
í IO. Mögulegt væri einnig að gera villutölfræðina eftir flettum eða
mynstrum en þær tölur gæfu ekki nógu nákvæma mynd af því hve
margir merkingarliðir væru rangt greindir.
4.1 Helstu vandamál
Algengasta ástæða rangt greindra merkingarvensla eru villur í grein-
ingu markarans. Nákvæmni markarans var ekki prófuð enda leiða
ekki allar villur markarans til rangrar greiningar merkingarvensla og
þar af leiðandi er ekki beint samband þar á milli. í sumum tilvikum
voru reglur MerkOr einnig lagaðar að villum markarans til þess að
ná betri árangri. Eins og Þórdís Ulfarsdóttir bendir á (2006:141) er
í „þessum stuttu textum [orðabókarskýringanna] lítið setningarlegt
samhengi fyrir markarann að styðjast við"8. Arangur markarans er
engu að síður ágætur eins og sjá má af því að villur, sem leiða til rangt
greindra merkingarvensla, eru aðeins um 2% af prófunarsettinu.
Lýsingarorð eru oft greind sem nafnorð og MerkOr greinir þau þar
af leiðandi sem yfirheiti:
(29) bylgusa skammvinn hríð, snjógangur [...]
Hér er greining markarans sú að skammvinn sé nafnorð og niðurstaða
MerkOr var YFIRHEITI (bylgusa, skammvinn) í staðinn fyrir YFIR-
HEITI (bylgusa, hríð), EIGINLEIKI (bylgusa, skammvinn).
Önnur tegund af villum er þegar vensl eru út af fyrir sig rétt greind
en gefa samt sem áður engar nothæfar upplýsingar. MerkOr útilokar
nokkur slík orð við greininguna en lista yfir þessi orð þarf að lengja.
Dæmi um slík orð úr niðurstöðum prófunarinnar:
8Þórdís Úlfarsdóttir fjallar í grein sinni um mörkun orðasambanda og tekur einnig
dæmi um mörkun orðabókartexta.