Orð og tunga - 01.06.2007, Page 29
Anna Björk Nikulásdóttir: Sjálfvirk greining merkingarvensla 19
(30) a. bulla svipuð stöng í vél eða dælu
EIGINLEIKI (bulla, svipuð)
b. spaði þannig lagað kvenhöfuðfat
EIGINLEIKI (spaði, lagað)
5 Form skýringartexta
í sambandi við form skýringatexta eru tveir meginþættir sem þarf
að athuga: Hvaða form eru vel eða illa til þess fallin að greina þau
vélrænt og hvaða form eru algengust í nafnorðaskýringum ÍO. Ná-
kvæmri greiningu er ekki lokið en hér verður bent á nokkur dæmi.
Hafa ber í huga að tölurnar eru byggðar á niðurstöðum markarans og
verður því að lesa þær með þeim fyrirvara að greining hans er ekki
alltaf rétt. Eins og sést í töflu 1 hér að ofan er heildartala skýringar-
hluta 106.977. Flestir þeirra hefjast á nafnorði, alls 73.290 og þar af
eru 35.158 einungis eitt nafnorð. Upptalning á nafnorðum eru 6.913
skýringarhlutar og 26.085 skýringarhlutar passa við mynstrið nafn-
orð_komma_frekari skýring. Önnur mynstur eru til dæmis nafnorð_at-
viksorð_nafnorð og nafnorð_eignarfallseinkunn. í skýringarhlutum,
sem hafa mynstur sem hefst á nafnorði, er yfirleitt að finna samheiti
eða yfirheiti og eru þær því vel fallnar til greiningar merkingarvensla.
Sem stendur er litið fram hjá því sem stendur í svigum og því eru
skýringar eins og eftirfarandi ekki greindar:
(31) handaburður handa- (og handleggja)hreyfing(ar)
Önnur form skýringarhluta, sem skila áreiðanlegum niðurstöðum, eru
form sem hefjast á lýsingarorði. Alls eru slík mynstur í nafnorðaskýr-
ingum ÍO 14.684 talsins, þar af kemur mynstrið lýsingarorð_nafnorð
5.672 sinnum fyrir. Þessi mynstur skila yfirleitt merkingarvenslunum
eiginleika og yfirheiti. Að síðustu má nefna mynstur sem hefjast á for-
nafni en þau eru 7.362 talsins. Úr þessum mynstrum eru það fyrst og
fremst merkingarvenslin tengd sögn (það að X) og orðið maður sem
yfirheiti (sá /sú sem...) sem koma til greina.
Auk skýringarhluta eins og í (17) það að unga út eggjum, eru ýmiss
konar form skýringa sem ekki er hægt að greina með tilliti til merk-
ingarvensla: