Orð og tunga - 01.06.2006, Blaðsíða 128
126
Orð og tunga
mikið greindist af óþekktum orðum, sem markarinn gaf til kynna með
sérstöku tákni. Lýsingarorð sem markarinn þekkti ekki greindi hann
oft sem nafnorð og öfugt, auk þess sem hann gerði fleiri mistök í grein-
ingu orðflokks.
Svo heppilega vill til að stórt viðbótarorðasafn er aðgengilegt. Það
eru orðin sem beygð voru fyrir verkefnið Beygingarlýsing íslensks nú-
tímamáls, sem var eitt af tungutækniverkefnum menntamálaráðuneyt-
isins, unnið á Orðabók Háskólans. í útgáfu 2.0 frá 2004 eru beygð
176.030 orð sem alls hafa 4.854.094 mismunandi beygingarmyndir,
eins og kemur fram hjá Kristínu Bjarnadóttur, verkefnisstjóra Beyg-
ingarlýsingarinnar (2004:23-24).
Þegar markarinn var látinn nota viðbótarorðasafnið auk grunn-
orðasafnsins batnaði árangur hans stórlega. Allar niðurstöður úr
mörkun sem birtar eru á þessum síðum voru fengnar með því að nota
viðbótarorðasafnið.
Algengar villur
Algeng villa í greiningu orðasambandanna er sú að nafnháttur sagnar
fremst í sambandinu greinist sem nafnorð eða lýsingarorð eins og sjá
má á eftirfarandi dæmi. Hér eru greiningarstrengirnir hafðir eins og
markarinn skilar þeim:
afla_nkeþ soðfisks_nkee
Þetta er röng greining, sögnin er greind sem nafnorð í karlkyni, ein-
tölu, þágufalli.
afla_sng sér_fpkeþ fjár_nhee
Hér er greiningin hins vegar rétt, sögnin er greind sem sögn í nafn-
hætti.
Annar galli á markaranum er sá að hann á erfitt með að tengja
forsetningu við fallorðið sem hún stýrir. Þegar greiningarstrengurinn
er einfaldaður á þann hátt að aðeins orðflokkurinn er eftir kemur það
ekki svo mjög að sök, en þegar það þarf nákvæmari greiningu er þetta
óheppilegt. Dæmi um það þegar markarinn skilur ekki tengslin milli
forsetningar og fallorðs má sjá í eftirfarandi orðasambandi:
þar_aa fór_sfg3eþ feitur_lkensf biti_nken í_aþ <Þjóðverja_nkfe-s>
(þar fór feitur biti í <Þjóðverja>)
í orðasambandinu er í greint sem forsetning sem stýrir þágufalli
(greining aþ). Þjóðverja er greint sem nafnorð í karlkyni, fleirtölu, eign-