Orð og tunga - 01.06.2013, Page 19
Jón Hilmar Jónsson: Að byggja undir íslensk-erlenda orðabók
9
andheitum. Innan merkingarflokksins áhyggjur eru einyrtar flettur
m.a. áhyggjur, búksorgir, hugarvíl og sút og meðal tvíyrtra flettna
eru hafa áhyggjur, bera ugg í brjósti, vera uggandi um sinn hag, vera í
öngum sínum, <honum, henni> vex <þetta> í augum og <þetta> stendur
<mér> fyrir svefni. Flettan <þetta> stendur <mér> fyrir svefni er auk þess
í samheitavenslum við flettuna <þetta> heldur vöku fyrir <mér> og sams
konar vensl eru á milli flettnanna láta sér <þetta> í augum vaxa og mikla
<vandann> fyrir sér.
Þannig getur íslenskt orðanet stutt merkingarflokkun í greiningar-
og vinnsluferli íslensk-erlendra orðabóka þótt gera verði ráð fyrir að
slík flokkun geti seint orðið tæmandi. I máltækniverkefninu Islenskur
merkingarbrunnur (sjá Anna B. Nikulásdóttir 2012) er einnig fyrir hendi
víðtæk merkingarflokkun á íslenskum orðaforða sem hagnýta má í
sama skyni en þar er beitt öðrum og vélrænni aðferðum við greining-
una. Gögnin sem þessi verkefni leggja til geta gegnt virku hlutverki
þegar byggt er upp orða- og flettusafn íslensk-erlendrar orðabókar og
auðveldað efnisafmörkun sem hæfir því hlutverki sem orðabókinni
er ætlað að gegna.
4 Formgerð og framsetning merkingarbærra
orðasambanda
Hér að framan var minnst á orðflokkagreiningu sem helsta greiningar-
þátt orðabókarefnis samkvæmt rótgróinni hefð. Þótt orðflokkagrein-
ing eigi sér langa sögu hefur hún sjaldnast gegnt beinu flokkunarhlut-
verki og segja má að takmörkuð áhersla hafi verið lögð á sérstöðu
einstakra orðflokka í almennum orðabókum. I stafrænu umhverfi eru
breyttar forsendur að þessu leyti, hægt er að skilyrða efnisflokkun og
orðaleit við einstaka orðflokka og hægara er að samræma meðferð
orðflokkanna í orðabókartextanum. En hefðbundin orðflokkagreining
nær aðeins til stakra orða og með því verða fleiryrtar merkingarbærar
einingar út undan og eiga sér ekki sambærilegan greiningarþátt.
í íslensku orðaneti er viðhöfð málfræðileg mörkun á fleiryrtum flett-
um sem gefur færi á formgerðarlegri flokkun þeirra (sjá Jón Hilmar
Jónsson 2012:46-49). Mörkunin tekur að nokkru leyti mið af hinu orða-
bókarlega umhverfi og er í vissum atriðum einfaldari en venjubundin
málfræðileg textamörkun. Auk orðflokkagreiningar er megináherslan
á fallmörkun, lexíkalskan breytileika í orðasamböndum og innbyrðis