Orð og tunga - 01.06.2012, Page 49
Jón Hilmar Jónsson
Að fanga orðaforðann:
orðanet í þágu orðabókar
1 Inngangur
í þessari grein er fjallað um orðabókarverkefnið Islenskt orðanet. Verk-
efnið miðar að því að skipa íslenskum orðaforða, jafnt stökum orðum
og merkingarbærum orðasamböndum, í samfellda heild, þar sem
merkingarskylt orðafar tengist saman og myndar merkingarflokka af
mismunandi tagi. Merkingarflokkunin byggist á því að rekja formleg
vensl í efnismiklu safni orðasambanda og samsetninga og kalla með
því fram merkingarvensl sem þau endurspegla.1
Efni greinarinnar er skipað þannig að fyrst eru reifaðar þær
breyttu aðstæður til orðabókarlýsingar sem rafræn gagnavinnsla og
textabirting hefur haft í för með sér. Þá er gerð grein fyrir forsendum
verkefnisins og efnviðinum og í framhaldi af því er viðfangsefninu
lýst og þeim markmiðum sem að er stefnt. Endurmótun flettulistans
í átt að einræðum (e. monosemantic) flettum, einræðingin sjálf (e. dis-
ambiguation) og myndun fleiryrtra flettna er síðan í brennidepli og
þar á eftir er fjallað um gagnaefnið, ólíkar gagnategundir og merk-
ingargreininguna sérstaklega. Þar beinist athyglin einkum að orða-
pörum og gildi þeirra við greiningu á merkingarlegum skyldleika
og mat á skyldleikastigi. Loks er gerð stutt grein fyrir birtingarformi
orðanetsins og vefsíðunni ordanet.is.
1 Verkefnið íslenskt orðanet er samstarfsverkefni greinarhöfundar og Þórdísar
Úlfarsdóttur. Ragnar Hafstað forritari hefur annast gerð gagnagrunna og
forritun, og saman hafa Þórdís og Ragnar séð um gagnavinnslu. Verkefnið
naut styrks úr Rannsóknarsjóði Rannís um þriggja ára bil.
Orð og tunga 14 (2012), 39-65. © Stofnun Ama Magnússonar í íslenskum fræðum,
Reykjavík.