Orð og tunga - 01.06.2012, Blaðsíða 51
Jón Hilmar Jónsson: Að fanga orðaforðann
41
stakkur skorinn, þar sem þau eru jafnan undirskipaðar einingar sem
erfitt getur verið að rata að og fá yfirsýn um, hvað þá að tengja saman
út frá sameiginlegum einkennum.2 I orðabókarlýsingu sem miðast
við merkingarbundna eiginleika flettnanna er ekkert því til fyrirstöðu
að orðasambönd fái sjálfstæða stöðu, komi fram óháð þeim orðum
sem þau eru mynduð úr og geti tengst stökum orðum sem jafngildar
einingar.
Orðanetum er það sameiginlegt að þar er fengist við greiningu
á merkingarvenslum orða í tilteknu tungumáli. Aðferðirnar eru
hins vegar mismunandi og lnlutverkið er sömuleiðis breytilegt (sjá
Whelpton 2012 (þetta hefti)). Langþekktasta orðanetið er WordNet,
sem upphaflega lýsir ensku með áherslu á samheitavensl stakra orða,
en hefur síðan orðið fyrirmynd sams konar lýsingar á orðaforða fjöl-
margra tungumála. Því er ætlað að endurspegla innri skipan orða-
forðans í huga málnotenda en um leið miðast greiningin mjög við
máltæknileg not og vélræna meðferð.
Orðanetið sem hér verður lýst stendur nær almennri orðabókar-
lýsingu, greiningin byggist á orðavenslum eins og þau koma fram í
textasamhengi og hún tekur jafnt til stakra orða og merkingarbærra
orðasambanda. Hér eru innbyrðis vensl merkingarbærra orðasafns-
eininga (orða jafnt sem orðasambanda) í brennidepli og leggja grunn
að margháttaðri flokkun orðaforðans. Öll úrvinnsla og greining efnis-
ins miðast við rafræna birtingu. Lýsingunni eru ekki sett nein stærð-
armörk að þ\u' er varðar fjölda flettna og gildi flettnanna ræðst fyrst
og fremst af því hversu virkar þær eru í tengslum við aðrar flettur.
3 Forsendur og efniviður
Hvatinn að því að ráðast í gerð íslenskrar orðabókarlýsingar með ofan-
greind sjónarmið í huga er að miklu leyti sóttur til þeirrar reynslu sem
fengist hafði við samningu þriggja efnislega samstæðra orðabóka um
íslensk orðasambönd, Orðastaðar, Orðaheims og Stóru orðabókarinnar
um íslenska málnotkun (sjá Jón Hilmar Jónsson 2001, 2002 og 2005).
2 Hugtakið orðasambaitd hefur hér afar rúma merkingu og tekur til sambanda
tveggja eða fleiri orða sem oft koma fram sem meira eða minna samstæð
setningarleg heild. Nánari tegundargreining orðasambanda markast m.a.
af því hversu fastbundin þau eru og hvernig merking þeirra tengist merk-
ingu orðanna sem þau eru mynduð af.