Orð og tunga - 01.06.2012, Blaðsíða 52
42
Orð og tunga
Þar var viðfangsefnið þess eðlis að bókarformið þrengdi mjög að
lýsingunni. I tveimur síðari bókunum er bæði um að ræða lýsingu á
orðum og hugtökum, og textinn skiptist í aðgreinda bókarhluta, þar
sem sérstök stafrófsröðuð orðaskrá vísar leiðina að orðasamböndum
í aðalflettulistanum. I orðaskránni eru vensl orða og orðasambanda,
jafnt raðvensl (e. syntagmatic relations) sem staðvensl (e. paradigmatic
relations), víða enn betur sýnileg en í megintextanum og við blasir
hvernig formlegar samstæður geta endurspeglað merkingarlegan
skyldleika. Þá hafði hið merkingarlega sjónarhorn fengið stóraukið
vægi með Orðaheimi þar sem fletturnar eru hugtakaheiti og sameina
merkingarskyld orðasambönd. Loks fylgdi Stóru orðabókinni um ís-
lenska málnotkun útgáfa á geisladiski sem sýndi Ijóslega fram á kosti
og möguleika rafrænnar birtingar á viðamiklum og margbrotnum
orðabókargögnum.
A Orðabók Háskólans hafði um árabil verið fengist við að semja
skrá um orðasambönd sem fram koma í notkunardæmum í ritmáls-
safni, þar sem framsetning orðasambandanna er með sama sniði og
í orðabókunum fyrrnefndu. Því lá beint við að sameina öll fyrrnefnd
orðabókargögn og mynda með því stöfn í stærra orðabókarverki
sem miðaðist við rafræna birtingu eingöngu. Verkinu var valið heitið
lslenskt orðanet út frá þeirri áherslu sem lögð er á greiningu á því
margþætta venslaneti sem gögnin mynda, auk þess sem haft er í huga
að verkið er ekki bundið sérstökum stærðar- eða efnismörkum fyrir
fram.
Saman myndar þetta orðabókarefni tvíþættan stofn í gagnagrunni
orðanetsins. I flettulistanum koma saman þau lykilorð (einkum nafn-
orð, lýsingarorð og sagnir) sem orðasambönd hafa verið færð undir
en við þann lista bætast allar samsetningar (og stofnhlutar þeirra)
sem fram koma undir flettiorðum í Orðastað. Samtals er hér um að
ræða rösklega 160.000 einyrtar flettur. Hinn meginhluti stofnsins eru
orðasamböndin sjálf, upphaflega um 180.000 sambönd.
Ljóst er að merkingargreining og merkingarflokkun á þessum
gögnum getur haft stoð af öðrum tiltækum gögnum um merkingar-
legan skyldleika orða. í talmálsskrá Orðabókar Háskólans eru rakin
samheiti (og að nokkru yfirheiti) sem heimildarmenn Orðabókarinnar
tilgreina í umsögnum sínum um einstök orð. Þessi gögn voru felld
inn í gagnagrunn orðanetsins en þau snerta alls um 17.000 orð.
Meðal jafnheita (þýðingarorða, e. equivalents) í tvímála orðabókum
er samheitakennt orðafar að vonum víða áberandi. Því þótti ástæða til
að afla gagna úr þeirri átt og fékkst leyfi útgefanda til að nýta efni úr