Orð og tunga - 01.06.2012, Blaðsíða 65
Jón Hilmar Jónsson: Að fanga orðaforðann
55
stakar flettur geta þá birst í ólíku flokkunarsamhengi og eftir atvikum
tengst fleiri en einum merkingarflokki. Notendur þurfa ekki endilega
að þekkja heiti merkingarflokkanna eða rekast á þau heldur er gert
ráð fyrir að þeir komist á viðeigandi slóð út frá flettu(m) sem þeir gera
ráð fyrir að varði leiðina þangað.
í 7. kafla er gerð nánari grein fyrir merkingarflokkuninni eins og
hún birtist notendum á vefsíðu orðanetsins. Framgangur hennar í
greiningunni ræðst af því hvaða áhersla er lögð á þá þætti sem liggja
henni til grundvallar. Þar hafa vissar aðgerðir orðið fyrirferðarmeiri
en séð var fyrir í upphafi og gagnagrunnurinn hefur verið aukinn með
verulegu viðbótarefni, í því augnamiði að víkka sjónarsviðið við grein-
ingu merkingarvenslanna og styrkja með því flokkunina. Greining
samheita (og tilbrigða þeirra) hefur frá upphafi verið fyrirferðarmikill
þáttur í uppbyggingu orðanetsins, og sú greining hefur um leið skilað
efni til afmörkunar stærri merkingarflokka. En merkingarflokkar og
samheiti, þar sem byggt er á mati og innsæi greinandans, ná ekki ein
sér að lýsa upp það svið sem merkingarvenslin birtast á. Þar þurfa
gögnin sjálf líka að geta talað sínu máli og sveigt til þær skörpu línur
sem alltaf myndast þegar skipað er í aðgreinda flokka.
6.3 Orðapör sem gagnategund
Meðal orðasambanda sem fram komu undir flettunni hlátureru orða-
pör, þ.e. hliðskipuð sambönd með jafnvægum liðum: pískur og hlátur,
hlátur og skvaldur. I grunngögnum orðanetsins er allmikið af slíkum
samböndum, nógu mikið til að gefa skýra vísbendingu um gildi þeirra
við merkingargreiningu og merkingarflokkun og til að sannfærast um
að orðapör skuli skilgreind sem sjálfstæð gagnategund (Par) í gagna-
grunni orðanetsins. Vensl slíkra hliðskipaðra setningarliða eru sérlega
bein og náin að því leyti að liðirnir falla inn í sama umhverfi og þau
eru því ekki háð samhenginu við aðra setningarliði (t.d. sameiginlegri
sögn eða lýsingarorði þegar um er að ræða nafnorð). Merkingarlegt
samband liðanna er hins vegar misjafnlega náið og af því sprettur
fjölbreytnin þegar litið er til einstakra flettna.
Með tilliti til þessa þótti þörf á að afla viðbótarefniviðar. Akveðið
var að leita fanga í hinu umfangsmikla textasafni Landsbókasafns
íslands - Háskólabókasafns Tímarit.is, en íslenskt textasafn Stofnunar
Árna Magnússonar í íslenskum fræðum hefur einnig verið nýtt í sama