Orð og tunga - 01.06.2007, Page 17
Anna Björk Nikulásdóttir: Sjálfvirk greining merkingarvensla
7
a) samheiti / jafnheiti2eða upptalning samheita / jafnheita.
(1) fagnaður 1 ánægja, gleði3
b) yfirheiti (genus proximum) ásamt nánari lýsingu, oft lýsingarorði eða
-orðum (differentia specifica) (Svensén 1993:122).
(2) breiðband breitt tíðnisvið notað til fjarskipta, [...]
Einnig er samsetning beggja flokka algeng:
(3) fagnaður [...] 2 höfðinglegar móttökur, gleðskapur
Með því að greina orðflokkamynstur skýringanna og samhengi þeirra
við merkingarvensl sést til dæmis að í (2) og (3) er höfuð (fyrsta) nafn-
liðarins yfirheiti flettunnar en hvert orð í upptalningu eins og í (1) er
samheiti / jafnheiti hennar. Ýmis önnur mynstur koma fyrir í skýr-
ingatextum ÍO þó ekki séu þau eins algeng og þau í (1) — (3) og verður
nánar fjallað um nokkur þeirra hér fyrir neðan.
Gögnin, sem rannsóknin byggist á, eru markaðir skýringartextar
nafnorða úr gagnagrunni ÍO. Skýringartextarnir voru markaðir með
TnT-málfræðimarkara Brants sem þjálfaður hefur verið á íslensku.4
Stór kostur ÍO er að skýringum er skipt niður í svokallaðar flettuteg-
undir í gagnagrunninum. Flettutegundir eru helsta viðfangsefni rann-
sóknarinnar og kýs ég að kalla þær skýringarhluta til einföldunar. Eft-
irfarandi skýring er til að mynda þrískipt:
(4) dílaburkni [1] íslensk burknategund [2] (Dryopter-
is assimilis) [3] af þrílaufungsætt, með fjaðurskiptum
blöðum, vex í gjám og kjarri
Þetta skipulag auðveldar til muna vélrænan aðgang að einstökum
hlutum skýringanna og skilar þar af leiðandi betri niðurstöðum en
ef öll skýringin er vistuð sem ein heild. I greiningu MerkOr er hver
skýringarhluti meðhöndlaður sem sjálfstæð eining. Við hann er flettan
tengd ásamt kenninúmeri sem og það orðflokkamynstur sem markar-
inn skilar. Skýringin í (4) hefur eftirfarandi greiningu:
3Sjá nánari umfjöllun um samheiti og jafnheiti í köflum 3.2 og 3.8.
3Ö11 orðabókardæmi eru úr vefútgáfu /slenskrar orðabókar (sbr. Vefbækur Eddu). Mál-
fræðiupplýsingum (kyni og beygingu) er sleppt í dæmunum.
4Gagnagrunnurinn var fenginn til rannsóknarinnar hjá Eddu útgáfu og kann ég
þeim bestu þakkir fyrir og þá sérstaklega starfsmönnum orðabókadeildar, þeim Lauf-
eyju Leifsdóttur og Marinó Njálssyni. Kærar þakkir einnig til Sigrúnar Helgadóttur
hjá Orðabók Háskólans sem markaði skýringatextana.