Skáldskaparmál - 01.01.1990, Page 56
Orðstöðulykill íslendinga sagna
EIRÍKUR RÖGNVALDSSON
1. Verklýsing
Vinna við Orðstöðulykil íslendinga sagna hófst á útmánuðum 1989.1 Hér er um
að ræða alla þá texta sem prentaðir eru í útgáfu Svarts á hvítu (1985-6/1987), að
frátöldum íslendinga þáttum og vísum. Alls eru þetta 2079 blaðsíður, en
lesmálsorð í textanum eru um 885 þúsund. Verkið er unnið þannig að öllum
textunum er steypt saman í eina skrá (sem er tæplega 5 megabæti að stærð).2
Síðan er sérstakt forrit (Word Cruncher frá Electronic Text Corporation í
Utah) látið skrifa í textaskrá (ASCII skrá) öll dæmi um hverja orðmynd, með
u.þ.b. 40 bókstafa umhverfi í hvora átt og tilvísun í sögu, kafla og blaðsíðu. Brot
úr slíkri skrá er sýnt á mynd 1 (á næstu síðu).
Síðan er textaskráin tekin inn í WordPerfect ritvinnsluforritið og búin undir
lemmun. I því felst m.a. að flettiorðið er feitletrað og dæmum um hverja orð-
mynd er raðað í stafrófsröð þess sem á eftir kemur. Að þessu loknu lítur bútur-
inn út eins og á mynd 2 (á næstu síðu).
Fram að þessu hefur vinnslan verið að mestu vélræn, en nú tekur við
handavinnan: sjálf lemmunin. I henni felst það að steypt er saman öllum beyg-
ingarmyndum sama orðs, og samhljóða orðmyndir sem tilheyra mismunandi
flettiorðum (lexemum) eru greindar sundur, auk þess sem dæmin eru öll greind
í orðflokka. Þetta er gífurlega mikil vinna, og ekki alltaf auðveld, því að oft
leikur vafi á því hvernig greina skuli einstakar orðmyndir (hvar mörkin liggi
milli lýsingarorða og atviksorða, hvenær greina beri stirðnuð föll nafnorða sem
atviksorð o.s.frv.). Búturinn sem áður var tekinn sem dæmi lítur að lokinni
lemmun út eins og á mynd 3 (á næstu síðu).
Síðan er skráin prentuð á geislaprentara, og við tekur prófarkalestur, sem er
mjög tímafrekur, enda hefur verið reynt að vanda til hans svo sem kostur er. Sú
greining sem unnin var við lemmunina og áður er lýst er öll endurskoðuð, og
stuðst við tiltækar fornmáls- og nútímamálsorðabækur.
Hér koma upp ótal vafaatriði sem leysa þarf úr. Hvernig á að fara með tví-
myndir (t.d. aðfangadagur/affangadagur, -igur/ -ugur, öx/öxi/exi, o.s.frv.)?
Hvernig á að fara að þegar aukafallsmynd getur tilheyrt tveim uppfletti-
SKÁLDSKAPARMÁL 1 (1990)
54