Orð og tunga - 01.06.1988, Page 138
126
Orð og tunga
tengd þeim.4 Það þótti því eðlilegt að ráðast fyrst til atlögu við sagnorðin með
eilhliða greiningu á notkun þeirra eins og hún birtist í söfnum Orðabókarinnar.
Á þeim tíma sem liðinn er síðan fyrstu hugmyndum um sagnorðagreiningu
var hreyft í árslok 1983 hefur verið unnið að því að móta umgjörð greiningar-
verkefnisins og ákvEirða greiningarciðferðir sem hæfðu þeim markmiðum sem að
er stefnt með greiningunni. Eitt það mikilvægasta í því sambandi veit að afla
viðeigsmdi hugbúnaðar til gagnaskráningar og úrvinnslu. Eftir ítarlega athugun
og samanburð á gagnasafnskerfum var ákveðið að festa kaup á gagnasafnskerf-
inu Revelation, og var fyrsta útgáfa þess tekin í notkun í árslok 1985. Kostir
Revelation eru m.a. þeir að færslur í einstökum sviðum eru ekki bundnar ákveð-
inni lengd eða stafafjölda, en slíkur sveigjanleiki hefur afar mikla þýðingu þegar
um margbrotna gagnaskráningu er að ræða. Fyrst í stað var gagnasafnskerfið
bundið einni tölvu, en árið 1986 var aflað netútgáfu sem tengdi fjórar vélar við
kerfið. Árið 1987 kom Revelation út í nýrri og endurbættri útgáfu, Advanced
Revelation. Sýnilegt var að hin nýja útgáfa fæli í sér ýmsar nýjungar og endur-
bætur sem stuðluðu að nákvæmari og markvissari greiningu en áður og jafnframt
að auknum afköstum. Því var ákveðið að fella greininguna að hinu nýja kerfi
og var búið að ganga frá fyrirkomulagi þess og nettengja kerfið við fjórar vélar
í ársbyrjun 1988. I kjölfar greiningarinnar hefur svo fylgt gerð orðabókartexta
sem fengið hefur fast snið með tilstyrk umbrotsforritsins TeX. Mikil tölvufræði-
leg vinna hefur verið lögð í að aðlaga gagnasafns- og umbrotshugbúnaðinn þessu
verkefni. I fyrstu var sú vinna að mestu í höndum Sigurðar Jónssonax, en hann
hætti störfum á Orðabókinni 1986. Frá 1987 hefur Björn Þór Svavaxsson haft
þetta verk með höndum. Auk Björns og Sigurðar hefur Jörgen Pind verið með
í ráðum um tölvufræðilega þætti verkefnisins. Sú lýsing á gagnaskráningu og
greiningu sem hér fer á eftir miðast öll við það fyrirkomulag sem mótað hefur
verið á gagnasafnskerfinu Advanced Revelation.
Eins og drepið var á hér að framan er markmiðið með greiningarverkefninu
ekki það eitt að semja fullbúinn orðabókíirt ^xta. Segja má að um þrenns konar
markmið sé að ræða:
1. Að mynda orðabókarstofn einstakra sagnorða, þar sem saman er kominn
flokkaður og greindur efiiiviður sem ganga má að við margs konar orða-
bókargerð.
2. Að semja stofntexta, þ.e. orðabókartexta af tiltekinni gerð sem látinn er
skila sér í lok greiningarferlisins og miðaður er við fyllstu not af dæma-
söfnum og greiningarþáttum.
3. Að greiða fyrir atriðaleit, þ.e. margvíslegum notum af því efni sem fram
kemur á orðaseðlunum.
4 Orðabækur um sagnorð eru einkum tvenns konar. Annars vegar eru bækur sem sérstak-
lega lýsa setningarlegu umhverfi sagnorða eða orðstöðu, svonefndar „VaIenz“-orðabækur sem
einkum tíðkast á þýsku málsvæði (sbr. Helbig og Schenkel 1969), hins vegar bækur um orða-
sambönd með sagnorðum (sbr. Courtney 1983).