Morgunblaðið - 05.02.1984, Blaðsíða 16
64
MORGUNBLAÐIÐ, SUNNUDAGUR 5. FEBRÚAR 1984
MORGUNBLAÐIÐ, SUNNUDAGUR 5. FEBRÚAR 1984
65
Orðabók Háskólans tölvusett:
Tölvan mötuð á
hundruðum þúsunda orða
af milljónum seðla
Sífellt ryður tæknin sér til rúms og gömlu vigin falla fyrir henni hvert af öðru. Líklega hefur
prófessor Alexander Jóhannesson ekki grunað það, að Orðabók Háskólans ætti eftir að verða
tölvuvædd, þegar hann kom á legg þessu hugarfóstri sínu fyrir um 40 árum. Sú er hins vegar
staðreyndin, nú vinna starfsmenn Orðabókar Háskólans að því að mata tölvu á hinum gömlu góðu
seðlum bókarinnar. Liklega finnst mörgum það merkilegt, að í stað þess að fletta upp í
seðlasafninu, milljónum seðla, til að finna tímasett dæmi um ákveðin orð og fleira, geti þeir
setzt við tölvu og krafið hana upplýsinga og fengið þær á andartaki. Tölvusetning Orðabókarinn-
ar greiðir mjög fyrir þvi að gefa Orðabókina út í prentuðu formi. Er þá ekki aðeins hugsanlegt að
miða við safnið í heild, heldur má einnig nýta ákveðna hluta safnsins við takmarkaðri útgáfuverk-
efni. Má nefna, að tölvan getur sýnt orðalista eftir aldri, orðflokkum, heimildum, gerð orða og
fleira. Undirritaður ræddi vegna þessa við Jón Aðalstein Jónsson, forstöðumann Orðabókarinnar,
og starfsmennina Guörúnu Kvaran, Jón Hilmar Jónsson og Jörgen Pind og fékk þau til að segja
frá Orðabók Háskólans og starfseminni í dag. Fara viðtölin hér á eftir: HG
Um 40 ár síðan
ákveðið var að semja
sögulega vísindalega
orðabók við HÍ
„NÚ ERU um 40 ár síðan ákveðið
var að semja sögulega vísindalega
orðabók hér við Háskóla íslands.
Gert var ráð fyrir að fyrri mörk
orðtöku miðuðust við útkomuár
Nýja testamentis Odds Gott-
skálkssonar 1540, sem er elzta
prentaða íslenzka bókin, sem varð-
veitzt hefur. Á þessum tíma verða
veruleg skil í íslenzkri málsögu og
fer því vel að upphaf Orðabókar
Háskólans sé miðað við siðaskipta-
tímann. Árnanefnd í Kaupmanna-
höfn sér um fornmálið og er undir-
búningsvinnu að mestu lokið. Hér
á landi hafði þetta sinn aðdrag-
anda og var aðalhvatamaðurinn í
lokin Alexander Jóhannesson,
prófessor í málfræði og jafnframt
fyrsti formaður stjórnar Orðabók-
ar Háskólans. Gegndi hann því
embKtti til dauðadags, 1964, en þá
tók Halldór Halldórsson prófessor
við formennsku. Jón G. Friðjóns-
son, dósent í málfræði tók síðan
við af Halldóri haustið 1981 og
hefur verið formaður stjórnarinnar
síðan. Með Jóni eru nú í stjórn
Orðabókarinnar Höskuldur Þrá-
insson, prófessor í málfræði, Stef-
án Karlsson handritafræðingur og
Svavar Sigmundsson lektor,"
sagði Jón Aðalsteinn Jónsson, for-
stöðumaður Orðabókar Háskól-
ans, er Morgunblaðið ræddi við
hann um Orðabókina.
9 manns starfa nú við
Orðabók Háskólans
„Fyrsti forstöðumaður Orða-
bókarinnar var Jakob Bene-
diktsson eða frá 1948 til 1977. Þá
tók Ásgeir Blöndal Magnússon
við starfinu, en síðan ég frá 1.
janúar 1980. Fyrstu starfsmenn
Orðabókarinnar voru Árni
Kristjánsson, síðar mennta-
skólakennari á Akureyri og Ás-
geir Blöndal Magnússon svo og
ég, sem hef starfað við Orðabók-
ina frá 1955. Auk forstöðumanns
starfa nú 3 fastráðnir sérfræð-
ingar við Orðabókina, þeir Guð-
rún Kvaran, Jón Hilmar Jónsson
og Gunnlaugur Ingólfsson.
Gunnlaugur er nú í leyfi og leys-
ir Jörgen Pind hann af. Að auki
starfar nokkuð af lausráðnu
fólki við Orðabókina og þessa
stundina starfa alis 9 manns við
hana.“
Orötaka hófst með
Nýja testamenti
Odds Gottskálkssonar
„Orðtaka hófst með Nýja
testamentinu, sem út kom í ís-
lenzkri þýðingu 1540 og má
segja, að mestallt prentað mál
fram til síðari hluta 19. aldar
hafa verið orðtekið. Eftir það
tímabil hefur mikið verið orð-
tekið frá þessari öld, og þá verk
allra helztu rithöfunda, en ljóst
er að mikið er enn eftir og kemur
þá að því, að velja þurfi á milli
verka vegna hins mikla fjölda,
sem gefinn er út. Á síðasta ári
var gerð orðtökuáætlun til að
vinna eftir í framtíðinni og þá
sett saman ritaskrá, flokkuð eft-
ir greinum, svo að hægt yrði að
fylla upp í eyður í seðlasafninu.
Orðtakan hefur farið þannig
fram, að sérfræðingar og ýmsir
aðrir starfsmenn hafa lesið
margs konar rit og merkt við
þau orð, sem hafa þótt áhuga-
verð. Um leið hefur verið af-
markað samhengi orðsins í
texta, svo að ljóst sé, hvernig það
er notað. Þegar orðtöku ritsins
er lokið, fær það ákveðna
skammstöfun eða styttingu úr
heiti þess, svo auðvelt sé að sjá,
hvaðan orðið og dæmið er komið.
Síðan eru orðin með afmörkuðu
samhengi og skammstöfun rits-
ins skrifuð eða vélrituð á þar til
gerða seðla. Höfum við haft
margt ágætisfólk úti í bæ í þessu
starfi. Þegar bækurnar koma
aftur ásamt seðlunum úr vélrit-
un eru þær og seðlar borin sam-
an. Loks tekur röðunarvinnan
við, því safnið er allt í stafrófs-
röð.“
Tvær og hálf tnilljón
seðla í orðasöfnum
Orðabókarinnar
„Orðtaka hefur að undanförnu
að mestu legið niðri vegna ný-
hafinnar tölvuskráningar safns-
ins, en gert er ráð fyrir að í því
öllu séu um tvær og hálf milljón
seðla. í aðalsafni (úr prentaða
málinu) eru um 2,2 milljónir
seðla, i talmálssafninu um
80.000, í safni Jóns Ólafssonar,
frá Grunnavík, frá 18. öld eru,
um 45.000 seðlar, þá eru hér um
40.000 seðlar úr óprentuðum
orðabókarhandritum frá 18. og
19. öld. Þá safnaði Björn M.
Óisen tölverðu úr talmáli á síð-
ari hluta 19. aldar og Þórbergur
Þórðarson safnaði talsverðu úr
íslenzku máli um 1920 og eru þau
söfn bæði hjá okkur. Þá vann
séra Jóhannes L.L. Jóhannesson
að orðabókargerð á milli 1920 og
1930 og það er hér hjá okkur
líka. Þessi söfn skarast auðvitað
nokkuð og í þeim eru ennfremur
margar samsettar orðmyndir, en
það má gera ráð fyrir að alls séu
hér í söfnunum um 600.000 orð,
en mjög mikið af þeim eru sam-
setningar."
Nær daglega spurt um
útkomu Orðabókarinnar
„Þessi söfn eru þegar tiltæk
hér fyrir fræðimenn og aðra
áhugamenn og þó Orðabók Há-
skólans hafi ekki verið gefin út,
hefur hún komið mörgum að
gagni. Orðabókin á nú mjög und-
ir högg að sækja við fjárveit-
ingavaldið. Þetta er opinber
stofnun og þyrfti mun meira fé
til að koma því í verk, sem við
teljum nauðsynlegt. Auk þess er
orðið mjög þröngt um okkur hér
og verði ekki úrbætt, dregur það
útkomu bókarinnar enn á lang-
inn, en segja má að á hverjum
degi sé spurt hvenær Orðabók
Háskólans komi út. Þetta fer allt
eftir aðstöðu og aðbúnaði, en allt
síðastliðið ár hefur verið unnið
að könnun á seðlasafninu með
tilliti til væntanlegrar útgáfu.
Við þá skrá, sem nú er verið að
semja í tölvu, er fyrst og fremst
tilgreind elzta heimild um hvert
orð. Jafnframt er tekið fram frá
hvaða tíma elzta og yngsta dæm-
ið sé og eins nákvæmlega getið
um dæmafjölda, ef hann fer ekki
yfir fimm dæmi. Við skráningu
eru öll orð tekin upp og ekkert
mat lagt á þau eftir hreintungu-
sjónarmiði.
Tölvuskráning Orðabókarinn-
ar hefur notið mjög góðrar fjár-
hagslegrar aðstoðar frá Þjóðhá-
tíðarsjóði, Vísindasjóði, Rann-
sóknarsjóði Háskóla íslands og
þá hefur Framkvæmdastofnun
veitt aðstoð fyrir drengilega
framgöngu Sverris Hermanns-
sonar auk þess sem IBM á ís-
landi hefur veitt okkur ómetan-
lega aðstoð," sagði Jón Aðal-
steinn Jónsson.
Sögnin að hlaða. Fjögur dæmi úr seðlasafninu um
notkun sagnarinnar og tilgreindar heimildir úr
texta.
Fyrirferðinni verður varla líkt saman þó reynt sé á þessari mynd.
„I)iskettan“ getur geymt upplýsingarnar af öllum þessum seðlum - og
fer létt með það.
Jón Aðalsteinn Jónsson, forstöðumaður Orðabókar
háskólans.
Jörgen Pind við „skjáinn".
Um 600.000 orð
í aðalsafninu
„FYRSTI áfanginn í tölvuskrán-
ingunni er að skrá aðalsafnið, en í
því er að finna orð úr prentuðu
máli frá 1540 fram á okkar daga.
Áætlað er, að orðin séu um 600.000
að tölu. Tölvuskráning krefst
nokkurrar undirbúningsvinnu svo
sem að taka út elzta og yngsta
dæmi hvers orðs og finna dæma-
fjölda þess í safninu. Þá er einnig
reynt að flokka orðin eftir gerð
þeirra og sem dæmi um það má
nefna íslenzk grunnorð, samsett
orð, viðskeytt og forskeytt, orð
með erlendum orðlið og fleira,"
sagði Jörgen Pind.
„Ætlunin var að byggja þetta
upp á þann hátt, að sem flestar
upplýsingar fylgdu hverju orði,
en jafnframt að halda tilkostn-
aði í iágmarki. Það, sem síðan
var ákveðið að færi inn, er orðið
sjálft, orðflokkur þess, aldur,
dæmafjöldi, orðgerðarmerking
og elzta heimild. Nú eru komin
rúmlega 50.000 orð inn og heim-
ildaskráin er einnig komin inn í
tölvuna. Við höfum því brugðið á
það ráð að láta tölvuna aldurs-
greina öll stakdæmi í safninu,
það er öll orð, sem einungis er
eitt dæmi um. Vélin les þá heim-
ildina og leitar að henni í heim-
ildaskránni. Finnist hún þar,
getur hún sjálf fært aldur við
orðið, en að öðrum kosti lætur
hún þann, sem situr við vélina,
vita af því, ef aldursákvörðun
bregzt. Þessi aðferð hefur sparað
okkur verulega undirbúnings-
vinnu og flýtt fyrir tölvuskrán-
ingunni, þar eð stakdæmi eru
um 60% af safninu.
Þegar tölvuvinnsla hófst, var
áætlað að orðafjöldinn í safninu
væri um 300.000. Alexander Jó-
hannesson og Björn Guðfinnsson
höfðu gizkað á, að í íslenzka
orðaforðanum væru um 200.000
orð. En nú er komið á daginn, að
í seðlasafni Orðabókar Háskól-
ans eru um 600.000 orð. Það er
hærri tala en nokkurn hafði órað
fyrir og sýnir vel stærð safnsins.
Þetta veldur að sjálfsögðu
nokkrum erfiðleikum, en við
stefnum samt að því að ljúka
skráningunni á tveimur til
þremur árum. Eftir það gæti svo
komið að hinum söfnunum svo
sem talmálssafninu.
Með því að hafa þessar upplýs-
ingar í tölvunni er hægt að iáta
hana vinna ýmis konar skár, sem
byggjast þá á ákveðnum upp-
lýsingum, sem orðunum fylgja.
Þannig má kaila upp lista yfir
orðflokkana, lista eftir aldri
heimilda, lista eftir orðgerð og
svo framvegis. Hér er því í reynd
um það að ræða, að við eigum nú
kost á því að komast inn í safnið
úr mörgum áttum í stað þess að
vera bundin við stafrófsröð orð-
anna. Þannig getum við spurt
um orðfæri ólíkra alda, svo að
dæmi sé nefnt, en það væri nán-
ast óhugsandi að velta slíkri
spurningu fyrir sér án aðstoðar
tölvunnar. Tölvuskráningin gef-
ur að sjálfsögðu aukna mögu-
leika til útgáfu orðabókarinnar,
en þá er komið að öðru vanda-
máli, sem er stærðin. Yrði ein-
ungis orðalistinn skráður og gef-
inn út, fyllti hann að minnsta
kosti um 10.000 síður í bók. Hins
vegar er það ótvíræður kostur að
hafa orðalistann og meðfylgj-
andi upplýsingar inni í tölvunni.
Tölvan og efnisbanki hennar
verða hér til staðar fyrir þá, sem
vinna að fræðilegum rannsókn-
um á íslenzka orðaforðanum, og
munar miklu að þurfa ekki að
fara í gegnum milljónir seðla,
heldur geta kallað þetta upp á
tölvuskjá, þegar upplýsinga er
þörf. Þá auðveldar þetta starfs-
mönnum Orðabókarinnar vinnu
þeirra á ýmsan hátt.
Orðtakan héðan í frá verður
svo unnin beint inn á tölvuna.
Þetta er í reynd nauðsynlegt til
þess að tryggja, að aðaltölvu-
skráin sé ætíð rétt, því að sífellt
bætast ný orð í safnið. Þá verða
seðlarnir bæði til inni á tölvunni
og auk þess keyrðir út eftir
stafrófsröð, sem auðveldar upp-
röðun þeirra. Þá auðveldar þetta
verulega tölvusetningu Orðabók-
arinnar, er að því kemur. Þetta
er hins vegar ekki hafið enn, en
til þess þarf sérstaka tölvu. Við
erum aðeins með tvær tölvur enn
sem komið er, önnur er notuð
fyrir orðasafnið og hin við rit-
vinnslu. Meðal annars er hún
notuð við þá ritstjórnarvinnu,
sem fram fer á Orðabókinni og
er í höndum Guðrúnar Kvaran
og Jóns Hilmars Jónssonar. En
vonir standa til að orðtaka á
tölvu geti hafizt síðar á þessu
ári.
Þá höfum við Sigurður Jóns-
son nú byrjað á þriggja mánaða
verkefni fyrir IBM á Islandi, sem
felst í því að gera úttekt á því
hvort vænlegt sé að leggja út í
vinnslu íslenzks leiðréttinga-
forrits, það er forrits, sem leið-
réttir stafsetningu 1 textum, sem
unnir eru í tölvum. Við munum
skoða eriend forrit og reyna að
meta gildi þeirra aðferða, sem
við uppbyggingu þeirra eru not-
aðar með hliðsjón af íslenzkri
stafsetningu og málkerfi. Þetta
er spennandi verkefni og við ger-
um okkur vonir um það, að
tölvuskráningin hér geti hjálpað
okkur við það, þar sem orðasafn
er hluti af slíku forriti. Það fær-
ist stöðugt í vöxt að texti sé unn-
inn inn á tölvur, þær eru notaðar
í nánast hverri prentsmiðju og
líklega á flestum skrifstofum.
Þessi aukna notkun hefur svo
kallað á sífellt flóknari rit-
vinnsluforrit og eru leiðrétt-
ingaforritin nýjasti áfanginn á
þeirri leið. Ef þetta tekst gæti
það þýtt mikinn sparnað í próf-
arkalestri," sagði Jörgen Pind.
50.000 vélrit-
aðar síður?
Einn liður í mótun orðalýsingar
hefur verið að semja lýsingu á
samfelldri orðarunu, sem tekur til
einnar opnu í Orðabók Blöndals,
roskinn — rúm. í Ijós kom, að í
opnunni voru rúmlega 200 orð, en
á sama stafrófsbili Orðabókar Há-
skólans eru um 1.100 orð. Af þeim
fjölda voru valin rúmlega 500 orð
til lýsingar í eins konar orðabók-
arsýnishorn. Urðu það um 80 vél-
ritaðar síður og sé samanburður-
inn við orðabók Blöndals látinn
gilda fyrir slíka „orðabók" í heild,
yrði hún um 50.000 vélritaðar síð-
ur.
Hér fer á eftir sýnishorn með
lýsingu fáeinna orða. Til skýr-
ingar má geta þess, að innan
sviga eru skammstafanir á þeim
ritum, sem orðadæmin eru úr.
Aldur er tilgreindur framan við
hvert dæmi, að jafnaði í aldar-
þriðjungum. £ merkir að aðeins
sé eitt dæmi um viðkomandi orð
eða merkingu í safninu; + merkir
að dæmið sé ur kveðskap;
oddklofar eru settir utan um
skammstafanir, sem lúta að
málfræðilegum eða setningar-
fræðilegum einkennum. Horn-
klofar eru settir utan um orð,
orðasambönd eða liði, sem rit-
stjórar hafa skotið inn í dæmi til
að skýra samhengi orða eða til
að fylla augljósar eyður:
R»gg- (~+rugg).
rugg | hestur, m. ( f ruggu-
hestur): s 19. £ Ef ég verð vænn,
þá fæ ég rugghest á jólunum.
(Kvbl. 1896, 78); -kjölur, m.: kjöl-
ur á skipi sem gerir það stöðugra í
sjó: f. 20. Ruggkilir eiga að vera á
skipinu. Útbúnaður fyrir vatns-
seglfestu. (Ægir. 1913,141), f. 20
ruggkilir eru á því og útbúnaður
fyrir vatnsseglfestu. (Ægir 1915,
45); -stóll, m. ( f ruggu-stóll); s
19. £ Hann settist 1 ruggstólinn
og ruggaði sjer hart. (Kvbl.
1896., 76).
1 rugga, f.: 1 vagga, ungbarns-
rúm sem hægt er að vagga, rugga:
m. 17. Rugga / Cunæ. Ad rugga /
Movere cunas. (GA. 201 I, 6), s
16. f 17. að taka sitt barn út úr
ruggunni, eða því nær, og drepa
það. (Morð., 70), f 17. þa nyfætt
Barn korn verdur vafed j Reifum
sijnum / og lagt j Ruggu sijna.
(NicSpeg., 493), m 17. + Rétt í
burt af ruggu sín / rykkja barni
þorði. (KolbGrSvr. I, 44), m 19.
Eg lýsi þig x x sannan föður að
þessu barni, sem í ruggunni er.
(JÁÞj. I, 89), s. 19. bezt er að það
[o: barnið] sé í ruggu eða sínu
eigin rúmi. (Fjallk. 1887, 3), m
20. og hönd hennar, sem rugguna
hreyfði, hægði á sér. (GDanBola-
fl. II, 43). 2. sveiglaga fjöl fest
undir ungbarnsrúm þannig að það
megi rugga því: s. 19. að setja
ruggur neðan á vöggur. (Víkv.
1873, 21). ( -♦ ruggu-).
2 rugga, v.: 1. velta, vagga, sveifl-
ast til: m.s. 19.+ En er drósin utar
ruggar / er hún hrygg og dauf í
bragði. (GThBR., 18), m 19. skip-
ið ruggaði á skerinu. (Þjóð. 25,
26), s 20. En þótt ég hafi drukkið
allmikið brennivín, gerði það
mér ekkert x x ekki að maður
færi að rugga, ónei. (MJohSamt.
II, 169), < miðm. > ruggast: m
20. Eg lít til fjallanna, og sjá!
Þau bifast, og allar hædir rugg-
ast. (Jer., 24 (1841)), m 19. fávísa
moldarbarn, hrósaðu þér ekki af
láni þínu meðan vagga lífsins
ruggast undir þér. (Þús. I, 79), s
20. Gatan virtist hafa tilhneig-
— Texti HG.
Ljósmyndir Friðþjófur
ingu til að sporðreisast undir
fótum mér, og jafnvel húsin
rugguðust líkt og skip á öldum.
(ÓJSigSeið., 98), m 20. finna bát-
inn ruggast undir sér og hossast
undir sér. (ÞórbÞStein., 197). 2.
< með andl. í þgf. > láta e-ð
(/e-n) velta, vagga, sveiflast til: m
17. * Ruggaði rænu flaggi / rögg-
in boðnar döggva. (HPSkv. II,
393), ms 17. + Rauður og Bessi
rumskast tóku / og rugga haug-
um. (Stól. I, 115), m 17. *endi-
lega hann rógburð reisti / og
ruggaði stuttum makka.
(GAndrDeil., XXVI), m 19. +Yð-
ur xx / bið eg í stilli rugga, dilla
/ minni sál. (JÞorl. I, 170), f 20.
og þótti oft gleyma sér, reri eða
ruggaði höfði. (MJ Söguk., 36), m
19. + þá fofnis láturs lofnin kát /
leikandi ruggar voggum..
(SPétLj. I, 35), s 19. sá þar konu,
sem var að rugga barnsruggu.
(ÓDavÞj. III, 64), m 20. og á
rúminu sat María og ruggaði
vöggu unga barnsins. (GDan
Bolafl. II, 43), (um barn): s 17.
+ þá sat eftir brúðurin bleik /
barninu sínu að rugga.
(PBjAmb. I, 73), rugga sér: m 19.
[sjófugl] ruggar sjer á hinum
hvítbryddu öldum. (ísl. 3, 73),
rugga undir e-u: hreyfa við e-u: m
19. Hver bilting x x hefur æ meir
og meir ruggað undir hásætum
konunganna. (Þjóð. ’52, 322),
rugga við e-u (/e-m): hreyfa við e-u
(/e-m): m 18. hun ruggar hægt
með Fijngrenum vid þvi
[o: fóstrinu]. (BuchwYfirs., 64), f
19. að x x rugga við samvizku
þeirra. (Þjóð. 36, 129), m 20. Eg
fór að hágráta, þaut nakinn upp
úr rúminu og ofan á gólf og fór
að rugga við henni og kalla á
hana. (JsJsRit. II, 66). 3. < Ih.
þt. > ruggaður: á vaggandi hreyf-
ingu, sem hefur verið látinn vagga,
sveiflast til: f 17. £+ Björk hnígur
fyrir stormi sterkum, / en
staldrar rót í jarðarhaldi, /
rugguð þó með laufið liggur, því
lífi nokkur frjófgun hlífir.
(JHBisk. II, 304 (MÓl)).
ruggandi, m.: veltingu (skips),
hristingur: s 19. f 20. Alla þessa
nótt var aldrei kyrt, sífeldur
ruggandi, hvinir og dynkir.
(ÞThLandsk., 153), m 20. En all-
ur þorri fólks harkaði af sér
rugganda og kröm. (JóhKötl
Sigl., 1973).
SJÁ NÆSTU SÍÐU