Árbók Háskóla Íslands - 01.02.1997, Side 429
427
ijgnnsóknar- pg þjónustustofnanir
Ritmálssafn. Meginverkefni Orðabókar
naskólans er í því fólgið að semja sögulega
°rðabók um íslenskt mál frá 1540. Lengi hef-
Ur verið unnið að því að safna til þess verks,
°S til þess að auðvelda aðgang að safninu,
Var ráðist í gerð svonefndrar ritmálsskrár. Því
verki lauk 1988 eins og frá hefur verið sagt í
, 1 "°k Háskólans. Skráin hefur verið opnuð
þeim,
sem aðgang hafa að háskólanetinu eða
Jvienntanetinu, og geta þeir nýtt sér það, sem
Un hefur fram að færa hverju sinni.
... ^au rit, sem orðtekin hafa verið, voru
tólvuskráð á tímabilinu og mynda sérstaka
skra í gagnasafni stofnunarinnar, heimilda-
Kra. Þar er að finna venjulegar bókfræðilegar
eirnildir um hvert rit auk atriða sem snerta
sJalfa orðtökuna, s. s. dæmafjölda úr hverju
Á árunum 1992 og 1993 var gert átak í inn-
s ætti notkunardæma og ráðnir til þess nokkr-
'r stúdentar í sumarvinnu hvort ár. Ráðist var í
y slá inn algengustu orð hvers orðflokks og
,' ensk orðtíðnibók lögð til grundvallar. Að
Þvi loknu var tekið til við upphaf stafrófsins.
111113 þessi skilaði verulegum árangri.
lalniálssafn
^ ^alrnálssafn Orðabókarinnar eykst með
verju ári. Flestar nýjar heimildir berast í
ngslum við þáttinn íslenskt mál, sem verið
.eIur a dagskrá Ríkisútvarpsins í rúma fjóra
Uratugi. Um þáttinn sáu að vanda Guðrún
varan, Gunnlaugur Ingólfsson og Jón Aðal-
peinn Jónsson. Á árinu 1992 var hafinn und-
jr uningur að innslætti á talmálssafni og gerð
a niálsskrár, og var það verk langt komið í
yrslok 1994 Skráin veitir yfirlit yfir orða-
röa talmálssafns, en tengir að auki saman
ngði orða og orðasambanda. Þegar skrán-
gu lýkur, verða ritmáls- og talmálsskrár
gdar saman og gerðar notendum aðgengi-
legar.
textasafn
Síðastliðinn áratug hefur verið unnið að
s.Vl koma upp tölvutæku textasafni til
in nings og viðbótar því efni, sem seðlasöfn-
geyma. Leitað var til prentsmiðja og bóka-
gefenda sem brugðust vel við og sendu
s 0 nuninni fjölmarga tölvutæka texta. Góð
mvinna hefúr einnig verið við Blindrabóka-
safn um skipti á textum. Orðabókin hefúr sjálf
látið slá inn nokkra texta, m. a. Nýja testa-
menti Odds Gottskálkssonar frá 1540, sem er
elsta ritið sem orðtekið hefúr verið.
Rúmlega 400 textar fengust á umræddu
tímabili, og eru nú um 550 textar og textabrot
í safninu, samtals nálægt 25 milljónum les-
málsorða. Markmiðið er að auka safnið af
eldri textum og skipuleggja það þannig að
textarnir gefi sem heillegasta mynd af málinu
á því tímabili sem fengist er við á stofnuninni
þ. e. frá 1540 og fram til dagsins í dag.
Textasafnið geymir eingöngu útgefin rit,
en auk þess hefur Orðabókin fengið mikið
efni í tölvutæku formi ffá Þjóðháttadeild
Þjóðminjasafns með margvíslegum heimild-
um um orðafar í mæltu máli.
Tölvumál
Árið 1990 bættust tvær öflugar tölvur við
tölvukost Orðabókar Háskólans. Þær eru af
gerðinni RS/6000, sem eru nýjar Unix-vélar
frá IBM. Með þessu jókst mjög afkastageta
tölvunets Orðabókarinnar. Auk þess var í lok
ársins keypt gagnagrunnskerfi fyrir hinar
nýju tölvur. Var það af gerðinni INFORMIX,
og virðist sem það muni henta álíka vel til
orðabókavinnslu og Revelation-kerfið sem
notað hefúr verið undanfarin ár á tölvum sem
keyra MS-DOS.
Hinar nýju tölvur voru samtals með tæp-
lega 1200 MB diskarými, og jókst diskarými
á tölvum Orðabókarinnar því mjög á þvi ári.
Árið 1992 keypti Orðabókin lesvél af gerð-
inni Kurzweil K-5100. Um er að ræða mjög
öfluga lesvél, og var hún notuð m. a. til að
lesa nokkrar bækur Halldórs Laxness fyrir
Vöku-Helgafell, auk þess sem lesnir voru
hlutar af þjóðsögum Jóns Árnasonar fyrir
Orðabókina. Bessi Aðalsteinsson hafði um-
sjón með lesvélinni.
Jörgen Pind vann í ígripum við endurbæt-
ur á villuleitarforriti sem hann hafði upphaf-
lega gert fyrir EB-þýðingardeildina á fyrra
ári. Vinnan fólst að mestu í því að safna orð-
um í orðasafn forritsins, og var aflað fanga
víða, m. a. í EES-skjölunum, í íslenska laga-
safninu, tollskránni en þó einkum í textasafni
Orðabókarinnar. Vinnu við orðasafnið lauk í
nóvember, og þá var því ásamt öðrum tengd-
um skrám komið fyrir á opnu svæði á tölvum