Tíminn - 11.02.1989, Qupperneq 5
Laugardagur 11. febrúar 1989
HELGIN
15
Nokkrir þeirra starfsmanna sem
vinna að verkefnum fyrir Orðabók
Háskólans í tölvumiðstöðinni við
Sigtún. Þetta eru þau Sveinn
Clausen, Vilhjálmur Bergsteins-
son, Dagný B. Þórgnýsdóttir,
Hrafnhildur Jónsdóttir og Hreinn
Pálsson.
hægt sé að ljúka þessu verki áður en
ný kynslóð með ný áhugamál tekur
við starfinu. Þetta fer þó auðvitað
allt eftir því hversu miidum mann-
afla við höfum á að skipa.
Yfirlitsská
um aðalseðiasafnið
Við biðjum Jón Aðalstein að bera
starfsemina nú saman við fyrri tíð,
þegar hann hóf störf á Orðabókinni.
„Breytingarnar eru gífurlega miklar,
einkum nú síðustu árin. Áður hvíldi
svo til allt starfið á örfáum mönnum
sem lengi vel urðu að sinna nánast
öllu sem orðabókarvinnu tilheyrir.
Nú er sérhæfingin orðin meiri og
tölvutæknin hefur stórlega auðveld-
að mörg störf og gert ýmisiegt mögu-
legt sem menn sáu naumast fram úr
efni sem unnið er upp úr textanum,
svo sem listi um íslensku þýðingar-
orðin sem notuð eru í bókinni. Enn
fremur er unnið að gerð orðabókar
um tíðni orða í íslensku nútímamáli
sem fyrirhugað er að út komi á næsta
ári.“
Söguleg orðabók
um sagnorð
Við beinum þeirri spurningu til
þeirra nafna hverju þessi verkefni
breyti um útgáfu þeirrar stóru sögu-
legu orðabókar sem stofnunin hefur
verið að safna efni til um áratuga-
skeið, hvort ekki eigi lengur við að
spyrja hvenær „orðabókin" komi út.
„Ég átti eftir að bæta einu útgáfu-
verkefni við upptalninguna áðan,“
segir Jón Aðalsteinn, „sem er lang-
umfangsmesta verkefnið sem ákveð-
ið hefur verið að ráðast í hér á
stofnuninni og markar upphafið að
gerð þeirrar stóru sögulegu orðabók-
ar sem þið voruð að nefna. Hér er
um að ræða mjög efnismikla sögu-
lega orðabók um íslensk sagnorð
sem samin verður á grundvelli þess
efnis sem söfn okkar hafa að geyma.
Jón Hilmar hefur haft umsjón með
undirbúningi þessa verks og ritar um
það í yfirlitsgrein í Orði og tungu,
svo að það er rétt að hann skýri
nánar frá þessi verkefni."
Við biðjum Jón Hilmar að lýsa því
hvernig þetta orðabókarverk er
hugsað. „Þessi afmörkun kemur
trúlega nokkuð á óvart, því að
auðvitað vilja menn fá í hendur
orðabók sem tekur til orðaforðans í
heild og allra orðflokka. En þegar
stórt sögulegt orðabókarkver er ann-
ars vegar er ekki hlaupið að því að
gera öllum orðaforðanum skil. Þar
sem ráðist hefur verið í slík stórvirki
með öðrum þjóðum hefur útgáfan
staðið yfir í langan tíma, jafnvel í
heila öld eða lengur, þannig að
menn fá stafkaflann a í hendur
áratugum áður en von er á staf-
kaflanum v. Þetta fyrirkomulag er
óheppilegt, bæði fyrir þá sem að
orðabókargerðinni standa og lesend-
urna sem vilja hagnýta sér efnið. Við
höfum hvergi nærri þeim mannafla á
að skipa að við gætum lokið slíku
heildarverki á fyrirsjáanlegum tíma.
Hér er því vænlegra að leita leiða til
afmörkunar, velja afmarkaða heild
sem staðið gæti sjálfstætt sem orða-
bókarverk og hægt væri að ljúka
innan tiltölulegra fárra ára, en væri
jafnframt áfangi að því marki að lýsa
öllum orðaforðanum. Út frá þessu
sjónarmiði var ákveðið að binda
fyrsta áfangann við lýsingu sagn-
orða. Sagnorðin eru tiltölulega lítið
brot af orðaforðanum, en mjög svo
fyrirferðarmikil í mæltu og rituðu
máli og lýsing þeirra því margbrotin
og rúmfrek í orðabókum. Með því
að gera þessum orðflokki skil sér-
staklega aukast einnig líkur á að
samræmi náist í lýsingu einstakra
orða.
f húsakynnum tölvudeildar. Frá
vinstri: Stefán Briem, Jörgen
Pind, deildarstjóri, og Björn Þór
Svavarsson. (Timamynd Ámi)
Undanfari orðabókargerðar-
innar er umfangsmikil tölvuskráning
og greining á þeim notkunardæmum
og umsögnum sem við höfum um
orðin hér í söfnunum. Dæmin eru
greind með tilliti til ýmissa einkenna,
svo sem beygingar, setningargerðar,
aldurs og merkingar, og síðan eru
valin þau dæmi sem birtast eiga í
orðabókartextanum. Greiningin fer
fram í sérstöku gagnasafnskerfi sem
við höfum aðlagað þessu verkefni.
Tölvunni eru gefin fyrirmæli um
tiltekna flokkun og framsetningu*
greiningarþáttanna, og með því að
bæta við fyrirmælum um leturskipan
og umbrot er fyrir því séð að orða-
bókartexti hverrar sagnar skili sér að
mestu leyti í fullbúinni mynd. Efnis-
skipan textanna er mjög fastbundin
svo að auðvelt er að finna þau
efnisatriði sem leitað er að hverju
sinni. f Orði og tungu eru birt
sýnishorn af orðabókartextanum
eins og við getum hugsað okkur að
hann verði í stórum dráttum. Eitt af
því sem kann að vekja athygli þar
eru ábendingaratriði og millivísarnir
sem við komum fyrir á spássíunum
til að opna fleiri inngönguleiðir inn
í lýsinguna."
Hvenær gerið þið ráð fyrir að
þessi orðabók komi út?
„Um það er erfitt að segja, enda
aðeins fáeinir mánuðir síðan form-
lega var samþykkt í stjórn Orðabók-
arinnar að hefja undirbúning að
útgáfu sögulegrar sagnorðabókar.
Við gerum okkur þó vonir um að
Jón Aðalsteinn við skrifborð Sig-
fúsar Blöndals, sem er í eigu
Orðabókar Háskóla íslands.
(Ttmamynd Ámi)
áður fyrr. Tölvuskrár yfir orðasöfnin
gera okkur kleift að skyggnast í
söfnin á annan og fljótvirkari hátt en
áður var unnt. Nú er nýlokið gerð
yfirlitsskár yfir öll orðin í aðalsafn-
inu þar sem eru dæmi um orð úr
prentuðu máli. Þama eru skráðar
nokkrar mikilvægar upplýsingar um
hvert orð, hver orðflokkurinn er,
hvort orðið er samsett eða ósamsett,
frá hvaða tímabili dæmi eru um
orðið í safninu, hve mörg dæmin eru
og hver elsta heimildin er. í þessari
skrá, sem komið hefur verið fyrir í
gagnasafnskerfi, er hægt að leita
upplýsinga á ýmsa vegu út frá þess-
um atriðum. Þess má geta að alls eru
orðin í þessari skrá rúmlega
600.000.“
„Við höfum í hyggju að auka
þessa skrá smátt og smátt með því
að bæta við fleiri þáttum,“ bætir Jón
Hilmar við. „Það er rétt að vekja
athygli á því að hér er verið að stíga
fyrstu skrefin í þá átt að opna
almenningi aðgang að söfnum Orða-
bókarinnar með tölvusambandi, og
hægt er að hugsa sér að aðgangurinn
verði um símalínu til stofnunarinn-
ar. Fyrst í stað verður Ritmálsskráin,
eins og við köllum hana, þó fyrst og
fremst aðgengileg á tölvum Orða-
bókarinnar, m.a. í tölvu sem við
ætlum gestum til afnota. Skráin mun
koma að miklum notum við rann-
sóknir á íslenskum orðaforða og
íslenskri orðmyndun og greiða fyrir
orðabókarstarfinu hér á ýmsa lund. “
Talmálssafnið
Jón Aðalsteinn beinir samtalinu
að öðrum söfnum Orðabókarinnar:
„Önnur söfn bíða þess svo að vera
tölvuskráð. Það á sérstaklega við um
Talmálssafnið svokallaða þar sem
eru dæmi úr mæltu máli sem að
mestu leyti hafa safnast með fyrir-
spurnum í útvarpsþættinum íslenskt
mál. Dæmin í þessu safni eru nálægt
200.000 talsins, en erfitt er að segja
um hversu mörg orð eru í safninu.
En víst er um það að í Talmálssafn-
inu er talsvert mikið af orðum,
orðasamböndum og merkingum sem
lítil eða engin dæmi eru um í prent-
uðum ritum.“
„Vandinn við tölvuskráningu Tal-
málssafnsins er m.a. sá,“ bætir Jón
Hilmar við, „að þar er um svo
margvíslegar upplýsingar að ræða.
og breytilegar frá einni heimildar-
umsögn til annarrar. En Talmáls-
safnið er mikil fróðleiksnáma, ekki
aðeins um orðaforðann í strangasta
skilningi, heldur einnig um íslenska
þjóðmenningu og áhuga almennings
á íslensku máli.“
Frekari orðtaka
og efnissöfnun
Við beinum þeirri spurningu að
lokum til Jóns Aðalsteins hvort
orðasöfnun og orðtöku sé nú lokið
og nægur efniviður sé fyrir hendi til
orðabókagerðar. „Nei, þvíferfjarri.
Orðtaka hefur haldið óslitið áfram
þótt hún hafi ekki verið stunduð í
sama mæli og áður. Að undanförnu
hefur hin hefðbundna orðtaka tals-
vert beinst að óprentuðum handrit-
um frá fyrri öldum, en búið er að
orðtaka mestallt prentað mál fram
til síðustu aldamóta, og auk þess
mjög mikið frá þessari öld, en þar
verður auðvitað að velja og hafna.
Sfðustu áratugum þarf þó að gera
betri skil, t.d. máli blaðaogtímarita.
Svo er tölvutæknin að opna nýjar
leiðir á þessu sviði sem við höfum
hug á að nýta okkur í framtíðinni.
Við höfum þegar komið okkur upp
allmiklu textasafni sem geymt er á
tölvu og getum m.a. notað það til
orðtöku. Flestir textarnir eru frá
síðustu árum, en nokkuð er einnig
um eldri texta. Þar á meðal er
þýðing Odds Gottskálkssonar á Nýja
testamentinu, en Orðabókin tók að
sér tölvuinnslátt á textanum vegna
útgáfu Lögbergs á bókinni nú fyrir
jólin. Þá má segja að orðtíðniverk-
efnið sem fyrr var á minnst greiði
fyrir orðtöku og orðaleik með ýms-
um hætti."
Við þökkum þeim Jóni Aðalsteini
og Jóni Hilmari fyrir þessar upplýs-
ingar um Orðabók Háskólans og þá
margvíslegu starfsemi sem þar fer
fram. Engum dylst hvílíka þýðingu
þetta starf hefur fyrir íslenska tungu
og menningu, og því er þess óskað
að starfsmönnum Orðabókarinnar
megi vel vegna við úrlausn þeirra
verkefna sem á þeim hvíla.