Morgunblaðið - 05.02.1984, Blaðsíða 16

Morgunblaðið - 05.02.1984, Blaðsíða 16
64 MORGUNBLAÐIÐ, SUNNUDAGUR 5. FEBRÚAR 1984 MORGUNBLAÐIÐ, SUNNUDAGUR 5. FEBRÚAR 1984 65 Orðabók Háskólans tölvusett: Tölvan mötuð á hundruðum þúsunda orða af milljónum seðla Sífellt ryður tæknin sér til rúms og gömlu vigin falla fyrir henni hvert af öðru. Líklega hefur prófessor Alexander Jóhannesson ekki grunað það, að Orðabók Háskólans ætti eftir að verða tölvuvædd, þegar hann kom á legg þessu hugarfóstri sínu fyrir um 40 árum. Sú er hins vegar staðreyndin, nú vinna starfsmenn Orðabókar Háskólans að því að mata tölvu á hinum gömlu góðu seðlum bókarinnar. Liklega finnst mörgum það merkilegt, að í stað þess að fletta upp í seðlasafninu, milljónum seðla, til að finna tímasett dæmi um ákveðin orð og fleira, geti þeir setzt við tölvu og krafið hana upplýsinga og fengið þær á andartaki. Tölvusetning Orðabókarinn- ar greiðir mjög fyrir þvi að gefa Orðabókina út í prentuðu formi. Er þá ekki aðeins hugsanlegt að miða við safnið í heild, heldur má einnig nýta ákveðna hluta safnsins við takmarkaðri útgáfuverk- efni. Má nefna, að tölvan getur sýnt orðalista eftir aldri, orðflokkum, heimildum, gerð orða og fleira. Undirritaður ræddi vegna þessa við Jón Aðalstein Jónsson, forstöðumann Orðabókarinnar, og starfsmennina Guörúnu Kvaran, Jón Hilmar Jónsson og Jörgen Pind og fékk þau til að segja frá Orðabók Háskólans og starfseminni í dag. Fara viðtölin hér á eftir: HG Um 40 ár síðan ákveðið var að semja sögulega vísindalega orðabók við HÍ „NÚ ERU um 40 ár síðan ákveðið var að semja sögulega vísindalega orðabók hér við Háskóla íslands. Gert var ráð fyrir að fyrri mörk orðtöku miðuðust við útkomuár Nýja testamentis Odds Gott- skálkssonar 1540, sem er elzta prentaða íslenzka bókin, sem varð- veitzt hefur. Á þessum tíma verða veruleg skil í íslenzkri málsögu og fer því vel að upphaf Orðabókar Háskólans sé miðað við siðaskipta- tímann. Árnanefnd í Kaupmanna- höfn sér um fornmálið og er undir- búningsvinnu að mestu lokið. Hér á landi hafði þetta sinn aðdrag- anda og var aðalhvatamaðurinn í lokin Alexander Jóhannesson, prófessor í málfræði og jafnframt fyrsti formaður stjórnar Orðabók- ar Háskólans. Gegndi hann því embKtti til dauðadags, 1964, en þá tók Halldór Halldórsson prófessor við formennsku. Jón G. Friðjóns- son, dósent í málfræði tók síðan við af Halldóri haustið 1981 og hefur verið formaður stjórnarinnar síðan. Með Jóni eru nú í stjórn Orðabókarinnar Höskuldur Þrá- insson, prófessor í málfræði, Stef- án Karlsson handritafræðingur og Svavar Sigmundsson lektor," sagði Jón Aðalsteinn Jónsson, for- stöðumaður Orðabókar Háskól- ans, er Morgunblaðið ræddi við hann um Orðabókina. 9 manns starfa nú við Orðabók Háskólans „Fyrsti forstöðumaður Orða- bókarinnar var Jakob Bene- diktsson eða frá 1948 til 1977. Þá tók Ásgeir Blöndal Magnússon við starfinu, en síðan ég frá 1. janúar 1980. Fyrstu starfsmenn Orðabókarinnar voru Árni Kristjánsson, síðar mennta- skólakennari á Akureyri og Ás- geir Blöndal Magnússon svo og ég, sem hef starfað við Orðabók- ina frá 1955. Auk forstöðumanns starfa nú 3 fastráðnir sérfræð- ingar við Orðabókina, þeir Guð- rún Kvaran, Jón Hilmar Jónsson og Gunnlaugur Ingólfsson. Gunnlaugur er nú í leyfi og leys- ir Jörgen Pind hann af. Að auki starfar nokkuð af lausráðnu fólki við Orðabókina og þessa stundina starfa alis 9 manns við hana.“ Orötaka hófst með Nýja testamenti Odds Gottskálkssonar „Orðtaka hófst með Nýja testamentinu, sem út kom í ís- lenzkri þýðingu 1540 og má segja, að mestallt prentað mál fram til síðari hluta 19. aldar hafa verið orðtekið. Eftir það tímabil hefur mikið verið orð- tekið frá þessari öld, og þá verk allra helztu rithöfunda, en ljóst er að mikið er enn eftir og kemur þá að því, að velja þurfi á milli verka vegna hins mikla fjölda, sem gefinn er út. Á síðasta ári var gerð orðtökuáætlun til að vinna eftir í framtíðinni og þá sett saman ritaskrá, flokkuð eft- ir greinum, svo að hægt yrði að fylla upp í eyður í seðlasafninu. Orðtakan hefur farið þannig fram, að sérfræðingar og ýmsir aðrir starfsmenn hafa lesið margs konar rit og merkt við þau orð, sem hafa þótt áhuga- verð. Um leið hefur verið af- markað samhengi orðsins í texta, svo að ljóst sé, hvernig það er notað. Þegar orðtöku ritsins er lokið, fær það ákveðna skammstöfun eða styttingu úr heiti þess, svo auðvelt sé að sjá, hvaðan orðið og dæmið er komið. Síðan eru orðin með afmörkuðu samhengi og skammstöfun rits- ins skrifuð eða vélrituð á þar til gerða seðla. Höfum við haft margt ágætisfólk úti í bæ í þessu starfi. Þegar bækurnar koma aftur ásamt seðlunum úr vélrit- un eru þær og seðlar borin sam- an. Loks tekur röðunarvinnan við, því safnið er allt í stafrófs- röð.“ Tvær og hálf tnilljón seðla í orðasöfnum Orðabókarinnar „Orðtaka hefur að undanförnu að mestu legið niðri vegna ný- hafinnar tölvuskráningar safns- ins, en gert er ráð fyrir að í því öllu séu um tvær og hálf milljón seðla. í aðalsafni (úr prentaða málinu) eru um 2,2 milljónir seðla, i talmálssafninu um 80.000, í safni Jóns Ólafssonar, frá Grunnavík, frá 18. öld eru, um 45.000 seðlar, þá eru hér um 40.000 seðlar úr óprentuðum orðabókarhandritum frá 18. og 19. öld. Þá safnaði Björn M. Óisen tölverðu úr talmáli á síð- ari hluta 19. aldar og Þórbergur Þórðarson safnaði talsverðu úr íslenzku máli um 1920 og eru þau söfn bæði hjá okkur. Þá vann séra Jóhannes L.L. Jóhannesson að orðabókargerð á milli 1920 og 1930 og það er hér hjá okkur líka. Þessi söfn skarast auðvitað nokkuð og í þeim eru ennfremur margar samsettar orðmyndir, en það má gera ráð fyrir að alls séu hér í söfnunum um 600.000 orð, en mjög mikið af þeim eru sam- setningar." Nær daglega spurt um útkomu Orðabókarinnar „Þessi söfn eru þegar tiltæk hér fyrir fræðimenn og aðra áhugamenn og þó Orðabók Há- skólans hafi ekki verið gefin út, hefur hún komið mörgum að gagni. Orðabókin á nú mjög und- ir högg að sækja við fjárveit- ingavaldið. Þetta er opinber stofnun og þyrfti mun meira fé til að koma því í verk, sem við teljum nauðsynlegt. Auk þess er orðið mjög þröngt um okkur hér og verði ekki úrbætt, dregur það útkomu bókarinnar enn á lang- inn, en segja má að á hverjum degi sé spurt hvenær Orðabók Háskólans komi út. Þetta fer allt eftir aðstöðu og aðbúnaði, en allt síðastliðið ár hefur verið unnið að könnun á seðlasafninu með tilliti til væntanlegrar útgáfu. Við þá skrá, sem nú er verið að semja í tölvu, er fyrst og fremst tilgreind elzta heimild um hvert orð. Jafnframt er tekið fram frá hvaða tíma elzta og yngsta dæm- ið sé og eins nákvæmlega getið um dæmafjölda, ef hann fer ekki yfir fimm dæmi. Við skráningu eru öll orð tekin upp og ekkert mat lagt á þau eftir hreintungu- sjónarmiði. Tölvuskráning Orðabókarinn- ar hefur notið mjög góðrar fjár- hagslegrar aðstoðar frá Þjóðhá- tíðarsjóði, Vísindasjóði, Rann- sóknarsjóði Háskóla íslands og þá hefur Framkvæmdastofnun veitt aðstoð fyrir drengilega framgöngu Sverris Hermanns- sonar auk þess sem IBM á ís- landi hefur veitt okkur ómetan- lega aðstoð," sagði Jón Aðal- steinn Jónsson. Sögnin að hlaða. Fjögur dæmi úr seðlasafninu um notkun sagnarinnar og tilgreindar heimildir úr texta. Fyrirferðinni verður varla líkt saman þó reynt sé á þessari mynd. „I)iskettan“ getur geymt upplýsingarnar af öllum þessum seðlum - og fer létt með það. Jón Aðalsteinn Jónsson, forstöðumaður Orðabókar háskólans. Jörgen Pind við „skjáinn". Um 600.000 orð í aðalsafninu „FYRSTI áfanginn í tölvuskrán- ingunni er að skrá aðalsafnið, en í því er að finna orð úr prentuðu máli frá 1540 fram á okkar daga. Áætlað er, að orðin séu um 600.000 að tölu. Tölvuskráning krefst nokkurrar undirbúningsvinnu svo sem að taka út elzta og yngsta dæmi hvers orðs og finna dæma- fjölda þess í safninu. Þá er einnig reynt að flokka orðin eftir gerð þeirra og sem dæmi um það má nefna íslenzk grunnorð, samsett orð, viðskeytt og forskeytt, orð með erlendum orðlið og fleira," sagði Jörgen Pind. „Ætlunin var að byggja þetta upp á þann hátt, að sem flestar upplýsingar fylgdu hverju orði, en jafnframt að halda tilkostn- aði í iágmarki. Það, sem síðan var ákveðið að færi inn, er orðið sjálft, orðflokkur þess, aldur, dæmafjöldi, orðgerðarmerking og elzta heimild. Nú eru komin rúmlega 50.000 orð inn og heim- ildaskráin er einnig komin inn í tölvuna. Við höfum því brugðið á það ráð að láta tölvuna aldurs- greina öll stakdæmi í safninu, það er öll orð, sem einungis er eitt dæmi um. Vélin les þá heim- ildina og leitar að henni í heim- ildaskránni. Finnist hún þar, getur hún sjálf fært aldur við orðið, en að öðrum kosti lætur hún þann, sem situr við vélina, vita af því, ef aldursákvörðun bregzt. Þessi aðferð hefur sparað okkur verulega undirbúnings- vinnu og flýtt fyrir tölvuskrán- ingunni, þar eð stakdæmi eru um 60% af safninu. Þegar tölvuvinnsla hófst, var áætlað að orðafjöldinn í safninu væri um 300.000. Alexander Jó- hannesson og Björn Guðfinnsson höfðu gizkað á, að í íslenzka orðaforðanum væru um 200.000 orð. En nú er komið á daginn, að í seðlasafni Orðabókar Háskól- ans eru um 600.000 orð. Það er hærri tala en nokkurn hafði órað fyrir og sýnir vel stærð safnsins. Þetta veldur að sjálfsögðu nokkrum erfiðleikum, en við stefnum samt að því að ljúka skráningunni á tveimur til þremur árum. Eftir það gæti svo komið að hinum söfnunum svo sem talmálssafninu. Með því að hafa þessar upplýs- ingar í tölvunni er hægt að iáta hana vinna ýmis konar skár, sem byggjast þá á ákveðnum upp- lýsingum, sem orðunum fylgja. Þannig má kaila upp lista yfir orðflokkana, lista eftir aldri heimilda, lista eftir orðgerð og svo framvegis. Hér er því í reynd um það að ræða, að við eigum nú kost á því að komast inn í safnið úr mörgum áttum í stað þess að vera bundin við stafrófsröð orð- anna. Þannig getum við spurt um orðfæri ólíkra alda, svo að dæmi sé nefnt, en það væri nán- ast óhugsandi að velta slíkri spurningu fyrir sér án aðstoðar tölvunnar. Tölvuskráningin gef- ur að sjálfsögðu aukna mögu- leika til útgáfu orðabókarinnar, en þá er komið að öðru vanda- máli, sem er stærðin. Yrði ein- ungis orðalistinn skráður og gef- inn út, fyllti hann að minnsta kosti um 10.000 síður í bók. Hins vegar er það ótvíræður kostur að hafa orðalistann og meðfylgj- andi upplýsingar inni í tölvunni. Tölvan og efnisbanki hennar verða hér til staðar fyrir þá, sem vinna að fræðilegum rannsókn- um á íslenzka orðaforðanum, og munar miklu að þurfa ekki að fara í gegnum milljónir seðla, heldur geta kallað þetta upp á tölvuskjá, þegar upplýsinga er þörf. Þá auðveldar þetta starfs- mönnum Orðabókarinnar vinnu þeirra á ýmsan hátt. Orðtakan héðan í frá verður svo unnin beint inn á tölvuna. Þetta er í reynd nauðsynlegt til þess að tryggja, að aðaltölvu- skráin sé ætíð rétt, því að sífellt bætast ný orð í safnið. Þá verða seðlarnir bæði til inni á tölvunni og auk þess keyrðir út eftir stafrófsröð, sem auðveldar upp- röðun þeirra. Þá auðveldar þetta verulega tölvusetningu Orðabók- arinnar, er að því kemur. Þetta er hins vegar ekki hafið enn, en til þess þarf sérstaka tölvu. Við erum aðeins með tvær tölvur enn sem komið er, önnur er notuð fyrir orðasafnið og hin við rit- vinnslu. Meðal annars er hún notuð við þá ritstjórnarvinnu, sem fram fer á Orðabókinni og er í höndum Guðrúnar Kvaran og Jóns Hilmars Jónssonar. En vonir standa til að orðtaka á tölvu geti hafizt síðar á þessu ári. Þá höfum við Sigurður Jóns- son nú byrjað á þriggja mánaða verkefni fyrir IBM á Islandi, sem felst í því að gera úttekt á því hvort vænlegt sé að leggja út í vinnslu íslenzks leiðréttinga- forrits, það er forrits, sem leið- réttir stafsetningu 1 textum, sem unnir eru í tölvum. Við munum skoða eriend forrit og reyna að meta gildi þeirra aðferða, sem við uppbyggingu þeirra eru not- aðar með hliðsjón af íslenzkri stafsetningu og málkerfi. Þetta er spennandi verkefni og við ger- um okkur vonir um það, að tölvuskráningin hér geti hjálpað okkur við það, þar sem orðasafn er hluti af slíku forriti. Það fær- ist stöðugt í vöxt að texti sé unn- inn inn á tölvur, þær eru notaðar í nánast hverri prentsmiðju og líklega á flestum skrifstofum. Þessi aukna notkun hefur svo kallað á sífellt flóknari rit- vinnsluforrit og eru leiðrétt- ingaforritin nýjasti áfanginn á þeirri leið. Ef þetta tekst gæti það þýtt mikinn sparnað í próf- arkalestri," sagði Jörgen Pind. 50.000 vélrit- aðar síður? Einn liður í mótun orðalýsingar hefur verið að semja lýsingu á samfelldri orðarunu, sem tekur til einnar opnu í Orðabók Blöndals, roskinn — rúm. í Ijós kom, að í opnunni voru rúmlega 200 orð, en á sama stafrófsbili Orðabókar Há- skólans eru um 1.100 orð. Af þeim fjölda voru valin rúmlega 500 orð til lýsingar í eins konar orðabók- arsýnishorn. Urðu það um 80 vél- ritaðar síður og sé samanburður- inn við orðabók Blöndals látinn gilda fyrir slíka „orðabók" í heild, yrði hún um 50.000 vélritaðar síð- ur. Hér fer á eftir sýnishorn með lýsingu fáeinna orða. Til skýr- ingar má geta þess, að innan sviga eru skammstafanir á þeim ritum, sem orðadæmin eru úr. Aldur er tilgreindur framan við hvert dæmi, að jafnaði í aldar- þriðjungum. £ merkir að aðeins sé eitt dæmi um viðkomandi orð eða merkingu í safninu; + merkir að dæmið sé ur kveðskap; oddklofar eru settir utan um skammstafanir, sem lúta að málfræðilegum eða setningar- fræðilegum einkennum. Horn- klofar eru settir utan um orð, orðasambönd eða liði, sem rit- stjórar hafa skotið inn í dæmi til að skýra samhengi orða eða til að fylla augljósar eyður: R»gg- (~+rugg). rugg | hestur, m. ( f ruggu- hestur): s 19. £ Ef ég verð vænn, þá fæ ég rugghest á jólunum. (Kvbl. 1896, 78); -kjölur, m.: kjöl- ur á skipi sem gerir það stöðugra í sjó: f. 20. Ruggkilir eiga að vera á skipinu. Útbúnaður fyrir vatns- seglfestu. (Ægir. 1913,141), f. 20 ruggkilir eru á því og útbúnaður fyrir vatnsseglfestu. (Ægir 1915, 45); -stóll, m. ( f ruggu-stóll); s 19. £ Hann settist 1 ruggstólinn og ruggaði sjer hart. (Kvbl. 1896., 76). 1 rugga, f.: 1 vagga, ungbarns- rúm sem hægt er að vagga, rugga: m. 17. Rugga / Cunæ. Ad rugga / Movere cunas. (GA. 201 I, 6), s 16. f 17. að taka sitt barn út úr ruggunni, eða því nær, og drepa það. (Morð., 70), f 17. þa nyfætt Barn korn verdur vafed j Reifum sijnum / og lagt j Ruggu sijna. (NicSpeg., 493), m 17. + Rétt í burt af ruggu sín / rykkja barni þorði. (KolbGrSvr. I, 44), m 19. Eg lýsi þig x x sannan föður að þessu barni, sem í ruggunni er. (JÁÞj. I, 89), s. 19. bezt er að það [o: barnið] sé í ruggu eða sínu eigin rúmi. (Fjallk. 1887, 3), m 20. og hönd hennar, sem rugguna hreyfði, hægði á sér. (GDanBola- fl. II, 43). 2. sveiglaga fjöl fest undir ungbarnsrúm þannig að það megi rugga því: s. 19. að setja ruggur neðan á vöggur. (Víkv. 1873, 21). ( -♦ ruggu-). 2 rugga, v.: 1. velta, vagga, sveifl- ast til: m.s. 19.+ En er drósin utar ruggar / er hún hrygg og dauf í bragði. (GThBR., 18), m 19. skip- ið ruggaði á skerinu. (Þjóð. 25, 26), s 20. En þótt ég hafi drukkið allmikið brennivín, gerði það mér ekkert x x ekki að maður færi að rugga, ónei. (MJohSamt. II, 169), < miðm. > ruggast: m 20. Eg lít til fjallanna, og sjá! Þau bifast, og allar hædir rugg- ast. (Jer., 24 (1841)), m 19. fávísa moldarbarn, hrósaðu þér ekki af láni þínu meðan vagga lífsins ruggast undir þér. (Þús. I, 79), s 20. Gatan virtist hafa tilhneig- — Texti HG. Ljósmyndir Friðþjófur ingu til að sporðreisast undir fótum mér, og jafnvel húsin rugguðust líkt og skip á öldum. (ÓJSigSeið., 98), m 20. finna bát- inn ruggast undir sér og hossast undir sér. (ÞórbÞStein., 197). 2. < með andl. í þgf. > láta e-ð (/e-n) velta, vagga, sveiflast til: m 17. * Ruggaði rænu flaggi / rögg- in boðnar döggva. (HPSkv. II, 393), ms 17. + Rauður og Bessi rumskast tóku / og rugga haug- um. (Stól. I, 115), m 17. *endi- lega hann rógburð reisti / og ruggaði stuttum makka. (GAndrDeil., XXVI), m 19. +Yð- ur xx / bið eg í stilli rugga, dilla / minni sál. (JÞorl. I, 170), f 20. og þótti oft gleyma sér, reri eða ruggaði höfði. (MJ Söguk., 36), m 19. + þá fofnis láturs lofnin kát / leikandi ruggar voggum.. (SPétLj. I, 35), s 19. sá þar konu, sem var að rugga barnsruggu. (ÓDavÞj. III, 64), m 20. og á rúminu sat María og ruggaði vöggu unga barnsins. (GDan Bolafl. II, 43), (um barn): s 17. + þá sat eftir brúðurin bleik / barninu sínu að rugga. (PBjAmb. I, 73), rugga sér: m 19. [sjófugl] ruggar sjer á hinum hvítbryddu öldum. (ísl. 3, 73), rugga undir e-u: hreyfa við e-u: m 19. Hver bilting x x hefur æ meir og meir ruggað undir hásætum konunganna. (Þjóð. ’52, 322), rugga við e-u (/e-m): hreyfa við e-u (/e-m): m 18. hun ruggar hægt með Fijngrenum vid þvi [o: fóstrinu]. (BuchwYfirs., 64), f 19. að x x rugga við samvizku þeirra. (Þjóð. 36, 129), m 20. Eg fór að hágráta, þaut nakinn upp úr rúminu og ofan á gólf og fór að rugga við henni og kalla á hana. (JsJsRit. II, 66). 3. < Ih. þt. > ruggaður: á vaggandi hreyf- ingu, sem hefur verið látinn vagga, sveiflast til: f 17. £+ Björk hnígur fyrir stormi sterkum, / en staldrar rót í jarðarhaldi, / rugguð þó með laufið liggur, því lífi nokkur frjófgun hlífir. (JHBisk. II, 304 (MÓl)). ruggandi, m.: veltingu (skips), hristingur: s 19. f 20. Alla þessa nótt var aldrei kyrt, sífeldur ruggandi, hvinir og dynkir. (ÞThLandsk., 153), m 20. En all- ur þorri fólks harkaði af sér rugganda og kröm. (JóhKötl Sigl., 1973). SJÁ NÆSTU SÍÐU

x

Morgunblaðið

Beinir tenglar

Ef þú vilt tengja á þennan titil, vinsamlegast notaðu þessa tengla:

Tengja á þennan titil: Morgunblaðið
https://timarit.is/publication/58

Tengja á þetta tölublað:

Tengja á þessa síðu:

Tengja á þessa grein:

Vinsamlegast ekki tengja beint á myndir eða PDF skjöl á Tímarit.is þar sem slíkar slóðir geta breyst án fyrirvara. Notið slóðirnar hér fyrir ofan til að tengja á vefinn.