Orð og tunga - 01.06.1988, Blaðsíða 160
148
Orð og tunga
dæmaríkustu sagnirnar.10 Ríflega helmingur þessara sagna hefur verið greindur,
þó sumar aðeins með tilliti til formgerðar.
Erfitt er að gera sér grein fyrir hversu umfangsmikið og tímafrekt verkefni
það er að lýsa íslenskum sagnorðinn í heild með líkum hætti og hér er rakið. Hér
skulu aðeins nefndar nokkrar tölur til vísbendingar. Sagnorð í Ritmálsskrá Orða-
bókarinnar eru alls rösklega 16.000 (til samanburðar eru nafnorð u.þ.b. 502.000
og lýsingarorð u.þ.b. 84.000). Þar af eru grunnsagnir og forskeyttar sagnir u.þ.b.
35% hvor flokkur um sig og samsettar sagnir u.þ.b. 30%. Nálægt 31% sagnanna
hafa fleiri en 5 dæmi að baki sér í safninu, 44% koma aðeins fram í einu dæmi.
Um 1.875 sagnir eru dæmi sem spanna tímabilið frá 16. öld til 20. aldar (þax
af 71% grunnsagnir), 1.297 sagnir spanna tímabilið frá 17. öld til 20. aldar (þar
af 72% grunnsagnir). 3.968 sagnir eru bundnar 20. öldinni einni (þar af 22%
grunnsagnir), 2.914 eru bundnar 19. öldinni einni (þar af 22% grunnsagnir).
í Orðabók Blöndals eru sagnorð u.þ.b. 7.500 (u.þ.b. 59% eru grunnorð, 22%
forskeytt, 19% samsett). Um nálega 4.200 sagnir (59%) eru tilgreind orðasam-
bönd eða tilbúin notkunardæmi. Um nálega 2.200 sagnir (32%) eru tilgreind
heimildarbundin notkunardæmi. I 1.745 sögnum (25%) fer þetta tvennt saman.
Með hliðsjón af sagnorðcdista úr Orðabók Blöndals og Ritmálsskránni hefur
lauslega verið reynt að afmarka fjölda þeirra sagna sem talist geta „kunnuglegar“
úr mæltu eða rituðu máli og krefjast myndu sjálfstæðrar orðabókarlýsingar.* 11
Kunnuglegar sagnir í þessum skilningi reyndust cills u.þ.b. 2.400.
Þessar tölur gefa aðeins óljósar vísbendingar um umfang sagnorðalýsingar f
heild. Þó má af þeim ráða að verkefnið er tiltölulega takmarkað og viðráðanlegt
miðað við öll þau verkefni sem tækju til orðaforðans í heild. Svo afmarkað
verkefni er skynsamlegur kostur með tilliti til þess að raunhæft er að vænta þess
að þeir sem hefja verkið geti fylgt því eftir en leggi framkvæmdina ekki sem
skyldu á herðar komandi kynslóðum eins og oft hefur orðið raunin þegar um stór
orðabókarverkefni er að ræða.
Næstu mánuði verður unnið að því að ganga frá sérstöku sýnihefti til kynn-
ingar á væntanlegri sagnorðabók auk þess sem greiningarvinnan verður aukin.
Um þessar mundir er Orðabókin að taka í notkun nýjan vélbúnað sem skilar meiri
afköstum en sá búnaður sem notaður hefur verið til þessa. Fyrir liggur að aðlaga
gagnaskráningarferli sagnorðagreiningarinnar hinum nýja búnaði, og er þess að
vænta að við það náist fram ýmsar tæknilegar endurbætur á gagnavinnslunni.
Með nýjum vélbúnaði mun einnig gefast kostur á því að koma textasafni Orða-
bókarinnar fyrir á tölvu í heilu lagi. Textasafnið hefur vaxið mjög ört undanfarin
ár og mun nú hafa að geyma u.þ.b. 10 milljónir lesmálsorða. Stórt og fjölbreytt
textasafn gegnir mikilvægu ldutverki við dæmaleit til viðbótar því efni sem fyrir
er í seðlasöfnum Orðabókarinnar.
lo10 dæmaríkustu sagnimar í Ritmálssafninu munu vera: taka (4.099 d.), ganga (3.550 d.),
koma (3.373 d.), leggja (3.281 d.), bera (2.675 d.), standa (2.418 d.), fara (2.199 d.), draga
(2.187 d.), slá (2.137 d.) og gera (1.933 d.).
11 Undanskildar eru „ókunnuglegar“ sagnir, svo og forskeyttar og samsettar sagnir sem ekki
krefðust lýsingar umfram þá sem fælist í lýsingu stofnhlutans. Þá er aðeins tekið tillit til eins
afbrigðis hverrar sagnar.