Orð og tunga - 01.06.1988, Qupperneq 18
6
Orð og tunga
niðurstöðurnar hafi verið notaðar eins og Ársæll ætlaðist til, þ.e. sem hjálpartæki
við stafsetningarkennslu.
3.3 Tíðni orða í Hreiðrinu
Rannsókn Ársæls Sigurðssonar sem greint var frá hér að framan var eins og nærri
má geta gerð „í höndunum“ þax sem engar tölvur var að fá til aðstoðar á þeim
tíma. Tölvur voru hins vegar komnar fram á sjónarsviðið í upphafi áttunda
áratugarins þegar Baldur Jónsson, Björn Ellertsson og Sven Þ. Sigurðsson fóru
af stað með könnun sína á tíðni orða í skáldsögu Ólafs Jóhanns Sigurðssonar
Hreiðrinu. Vinna við hana fór einkum fram á árunum 1973-74 og birtust nið-
urstöður hennar síðan í þremur tíðniskrám árið 1975, Tíðni orða í Hreiðrinu
1-3, og síðan fimm árum síðar í greinargerð um könnunina með frekari niður-
stöðum undir heitinu Tölvukönnun á tíðni orða og stafa í íslenskum texta. Annar
afrakstur þessarar vinnu var Orðstöðulykill að Hreiðrinu sem út kom árið 1978.
Um megintilgang könnunarinnar segja þeir Baldur, Björn og Sven (1980:10):
Segja má, að megintilgangurinn með þessari tilraun hafi verið að fá úr
því skorið, hvort unnt væri að nota tölvur til rannsókna á íslensku ritmáli
hér á landi. í rauninni hafði aldrei reynt á það, hvort við réðum yfir
nægilegum tækjabúnaði og kunnáttu til að leysa slikt verkefni. Auðvitcið
gerðum við okkur góðar vonir. Þess vegna var verkefnið mótað með það
í huga, að árangurinn kæmi að beinum notum, ef síðar yrði ráðist í að
tölvuvinna orðabók, sem veitti vitneskju um tíðni orða í íslensku ritmáli
nú á dögum. Það markmið vakti fyrir okkur í öndverðu.
Fyrsta skrefið vax því að koma textanum yfir á tölvutækt form en úrvinnslan
var fólgin í tíðnikönnun annars vegar og gerð orðstöðulykils hins vegar.
Niðurstöðurnar urðu síðan í stuttu máli þær að hægt væri að nota tölvur
til rannsókna á íslensku ritmáli þótt árangurinn kæmi ef til vill ekki að eins
miklum notum og ætla mátti, meðal annars vegna örrar þróunar í tölvutækni.
Baldur Jónsson gerði sér líka fulla grein fyrir þessu í formála að greinargerðinni:
„Tæknin, sem beitt var við þessa frumraun, er nú að sumu leyti úrelt, en rétt
þótti að gera henni líka nokkur skil, þótt ekki væri til annars en halda sögulegum
fróðleik til haga“ (Baldur Jónsson o.fl. 1980:3).
Niðurstöður tíðnikönnunarinnar eru hins vegar í fullu gildi og er rétt að gera
stutta grein fyrir þeim. Skipta má tíðnikönnuninni í tvennt: Annars vegar
könnun á tíðni orðmynda en liins vegar könnun á tíðni rittákna, sambandi
orðlengdar og orðtíðni, meðallengd orðmynda, meðaltíðni orðmynda o.fl. slíkt.
Niðurstöður úr orðtíðnikönnuninni birtust í áðurnefndum þremur tíðniskrám
(Baldur Jónsson 1975). Sú fyrsta hefur að geyma orðmyndir í stafrófsröð eftir
upphafi þeirra, önnur orðmyndir í stafrófsröð eftir niðurlagi þeirra og hin þriðja
orðmyndir í röð eftir lækkandi tíðni. Tölulegar niðurstöður birtust síðan í grein-
argerðinni (Baldur Jónsson o.fl. 1980:55-126) í skrám og töflum. Meðal upp-
lýsinga sem þar er að finna er samanburður á tíðni 100 algengustu orðmynda í
Hreiðrinu og orðasafni Ársæls Sigurðssonar, tíðni bókstafa, skipan sérhljóða og
samhljóða í algengustu gerðum orðmynda og lesmálsorða, tíðni tvístöfunga svo
og heildaryfirlit yfir tíðni orðmynda og rittákna.