Íslenskt mál og almenn málfræði - 01.01.2001, Page 85
83
Tungumál, tölvur og tungutækni
flokkum: 1) íslensk skáldverk, 2) þýdd skáldverk, 3) ævisögur og
endurminningar, 4) fræðslutextar, 5) bama- og unglingabækur. I 4.
flokki var helmingurinn af sviði hugvísinda og hinn helmingurinn úr
raunvísindum og tækni og í 5. flokki var helmingur textanna frum-
saminn á íslensku en hinn helmingurinn þýddur.
Hér eru vissulega margs konar textar en þó er hæpið að segja að
þessi málheild sé dæmigerð fyrir íslenskt mál í lok 20. aldar. Það vekur
athygli að meirihluti textanna (60 af 100) eru skáldverk en hins vegar
vantar algerlega texta úr dagblöðum og tímaritum almenns efnis. Þá má
nefna að aðeins rúmur fjórðungur textanna er frumsaminn eða þýddur
nf konum. Ekki er auðvelt að segja til um uppruna eða aldur höfunda,
en þeir þættir geta líka skipt máli.7 Það er sem sé ljóst að þama em ýms-
ar breytur sem hægt væri að hugsa sér að taka tillit til og án efa yrðu nið-
nrstöður um orðaforða og orðtíðni aðrar ef aðrir textar lægju að baki.
Síðast en ekki síst vantar talmál algerlega í þá málheild sem lögð
var til grundvallar íslenskri orðtíðnibók (1991). Sáralítið er í raun vit-
nð um íslenskt talmál og að hvaða leyti það er frábmgðið ritmáli, t.d.
1 beygingum, setningagerð, orðavali o.s.frv. Þó má fullyrða, bæði út
frá óformlegum athugunum og erlendum rannsóknum, að þama sé
talsverður munur á. Undanfarin tvö ár hefur verið unnið að söfnun til
íslenskrar talmálsheildar sem nefnist íslenskur talmálsbanki, eða ÍS-
TAL (sjá http://www.hi.is/~eirikur/istal). Fmmkvæði að þessu verki
átti Þómnn Blöndal, lektor við Kennaraháskóla íslands, en þátttakend-
Ur í því em alls sjö frá Kennaraháskólanum, Háskóla íslands og Orða-
bók Háskólans. Markmið verkefnisins er að koma á fót gagnabanka
með íslensku talmáli sem getur orðið gmndvöllur rannsókna á ein-
kennum talaðs máls og leitt í ljós muninn á talmáli og ritmáli. Með til-
komu þessa banka skapast í fyrsta sinn tækifæri til að rannsaka ýmsa
þætti íslensks talmáls og bera það saman við ritmálið (sjá Ástu Svav-
arsdóttur 2001; Þómnni Blöndal 2001).
Til samanburðar má nefna samsetningu textasafnsins sem liggur til grundvallar
COBUILD orðabókinni ensku, sem sagt er frá í bókinni Looking Up (sjá Renouf
1987). þar var m.a. gætt að hlutföllum í aldri, kyni og uppruna höfunda. Ákveðið var
að hafa 75% textans eftir karla en 25% eftir konur; 70% breska ensku, 20% ameríska
ensku og 5% önnur afbrigði málsins; og 75% ritmál, 25% talmál.