Orð og tunga - 01.06.2005, Blaðsíða 14
12
Orð og tunga
umfjöllunarefnum - þótt því fylgi viss áhætta þar eð lélegra mál gæti
slæðst með - og dálítið af sérfræðilegra efni, einkum því sem lýtur að
lögfræði og stjórnsýslu (Zgusta 1971:226). Einhverjum kann að þykja
þetta óvísindaleg ef ekki fordómafull afstaða sem reiðir sig um of á
smekk „hinna bestu manna". Þá er rétt að minna á að með þessari að-
ferð hafa verið búnar til orðabækur sem þóttu vel brúklegar, jafnvel
afbragðsgóðar á sinna tíma vísu, og sumar þykja enn standa vel fyrir
sínu.
Þegar efni er safnað með þessum hætti má búast við að það fágæta
og sérkennilega, það sem vekur athygli orðtökumannsins, sé ekki síð-
ur líklegt til að rata á seðil en það sem er algengt og hversdagslegt,
enda er jafnan brýnt fyrir mönnum í leiðbeiningum að vera vakandi
fyrir nýmælum eða óvenjulegri orðanotkun. Tilgangur orðtökunnar
er ekki einungis að safna nægilega mörgum orðum (og þeim réttu
auðvitað) heldur líka að safna vitnisburði um helstu tilbrigði í notkun
orðanna og því má búast við að seðlafjöldi fyrir einstök orð ráðist af
fjölbreytni í notkun þeirra fremur en tíðni í lesnum textum.
Þegar tölvutækni færðist í aukana á seinni hluta síðustu aldar kom
til sögunnar ný aðferð til að safna efni til orðabóka, þ.e. vélræn leit eða
smölun úr rafrænum textum. Fyrstu rafrænu textasöfnin voru bæði
lítil og ljót á mælikvarða nútímans, textarnir voru einhæfir og tæknin
klunnaleg, enda hlutu þau í fyrstu ekki mikla hylli hjá orðabókafólki.
Framfarir á þessu sviði hafa hins vegar verið stórstígar og nú þyk-
ir sjálfsagt að nýjar orðabækur styðjist að verulegu leyti við rafræna
orðasmölun af einhverju tagi. Lestur og orðtaka með gamla laginu
hefur jafnframt látið mjög undan síga enda þykir véltæknin hafa um-
talsverða yfirburði. í því sambandi eru m.a. nefndir eftirfarandi kostir:
• Aukin afköst: Með vélrænni orðasöfnun er unnt er að komast
yfir margfalt meira efni á margfalt styttri tíma.
• Vélin lætur ekkert fram hjá sér fara, sú hætta er úr sögunni að
fordómar orðtökumanna eða andvaraleysi þeirra liti þá mynd
sem gefin er af orðaforðanum.
• Hægt er að safna sannfærandi gögnum um tíðni orða sem nota
má til að afmarka orðaforða viðkomandi verks.
Fleira mætti nefna en kjarni málsins er sá að notkun rafrænna texta-
safna hefur þótt - og þykir - líklegri til að gefa raunsanna mynd af