Orð og tunga - 01.06.2013, Side 34
24
Orð og tunga
orðabókum, orðasöfnum, handbókum og fræðigögnum og vera sem
almennast hjálpargagn fyrir sem allra flesta þátttakendur í íslensku
málsamfélagi, vera „til gagns flestum þeim, sem þurfa skýringa á
íslenzkum orðum í almennu lesefni, gömlu eða nýju" eins og það er
orðað í formála fyrstu útgáfu (bls. V).
(Mörður Árnason. 1998:3)
Hér er ekki minnst á að orðabók ætti að gefa hugmynd um daglegt
mál á vinnslutíma orðabókarinnar enda voru tæknilegar forsendur til
þess ekki fyrir hendi hér á landi árið 1998 þegar Mörður skrifaði grein
sína. Þar var enn byggt á þeim grunni sem notaður var við fyrstu
útgáfu ío, þ.e. Blöndalsorðabók og söfn Orðabókar Háskólans (OH)
sem sett var á stofn tveimur áratugum fyrr.
Orðabókarmönnum sem vinna að útgáfu orðabóka gefst yfirleitt
takmarkað ráðrúm til að leggjast í orðtöku; það er einfaldlega of dýrt
þegar horfst er í augu við tiltekinn útgáfudag sem venjulega er alltof
skammt undan. Gildir þá einu hvort orðtakan er hefðbundin, þ.e.
byggist á lestri texta, eða vélræn, þ.e. byggist á söfnun orðmynda úr
rafrænum (en ómörkuðum) textum; báðar aðferðirnar eru seinlegar
og matið á því hvað á heima í tiltekinni orðabók er erfitt.
Nýjar aðferðir í orðabókargerð byggjast á málheildum, þ.e. völdum
textasöfnum sem ætlað er að gefa mynd af málinu eins og það er á
hverjum tíma. Þar er m.a. stuðst við tíðnitölur til að meta hvort orð
eiga heima í tilteknu orðabókarverki. Fyrsta enska orðabókin sem
studdist við tíðnikannanir og málheild, Cobuild, kom út árið 1987.
Þar var markmiðið að birta enska tungu í orðabók, eins og hún
væri raunverulega notuð (sjá bókarkápu: „ ... based on a detailed
analysis of how today's English is really used") en ekki aðeins eins og
orðabókarhefðin segði til um:
For the first time, a dictionary has been compiled by the thorough
examination of a representative group of English texts, spoken and
written, running to many millions of words.
(Sinclairl987:XV)
Á íslandi hefur slíkt orðabókarverk ekki enn litið dagsins ljós en
reyndar er óljóst að nokkur málheild nái því að vera staðgeng (e.
representative) þannig að sönn mynd af tungumálinu birtist í henni en
það er forsenda þess að orðabók með þessu háleita markmiði verði gerð
(Aðalsteinn Eyþórsson 2005:14). Samt sem áður er jafnvæg málheild
(e. balanced corpus) ný gerð af heimild fyrir orðabókarmenn þar sem
komast má nær orðaforða og málnotkun en hingað til hefur verið