Orð og tunga - 01.06.2007, Page 41
Ásta Svavarsdóttir: Talmál og málheildir — talmál og orðabækur 31
Ritmál 83%
Bækur, blöð og tímarit 73%
Ymislegt ritmál (útgefið og óútgefið) 8%
Til upplestrar (ræður, handrit o.fl.) 2%
Talmál 17%
Persónuleg samtöl 10%
Talað mál við ólíkar aðstæður 7%
Tafla 1 Hlutfall texta í BNC eftir uppruna þeirra (Burnard 2000)
í ritmálshluta BNC eru 75% nytjatextar (e. non-fiction) af ýmsu tagi
og á ýmsum sviðum en 25% textanna eru skáldverk (e. fiction). Flestir
textarnir eru yngri en frá 1975. Með hverjum texta eru skráðar upplýs-
ingar um atriði eins og efni hans, höfund, (ætlaðan) lesendahóp o.fl.
og því má flokka textana og leita í þeim eftir slíkum atriðum. BNC
er ein af helstu fyrirmyndum íslensku málheildarinnar (MÍM) og gert
er ráð fyrir að samsetning hennar verði svipuð m.t.t. textategunda og
hlutfallsins milli þeirra. íslenska málheildin verður þó miklu minni en
sú breska því áætlað er að MÍM verði um 25 milljónir lesmálsorða á
móti 100 milljónum lesmálsorða í BNC. Til samanburðar má nefna að í
textasafni íslenskrar orðtíðnibókar (500 þúsund orð) eru skáldverk u.þ.b.
60% textanna (frumsamdar og þýddar skáldsögur auk barnabóka) en
aðeins 40% nytjatextar. Þá eru ævisögur og endurminningar flokkaðar
með nytjatextum þótt það geti orkað tvímælis og sumir textar af því
tagi eigi ekki síður heima með bókmenntaverkum.
í framhaldi af þessu er vert að líta aðeins nánar á hlutverk og
notkun málheilda. Eins og áður segir er þeim fyrst og fremst ætlað
að vera heimild um málið eða tiltekinn hluta þess og nýtast sem efni-
viður í hagnýtum og fræðilegum verkefnum. Þar má í fyrsta lagi nefna
tungutækniverkefni af ýmsu tagi, ekki síst þróun og gerð tóla og hjálp-
argagna sem tengjast máli og málnotkun. Þar má nefna leiðréttingar-
og þýðingarforrit, leitarvélar, ýmis hjálpartól fyrir fatlaða og kennslu-
forrit. I öðru lagi eru málheildir mikilvæg stoð við samningu orðabóka
og annarra handbóka um mál og málnotkun og við gerð kennsluefn-
is. I slíkum verkefnum nýtast málheildir vel við greiningu og lýsingu
á orðaforða, beygingum og setningagerð því ýmiss konar mynstur í
málnotkun, t.d. orðastæður og orðasambönd, birtast mjög skýrt þegar
hægt er að draga saman mikinn fjölda dæma og raða þeim innbyrðis.