Orð og tunga - 01.06.2013, Blaðsíða 43
Kristín Bjarnadóttir: Hvert á að sækja orðaforðann í orðabók?
33
eins og stundum hefur viljað brenna við þegar stuðst er við tilfinningu
orðabókarmannsins.
Mörkun og lemmun á MÍM er ekki lokið og þar leynast enn villur,
bæði í uppflettimyndum og orðflokkum. Vegna þess liggja tölur um
lemmufjölda og tíðni ekki fyrir enn. Hér á eftir er sagt frá tilraun til
að áætla lemmufjölda í hluta af MIM en hún byggist á samanburði
orðmynda úr MIM og beygingarmynda úr BIN. Samanburðurinn var
gerður haustið 2011 og takmarkið með honum var að bæta orðaforð-
anum úr MÍM við BÍN. Samkvæmt lauslegri áætlun eru u.þ.b. 125
þúsund lemmur í MIM sem ekki finnast í BIN.7
I þeim hluta MIM sem borinn var saman við BIN eru u.þ.b. 17,5
milljónir lesmálsorða. Þar af voru einkvæmar eða ótvíræðar orðmyndir
(með marki) tæplega 738 þúsund og voru þær bornar saman við 5,8
milljónir beygingarmynda úr BIN. Niðurstaðan úr samanburðinum
er í töflu 2.
Orðmyndir í MÍM (með marki) 737.856
Þar af í BÍN 425.238
Þar af ekki í BÍN 312.618
Tafla 2. Orðmyndafjöldi í MÍM og BÍN.
Orðmyndir úr MÍM sem finnast í BÍN eru taldar vera tækar íslenskar
orðmyndir, þ.e. 425.238 orðmyndir af 737.856. Orðmyndir sem ekki
voru í BÍN voru skoðaðar hver fyrir sig á skjá, ríflega 312 þúsund
orðmyndir. Af þeim eru u.þ.b. 60% íslenskar orðmyndir en 40% er
annað efni, t.d. erlend orð (25%), villur (6%), skammstafanir (1,7%) o.fl.
Þetta aðskotaefni eru u.þ.b. 13% af einkvæmum orðmyndum í MIM
en ekki liggur fyrir hve stór hluti af lesmálsorðunum þetta er. Allar
orðmyndir sem hafa verið aðlagaðar að íslensku málkerfi flokkast
sem „íslenskar orðmyndir", þ.m.t. allar beygðar slettur (pródúsjónin)
og beygð erlend nöfn, t.d. grísku nöfnin Parmenídes og Erastoþenes (ef.
Pannenídesar, Erastoþenesar).
Niðurstaða af samanburðinum á MIM og BIN er að í MIM séu
u.þ.b. 125 þúsund lemmur sem ekki er að finna í BIN. Samanlagður
lemmufjöldi í BÍN og MÍM er því sennilega yfir 400 þúsund. Til þess
að nýta þetta efni til orðabókargerðar þarf að grisja það, t.d. með því
að styðjast við tíðnitölur úr MÍM þar sem orðaforðinn í BÍN er fenginn
úr orðalistum sem hvorki styðjast við tíðnikannanir né neins konar
7 Samanburðinn var unninn í samvinnu við Jón Friðrik Daðason og Sigrúnu Helga-
dóttur og kann höfundur þeim bestu þakkir fyrir.