Orð og tunga - 01.06.2014, Blaðsíða 147
Kristín Bjarnadóttir: Beygingarlýsing íslensks nútímamáls
135
leiðrétt og lemmunin líka, í því efni sem telst vera íslenskur orða-
forði.24 Þess ber að geta að hugbúnaðurinn sem notaður er í lemmun-
ina, svokallað lemmald (Anton Karl Ingason o.fl. 2008), erfir villur í
orðflokkagreiningu úr mörkunum í MIM en textinn er fyrst markaður
og síðan lemmaður. Rangur orðflokkur í marki verður þess vegna til
þess að sjálf nefnimyndin eða lemman verður óhjákvæmilega röng. I
yfirferðinni var efni sem ekki telst til íslensks orðaforða flokkað sér-
staklega og merkt eins og komið verður að hér á eftir.
Alls var farið yfir 312.618 orðmyndir (eða markaða strengi) úr
MÍM, þ.e. það efni sem ekki fannst í BÍN. Ríflega þriðjungur (34,5%)
þessara orðmynda var rétt orðflokksmerktur og lemmaður í MIM en
hafði einfaldlega ekki ratað inn í BIN úr öðrum heimildum. I Töflu 6
er fjöldi beygingarmynda úr meginorðflokkunum þremur úr saman-
burðarefninu úr MIM. 11. dálki er fjöldi beygingarmynda skv. mörk-
uninni í MIM og í 2. dálki er fjöldi rétt markaðra beygingarmynda þar.
Mismunurinn á 1. og 2. dálki sýnir ranga greiningu og/eða lemmun í
MIM.25 I 3. dálki eru tölur um beygingarmyndir í hverjum orðflokki
eftir handleiðréttingu á samanburðarefninu. Þar er m.ö.o. niðurstöðu-
tala um beygingarmyndir í hverjum orðflokki í því efni úr MIM sem
ekki finnst í BIN, eftir leiðréttingu.
Heildartala í MIM Rétt í MÍM Niðurstaða
hk. 70.770 31.942 54.317
kk. 142.630 42.910 64.709
kvk. 78.908 46.207 64.499
lo. 23.835 11.713 18.345
so. 7.639 1.035 3.210
Tnfla 6. Fjöldi beygingarmynda í MÍM, fyrir og eftir leiðréttingu.
Samanburðurinn á MIM og BIN var aðallega gerður til þess að finna
íslenskar beygingarmyndir sem vantaði í BIN. U.þ.b. 60% af öllum
mörkuðum strengjum úr MIM sem ekki fundust í BIN reyndust vera
íslenskar beygingarmyndir. í yfirferðinni var afgangurinn, u.þ.b. 40%,
flokkaður lauslega. Þar var erlent efni fyrirferðarmest (24,6%), en
einnig má nefna villur (5,8%), skammstafanir (1,6%) og ýmiss konar
tölvustrengi, vefföng, slóðir o.þ.h. (0,7%). Þetta efni skiptir ekki bein-
24 Til dæmis má nefna mark og lemmun á beygingarmyndinni Miklagarði sem greind
er sem þolfall eintölu af kvenkynsnafnorðinu Miklagarð í MIM, í stað þágufalls
eintölu af karlkynsnafnorðinu Mikligarður.
25 Athugið að villufjöldinn á aðeins við efni sem ekki finnst í BIN og hlutfallið gefur
alls ekki mynd af heildarvillufjölda í greiningu og/eða lemmun í MÍM.