Orð og tunga - 08.07.2019, Page 174
162 Orð og tunga
þúsund króna styrk úr Innviðasjóði og 1.650 þúsund króna styrk úr
Mót fram lagasjóði Háskóla Íslands. Sigrún Helgadóttir og Steinþór
Stein gríms son, verkefnastjórar hjá Stofnun Árna Magnússonar í ís-
lensk um fræðum skipulögðu vinnuna og unnu að öflun leyfa frá rétt-
höf um texta. Starkaður Barkarson var ráðinn til að safna textunum
saman, greina og búa um þá svo hægt væri að vinna með allt efnið á
sambærilegan hátt. Nokkuð vel gekk að safna efni og sumarið 2017
var efnissöfnun í fyrstu útgáfu hér um bil lokið. Þó átti eftir að setja
textana upp svo hægt væri að sækja þá á stöðluðu sniði með lýsi-
gögnum, og uppsetning á leitarkerfi fyrir málheildina var skammt
á veg komin. Þá um sumarið hlaut verkefnið sérstakan styrk frá
menntamálaráðuneytinu, sem veittur var nokkrum verkefnum sem
brýnt þótti að komin yrðu vel á veg þegar verkáætlun um máltækni
fyrir íslensku yrði hrundið í framkvæmd (Anna Björk Nikulásdóttir
o.fl. 2017). Styrkurinn hljóðaði upp á 8 milljónir og fyrir þá peninga
var hægt að klára fyrstu útgáfu málheildarinnar og komast langt með
undirbúning annarrar útgáfu. Starkaður hélt áfram að ganga frá text-
un um og við hlið hans var ráðinn Gunnar Thor Örnólfsson, sem hafði
veg og vanda af uppsetningu Korp-málheildarkerfisins (Borin o.fl.
2012) og aðlögun þess að íslensku. Þá var einnig settur upp n-stæðu-
skoðari sem sýnir breytingar á notkun orða og orðasambanda yfir
tíma.
Þegar vinnu við fyrstu útgáfu málheildarinnar lauk höfðu safn-
ast talsvert fleiri textar en lagt var upp með í upphafi. Hún var yfir
1200 milljón orð og þar með um 50 sinnum stærri en Mörkuð ís-
lensk málheild. Í því sambandi er þó rétt að taka fram að MÍM er
jafnvæg málheild, þ.e. reynt var að gæta þess að jafnvægi væri á stærð
textaflokka. Engar tilraunir voru gerðar til þess í Risamálheildinni,
þar er reynt að viða að sér öllu því sem er aðgengilegt. Notendur mál-
heildarinnar geta svo sjálfir valið þá textaflokka sem þeir vilja skoða
sérstaklega.
Í fyrstu útgáfu málheildarinnar skiptum við textunum upp í 10
flokka, sbr. Töflu 1, en nánari upplýsingar um hvern textaflokk er að
finna á vef Risamálheildarinnar, málheildir.árnastofnun.is.
tunga_21.indb 162 19.6.2019 16:56:18