Orð og tunga - 08.07.2019, Page 179
Steinþór Steingrímsson: Risamálheildin 167
5 Að lokum
Á vef málheildarinnar, málheildir.árnastofnun.is, hefur einnig verið veitt-
ur leitaraðgangur að eldri íslenskum málheildum, MÍM, fornritamál-
heild og Íslenskri orðtíðnibók. Reiknað er með því að nota þessa leitarvél
fyrir aðrar íslenskar málheildir sem kunna að verða til á næstu árum.
Haldið verður áfram að safna textum og vinna að nýjum útgáfum
Risa málheildarinnar á hverju ári, að minnsta kosti á meðan mál-
tækni áætlun fyrir íslensku stendur yfir, en árið 2019 hefst vinna
skv. verkáætlun um máltækni fyrir íslensku 2018–2022 (Anna Björk
Nikulásdóttir o.fl. 2017). Meðfram því verður unnið að því að bæta
greininguna og verkfærin sem notendur geta notað til að vinna með
málheildargögnin. Þá verður einnig reynt að gæta að því að leið-
beiningar og upplýsingar um málheildina og verkfærin séu upp-
færðar, þar sem þeirra þykir þörf.
Heimildaskrá
Anna Björk Nikulásdóttir, Jón Guðnason og Steinþór Steingrímsson. 2017.
Mál tækni fyrir íslensku 2018–2022: verkáætlun. Reykjavík: Mennta- og
menn ingarmálaráðuneytið.
Birkenes, Magnus B., Lars G. Johnsen, Arne M. Lindstad og Johanne Ostad.
2015. From digital library to n-grams: NB N-gram. Í: Proceedings of the
20th Nordic Conference of Computational Linguistics (NODALIDA-2015),
NEALT Proceedings Series Vol. 23, bls. 293–295. Vilníus.
Borin, Lars, Markus Forsberg og Johan Roxendal. 2012. Korp – the corpus
infrastructure of Språkbanken. Í: Proceedings of the Eight International
Conference on Language Resources and Evaluation (LREC 2012), bls. 474–478.
Istanbúl.
Hrafn Loftsson og Eiríkur Rögnvaldsson. 2007. IceNLP: A Natural Language
Processing Toolkit for Icelandic. Í: Proceedings of Interspeech 2007, bls.
1533–1536. Antwerpen.
Hrafn Loftsson og Robert Östling. 2013. Tagging a Morphologically Complex
Language Using an Averaged Perceptron Tagger: The Case of Icelandic.
Í: Stephan Oepen, Kristin Hagen og Janne Bondi Johannessen (ritstj.).
Proceedings of the 19th Nordic Conference of Computational Linguistics
(NoDaLiDa -2013), NEALT Proceeding Series 16, bls. 105–120. Oslo.
Sigrún Helgadóttir, Ásta Svavarsdóttir, Eiríkur Rögnvaldsson, Kristín Bjarna-
dóttir og Hrafn Loftsson. 2012. The Tagged Icelandic Corpus (MIM). Í:
Proceedings of the SaLTMiL-AfLaT Workshop on “Language Technology for
Normalisation of Less-Resourced Languages”, bls. 67–72. Istanbúl.
Steinþór Steingrímsson og Örvar Kárason. Handrit. Augmenting a BiLSTM
tunga_21.indb 167 19.6.2019 16:56:21