Orð og tunga - 01.06.2014, Blaðsíða 150
138
Orð og tungn
Enn sem komið er byggist BÍN á því að rannsaka einstök orð og
geyma beygingardæmin sem heild. Smám saman verður raunhæft
í ljósi þess sem áður er rakið að búa til reglukerfi til þess að lýsa
íslenska beygingarkerfinu, eftir því sem gögnin í BÍN aukast. Slíkt tól
kæmi áreiðanlega að góðum notum í ýmsum máltækniverkefnum,
sérstaklega ef það væri notað ásamt orðhlutagreini, þar sem BÍN er
ekki og verður aldrei tæmandi.
Rétt er að minna á að BÍN er enn verk í vinnslu. Gögn úr BÍN eru
aðgengileg án endurgjalds á vefsíðu Stofnunar Árna Magnússonar í
íslenskum fræðum, með þeim skilmálum sem þar koma fram.
Heimildir
Anton Karl Ingason, Hrafn Loftsson, Sigrún Helgadóttir og Eiríkur Rögn-
valdsson. 2008. A Mixed Method Lemmatization Algorithm LFsing a Hi-
erarchy of Linguistic Identities (HOLI). í: Raante, Arne, og Bengt Nord-
ström (ritstj.): Advances in Natural Language Processing, s. 205-216. (Lecture
Notes in Computer Science, Vol. 5221.) Berlín: Springer.
Ásta Svavarsdóttir. 1993. Beygingakerfi nafiiorða í nútímaíslensku. Reykjavík:
Málvísindastofnun Háskóla íslands.
Eiríkur Rögnvaldsson. 1990. íslcnsk orðhlutafræði. Reykjavík: Málvísinda-
stofnun Háskóla íslands.
Eiríkur Rögnv'aldsson 1998. Málfræði í íslenskri orðabók: Hvemig og til
hvers? Orð og tunga 4:25-32.
Eiríkur Rögnvaldsson, Hrafn Loftsson, Kristín Bjamadóttir, Sigrún Helga-
dóttir, Anna B. Nikulásdóttir, Matthew Whelpton og Anton Karl Ingason.
2009. Icelandic Language Resources and Technology: Status and Pros-
pects. Proceedings ofthe NODALIDA 2009 Workslwp Nordic Perspectives on
the CLARIN Infrastructure of Language Resources. Odense.
Friðrik Magnússon. 1984. Ein lítil beygingarending. Mímir 32:33M3.
Guðrún Kvaran. 2005. Orð. Handbók um beygingar- og orðmyndunarfræði.
Islensk tunga 2. Reykjavík: Almenna bókafélagið.
Guðrún Kvaran og Sigurður Jónsson frá Amarvatni. 1991. Nöfn íslendinga (1.
útg.). Reykjavík: Heimskringla.
Hrafn Loftsson, Jökull H. Yngvason, Sigrún Helgadóttir og Eiríkur Rögn-
valdsson. 2010. Developing a PoS-tagged corpus using existing tools.
Sarasola, Kepa, Francis M. Tyers og Mikel L. Forcada (ritstj.), SaLTMiL
Workshop on Creation and Use of Basic Lexical Resources for Less-Resourced
Languages, LREC 2010, s. 53-60. Valetta, Möltu. [Rafræn útgáfa 8.7.2013:
https://notendur.hi.is/eirikur/corpustagging.pd f.)
Jón Friðrik Daðason. 2012. The Post-Correction oflcelandic OCR Text. Skemm-
an.is. [http://hdl.handle.net/1946/12085j