Árbók VFÍ/TFÍ - 01.06.2002, Blaðsíða 313
átta sig á því hvert þessi „hún" vísar. Það verða því verkefni við framþróun tungutækn-
innar um ókomna tíð.
Smíði gagnagrunnanna er umfangsmikið og krefjandi starf. Stór hluti vinnunnar við að
gera tungumál tækt fyrir tungutækni felst í þessari smíði. Þúsundir manna þurfa að lesa
texta til að byggja upp hljóðunga- og framburðarlíkönin og setningafræðilega líkanið er
byggt með greiningu textasafna. f þessu felst stærsti kostnaðarliðurinn við tungutækn-
ina. Tungumálið er síbreytilegt og ný orð bætast stöðugt við. Þess vegna þarf stöðuga
vinnu við að uppfæra gagnagrunnana. Þetta verður þó vel gerlegt vegna þess að hluti
ferlisins er sjálfvirkur.
Lokaorð
Framtíð tungutækninnar er björt. Þær þjóðir sem eiga tungutæknilausnir eru þegar
farnar að hagnýta þær í miklum mæli og sums staðar er þetta hluti daglegs lífs. Beiting
tungutækni eykst hröðum skrefum við hvers kyns tölvunotkun. Til dæmis er tungutækni
nýtt í Windows XP-stýrikerfinu frá Microsoft. Það fyrirtæki hefur um 100 manns í vinnu
að rannsóknar- og þróunarstörfum á þessu sviði, aðeins IBM hefur umfangsmeiri starf-
semi. Það er því íjóst að tungutæknin þrengir sér inn á flest svið upplýsinga- og
fjarskiptatækninnar á næstu misserum og árum. Þær þjóðir sem ekki eiga tungutækni-
lausnir á sínu tungumáli munu nýta sér þær á öðrum málum. Þannig er yfirvofandi að ef
fslendingar taka ekki til hendinni og smíða slíkar lausnir fyrir íslensku munu landsmenn
nýta sér enskar tungutæknilausnir. Líklega væri það upphafið að endalokum íslenskrar
tungu sem verkfæris í daglegri notkun.
Heimildir:
[1] Rögnvaldur Ólafsson og fl. Tungutækni, skýrsla starfshóps. Menntamálaráðuneytið, apríl 1999, fáanleg á
http://www.tungutaekni.is.
[2] Sjá http://www.box.is.
[3] http://www-3.ibm.com/software/speech/
[4] Eiríkur Rögnvaldsson. Þættir úr sögulegri setningafræði. Reykjavik 1993. Sjá http://www.hi.is/~eirikur/syntsag.pdf.
[5] Jean Kumagai. Talk to the Machine. IEEE Spectrum, september 2002, bls. 60-64.
[6] http://fife.speech.cs.cmu.edu/Communicator/
[7] http://www.hex.is/
[8] Huang, X., Acero, A„ Hon, H.W. Spoken Language Processing - A guide to theory, algorithm andsystem development. ISBN
0-13-022616-5, Prentice Hall, 2001.
[9] Cole, R.A. og fl. Survey of the State of the Art of Human Language Technology. November 1995. Ritið má finna á post-
script formi á http://cslu.cse.ogi.edu/HLTsurvey/ og á PDF formi á http://www.dfki.de/lt/index.html.
[1OJ British Telecom Technology Journal, vol 14. no 1,janúar 1996. Fæst á http://www.sc-serverl .bt.com/bttj/archive.htm.
[11] Rabiner, L.R. A tutorial on hidden Markov models and selected applications in speech recognition. Proceedings of the
IEEE, 77 (2),1989, bls.257-286.
[12] Cox, S. J. Hidden Markov models for automatic speech recognition: theory and applications. BTTechnology Journal, 6 No
2,1988, bls. 105-115.
Tækni- og vísindagreinar
3 0 9