Árbók VFÍ/TFÍ - 01.06.2002, Síða 308
• Tölvuorðabækur.
• Talgreinar, þ.e. búnaður sem umbreytir tali í tölvutækan texta.
• Talarar, þ.e. búnaður sem breytir texta í tal, einnig kallað talgervlar en gæti vel verið
kallað lesarar eða þulir.
• Búnaður sem þýðir milli tungumála.
• Búnaður sem greinir hver mælir.
• Búnaður sem greinir andlegt ástand þess sem mælir.
• Búnaður sem greinir á hvaða tungumáli er mælt.
• Búnaður sem býr til útdrátt úr mæltu máli eða rituðum texta.
Eins og sést af þessari upptalningu krefst tungutæknin þekkingar sem kemur frá mörgum
sviðum, þ.á m. tölvunarfræði, málvísindum, merkjafræði, stærðfræði, sálarfræði og líf-
fræði.
I þessari grein er sjónum beint að notkun tungutækninnar í fjarskiptum, einkum í síma-
kerfum. Greint verður frá þeirri stöðu sem tungutæknin hefur núna og lauslega vikið að
því hvernig tölvur fara að því að breyta tali í texta, þ.e. talgreiningu. Að lokum verður
fjallað um stöðu íslenskunnar í tungutækniheiminum.
Notkun tungutækni er mjög háð því að fyrir hendi séu talgreinar og talarar. Talgreiningin
hefur verið talin flóknasti og erfiðasti hluti tungutækninnar en smíði á góðum tölurum
hefur einnig verið erfiðleikum bundin. Talgreiningarbúnað má flokka í tvo meginflokka:
• Búnaður sem ætlaður er aðeins einum notanda
• Búnaður sem ætlaður er til notkunar fyrir alla sem tala viðkomandi tungumál
Tungutækni fyrir einstaklinga
Búnaður úr fyrrgreinda flokknum er einfaldari og hefur verið til á markaði um nokkurra
ára skeið. Slíkur búnaður kostar nokkur þúsund krónur og er til frá nokkrum fram-
leiðendum, þ.á m. IBM, Philips og Nuance. Hægt er að fá búnað fyrir helstu tungumál
eins og ensku, ítölsku, frönsku, þýsku, spænsku og mandarín. Önnur minni tungumál
eins og þau skandinavísku hafa einnig skotið upp kollinum í heimi tungutækninnar. Víða
erlendis hefur tungutæknin þegar áunnið sér sess meðal fólks og er notuð í daglegum
störfum. Dæmi um notkunarsvið er upplestur þar sem tölvu er lesið fyrir. Þarna kemur
talgreiningin í stað lyklaborðsins. Einnig er hægt að láta tölvu lesa texta og er nokkuð um
það að tölvur lesi fyrir ökumenn á vegum úti. Vísir að slíkri notkun er kominn fram í
nýrri þjónustu Landssímans, en hún nefnist Box [2]. Þar er m.a. hægt að láta lesa
tölvupóst gegnum síma. Box-þjónustan byggir eingöngu á notkun talara, viðskiptavinir
stýra kerfinu með lyklaborði á GSM-síma eða tölvu. Þessi talari er nokkurn veginn það
eina sem gert hefur verið fyrir íslensku á því sviði tungutækninnar sem fjallar um talað
mál.
Dæmigerður talgreiningarbúnaður sem nú er boðinn til kaups [3] býr yfir orðasafni með
yfir 300 þúsund orðum. Honum nægir PC-tölva sem telst tiltölulega slöpp nú til dags,
hún þarf að hafa 300 MHz Pentium II eða sambærilegan örgjörva, um 100 MB minni og
kerfið tekur aðeins um 520 MB diskrými. Eftir að búnaðurinn hefur verið settur upp á
tölvunni tekur við að þjálfa hann. Þjálfunin felst í því að lesa texta fyrir búnaðinn og
fylgjast með að hann meðtaki textann rétt. Minnsta þjálfun tekur um hálfa klukkustund
en með meiri þjálfun eflist búnaðurinn að getu. Frekari þjálfun felst í því að nota
3 0 4
Arbók VFl/TFl 2002