Mímir - 01.06.1998, Side 69
69
Eiríkur Rögnvaldsson
Tungutækni
í. Hvað er tungutækni?
Orðin „tungumálaverkfræði “ og „tungu-
tækni“ koma mörgurn ókunnuglega fyrir eyru,
sem von er, en hafa þó stungið upp kollinum
stöku sinnum á undanförnum misserum. Bæði
eru þau þýðingar á enskurn orðurn, annars
vegar „language engineering" sem hefur verið
notað um nokkurt skeið og hins vegar „langu-
age technology“ sem er rneira notað upp á
síðkastið. Merkingarmunur þessara orða er
hvorki mikill né skýr, en í stuttu og einfölduðu
máli má segja að þau séu notuð um hvers kyns
hagnýtingu tölvutækninnar í tengslum við
mannlegt mál - og öfugt. Undir þetta fellur t.d.
smíði talgervla sem líkja eftir mannsrödd og
lesa upp ritaðan texta, forrit sem leiðrétta staf-
setningu, beygingar og stíl, þýðingarforrit og
fjöldamargt annað. Rétt er að leggja áherslu á
að tungutækni er alls ekki fræði, heldur tækni,
eins og orðið bendir til. Eins og títt er um
tækni liggja hins vegar mikil fræði þar að baki;
ekki síst tölvufræðileg málvísindi eða máltölv-
un (computational linguistics) og textamál-
fræði eða gagnamálfræði (corpus linguistics).
2. Tungutækni, talgreining
°g upplýsingabyltingin
Þróunin í tölvuheiminum stefnir í þá átt að
tungumálið - venjulegt, mannlegt mál - sé not-
að sífellt meira og á fjölbreyttari hátt en áður.
Þetta á t.d. við í hvers kyns upplýsingaleit í
gagnabönkum, á veraldarvefnum o.s.frv. í stað
þess að fyrirspurnir séu settar frarn á staðlaðan
hátt, með takmörkuðum orðaforða, er nú
stefnt að því að hægt sé að spyrja á venjulegu
máli, sem næst því sem maður ræðir við mann.
Augljóst er að þetta eykur rnjög aðgengi al-
mennings að upplýsingum og gagnabönkum,
vegna þess að ekki er lengur þörf á að setja sig
inn í flóknar reglur um það hvernig fyrirspurn-
ir skulu settar fram.Tölvuforritin eru að verða
það fullkomin að þau geta túlkað mun fjöl-
breyttari fyrirspurnir. Þar að auki má búast við
að þróun í tungutækni geri mönnum auðveld-
ara að leita sér upplýsinga á ýmsurn tungumál-
um í framtíðinni. Þannig segir t.d. í bæklingn-
um Language and Tecbnology, sem Evrópu-
sambandið gaf út 1996 (s. 6-7):
In an ideal world, every user would be able to access
the information they required using their own language, and
be able to receive the information in their own language.'In-
formation’ in this context includes business and commerci-
al information (including advertisements, orders, bills, pay-
ments, etc.), educational materials, entertainment, and so
on.
Á næstu árum má einnig búast við mikilli
þróun í talgreiningu og hagnýtingu hennar.
Með talgreiningu er átt við það þegar tölvu-
forrit greinir það sem sagt er og túlkar það.
Augljóst er að slík greining opnar rnjög mikla
og fjölbreytta möguleika. Þannig er t.d. hægt
að hugsa sér að hvers kyns tækjum (heimilis-
tækjum, bílum, tölvum o.s.frv.) verði stjórnað
með því að „tala við“ þau, í stað þess að ýta á
takka, snúa stýri eða snerlum, slá inn skipanir
o.s.frv. Það er skemmra í það en marga grunar