Tölvumál - 01.07.1999, Blaðsíða 27
Tungutækni
Hvað er tungutækni og fyrir hverja?
Eríndi flutt á ráðstefnu Skýrslutæknifélags íslands og EUROMAP, þann 12. desember 1998.
Heiðar Jón Hannesson
Hlutverk tungulækni er
að koma málgetu inn
í búnað sem maður-
inn nýtir í sína þjón-
ustu
Tungutækni hefur tek-
ið miklum framförum
á síðustu árum og
fyrst núna eru að
verða til markaðshæf-
ar lausnir
Orðið tungutækni er nýyrði í ís-
lensku máli og er þýðing á því
sem enskumælandi menn kalla
„Human language technology“. Hlutverk
tungutækni er að koma málgetu inn í bún-
að sem maðurinn nýtir í sína þjónustu,
hvort heldur það er hugbúnaður, vélbún-
aður eða upplýsingakerfi. Tungumál sem
njóta stuðnings tungutækni eru sögð
tölvutæk, þar sem hægt er að vinna með
þau mál á nánast hvaða formi sem er.
Bylting
Tungutækni felur í sér rnestu byltingu í
upplýsingavinnslu sem maðurinn hefur
staðið fyrir. Þekking mannsins er vistuð á
mismunandi tungumálum og tækni sem
ræður við sjálft vistunarformið opnar því
áður óþekktar leiðir að upplýsingavinnslu.
Vert er að skoða þessa þróun í ljósi fyrri
framfaraskrefa mannsins á sviði upplýs-
ingaöflunar og miðlunar. Með uppgötvun
ritmáls varð mögulegt að vista upplýsing-
ar til framtíðar og uppsöfnun þekkingar
hófst. Aðgengi að slíkum upplýsingum var
hins vegar takmarkað við fáa aðila, sem
stöðu sinnar og staðsetningar, höfðu að-
gang að þeim. Tilkoma prentlistar hafði
afgerandi áhrif á miðlun upplýsinga, þar
sem tæknilega varð mögulegt að dreifa rit-
uðum upplýsingum með hagkvæmum
hætti. Fleiri fengu aðgang að upplýsingum
með þeim afleiðingum að meiri og að-
gengilegri þekking varð til. Upphafið af
þekkingarsamfélagi nútímans má rekja til
uppgötvunar prentlistar.
Ljósvakamiðlar höfðu byltingarkennd
áhrif á tímaháða miðlun hins talaða rnáls,
sem er að verulegu leyti óháð staðsetn-
ingu. Með sjónvarpinu varð mögulegt að
miðla upplýsingum samtímis á töluðu og
prentuðu formi, þar sem prentmálið er
jafnvel á öðru tungumáli en hið talaða,
sbr. textun efnis. Með ljósvakamiðlun
hófst söfnun og vistun upplýsinga á tal-
rnáli.
Tölvutækni var afar mikilvægt skref í
þekkingarmiðlun og öflun upplýsinga.
Mögulegt varð að vista meira og aðgengi-
legra magn upplýsinga en áður. Textaleit í
stórum söfnum varð möguleg svo og vist-
un hljóðs og mynda með textum. Með
tölvutækni varð í fyrst sinn hægt að afla
upplýsinga óháð formi tungumálsins, þ.e.
hvort heldur upplýsingarnar voru á rituðu
eða töluðu formi.
Og svo varð Veraldarvefurinn til á
Internetinu. Með tilkomu hans varð heim-
urinn að einu svæði. Afleiðing áforma um
turnbyggingu í hinni fornu borg Babylon
blasir við. Með þróun tungutækni mun
maðurinn loksins ná að vinna sig út úr
þeim gömlu syndum, ef einhverjar voru.
Upplýsingavinnsla mun verða óháð tungu-
málinu og því formi sem þær eru vistaðar
á. Tungumál sem ekki fá viðeigandi stuðn-
ing í tungutækni munu ekki verða sýnileg
í slíku umhverfi - heldur daga uppi og
deyja í byltingunni.
Hvers vegna núna?
Tungutækni hefur tekið miklum framför-
um á síðustu árum og fyrst núna eru að
verða til markaðshæfar lausnir. Fyrir
þessu eru tæknilegar, markaðslegar og
pólitískar ástæður.
Tæknilega réði þróun örgjörva þar
mestu en tungutækni er krefjandi fyrir
rauntímavinnslu og þarf því öfluga ör-
gjörva. Nógu öflugar einmenningstölvur
komu fyrst á markað fyrir u.þ.b. tveimur
árum. Þetta eru vélar sem ráða við þróaðri
tungutækni, s.s. talgreiningu, þar sem tali
er breytt í texta, en þær eru nú að finna á
hvers rnanns borði.
Markaðslega þrýsti Veraldarvefurinn á
slíkar lausnir. Fyrir tilkomu hans var hvert
málsvæði útaf fyrir sig og því ekki jafn al-
rnenn þörf á rauntímabrú milli tungumála,
þar sem eitt tungumál er þýtt yfir á annað
með vélrænum hætti. Aðgengilegt upplýs-
ingamagn var heldur ekki jafn yfirþyrm-
Tölvumál
27