Orð og tunga - 01.06.1990, Qupperneq 66
44
Orð og tunga
m.a. starfrækt í tölvunetinu EURONET. Styrkur SYSTRANs felst í gríðarlega
stórum orðasöfnum með um eða yfir 200.000 uppflettiorðum hvert, en gæði þýð-
inganna hafa ekki þótt nógu mikil nema settar séu einhverjar takmarkanir. En
sama gildir raunar um öll önnur vélræn þýðingarkerfi fyrir tungumál sem hafa
verið markaðssett fram til dagsins í dag. Þau ráða ekki við að þýða texta um
hvaða efni sem vera skal, svo að vel sé, án mannlegrar ílilutunar. Hins vegar
hafa sum þeirra reynst hagnýt með vissum takmörkunum. Það getur verið um
að ræða afmarkað efnissvið með takmörkun á orðaforða og einfaldaða málfræði
eða þá að þýðingin er vélræn aðeins að hluta, til dæmis þannig að frumtextinn
sé lagaður til fyrir vélrænu þýðinguna eða að textinn sé lagfærður að lokinni
vélrænu þýðingunni. Hér er við hæfi að nefna sem dæmi um afmarkað efnissvið
að IBM í Japan hefur náð athyglisverðum árangri í að vélþýða tölvuleiðarvísa af
ensku á japönsku.
Á sjöunda áratugnum og langt fram á þann áttunda var heldur dauft yfir
vélrænum tungumálaþýðingum, en síðan hefst endurreisnartími, sem sennilega
má einkum rekja til framfara bæði í málvísindum og í gervigreind.
I heimildum mínum, sem eru frá árinu 1988, er getið um 41 þekkt kerfi eða
verkefni fyrir vélrænar tungumálaþýðingar sem unnið er að eða unnið hefur verið
að víðs vegar um heim. I'lest þeirra liafa byrjað um eða eftir 1980.
Lengi frarnan af fengust menn við rannsóknir á þessu sviði nær eingöngu
í háskólum eða stofnunum tengdum háskólum, en síðustu 5 árin hefur mestur
vöxtur verið í einkageiranum, einkum hjá tölvuframleiðendum og hugbúnaðar-
fyrirtækjum, en einnig í smærri sniðum hjá einstaklingum og smáhópum.
Árið 1988 er talið að fjöldi starfsmanna með vélrænar tungumálaþýðing-
ar að viðfangsefni hafi verið 1600-1800 cdls í heiminum, þar af helmingurinn í
Japan, en Japanar hafa einkum fengist við vélrænar þýðingar milli ensku og
japönsku. I hinum ýmsu þýðingarkerfum er beitt mismunandi aðferðum. I sum-
um er t.d. reynt að hagnýta nýjustu aðferðir gervigreindar en í öðrum er sneitt
hjá þeim.
I Evrópu er EUROTRA þekktasta þýðingarkerfið og með flesta starfsmenn og
mestan kostnað. Byrjað var að vinna að því árið 1978 og hefur það nú u.þ.b. 100
starfsmenn er starfa á 16 stöðum í 11 Evrópubandalagslöndum, víðast í tengslum
við háskóla. EUROTRA er kostað af Evrópubandalaginu, sem hafði fram til
ársins 1987 lagt fé í þetta verkefni sem nemur 2,4 milljörðum íslenskra króna.
Þess má geta að sama ár var þýðingarhraðinn í tilraun hjá EUROTRA 1 setning
á 20 mínútum og þótti ekki öllum sú niðurstaða í samræmi við verðið.
Þá vil ég líka nefna rannsóknir í Frakklandi og Þýskalandi, sem eiga lengri
sögu en EUROTRA. í Frakklandi er það GETA-rannsóknarhópurinn, sem hefur
aðsetur í Grenoble og hefur m.a. staðið fyrir þýðingarkerfinu ARIANE. Og í
Þýskalandi er liáskólinn í Saarbrucken aðsetur fyrir þýðingarkerfin SUSY og
ASCOF.
Og að síðustu vil ég nefna DLT-þýðingarkerfið sem liefur aðsetur í Utrecht í
Hollandi. Það er á vegum hugbúnaðarfyrirtækisins BSO/Research, en hefur verið
kostað að hálfu leyti af hollenskum stjórnvöldum. Upphaf DLT má rekja til ársins
1979, en markviss hönnun hófst árið 1983. Það er einmitt þetta þýðingarkerfi
sem ég ætla nú að lýsa nokkru nánar og greina frá afskiptum mínum af því.