Orð og tunga - 01.06.1990, Page 66

Orð og tunga - 01.06.1990, Page 66
44 Orð og tunga m.a. starfrækt í tölvunetinu EURONET. Styrkur SYSTRANs felst í gríðarlega stórum orðasöfnum með um eða yfir 200.000 uppflettiorðum hvert, en gæði þýð- inganna hafa ekki þótt nógu mikil nema settar séu einhverjar takmarkanir. En sama gildir raunar um öll önnur vélræn þýðingarkerfi fyrir tungumál sem hafa verið markaðssett fram til dagsins í dag. Þau ráða ekki við að þýða texta um hvaða efni sem vera skal, svo að vel sé, án mannlegrar ílilutunar. Hins vegar hafa sum þeirra reynst hagnýt með vissum takmörkunum. Það getur verið um að ræða afmarkað efnissvið með takmörkun á orðaforða og einfaldaða málfræði eða þá að þýðingin er vélræn aðeins að hluta, til dæmis þannig að frumtextinn sé lagaður til fyrir vélrænu þýðinguna eða að textinn sé lagfærður að lokinni vélrænu þýðingunni. Hér er við hæfi að nefna sem dæmi um afmarkað efnissvið að IBM í Japan hefur náð athyglisverðum árangri í að vélþýða tölvuleiðarvísa af ensku á japönsku. Á sjöunda áratugnum og langt fram á þann áttunda var heldur dauft yfir vélrænum tungumálaþýðingum, en síðan hefst endurreisnartími, sem sennilega má einkum rekja til framfara bæði í málvísindum og í gervigreind. I heimildum mínum, sem eru frá árinu 1988, er getið um 41 þekkt kerfi eða verkefni fyrir vélrænar tungumálaþýðingar sem unnið er að eða unnið hefur verið að víðs vegar um heim. I'lest þeirra liafa byrjað um eða eftir 1980. Lengi frarnan af fengust menn við rannsóknir á þessu sviði nær eingöngu í háskólum eða stofnunum tengdum háskólum, en síðustu 5 árin hefur mestur vöxtur verið í einkageiranum, einkum hjá tölvuframleiðendum og hugbúnaðar- fyrirtækjum, en einnig í smærri sniðum hjá einstaklingum og smáhópum. Árið 1988 er talið að fjöldi starfsmanna með vélrænar tungumálaþýðing- ar að viðfangsefni hafi verið 1600-1800 cdls í heiminum, þar af helmingurinn í Japan, en Japanar hafa einkum fengist við vélrænar þýðingar milli ensku og japönsku. I hinum ýmsu þýðingarkerfum er beitt mismunandi aðferðum. I sum- um er t.d. reynt að hagnýta nýjustu aðferðir gervigreindar en í öðrum er sneitt hjá þeim. I Evrópu er EUROTRA þekktasta þýðingarkerfið og með flesta starfsmenn og mestan kostnað. Byrjað var að vinna að því árið 1978 og hefur það nú u.þ.b. 100 starfsmenn er starfa á 16 stöðum í 11 Evrópubandalagslöndum, víðast í tengslum við háskóla. EUROTRA er kostað af Evrópubandalaginu, sem hafði fram til ársins 1987 lagt fé í þetta verkefni sem nemur 2,4 milljörðum íslenskra króna. Þess má geta að sama ár var þýðingarhraðinn í tilraun hjá EUROTRA 1 setning á 20 mínútum og þótti ekki öllum sú niðurstaða í samræmi við verðið. Þá vil ég líka nefna rannsóknir í Frakklandi og Þýskalandi, sem eiga lengri sögu en EUROTRA. í Frakklandi er það GETA-rannsóknarhópurinn, sem hefur aðsetur í Grenoble og hefur m.a. staðið fyrir þýðingarkerfinu ARIANE. Og í Þýskalandi er liáskólinn í Saarbrucken aðsetur fyrir þýðingarkerfin SUSY og ASCOF. Og að síðustu vil ég nefna DLT-þýðingarkerfið sem liefur aðsetur í Utrecht í Hollandi. Það er á vegum hugbúnaðarfyrirtækisins BSO/Research, en hefur verið kostað að hálfu leyti af hollenskum stjórnvöldum. Upphaf DLT má rekja til ársins 1979, en markviss hönnun hófst árið 1983. Það er einmitt þetta þýðingarkerfi sem ég ætla nú að lýsa nokkru nánar og greina frá afskiptum mínum af því.

x

Orð og tunga

Direct Links

If you want to link to this newspaper/magazine, please use these links:

Link to this newspaper/magazine: Orð og tunga
https://timarit.is/publication/1210

Link to this issue:

Link to this page:

Link to this article:

Please do not link directly to images or PDFs on Timarit.is as such URLs may change without warning. Please use the URLs provided above for linking to the website.