Orð og tunga - 01.06.2016, Page 151
Ingibjörg Elsa Björnsdóttir: Vélþýðingar á íslensku 141
Það sem vélþýðingarkerfi eiga almennt erfiðast með að vinna úr er
fyndni, kaldhæðni og margræðni. Hvert orð hefur í vélþýðingarkerf-
inu aðeins eina merkingu. Apertium-orðabækur ráða í dag einungis
við eina samsvörun fyrir hvert orð. En verið er að þróa orðabækurnar
þannig að hugsanlega geti þær í framtíðinni skráð fleiri en eitt mark-
málsjafngildi fyrir hvert uppflettiorð í upprunamálinu (Forcada o.fl.
2011:134). Á þessu er erfitt að ráða bót þannig að erfitt er að segja til
um það í dag hve langt tölvutæknin muni komast á þessu sviði.
6 Lokaorð
Í vissum skilningi má segja að Apertium-kerfið sé tilraunastofa í
vél þýðingum, þ.e. opinn hugbúnaður sem allir geta tekið þátt í að
þróa. Apertium er því einn besti kostur sem Íslendingar eiga nú til
að rannsaka og þróa vélþýðingarkerfi fyrir íslensku. Apertium-kerfið
hef ur þægilegt viðmót og þýðir á örskammri stund af íslensku yfir
á ensku eða sænsku. Ákveðnar takmarkanir eru þó enn á íslenska
Apertium-kerfinu, t.d. er varðar orðaforða og margræðni.
Niðurstaða þessarar úttektar er sú að Apertium-kerfið sé tiltölu lega
einfalt í notkun og þróun og bjóði upp á marga möguleika á blandaðri
notkun með öðrum kerfum, t.d. vélþýðingarkerfum sem byggjast á
dæmum, auk þess sem myndangreinandi eining Apertium-kerfisins
geti nýst í öðrum kerfum við samanburðarrannsóknir á tungumálum.
Málföng tungumáls nýtast ekki einungis til vélþýðinga heldur
opna þau nýjar leiðir til rannsókna á málinu og á samanburði við önn-
ur tungumál. Því er mjög mikilvægt að grundvallarmálföng séu til
fyrir íslensku. Þróun málheilda og orðasafna er sérstaklega mikilvæg
til að hægt sé að auka orðaforða og nákvæmni vélþýðingarkerfa fyrir
íslensku í framtíðinni.
Heimildir
apertium.org (18. júlí 2015)
Forcada, Mikel L., Francis M. Tyers og Gema Ramírez Sánchez. 2009. The
Apertium machine translation platform: five years on. Í: Juan Antonio
Pérez-Ortiz, Felipe Sánchez-Martínez og Francis M. Tyers (ritstj.). Pro-
ceedings of the First International Workshop on Free/Open-Source Rule-Based
Machine Translation, bls. 3–10. Alicante.
tunga_18.indb 141 11.3.2016 14:41:19