Ritið : tímarit Hugvísindastofnunar - 01.10.2021, Blaðsíða 179
AGNES, DAGBJÖRT, LILJA BJÖRK OG ANTON KARL
178
Í þessari grein verður fjallað um niðurstöður rannsóknar sem gerð var á
íslenskum þýðingum úr vélþýðingarkerfinu Google Translate. Markmiðið
var að kanna hvort kynjahalli kæmi fram í íslenskum þýðingum líkt og rann-
sóknir hafa sýnt að getur gerst í öðrum málum. Í íslensku eru þrjú málfræði-
leg kyn: karlkyn, kvenkyn og hvorugkyn. Kyn er málfræðileg beygingar-
formdeild fallorða, til að mynda hafa nafnorð fast kyn en lýsingarorð fá kyn
sitt frá fallorðinu sem þau standa með eða vísa til. Persónufornöfn í þriðju
persónu standa alltaf í ákveðnu kyni, hún/hán/hann/það, en persónufornöfn
í fyrstu og annarri persónu eru eins, ég/þú, óháð kyni þess einstaklings sem
þau vísa til. Ef lýsingarorð á við persónufornafn í fyrstu eða annarri persónu
hlýtur það kynbeygingu sína út frá samhengi. Hins vegar er þessu öðru-
vísi háttað í ensku þar sem hvorki nafnorð né lýsingarorð eru flokkuð eftir
kynjum. Vegna þessa breytileika milli tungumálanna er unnt að kanna hvort
kynjahalli komi fram þegar vélþýðingarkerfi er látið þýða setningar í fyrstu
persónu með lýsingarorði frá ensku yfir á íslensku.
Í rannsókninni voru lýsingarorð þýdd úr kynhlutlausum setningum á
ensku, þ.e. setningum þar sem kyn kemur ekki fram, yfir á íslensku. Í ljós
kom að vélþýðingarnar virðast vera nokkuð hlutdrægar þar sem það virð-
ist háð merkingu lýsingarorðanna hvort þau fá karlkyns- eða kvenkyns-
beygingu í íslenskri þýðingu. Þegar lýsingarorð sem lýsa persónuleika og
persónueinkennum fólks eru skoðuð kemur í ljós að þau sem hafa jákvæða
merkingu eru líklegri til þess að fá karlkynsbeygingu en kvenkynsbeygingu
í íslensku þýðingunni. Þetta eru orð eins og sterkur (e. strong) og snjall (e.
clever). Af lýsingarorðum með neikvæða merkingu er hins vegar líklegra að
kvenkynsmynd sé notuð í þýðingunni, t.d. heimsk (e. stupid) og veik (e. weak).
Þessu er aftur á móti öfugt háttað með lýsingarorð sem lýsa útliti, en orð
sem venjulega eru notuð til þess að lýsa útliti á jákvæðan hátt eru frekar
þýdd með kvenkynsmynd en þau neikvæðu með karlkynsmynd. Einnig er
lýsingarorðið góð/ur (e. good) skoðað í samhengi við ákveðin störf, heim-
ilisstörf annars vegar og tækni- og iðnaðarstörf hins vegar. Þar virðist það
háð eðli starfanna hvort lýsingarorðið fær kvenkyn eða karlkyn. Við höfum
ekki aðgang að frumgögnum Google en trúlega endurspeglar þetta með ein-
North American Chapter of the Association for Computational Linguistics: Human Lang-
uage Technologies 2/2018, bls. 8–14; Kaiji Lu, Piotr Mardziel, Fangjing Qu, Pree-
tam Amancharla og Anupam Datta, „Gender Bias in Neutral Natural Language
Processing“, Logic, Language, and Security, ritstj. Vivek Nigam, Tajana Ban Kirigin,
Carolyn Talcott, Joshua Guttman, Stepan Kuznetsov, Boon Thau Loo og Mitsuhiro
Okada, Cham: Springer, 2020, bls. 189–202.