Orð og tunga - 01.06.2015, Síða 134
122
Orð og tnnga
í orðhluta. Tæknilega eru ýmsar aðferðir viðhafðar við orðskiptingu
en þeim má skipta í tvo flokka.
Sá fyrri samanstendur af aðferðum sem styðjast við þýðingarorða-
bækur á milli viðfangsmálsins (þar sem reglur um samsett orð eru
virkar) og markmáls þar sem orðhlutaskil samsettra orða eru ótvíræð,
t.d. í ensku þar sem samsett orð eru gjarnan rituð með orðabilum
(t.d. team spirit, lawn tennis). Slíkar orðabækur má t.d. vinna upp úr
samhliða málheildum eins og Brown (2002) gerir fyrir þýsku og ensku.
Skipting þar sem þýðingin á orðhlutunum stemmir við þýðinguna á
samsetta orðinu sjálfu verður þarna fyrir valinu. I tilbúnu dæmi úr
íslensku er valið á milli lið, .. . , +sandi, .., og liðs, .. , . ,+andi, ...
en þar yrði seinni skiptingin fyrir valinu, sbr. ensku þýðinguna 'team
spirit'. Gögn af þessu tagi eru ekki tiltæk fyrir íslensku og aðferðin er
því ekki nothæf.
Aðrar aðferðir skipta samsettum orðum í þekkta orðhluta og meta
líkindi hverrar skiptingar út frá tíðni orðhlutanna. Koehn og Knight
(2003) finna allar runur af þekktum sjálfstæðum orðum sem saman
geta myndað tiltekið samsett orð og meta líkurnar á hverri skiptingu
út frá margfeldismeðaltali (e. geometric mean) orðtíðni hlutanna eins
og sjá má í Töflu 5 fyrir orðið þingstörfunum.
Akvæði Orðtíðni Haus Orðtíðni Margfeldismeðaltal
ÞinS(no.hk.st„fn) 28.846 störfunum(nohkþgfft> 297 (28846*297)1/2 =2927,0
ÞinSs(„„hk.ef,t.) 4-688 törfunum(nokkþgfft) 18 (4688*18)1/2=290,5
Tafla 5. Dæmi um tíðni orðhluta í samsettu orði ásamt margfeldismeðaltali.
Með samanburði á tíðni í textasafni er ljóst að störf eru algengari á
þingi en tarfar og því er fyrri greiningin valin.
Schiller (2005) útfærir svipaða aðferð en brýtur samsett orð niður
í runu ákvæða og hausa sem koma fyrir í stóru þjálfunarsafni af full-
greindum þýskum samsettum orðum. Líkurnar gagnvart hverjum
orðhluta eru metnar út frá þjálfunarsafninu eftir því hversu oft hann
kemur fyrir sem ákvæði eða haus, eftir því sem við á.
Þessar aðferðir eiga það sameiginlegt að þær skipta samsettum
orðum aðeins í runur af orðhlutum. Kosturinn við stofnhlutatré sam-
setts orðs er að þar er hægt að nýta eins fíngreinda skiptingu á orðinu
og þörf krefur. Skiptingin fjármála+ráðherra myndi henta vel fyrir vél-
ræna þýðingu (að því gefnu að báðir hlutarnir séu þekktir) en með
tilliti til beygingar er hentugra að greina beygingarlegan haus (herra)
sem nægir til þess að beygingarflokkur o.þ.h. sé ljós.