Orð og tunga - 01.06.2015, Page 131
Jón Friðrik og Kristín: Kvistur: Vélræn stofnhlutagreining
119
merkingu) aukast eftir því sem liðum fjölgar en þar kemur saman-
burður við önnur samsett orð, þar sem sömu liðir koma fyrir, að
gagni við að ákvarða stofnhlutagreininguna (sjá Mynd 2 í kafla 4.2
hér á eftir).
Fjölbreytileiki í samsetningarmyndum orða veldur vandkvæðum
í vélrænni greiningu á samsettum orðum í íslensku. Til dæmis birt-
ast nafnorð sem ákvæði í samsettum orðum oftast sem stofn eða
eignarfall eintölu eða fleirtölu en bandstafir og þágufallsmyndir4
finnast líka þótt það sé mun sjaldgæfara (Kristín Bjarnadóttir 2002).
Nokkur fjölbreytileiki er einnig í samsetningarmyndum lýsingarorða
sem ákvæða, sbr. góðmenni (stofn), lítilsvirðing (eignarfall), litliputti
(fallbeygður fyrri hluti) og betristofa (miðstig). Þá eru aðrir orðflokkar
ónefndir, auk setningarliða sem einnig geta verið fyrri hlutar í sam-
settum orðum, t.d. í orðunum milliþinganefnd og Góðrarvonarhöfði.
Föst samsetning
Laus samsetning
Bandstafir
Stofn
Eignarfall eintölu
Eignarfall fleirtölu
Þágufall eintölu
Þágufall fleirtölu
handbolti, fótbolti
Iwndarbak, fótarbein
handapat, fótatak
hendiveifa
fótumtroðsla
labbitúr, ráðunautur
Tafla 2. Form nafnorðsákvæða í samsettum orðum.
Valið á milli fastrar og lausrar samsetningar og milli eignarfalls eintölu
og fleirtölu nafnorða í fyrri hluta samsettra orða virðist vera tilviljun
eins og sjá má í Töflu 2. Valið er þó ekki frjálst (Kristín Bjarnadóttir
1995). E.t.v. má segja að valið sé lesgert, þannig að það er orðbundið
hver háttur er hafður á hverju sinni, sjá Töflu 3.5
4 Nafnorð með þágufallsákvæði eru mjög fá í Ritmálssafni Orðabókar Háskólans en
þar eru dálítið fleiri lýsingarorð og lýsingarhættir þátíðar, auk örfárra staðfestra
dæma um sagnir í germynd (Kristín Bjarnadóttir 2000a; Kristín Bjamadóttir
2000b). Um nafnorðið hendiveifa eru 9 dæmi í Ritmálssafiii, t.d. Konan sendist sem
hendiveifa upp stigann....
5 Samkvæmt orðmyndunarreglum ættu allar orðmyndir í Töflu 3 að vera tækar en
orðmyndimar sjálfar virðast vera lesgerðar (lexíkalíseraðar) eins og sést af tíðni-
tölum, t.d. úr íslenskum orðasjóði: bókbúð (1), bókarbúð (0), bókabúð (825). Fleiri dæmi
finnast um bókabúð (165 þúsund) og bókbtið (63) í Google en mörg dæmin um
bókbúð þar eru augljóslega villur, t.d. Bókbúð Máls og menningar og Bókbúð Braga,
enda eru leitamiðurstöður þaðan ekki mjög traust heimild um nákvæma tíðni þótt
þær geti gefið góðar vísbendingar. Niðurstaðan er því að stjörnumerktu orðin séu
rétt mynduð; þau eru bara ekki notuð.