Orð og tunga - 01.06.2015, Page 130
118
Orð og tnnga
alþjóðadýraheilbrigöismálastofnun
alþjóða dýraheilbrigðismálastofnun
/ \ jS Ni
al þjóða dýra heilbrigðismálastofnun
/ N
heilbrigðismála stofnun
/ \
heilbrigðis mála
heil brigðis
Mynd 1. Dæmi um tvíundatré fyrir margsamsett orð.
Hlutfall ofurlangra orða af þessu tagi er lágt í íslenskum orðasjóði en í
Töjlu 1 eru tölur um fjölda liða í þekktum orðum þar. I fremri talna-
dálki er fjöldi einstakra orðmynda en í síðari talnadálki eru saman-
lagðar tíðnitölur fyrir sömu orðmyndir (lesmálsorð) eða stafastrengi.
Fjöldi liða Fjöldi orðmynda Fjöldi lesmálsorða
1 (grunnorð) 146.000 427.188.333
2 509.497 70.816.731
3 137.804 10.149.391
4 18.698 1.130.527
5 1.188 70.129
6 17 92
7 1 10
Óþekkt orð 3.974.811 34.010.620
Alls 4.788.016 543.365.833
Tafln 1. Fjöldi stofnhluta í þekktum orðum í íslenskum orðasjóði.
I tölum fyrir óþekkt orð eru bókstafarunur sem geta verið með einu
bandstriki en öllum strengjum með tölustöfum og öðrum táknum
er sleppt. Til óþekktu orðanna í Islenskum orðasjóði teljast eiginlegar
óþekktar orðmyndir (t.d. jólaórói, kolvetnisgas, koltvísýringslosun, kol-
munnavertíð), auk skammstafana (t.d. ki, m.a., t.d., NATO), útlendra
orða (t.d. the, and, york, quixotic), villna (t.d. mart, kanski, mannn) o.fl.
Takmarkið er að Kvistur fækki óþekktum orðum með því að greina
samsett orð í þekkta orðhluta þannig að orðið sem heild sé ekki leng-
ur órætt. Möguleikar á margræðni í stofnhlutagreiningu (og þar með