Málfregnir - 01.10.1988, Qupperneq 27
BALDUR JÓNSSON
Um skiptingu orða milli lína
Einhvern tímann heföi það þótt auvirði-
leg iðja að sitja við að sundurlima orð til
að segja fyrir um skiptingu þeirra milli
lína. Fyrr á öldum var hver lína fyllt af
lesmáli eins og lengd hennar leyfði og
síðan haldið áfram í næstu línu hvort
sem stóð á orðaskilum eða ekki. Menn
skiptu orðum þar sem þeim hentaði,
fluttu jafnvel einn staf yfir, ef svo bar
undir, og skeyttu ekki um skiptistrik
fremur en þeim sýndist. Pessu getur les-
andi vanist eins og öðru. En nú á dögum
þykir gleggra að skipta orðum eftir
föstum reglum og auðkenna skiptingu
með striki. Til þess eru greinarmerki að
vera til glöggvunar í lesmáli.
En reglur um notkun greinarmerkja
hafa ekki alltaf hlotið mikið lof í þessu
landi, og margur hefir talið sig yfir það
hafinn að hokra að slíkum hégóma. Eigi
að síður er nú svo komið á tölvuöld að
mörgum blöskrar hvernig vélarnar slíta
orðin í sundur. Tölvunotkun hefir því
orðið til þess að beina vaxandi athygli að
skiptingu orða milli lína, og þá auðvitað
vélrænni orðskiptingu.
Margir hafa spreytt sig á þvt að semja
sem fullkomnust orðskiptingarforrit handa
tölvum. Hver þjóðtunga hefir sínar
reglur um skiptingu orða milli lína, svo að
forrit, sem miðað er til dæmis við ensku,
kemur íslendingum að litlum notum. Nú
eru liðin mörg ár síðan fyrst voru gerðar
tilraunir til að bæta úr þessu hér, en
árangur var lítils virtur í fyrstu. Síðustu
misserin hafa ýmsir glímt við þetta verk-
efni, og nú er loksins komið á markaðinn
býsna duglegt íslenskt orðskiptingarfor-
rit, sem Reiknistofnun Háskólans og
íslensk málstöð hafa haft samvinnu um.
Höfundur forritsins, sem heitir „Skipta",
er Magnús Gíslason reiknifræðingur.
Hann hefir einnig tekið saman handbók
eða leiðarvísi um notkun þess og er hún
nýkomin út á vegum Reiknistofnunar
Háskólans. íslensk málstöð sagði fyrir
um orðskiptingar, og er ég ábyrgur fyrir
þeim hluta verksins. Par sem hér er um
nýjung að ræða þykir mér rétt að gera
nokkra grein fyrir því sem að mér snýr í
þessu verki.
Orðasafnið
í orðasafninu, sem lagt var til grundvall-
ar, voru um 200 þúsund mismunandi
orðmyndir, teknar úr ýmsum tölvu-
tækum orðaskrám og textum í vörslu
málstöðvar og Reiknistofnunar, svo sem
skáldsögum, dagblaðaefni, orðabók Blön-
dals, Lagasafni, símaskrá o.fl. Starfsfólk í
málstöðinni fór yfir dágóðan hluta af
heildarsafninu og setti inn skiptingar þar
sem við átti. Síðan var smám saman bætt
við orðum sem forritið skipti til bráða-
birgða, betur og betur eftir því sem það
þroskaðist. Að lokum fór ég yfir allt
safnið og gerði þær lagfæringar og breyt-
ingar sem ég taldi við þurfa. Þetta var
býsna fróðleg yfirferð og vakti upp at-
hyglisverðar spurningar. Ég geng þess
ekki dulinn að í orðskiptingunni, eins og
hún varð, eru mörg álitamál. En ekki var
annars kostur en fara fljótt yfir sögu og
hugsa þá fremur til þess að bæta árang-
urinn í annarri útgáfu.
Reynt var að hafa orðasafnið sem allra
fjölbreyttast svo að forritið gæti sem best
ráðið við hversdagslegt íslenskt lesmál
með kostum þess og göllum. Þá þurfti til
dæmis að gæta þess að hafa með æðimikið
27