Málfregnir - 01.10.1988, Blaðsíða 29
sýndarsamsetningar. Þaö hugtak kom í
góðar þarfir við lausn þessa orðskiptingar-
verkefnis. Vel má vera að ég hafi notað
það um of, talið of mörg orð til sýndar-
samsetninga, en hverju sinni reyndi ég að
meta það og úrskurða með rökum hvar
skipta skyldi. Mér er þó ljóst að í þessu
efni náðist ekki fullt samræmi. Hér þyrfti
vandlegri íhugun eða rannsókn að koma
til.
í sumum tökuorðum var uppruni látinn
ráða, eða a.m.k. stuðst við hann þótt
hann sé ekki augljós í íslensku. Það á til
dæmis við um þýskættaða orðið her-bergi
og ýmis orð af latneskum uppruna, svo
sem pró-fastur og pró-fessor og manns-
nafnið Bene-dikt. Um orðið appelsína
má deila. En með hliðsjón af frummerk-
ingu orðsins, „epli frá Kína“, freistaðist
ég til að skipta samkvæmt því: app-el-
sína (en ekki app-els-ína).
Þeir sem nota forritið með þessum
skiptingum verða að hafa í huga að þær
eru ekkert til að treysta á um sundur-
hlutun orða eftir uppruna. Slíkt hlutverk
er þeim ekki ætlað.
Geta forritsins
Eins og Magnús Gíslason bendir á í
handbókinni um forritið getur engin vél
ráðið við skiptingu orðmynda sem eru
algerlega tvíræðar, nema einhver viðbót-
arvitneskja komi til. Eitthvað er auð-
vitað um slíkar orðmyndir í íslensku,
þ.e. orðmyndir sem verður að skipta á
mismunandi vegu eftir merkingu. En
ástæðulaust er að mikla þetta fyrir sér.
Dæmi má vissulega finna, en þessi orð
eru hvorki mörg né tíð. Magnús nefnir
dæmið heimsendir, sem skiptist eftir
atvikum heims-endir eða heim-sendir.
Forritið hefir einungis fyrri skiptinguna
því að líklegt var talið að hún gerði oftar
vart við sig en hin.
Hér á undan hefir verið vikið að
umdeilanlegum skiptingum og nú einnig
að tvíræðum orðmyndum. En þar að
auki má búast við einhverjum skiptingar-
villum sem mér hefir sést yfir. Nú þegar
er mér kunnugt um a.m.k. eina sem ég
get nefnt. Hún er sú að orðinu áttœr-
ingur hefir í ógáti verið skipt át-tæringur.
Þrátt fyrir einhverja agnúa bendir allt
til þess að forrit Magnúsar Gíslasonar
ráði furðuvel við skiptingu orða milli
lína í íslensku lesmáli. Það var prófað á
dagblaðatexta með blönduðu efni. Hann
var 15937 lesmálsorð alls og 5067 mis-
munandi orðmyndir. í öllum textanum
voru 11023 leyfilegir skiptistaðir (flestum
orðum er ekki hægt að skipta). Af þeim
fann forritið 10639 staði eða 95,52%.
Það vildi leyfa skiptingu á 53 stöðum,
sem teljast óleyfilegir samkvæmt reglum,
og er það um 0,48%. Ef einungis eru
teknir þeir skiptistaðir, sem forritið
fann, eru 99,51% réttir og aðeins 0,49%
rangir. Það held ég að megi teljast glæsi-
legur árangur í fyrstu útgáfu.
Við sem höfum staðið að þessu verki
höfum í hyggju að endurbæta það og
stefnum að annarri útgáfu þegar fram
líða stundir. Okkur væri mikil þökk í
ábendingum frá þeim sem nota forritið,
og raunar eru allar skynsamlegar og
vinsamlegar athugasemdir um skiptingu
orða í íslensku vel þegnar. Þeim má
beina til íslenskrar málstöðvar.
29