Tölvumál - 01.10.1991, Blaðsíða 20
Október 1991
til óplægður akur. Núverandi
gerð forritsins getur ekki greint
orð sem líta eins út en hafa
mismunandi merkingu. Orðið
"á" hefur til dæmis a.m.k. fjórar
merkingar í þremur orðflokkum
og mörg orð geta verið hvort
sem er sögn eða nafnorð þegar
þau eru skoðuð ein sér. Slík
margræðni er enn algengari en
okkur hafði grunað. í einni
vinnuútgáfu var farin sú leið að
láta tölvuna spyrja notandann
um vafaatriði í hvert sinn sem
þau komu upp. Þær umræður
tóku of mikið af tfma notandans,
en í framtíðinni má láta forritið
geyma svörin þannig að ekki
þurfi að spyrja aftur um sömu
orðin ef farið er yfir textann í
annað sinn. Einnig má kenna
tölvunni fleiri reglur um
orðmyndir en nú eru tiltækar á
vélrænu formi og enn vantar alla
greiningu á samhengi, sem oft
tekur afvafa, t.d. um orðflokka.
Þróun á næstunni
Þróa þarf samhliða notendaskil
forritsins og framsetningu á
málfræðigögnum. Við prófanir
koma fram mýmörg atriði sem
þurfa lagfæringa við og þarf þá
ýmist að laga notendaskilin eða
auka við málfræðiupplýsingar í
gagnagrunni forritsins.
í Ritvelli eru notaðar aðgerðir
sem áður voru notaðar í Púkanum.
Grunnforritin í Púkanum er
annarsvegar forrit sem finnur
eins konar frummynd orða og
hinsvegar forrit sem skilar
beygingarmyndum. Þessi forrit
nota orðstofnaskrá með upp-
lýsingum um beygingarflokka og
samsetningarmöguleika orða.
Þau eru notuð til þess að finna
grunngerð orðs innan úr
samfelldum texta áður en leitað
er í samheitasafni og til þess að
setja upp beygingarmyndir auk
þess að yfirfara stafsetningu.
Hnökrar eru á núverandi vinnslu
í Ritvelli eins og sést á því að
forritið tekur gild ýmis ótæk orð
og gerir tillögur um samheiti
sem eiga ekki við í samhenginu.
Annars vegar er þetta vegna þess
að notað er samheitasafn með
orðum án viðbótarupplýsinga s.s.
orðflokka og beygingarflokka og
hinsvegar vegna ófiillnægjandi
upplýsinga um samsetningar.
Einnig vantar allar upplýsingar
um samhengi.
Frekari þróun ritvinnslu á íslensku
máli er verkefni sem ekki er
sjáanlegt að ljúki, þótt greina
megi áfanga sem gera mikið gagn
svo langt sem þeir ná. Af hálfu
málfræðinnar vantar málfræði-
upplýsingar á formi sem hentar
til notkunar í ritvinnslu og
væntanlega þarf að fínvinna
kenningar um flokkaskiptingu og
jafnvel nálgast viðfangsefnin út
frá nýju sjónarhorni. Miklar
upplýsingar eru þó til, sem unnt
er að setja upp fyrir tölvu án
djúprar þekkingar á nýjustu
rannsóknum, m.a. í Samheita-
orðabók. Þróun á Ritvelli er nú
komin á það stig að koma þarf á
samvinnu við fræðimenn í
Háskólanum á sviði íslensku, en
til þessa hafa grunnskólakennarar
séð um móðurmáls- og
kennslufræðiþátt verksins.
Næsti áfangi á leið til bættrar
vinnslu er að vinna við
samheitasafnið, bæði við að
merkja orðin, þróa aðgang að
safninu og reyna að greina með
hvaða hætti orð eru samheiti.
Þessi hluti er mestur hrein
rannsóknarvinna.
Annar áfangi er að bæta
upplýsingar f grunnforritunum
um beygingarmyndir og sam-
setmngar til þess að fekka ótækum
orðum sem forritin samþykkja.
Rétt er að líta á núverandi gerð
sem frumgerð, málvillur sem
sleppa athugasemdalaust í gegn
um forritið stafa af því að það er
ekki fullkomið fremur en af því
að aðgerðin sem notuð er sé
röng. Þetta þarf þó að vinna að
hluta til samhliða vinnu með
samheitin.
Þriðji áfangi gæti verið að vinna
með setningaffæði og upplýsingar
um samhengi í stao þess að vinna
með einstök orð. Núverandi
forrit getur ekki fundið samheiti
við orðasambönd, heldur vinnur
það eingöngu með orð. Einnig
væru góðar upplýsingar um
samhengi leið til þess að finna
ritvillur af þeirri gerð að eitt
löglegt orð komi í stað annars,
þótt það falli ekki inn f
setningafræðilegt samhengi.
Vinna þarf að kennsluleiðbein-
ingum sem miða að þvf að forritið
verði notað sem hjálpartæki án
þess að umturna eldra skipulagi
kennslunnar.
Hugmyndin er að þróa hjálpartæki
fyrir nemendur sem eru að semja
og endurvinna ritgerðir. Forritið
á að hvetja þá til þess að velta
fyrir sér ýmsumþáttum sem hafa
áhrif á framsetningu ritaðs máls.
Sum þessara atriða er svo sem
unnt að vinna án tölvu.
Meginkostur tölvunnar sem hér
er notaður er að hún vinnur
sjálfvirkt verk sem notendur
vanrækja oft að vinna í
höndunum. Hún getur flett upp
miklu fleiri atriðum en unnt er að
gera í orðabókum á þeim tíma
sem til umráða er fýrir ritun.
Auk þess er auðveldara að lagfæra
texta sem skrifaður er f tölvu en
það sem hefur verið skrifað á
blað.
20 - Tölvumál