Tölvumál


Tölvumál - 01.10.1991, Blaðsíða 20

Tölvumál - 01.10.1991, Blaðsíða 20
Október 1991 til óplægður akur. Núverandi gerð forritsins getur ekki greint orð sem líta eins út en hafa mismunandi merkingu. Orðið "á" hefur til dæmis a.m.k. fjórar merkingar í þremur orðflokkum og mörg orð geta verið hvort sem er sögn eða nafnorð þegar þau eru skoðuð ein sér. Slík margræðni er enn algengari en okkur hafði grunað. í einni vinnuútgáfu var farin sú leið að láta tölvuna spyrja notandann um vafaatriði í hvert sinn sem þau komu upp. Þær umræður tóku of mikið af tfma notandans, en í framtíðinni má láta forritið geyma svörin þannig að ekki þurfi að spyrja aftur um sömu orðin ef farið er yfir textann í annað sinn. Einnig má kenna tölvunni fleiri reglur um orðmyndir en nú eru tiltækar á vélrænu formi og enn vantar alla greiningu á samhengi, sem oft tekur afvafa, t.d. um orðflokka. Þróun á næstunni Þróa þarf samhliða notendaskil forritsins og framsetningu á málfræðigögnum. Við prófanir koma fram mýmörg atriði sem þurfa lagfæringa við og þarf þá ýmist að laga notendaskilin eða auka við málfræðiupplýsingar í gagnagrunni forritsins. í Ritvelli eru notaðar aðgerðir sem áður voru notaðar í Púkanum. Grunnforritin í Púkanum er annarsvegar forrit sem finnur eins konar frummynd orða og hinsvegar forrit sem skilar beygingarmyndum. Þessi forrit nota orðstofnaskrá með upp- lýsingum um beygingarflokka og samsetningarmöguleika orða. Þau eru notuð til þess að finna grunngerð orðs innan úr samfelldum texta áður en leitað er í samheitasafni og til þess að setja upp beygingarmyndir auk þess að yfirfara stafsetningu. Hnökrar eru á núverandi vinnslu í Ritvelli eins og sést á því að forritið tekur gild ýmis ótæk orð og gerir tillögur um samheiti sem eiga ekki við í samhenginu. Annars vegar er þetta vegna þess að notað er samheitasafn með orðum án viðbótarupplýsinga s.s. orðflokka og beygingarflokka og hinsvegar vegna ófiillnægjandi upplýsinga um samsetningar. Einnig vantar allar upplýsingar um samhengi. Frekari þróun ritvinnslu á íslensku máli er verkefni sem ekki er sjáanlegt að ljúki, þótt greina megi áfanga sem gera mikið gagn svo langt sem þeir ná. Af hálfu málfræðinnar vantar málfræði- upplýsingar á formi sem hentar til notkunar í ritvinnslu og væntanlega þarf að fínvinna kenningar um flokkaskiptingu og jafnvel nálgast viðfangsefnin út frá nýju sjónarhorni. Miklar upplýsingar eru þó til, sem unnt er að setja upp fyrir tölvu án djúprar þekkingar á nýjustu rannsóknum, m.a. í Samheita- orðabók. Þróun á Ritvelli er nú komin á það stig að koma þarf á samvinnu við fræðimenn í Háskólanum á sviði íslensku, en til þessa hafa grunnskólakennarar séð um móðurmáls- og kennslufræðiþátt verksins. Næsti áfangi á leið til bættrar vinnslu er að vinna við samheitasafnið, bæði við að merkja orðin, þróa aðgang að safninu og reyna að greina með hvaða hætti orð eru samheiti. Þessi hluti er mestur hrein rannsóknarvinna. Annar áfangi er að bæta upplýsingar f grunnforritunum um beygingarmyndir og sam- setmngar til þess að fekka ótækum orðum sem forritin samþykkja. Rétt er að líta á núverandi gerð sem frumgerð, málvillur sem sleppa athugasemdalaust í gegn um forritið stafa af því að það er ekki fullkomið fremur en af því að aðgerðin sem notuð er sé röng. Þetta þarf þó að vinna að hluta til samhliða vinnu með samheitin. Þriðji áfangi gæti verið að vinna með setningaffæði og upplýsingar um samhengi í stao þess að vinna með einstök orð. Núverandi forrit getur ekki fundið samheiti við orðasambönd, heldur vinnur það eingöngu með orð. Einnig væru góðar upplýsingar um samhengi leið til þess að finna ritvillur af þeirri gerð að eitt löglegt orð komi í stað annars, þótt það falli ekki inn f setningafræðilegt samhengi. Vinna þarf að kennsluleiðbein- ingum sem miða að þvf að forritið verði notað sem hjálpartæki án þess að umturna eldra skipulagi kennslunnar. Hugmyndin er að þróa hjálpartæki fyrir nemendur sem eru að semja og endurvinna ritgerðir. Forritið á að hvetja þá til þess að velta fyrir sér ýmsumþáttum sem hafa áhrif á framsetningu ritaðs máls. Sum þessara atriða er svo sem unnt að vinna án tölvu. Meginkostur tölvunnar sem hér er notaður er að hún vinnur sjálfvirkt verk sem notendur vanrækja oft að vinna í höndunum. Hún getur flett upp miklu fleiri atriðum en unnt er að gera í orðabókum á þeim tíma sem til umráða er fýrir ritun. Auk þess er auðveldara að lagfæra texta sem skrifaður er f tölvu en það sem hefur verið skrifað á blað. 20 - Tölvumál

x

Tölvumál

Beinir tenglar

Ef þú vilt tengja á þennan titil, vinsamlegast notaðu þessa tengla:

Tengja á þennan titil: Tölvumál
https://timarit.is/publication/239

Tengja á þetta tölublað:

Tengja á þessa síðu:

Tengja á þessa grein:

Vinsamlegast ekki tengja beint á myndir eða PDF skjöl á Tímarit.is þar sem slíkar slóðir geta breyst án fyrirvara. Notið slóðirnar hér fyrir ofan til að tengja á vefinn.