Íslenskt mál og almenn málfræði - 01.01.2001, Page 75
73
Tungumál, tölvur og tungutœkni
1- Samspil tölva og tungumáls
Áður en lengra er haldið er rétt að huga að merkingu ýmissa orða og
hugtaka sem tengjast tölvunotkun í málrannsóknum (sjá líka Eirík
Rögnvaldsson 2001). Ekki er mikil hefð fyrir íslensku orðafari á þessu
sviði og orðanotkun hefur verið nokkuð á reiki. Hér verða tekin fyrir
hugtökin máltölvun, tölvufræðileg málvísindi, gagnamálfræði og
tungutækni. Það fyrsttalda er nokkuð þekkt en hefur verið notað í
víðri og óljósri merkingu. Síðastnefnda orðið er nýlegt en hefur hlot-
ið mikla útbreiðslu á skömmum tíma. Hin tvö eru svo nýyrði sem ekki
hafa fengið fastan sess enn og ekki er ljóst hvemig reiðir af.
1-1 Máltölvun, tölvufrœðileg málvísindi, gagnamálfrœði
Elsta orðið um tölvunotkun við málrannsóknir er líklega máltölvun,
sem Baldur Jónsson (1975) bjó til fyrir 30 ámm. Þetta orð samsvarar
einna helst því sem nefnist linguistic computing á ensku, eða lin-
guistic and literary computing. Það á við hvers kyns notkun tölva
við lausn mállegra verkefna. Þar getur verið um að ræða talningar orða
°g bókstafa, gerð tíðniskráa, orðstöðulykla, orðabókagerð o. s.frv.
Þetta em verkefni sem í sjálfu sér væri hugsanlegt að vinna án aðstoð-
ar tölvunnar en yrðu mörg hver aldrei unnin í höndunum vegna þess
hversu umfangsmikil þau em. Oft þarf litla tölvuþekkingu til að leysa
þessi verk af hendi; þau em unnin með hjálp tilbúinna forrita eða for-
rítapakka s.s. WordSmith, WordCruncher o. s. frv.
Með tölvufræðilegum málvísindum, eða computational lingu-
istics, er aftur á móti frekar átt við það að matreiða tungumálið þann-
ig handa tölvum að þær geti framkvæmt málfræðilega greiningu. Slík
greining er aftur undirstaða þess að hægt sé að nota tölvur við vélræn-
ar þýðingar, lemmun, talgreiningu o.fl. Þar er sem sé verið að semja
nýja tegund mállýsingar, þar sem taka þarf tillit til ýmissa atriða sem
ekki skipta máli þegar málfræðingar sjá um greininguna. Stundum
kemur gerð hugbúnaðar inn í þetta en venjulega em þó sérstakir for-
ritarar sem sjá um þá hlið mála. Það breytir ekki því að þeir sem semja
niállýsinguna þurfa að hafa góða hugmynd um það hvemig tölvur
vinna; hvað þær geta gert og hvað ekki.