Morgunblaðið - 03.07.1981, Page 18
18
MORGUNBLAÐIÐ, FÖSTUDAGUR 3. JÚLÍ1981
Norrænt tölvunarnámskeið
Baldur Jónsson, dósent
Hvernig nota má tölvur
við málfræðirannsóknir
Baldur Jónsson, dósent, námskeiðsstjóri á Norræna máltölvunar-
námskeiðinu, sem haldið er i Háskóla íslands.
í Iiáskóla ísiands er nú hald-
ið norrænt máltölvunarnám-
skeið <>k taka þátt i þvi tuttugu
málíra'ðinttar <>k tölvufræð-
inKar frá norðurlöndum. betta
er í fyrsta skipti sem slíkt
námskeið er haldið hérlendis en
áður hafa verið haldin sams-
konar námskeið í Svíþjóð. Nor-
etfi ok Danmörku. Þetta nám-
skeið er haldið m.a. með styrk
frá stjórn Norrænna vísinda-
námskeiða. Námskeiðsstjóri er
Baldur Jonsson. dósent, <>k
saKði hann að í þessu fælist
viðurkenninK á því starfi, sem
hér fer fram á sviði máltölvun-
ar. því styrkurinn væri aðeins
veittur til staða þar sem að-
staða til rannsókna þykir K*>ð.
Mbl. átti stutt spjall við Baldur
ok spurði hann fyrst hvað mál-
tölvun væri:
„Máltölvun snýst um það
hvernig nota meKÍ tölvur til að
leysa málfræðileK verkefni af
ýmsu taKÍ,“ saRði Baldur. Notkun
tölva í þessu skyni hófst fyrir
alvöru á sjötta tUK aldarinnar en
þá voru tilraunir Kerðar til þess
að láta tölvu þýða texta. Þetta er
hinsveKar mjöK erfitt ok menn
snéru sér að einfaldari verkefn-
um, könnun á tíðni orða, Kerð
orðalykla o.fl.
— Geturðu nefnt ákveðin dæmi
um vandamál í málfræði sem
unnt er að leysa með aðstoð tölvu?
— Tölvur hafa verið notaðar til
þess að kanna tíðni orða ok stafa í
tunKumálum eða ákveðnum texta
ok þessháttar rannsóknir hafa
verið Kerðar á íslensku máli við
Háskólann. HæKt er að finna
hvaða stafir raðast oftast saman
o.s.frv. Með aðstoð tölvu er hægt
að fá lista yfir öll orð sem ríma
o.s.frv.
— Við hverslaKs textarann-
sóknir er haKkvæmt að hafa orðin
á tölvu og hafa tölvur t.d. verið
notaðar til að leita að höfundi
texta, sem ekki var vitað um
höfund að áður.
— Fyrsta verkefnið af þessu
tagi, sem unnið var að hérlendis
var framkvæmt af þeim Baldri
Jónssyni, dósent, Birni Ellerts-
syni og Sven Þ. Sigurðsson og
hafa niðurstöður þess komið út á
prenti. „Megintilgangurinn með
þessari tilraun var að kanna
hvort mögulegt væri að nota tölvu
við rannsóknir á íslensku ritmáli
og þar sem við gerðum okkur
góðar vonir um að það væri
mögulegt var verkefnið mótað
með það í huga að árangurinn
kæmi að beinum notum ef ráðist
yrði í að tölvuvinna orðabók. Við
völdum skáldsöguna „Hreiðrið"
eftir Ólaf Jóhann Sigurðsson og
komum henni í tölvutækt form.
Við væntum þess að fá þríþættar
niðurstöður. í fyrsta lagi væri
með þessu úrtaki hægt að gera
tíðniorðabók, þ.e. skrá orð eftir
því hvað þau kæmu oft fyrir í
textanum. í ljos kom að orðið „að“
kom oftast fyrir í bókinni. í öðru
lagi var með þessu ætlunin að
gera orðstöðulykil, þ.e. skrá orða í
stafrófsröð ásamt samhengi hvers
orðs í textanum. Samhliða þessu
var svo athugað ýmislegt annað,
t.d. tíðni stafa og stafasambanda.
Stafurinn „a“ mun vera algeng-
astur en á eftir koma „n“, „i“, „r“
og „s“. Upplýsingar um hvaða orð
séu algengust í ákveðnu tungu-
máli má nota við tungumála-
kennslu, þegar ákveðið er hvaða
orð skuli höfð í lesefninu.
Þegar miklum fjölda orða hefur
verið komið inn í tölvu má nota
þann forða til þess að fá fram
margvíslegar upplýsingar um
tíðni orða og stafa, beygingar-
fræði, setningarfræði o.fl.
Á námskeiðinu nú er athyglinni
einkum beint að merkingarfræð-
inni, hvernig best er að skýra
merkingu orða þannig að unnt sé
að nota orðasafn á vélrænan hátt
við textagreiningu. Kennarar á
námskeiðinu eru þau Jerry
Hobbs, frá Stanford Research
Institute, Sture Allén, vararektor
Gautaborgarháskóla, Maurice
Gross, forstöðumaður máltölvun-
arstofnunar við Parísarháskóla,
Bente Maegaard og Hanne Ruus
frá Kaupmannahafnarháskóla.
Þeir sem taka þátt í námskeiðinu
eru allir reyndir fræðimenn og
sumir vel þekktir.
Bandaríkjamaðurinn hefur ver-
ið að kenna okkur að nýta forrit-
unarmál, LISP, sem er sérstak-
lega vel fallið til rannsókna í
málvísindum, og höfum við m.a.
verið að æfa okkur í notkun þess,“
sagði Baldur.
Sturc Allén, vararektor Gautaborgarháskóla:
Bæði fræðilegt
og hagnýtt gildi
Meðal kcnnara á norræna
máltölvunarnámskeiðinu er
prófessor Sture Allén, vararekt-
or Gautaborgarháskóla. en
hann er frumkvöðull á sviði
máltölvunarrannsókna <>g
stjórnar máltölvunarstofnun
háskólans i Gautaborg
(Sprákdata). Iiann er norrænu-
fræðingur að mennt ok er vara-
formaður sænsku málnefndar-
innar. í fyrra var hann kjörinn
í Sænsku akademiuna. Hann
var fyrstur manna á Norður-
löndum til að kanna ritaðan
texta mcð aðstoð tölvu <>k gaf út
fyrstu alhliða tíðniorðabokina i
heiminum. Mbl. ræddi stuttlega
við Ailén.
„Máltölvunarfræði hefur bæði
hagnýtt og fræðilegt gildi. Tölv-
ur geta komið að gagni t.d. við
bókaútgáfu og sparað mikinn
prófarkalestur. Tölvan getur
skipt orðum milli lína ef hún er
mötuð á þeim reglum, sem gilda
í því sambandi.
Það getur einnig verið hagnýtt
við kennslu að vita hvaða orð
koma oftast fyrir í tungumálinu.
Sprákdata er nú að vinna að
gerð orðabókar fyrir erlenda
farandverkamenn í Svíþjóð, og
við það verk er tekið mið af
tölulegum upplýsingum um
hvaða orð eru oftast notuð í
daglegu lífi.
Tölvutækur orðaforði er hag-
nýtt hjálpartæki fyrir fræði-
menn, því þeir geta leitað til
hans viiji þeir fá dæmi um
ákveðin málfræðileg atriði í
miklu magni. Hjá Sprákdata
höfum við safnað saman miklum
upplýsingum um notkun og
merkingu orða, sem geta komið
fræðimönnum að gagni við
margvíslegar rannsóknir, t.d. á
sagnorðum, samsettum nafnorð-
um o.fl.
í Svíþjóð og víðar hafa verið
framleiddar tölvur fyrir mál-
leysingja, sem hafa að geyma
níu hundruð orð og getur mál-
leysinginn kallað fram það orð
sem hann vill með því að ýta á
einn takka.
— Hvernig fékkstu áhuga á
tölvumálfræði?
„Ég var að vinna að doktors-
ritgerð, sem fjallaði um texta frá
17. öld og fól verkefnið m.a. í sér
útgáfu á textanum. Ég komst
fljótt að því að mér var nauðsyn-
Sture Allén, kennir á Norræna
tölvunámskeiðinu. Ilann er m.a.
vararektor Gautahorgarhá-
skóla og félagi i Sænsku aka-
demiunni.
legt að geta flett upp mismun-
andi rithætti og notkun orðanna
í textanum og ég sá að tölva gat
verið hagnýtt hjálpartæki til
þess. Þetta var árið 1961 og ég
vann að útgáfu þessarar bókar
með aðstoð tölvunhar. Þetta var
í fyrsta skipti sem þessari tækni
var beitt við bókaútgáfu á
Norðurlöndum og þótt víðar
væri leitað.
Þremur árum síðar skipulagði
ég rannsókn á merkingu og
notkun sænskra orða og margs-
konar orðabækur hafa verið ger-
ðar sem byggja á þeirri ran-
nsókn. Sem efnivið í rann-
sóknina völdum við milljón orð
úr sérstaklega völdum greinum
sænskra dagblaða frá 1965.“
Að hverju vinnur Sprákdata
nú?
„Um helmingur starfsfólksins
vinnur að gerð nýrrar orðabók-
ar. Eins og ég nefndi áðan er
unnið að gerð orðabókar fyrir
innflytjendur, en innflytjendur í
Svíþjóð tala um 150 mismunandi
tungumál. Ríkisstjórnin hefur
ákveðið að kosta nýja heildarút-
gáfu á verkum August Strindb-
ergs. Hún verður sjötíu bindi og
verður hún unnin í tölvu.
Nýlega gerðum við könnun á
málfari þingmanna á sænska
þinginu. Við höfðum aðgang að
öllu því sem sagt var í ræðustól í
þinginu á árunum 1978—79. Alls
féllu 4 milljónir orða af vörum
þingmanna á þessu tímabili.
Gera má samanburð á umræðu-
efni ungra og gamalla þing-
manna, ka.'la og kvenna o.s.frv.
Hvað áttu von á að textar-
annsóknir með aðstoð tölvu geti
náð langt?
„Tölvurannsóknum á máli
verða alltaf ákveðin takmörk
sett og ég á ekki von á að tölva
eigi eftir að geta greint texta til
hlítar, en tölvan gerir kleift að
læra margt um málið, sem enn
er órannsakað," sagði Sture All-
én að lokum.
TIL ÍSLAi
LESTUNÍ
ERLENDUM
AMERIKA
PORTSMOUTH
Berglind
Ðakkafoss
Berglind
Bakkafoss
NEWYORK
Goöafoss
Bakkafoss
Bakkafoss
HALIFAX
Goöafoss
13. júlí
22. júlí
3. ágúst
12. ágúst
11. júlí
24. júlí
14. ágúst
13. júlí
BRETLAND/
MEGINLAND
Eyrarfoss 6. júlí
Álafoss 13. júlí
Eyrarfoss 20. júlí
Álafoss 27. júlí
ANTWERPEN
Eyrarfoss 7. júlí
Álafoss 14. júlí
Eyrarfoss 21. júlf
Álafoss 28. júlí
FELIXSTOWE
Eyrarfoss 8. júlí
Álafoss 15. júlí
Eyrarfoss 22. júlí
Álafoss 29. júlí
HAMBORG
Eyrarfoss 9. júlí
Álafoss 16. júlí
Eyrarfoss 23. júlí
Álafoss 30. júlí
WESTON POINT
Urriöafoss 15. júlí
Urriöafoss 29. júlí
Urriöafoss 10. ágúst
Urriöafoss 26. ágúst
NORÐURLÖND/
EYSTRASALT
BERGEN
Dettifoss 13. júlí
Dettifoss 27. júlí
Dettifoss 10. ágúst
KRISTIANSAND
Mánafoss 6. júlí
Mánafoss 20. júlí
Mánafoss 3. ágúst
MOSS
Mánafoss 7. júlí
Dettifoss 14. júlí
Mánafoss 21. júlí
Dettifoss 28. júlí
ÞRÁNDHEIMUR
Selfoss 6. júlí
GAUTABORG
Mánafoss 8. júlí
Dettifoss 15. júlí
Mánafoss 22. júlí
Dettifoss 29. júlí
KAUPMANNAHÖFN
Mánafoss 9. júlí
Dettifoss 16. júlí
Mánafoss 23. júlí
Dettifoss 30. júlí
HELSINGBORG
Mánafoss 10. júli
Dettifoss 17. júlí
Mánafoss 24. júlí
Dettifoss 31. júlí
HELSINKI
Múlafoss 10. júlí
írafoss 20. júlf
Múlafoss 28. júlí
RIGA
Múlafoss 13. júlf
írafoss 23. júlí
Múlafoss 30. júlí
GDYNIA
Múlafoss 14. júlí
írafoss 24. júlí
Múlafoss 31. júlf
THORSHAVN
Mánafoss
frá Reykjavík 16. júlí
VIKULEGAR
STRANDSIGLINGAR
- fram og til baka
frá REYKJAVÍK alla mánudaga
frá ISAFIRDI alla þriöjudaga
frá AKUREYRI alla fimmtudaga
EIMSKIP
SIMI 27100