Málfregnir - 01.12.2001, Blaðsíða 14
og kennslu á háskólastigi. Erlendis er mál-
tölvun (computational linguistics) víða
kennd í háskólum, ýmist sem sérstök grein
eða innan málvísindadeilda eða tölvunar-
fræðideilda.
Mikill vöxtur hefur verið í þessum grein-
um á undanförnum árum. Langflest störf,
sem málfræðingum standa til boða við
háskóla í ensku- og þýskumælandi löndum
um þessar mundir, eru t.d. á þessu sviði.
Vitaskuld er beint samband milli þenslunnar
á þessi sviði í háskólum og hinnar öru þró-
unar sem hefur verið í tungutækni sem iðn-
grein en hún veltir nú háum fjárhæðum.
Þörf atvinnulífsins fyrir fólk með menntun
á þessu sviði hefur stóraukist og þar með
vilji til að efla slíka kennslu á háskólastigi.
Háskóli Islands hefur nú hafið undirbún-
ing að meistaranámi í tungutækni. Mennta-
málaráðuneytið gerði samning við skólann
um þetta nám og um þjónustu við verkefnis-
stjórn í tungutækni í tengslum við það.
Markmiðið með náminu er að mennta nem-
endur til þess að vinna að þróun tungutækni
fyrir íslensku, taka að sér störf á þessu sviði
í íslenskum upplýsingatæknifyrirtækjum og
miðla þekkingu sinni til annarra. Unnið
verður að rannsóknum á tungutækni fyrir
íslenska málsamfélagið með sérstakri
áherslu á lausnir sem gætu nýst öðrum fá-
mennum málsamfélögum.
Til þess að örva þróun og framleiðslu
tungutæknitóla fyrir íslensku mun mennta-
málaráðherra, að fengnum tillögum verk-
efnisstjómar um tungutækni, veita styrki til
tvenns konar verkefna. Annars vegar styrki
til þess að koma upp málsöfnum og þekk-
ingargrunnum sem nauðsynlegir em taldir
við þróun tungutæknitóla. Hins vegar er
ætlunin að styrkja fyrirtæki til þess að þróa,
framleiða og setja á markað tiltekið tungu-
tæknitól.
Til þess að unnt sé að þróa og framleiða
tungutækniverkfæri er nauðsynlegt að mikl-
ar upplýsingar um íslenskt mál liggi fyrir í
formi sem er aðgengilegt fyrir hin ýmsu
verkfæri. Hér skortir talsvert á að ástandið
hér á landi sé sambærilegt við það sem
gerist meðal nágranna okkar. Það eru þekk-
ingargrunnar af þessu tagi sem gert er ráð
fyrir að styrkja á vegum verkefnisstjórnar-
innar.
Til þess að tryggja að opinbert fé, sem
þannig er varið til þróunar þekkingargrunna,
nýtist sem best verður einungis stutt við
gerð þekkingargrunna sem atvinnufyrirtæki
á sviði tungutækni hyggst nýta til þróunar
tiltekins tungutæknitóls. Gert er ráð fyrir að
fyrirtækið, sem óskar eftir að þekkingar-
grunnur sé búinn til, taki einhverja áhættu
um að niðurstöður verði í raun nýttar. Þá er
það skilyrði að niðurstöður rannsókna af
þessu tagi verði öllum opnar til áframhald-
andi rannsókna eða til að þróa önnur
tungutækni verkfæri.
Sé ekki hægt að veita fullan aðgang að
þekkingargrunni mun tungutækniverkefnið
einungis fjármagna þann hluta verksins sem
er opinn öllum. Þannig öðlast styrkþegi ekki
eignarrétt á grunninum.
Markmiðið með þessum styrkjum er að
framleiðendur tungutæknitóla hafi aðgang
að þeirri þekkingu og þeim málsöfnum sem
þeir þurfa á að halda og að þróun slíkra tóla
fyrir íslensku verði þar með ódýrari og
auðveldari.
Af þeim upplýsingum, sem nú liggja fyrir,
virðist sem það fyrsta, sem þarf að koma
upp vegna tungutækniverkefna, sé stór
textagrunnur sem greindur verði eftir mál-
fræðilegum atriðum. Þannig verði hvert orð
greint í orðflokk og gerð grein fyrir beyg-
ingum og öðrum málfræðiatriðum eftir því
sem við á.
Textagrunnur af þessu tagi mun ekki ein-
ungis nýtast framleiðendum tungutæknitóla.
Hann mun einnig nýtast við margháttaðar
rannsóknir, bæði í tungutækni og við al-
mennar rannsóknir á íslenskri tungu.
Mikið er til af texta í tölvutæku formi, til
dæmis hjá Orðabók Háskólans, Morgun-
blaðinu, bókaútgefendum og fleirum, sem
nýst getur til að mynda slíkan grunn. Það er
hins vegar talsverð vinna að greina orða-
14