Árbók VFÍ/TFÍ - 01.06.2002, Page 312
þessu stigi er reiknaður lógariþmi af merkinu sem hefur ýmsa kosti í för með sér, t.d.
kemur misjafn merkisstyrkur fram sem hliðrun á lóðrétta ásnum því lógariþmi varpar
margföldun í samlagningu. Að þessu búnu er reiknuð stakræn kósínus-vörpun af merk-
inu (DCT) og er þá fengið fyrirbæri sem nefnt er kepstur (e. cepstrum) (þetta er ekki
kepstur skv. formlegri skilgreiningu þess sem er sú að kepstur er Fourier-vörpun af
lógariþma af aflrófi en ekki kósínus-vörpun).
Kósínus-vörpunin hefur í för með sér enn frekari minnkun á gagnamagni og tíðni-
þættirnir sem út úr henni koma eru tiltölulega óháðir tölfræðilega. Þetta er mikilvægt
þegar kemur að því að bera þá saman við tíðniþætti þeirra orða sem kerfið hefur lært og
geymir. Tíðniþáttunum er raðað upp í gagnavektor ásamt nokkrum öðrum mæligildum
(m.a. tímaafleiður tíðniþáttanna). Þessi gagnavektor er nú notaður til frekari vinnslu,
m.a. til þess að leita að líkum gagnavektorum í minni kerfisins, og hafa einkvæma vörp-
un til þeirra orða sem kerfið hefur lært.
I flestum talgreinum byggist þessi vinnsla á notkun svonefndra falinna Markov-líkana (e.
Hidden Markov Modeling, HMM). Þetta er náskylt Markov-keðjum sem margir þekkja
en þær eru notaðar sem líkön fyrir ákveðna gerð slembiferla. Með þessu móti er hægt að
fást við það hve breytilega fólk talar. Fróðleik um HMM er að finna í [8,9,10,11,12]. Önnur
leið sem notuð hefur verið en í mun minni mæli felst í því að nota tauganet (e. neural net-
works).
Ut úr merkinu sem talgreini berst þarf hann að greina minnstu einingar málsins sem
nefndar eru hljóðungar (e. phonems). Hljóðungarnir mynda atkvæðin sem síðan mynda
orðin. Orðin mynda svo heilar setningar. Til að þessi greining skili árangri þarf tal-
greinirinn að búa yfir upplýsingum um alla þessa þætti í tungumálinu. Þannig þarf
gagnagrunn yfir hljóðunga tungumálsins, yfir það hvernig einstök orð eru borin fram og
yfir það hvernig setningarnar eru byggðar upp, mynd 5. Nú er unnið að byggingu gagna-
grunns fyrir síðastnefnda atriðið fyrir íslensku. Þessi vinna á sér stað hjá Orðabók
Háskólans og Friðriki Skúlasyni og er styrkt af af tungutæknisjóði. Þarna er unnið mikil-
vægt starf sem verður grundvöllur að frekari landvinningum íslenskunnar.
Til þess að búa til talgreini fyrir tungumál, t.d. íslensku, þarf öll þau líkön og alla þá
þekkingu sem kemur fram á mynd 5. Hljóðungalíkan þarf að byggja upp sem segir til um
hljóðungana í tungumálinu og hvaða bókstafir eru að baki þeirra. Framburðarlíkanið
segir til um hvernig orðin eru rituð þannig að þegar greinirinn heyrir framburðinn veit
hann hvernig á að rita orðið. Orðin mynda setningar sem eru byggðar upp skv. lögmálum
málsins og þurfa að innihalda merkingu. Setningafræðilega líkanið er notað til að meta
hvort orð megi standa saman eða hvort staða þeirra í setningunni sé eðlileg. Þetta nægir
þó ekki í öllum tilvikum og verður þá að grípa til þekkingar á merkingu orðanna.
Skemmtilegt dæmi um þetta er að finna í [1]. Þar er dæmi tekið af orðinu „á". Merking
þess í setningunum „Ég sá straumharða á" og „Ég sá flekkótta á" verður aðeins ákvörðuð
út frá merkingu orðanna í
kring, þ.e. hvort takist að
greina milli fljótsins og
sauðsins. í setningunni „Ég sá
þessa á í gær" er hins vegar
ekki hægt að ákvarða hvort
fyrirbærið er á ferð. Það væri
þó hugsanlegt ef merking
næstu setninga á undan eða
eftir er skoðuð. Ef næsta setn-
ing er t.d. „Hún var með eitt
lamb" virðist málið leyst. Svo
er fyrir „mennska talgreina"
en tölvur eiga erfitt með að
3 0 8
Arbók VFl/TFl 2002