UTBlaðið - 20.01.2006, Page 27
UTBLAÐIÐ | 27
Vefur Reykjavíkurborgar er um þessar mundir að breytast
í gagnvirka þjónustumiðstöð á netinu.
Frá og með næstu mánaðamótum geta borgarbúar
nýtt sér rafrænar umsóknir og málsmeðferð vegna:
Reykjavik.is
– fijónustumi›stö› á vefnum
www.reykjavik.is
fiJÓNUSTA FYRIR fiIG
Grunnskóla
Leikskóla
Frístundaheimila
Tónlistarskóla
Vinnumiðlunar ungs fólks
Fleiri umsóknarferlar munu svo
bætast við en eyðublöð verða
einnig aðgengileg til útprentunar auk
þess sem aðgengi að
upplýsingum um þjónustu
og stjórnkerfi borgarinnar verður
bætt verulega.
Um þessar mundir er vinnu við
nýjan íslenskan þul að ljúka. Þul-
ur (talgervill) er búnaður sem les
upp (rafrænan) texta með sem
eðlilegustum framburði. Slíkur
búnaður hefur verið til fyrir ís-
lensku síðan um 1990 og hefur
gagnast blindum og sjónskertum
mjög vel. En á undanförnum
árum hefur tækni á þessu sviði
fleygt fram og nýi þulurinn mun
því standa þeim gamla langtum
framar, bæði í framburði einstakra
málhljóða og ekki síður í eðlilegu
íslensku tónfalli.
Þulurinn er samstarfsverkefni
Símans, Hex hugbúnaðar og Mál-
vísindastofnunar Háskóla Íslands
og kostaður að talsverðu leyti af
tungutækniáætlun menntamála-
ráðuneytisins. Notuð er tækni frá
fyrirtækinu Nuance (áður
ScanSoft) sem er leiðandi á þessu
sviði í heiminum. Aðstandendur
þularins hafa góða reynslu af
samstarfi við fyrirtækið síðan það
vann með þeim að gerð íslensks
talgreinis fyrir tveimur árum (Hjal-
verkefnið). Þjálfun þularins fór
fram í starfsstöð fyrirtækisins í
Belgíu. Björn Kristinsson, MA í
tungutækni og starfsmaður Hex,
dvaldist þar um nokkurra mánaða
skeið og vann að verkinu með
sérfræðingum Nuance.
Ragnheiður Elín Clausen lagði
þulnum til rödd. Tekinn var upp
lestur hennar á miklum fjölda fjöl-
breyttra íslenskra setninga sem
eru valdar þannig að í þeim komi
fyrir mörg dæmi um öll hljóð og
hljóðasambönd málsins, svo og
öll algengustu orð og orðasam-
bönd. Einnig þarf mismunandi
tónfall að koma fram. Þessar
hljóðskrár eru síðan greindar í
einingar með sérstakri tækni og
komið fyrir í gagnasafni þularins.
Þegar þulurinn les texta leitar
hann alltaf í gagnasafni sínu að
lengstu tiltæku samsvörun við
þann texta sem lesa skal. Eigi
hann t.d. að lesa „gott veður“ er
ekki ótrúlegt að það samband sé
að finna í heilu lagi í gagnasafn-
inu, vegna þess hversu algengt
það er, og þá er það að sjálf-
sögðu notað sem heild. Þurfi hins
vegar að lesa sjaldgæfara sam-
band eins og „gott áramótaveður“
er ekki líklegt að það sé til sem
heild, en þá er steypt saman
„gott“ úr öðru sambandi (t.d. „gott
kvöld“) og „áramótaveður“ ef það
er til í gangasafninu. Sé „áramóta-
veður“ hins vegar ekki til sem
heild er hægt að búa orðið til úr
einstökum orðhlutum sem teknir
eru úr öðrum orðum, eða jafnvel
einstökum málhljóðum. Eftir því
sem meira þarf að klippa saman
hljóð og orðhluta á þennan hátt
eykst þó alltaf hættan á hnökrum
á framburði, og þess vegna skiptir
miklu máli að gagnasafnið sem
byggt er á sé stórt og vel valið.
Nýtist almenningi í daglegu lífi
Eins og áður segir hefur sá þulur
sem til hefur verið fram að þessu
einkum nýst blindum og sjón-
skertum. Nýi þulurinn mun að
sjálfsögðu koma þessum hópum
að gagni, en honum er þó ekki
síður ætlað að nýtast öllum al-
menningi á ýmsum sviðum dag-
legs lífs. Gera má ráð fyrir að
hann verði notaður í ýmiss konar
þjónustuverum, bankalínum,
pöntunarsímum o.þ.h. Með til-
komu hágæða þular og talgreinis
opnast nýir möguleikar á margs
konar öruggri og skjótvirkri þjón-
ustu við almenning, sem jafnframt
getur leitt til verulegs sparnaðar
hjá þeim fyrirtækjum og stofnun-
um sem taka þennan búnað í
notkun.
Á skýringarmyndinni er sýnt
kerfi sem þarf til að veita þjón-
ustu sem byggist á notkun þular
og talgreinis. Sá sem óskar þjón-
ustu hringir í kerfið, þulurinn
svarar, segir deili á þjónustunni
og spyr hvers óskað er. Maðurinn
svarar því, talgreinirinn skynjar
svarið og sendir tölvunni (við-
mælanda) upplýsingar um það
sem óskað er eftir. Jafnframt held-
ur tölvan uppi samræðum við
hringjandann gegnum þulinn og
veitir honum þá þjónustu sem um
var beðið. Þulurinn og talgreinir-
inn gefa kost á því að gera margs
konar þjónustu sjálfvirka sem
hingað til hefur krafist mannafla.
Hér eru áskorun og tækifæri fyrir
hugbúnaðarsmiði að nýta sér
þessa tækni til að búa til hugbún-
aðarkerfi sem byggjast á tungu-
tækninni. Hægt er að hlusta á tal-
dæmi frá þulnum með því að fara
á slóðina http://talgervill.hexia.net
Nýr íslenskur „þulur“ að koma á markað
– eftir Eirík Rögnvaldsson, Háskóla Íslands, Björn Kristinsson, Hexsoftware, og Sæmund E. Þorsteinsson, Símanum
Ragnheiður Elín Clausen.