UTBlaðið - 20.01.2006, Blaðsíða 27

UTBlaðið - 20.01.2006, Blaðsíða 27
UTBLAÐIÐ | 27 Vefur Reykjavíkurborgar er um þessar mundir að breytast í gagnvirka þjónustumiðstöð á netinu. Frá og með næstu mánaðamótum geta borgarbúar nýtt sér rafrænar umsóknir og málsmeðferð vegna: Reykjavik.is – fijónustumi›stö› á vefnum www.reykjavik.is fiJÓNUSTA FYRIR fiIG Grunnskóla Leikskóla Frístundaheimila Tónlistarskóla Vinnumiðlunar ungs fólks Fleiri umsóknarferlar munu svo bætast við en eyðublöð verða einnig aðgengileg til útprentunar auk þess sem aðgengi að upplýsingum um þjónustu og stjórnkerfi borgarinnar verður bætt verulega. Um þessar mundir er vinnu við nýjan íslenskan þul að ljúka. Þul- ur (talgervill) er búnaður sem les upp (rafrænan) texta með sem eðlilegustum framburði. Slíkur búnaður hefur verið til fyrir ís- lensku síðan um 1990 og hefur gagnast blindum og sjónskertum mjög vel. En á undanförnum árum hefur tækni á þessu sviði fleygt fram og nýi þulurinn mun því standa þeim gamla langtum framar, bæði í framburði einstakra málhljóða og ekki síður í eðlilegu íslensku tónfalli. Þulurinn er samstarfsverkefni Símans, Hex hugbúnaðar og Mál- vísindastofnunar Háskóla Íslands og kostaður að talsverðu leyti af tungutækniáætlun menntamála- ráðuneytisins. Notuð er tækni frá fyrirtækinu Nuance (áður ScanSoft) sem er leiðandi á þessu sviði í heiminum. Aðstandendur þularins hafa góða reynslu af samstarfi við fyrirtækið síðan það vann með þeim að gerð íslensks talgreinis fyrir tveimur árum (Hjal- verkefnið). Þjálfun þularins fór fram í starfsstöð fyrirtækisins í Belgíu. Björn Kristinsson, MA í tungutækni og starfsmaður Hex, dvaldist þar um nokkurra mánaða skeið og vann að verkinu með sérfræðingum Nuance. Ragnheiður Elín Clausen lagði þulnum til rödd. Tekinn var upp lestur hennar á miklum fjölda fjöl- breyttra íslenskra setninga sem eru valdar þannig að í þeim komi fyrir mörg dæmi um öll hljóð og hljóðasambönd málsins, svo og öll algengustu orð og orðasam- bönd. Einnig þarf mismunandi tónfall að koma fram. Þessar hljóðskrár eru síðan greindar í einingar með sérstakri tækni og komið fyrir í gagnasafni þularins. Þegar þulurinn les texta leitar hann alltaf í gagnasafni sínu að lengstu tiltæku samsvörun við þann texta sem lesa skal. Eigi hann t.d. að lesa „gott veður“ er ekki ótrúlegt að það samband sé að finna í heilu lagi í gagnasafn- inu, vegna þess hversu algengt það er, og þá er það að sjálf- sögðu notað sem heild. Þurfi hins vegar að lesa sjaldgæfara sam- band eins og „gott áramótaveður“ er ekki líklegt að það sé til sem heild, en þá er steypt saman „gott“ úr öðru sambandi (t.d. „gott kvöld“) og „áramótaveður“ ef það er til í gangasafninu. Sé „áramóta- veður“ hins vegar ekki til sem heild er hægt að búa orðið til úr einstökum orðhlutum sem teknir eru úr öðrum orðum, eða jafnvel einstökum málhljóðum. Eftir því sem meira þarf að klippa saman hljóð og orðhluta á þennan hátt eykst þó alltaf hættan á hnökrum á framburði, og þess vegna skiptir miklu máli að gagnasafnið sem byggt er á sé stórt og vel valið. Nýtist almenningi í daglegu lífi Eins og áður segir hefur sá þulur sem til hefur verið fram að þessu einkum nýst blindum og sjón- skertum. Nýi þulurinn mun að sjálfsögðu koma þessum hópum að gagni, en honum er þó ekki síður ætlað að nýtast öllum al- menningi á ýmsum sviðum dag- legs lífs. Gera má ráð fyrir að hann verði notaður í ýmiss konar þjónustuverum, bankalínum, pöntunarsímum o.þ.h. Með til- komu hágæða þular og talgreinis opnast nýir möguleikar á margs konar öruggri og skjótvirkri þjón- ustu við almenning, sem jafnframt getur leitt til verulegs sparnaðar hjá þeim fyrirtækjum og stofnun- um sem taka þennan búnað í notkun. Á skýringarmyndinni er sýnt kerfi sem þarf til að veita þjón- ustu sem byggist á notkun þular og talgreinis. Sá sem óskar þjón- ustu hringir í kerfið, þulurinn svarar, segir deili á þjónustunni og spyr hvers óskað er. Maðurinn svarar því, talgreinirinn skynjar svarið og sendir tölvunni (við- mælanda) upplýsingar um það sem óskað er eftir. Jafnframt held- ur tölvan uppi samræðum við hringjandann gegnum þulinn og veitir honum þá þjónustu sem um var beðið. Þulurinn og talgreinir- inn gefa kost á því að gera margs konar þjónustu sjálfvirka sem hingað til hefur krafist mannafla. Hér eru áskorun og tækifæri fyrir hugbúnaðarsmiði að nýta sér þessa tækni til að búa til hugbún- aðarkerfi sem byggjast á tungu- tækninni. Hægt er að hlusta á tal- dæmi frá þulnum með því að fara á slóðina http://talgervill.hexia.net Nýr íslenskur „þulur“ að koma á markað – eftir Eirík Rögnvaldsson, Háskóla Íslands, Björn Kristinsson, Hexsoftware, og Sæmund E. Þorsteinsson, Símanum  Ragnheiður Elín Clausen.

x

UTBlaðið

Beinir tenglar

Ef þú vilt tengja á þennan titil, vinsamlegast notaðu þessa tengla:

Tengja á þennan titil: UTBlaðið
https://timarit.is/publication/1121

Tengja á þetta tölublað:

Tengja á þessa síðu:

Tengja á þessa grein:

Vinsamlegast ekki tengja beint á myndir eða PDF skjöl á Tímarit.is þar sem slíkar slóðir geta breyst án fyrirvara. Notið slóðirnar hér fyrir ofan til að tengja á vefinn.