Tölvumál - 01.07.2000, Blaðsíða 13
Þekkingarstjórn
Þekkingarstjórn með hjólp gervigreindar
Guðmundur Guðnason
Með sjálfvirkri þekkingarstjóm
geta fyrirtæki sparað starfs-
mönnum sínum mikinn tíma
sem venjulega fer í flokkun og leit upplýs-
inga. Skilvirkt flæði og flokkun upplýs-
inga verður til þess að einfaldara verður að
skilja kjamann frá hisminu. Vefráp verður
ekki endalaus leit í ofvöxnum fmmskógi
upplýsinga heldur geta vefir verið sniðnir
sjálfvirkt að þörfum hvers og eins.
Það skiptir höfuðmáli
að geta nálgast þær
upplýsingar sem
nauðsynlegar eru á
hverjum tíma án fyrir-
hafnar
Of mikið af upplýsingum, of lítill tími
Hvað er sameiginlegt með ritvinnsluskjöl-
um, töflureiknisskjölum, tölvupósti og
vefsíðum? Jú, þetta eru allt saman ómót-
aðar upplýsingar. Þetta er texti sem
geymdur er í skjölum sem oft á tíðum em
flokkuð á fmmstæðan og einstaklings-
bundinn hátt. Gífurlegt magn upplýsinga
og þar með þekkingar er geymt á þennan
hátt hjá fyrirtækjum nútímans og sá tími
sem fer í að reyna að flokka þessi gögn og
leita í þeim er allt of mikill.
Hver kannast ekki við að þurfa að leita
að skýrslu frá því í fyrra sem þú manst eft-
ir að hafa gert en þú manst bara ekki hvar
þú geymdir hana. Það skiptir höfuðmáli að
geta nálgast þær upplýsingar sem nauð-
synlegar em á hverjum tíma án fyrirhafn-
Hingað til hafa tilraunir til að flokka
ómótuð gögn gengið út á notkun
stikkorða, textaleit og handvirka flokkun,
sama aðferð og notuð er hjá flestum leitar-
vélum á Intemetinu. Flestir hafa notað
leitarvélar á Intemetinu og þekkja hversu
mikið af gagnslausum upplýsingum birtast
þegar leitað er að ákveðnum málefnum og
hversu mikill tími fer í að fletta og leita
þar til þú finnur það sem þú leitar að, ef þú
finnur það...
Það sem þarf er aðferð til að flokka
skjöl og finna skjöl útfrá efnisinnihaldi,
ekki bara að eitt eða tvö orð séu eins. Ef
þú leitar að orðinu „Jaguar“ viltu gera
greinarmun á Jagúar bíl og Jagúar risa-
kisu, ef þú leitar að orðinu „kynlíf1 viltu
gera greinarmun á kynfræðslu og klámi, ef
þú leitar að orðinu „flaga“ viltu gera
greinarmun á kartöfluflögum og kísilflög-
um. Allt ræðst þetta af samhenginu, hvaða
orð em í kring og hvert er efnisinnihald
textans í heild þar sem orðið kemur fyrir.
Lausnin er fundin
Fyrirtækið Autonomy
(www.autonomy.com) hefur þróað hug-
búnað til þess að flokka og vinna með
mikið magn af ómótuðum upplýsingum á
sjálfvirkan hátt. Tæknin byggir á lögmáli
ensks stærðfræðings, Thomas Bayes, sem
hann setti fram fyrir um 250 ámm. Lög-
málið segir í stuttu máli: Líkurnar á því að
A gerist að því gefnu að B hafi þegar gerst
eru jafnar líkunum á því að B gerist að því
gefnu að A hafi gerst margfaldað meðlík-
um á að A gerist deilt með líkum á að B
gerist.
Formúlan er vægast sagt flókin, en hún
miðar að því að skýra líkindatengsl milli
tveggja breyta og hversu mikið ein breyta
hefur áhrif á aðra. Ef við tökum dæmi um
hvemig Autonomy útfærir þetta til grein-
ingar á texta: Formúlan er notuð til að
meta t.d. líkurnar á því að orðið tölva sé á
einhvem hátt í tengslum við orðið hug-
búnaður. Þessu til viðbótar eru notuð lög-
mál úr upplýsingafræðum til að ákvarða
hvaða tengsl skipta mestu máli. Utfrá þess
konar útreikningi getur Autonomy fundið
út efnisinnihald eða meginefni textans
sem er svo umbreytt í talnamnu.
Autonomy getur þannig borið saman texta
sem hafa samskonar talnaranu og þar með
fjalla um svipað efni og sagt hversu mikl-
ar líkur séu á að þeir fjalli um það sama.
Sjólfvirk þekkingarstjórn
Það er þessi eiginleiki, að geta borið sam-
an efnisinnihald hvaða texta sem er, óháð
tungumáli, sem gerir Autonomy kleift að:
• Draga saman og flokka á sjálfvirkan
hátt allar innri og ytri upplýsingar á að-
gengilegan hátt, t.d. á vefsíðu. Með
innri upplýsingum á ég við ritvinnslu-
skjöl, tölvupóst og þess háttar. Með ytri
upplýsingum á ég við t.d. vefsíður og
fréttir á Intemetinu.
Tölvumál
13