Tölvumál - 01.02.2008, Side 54
5 4 | T Ö L V U M Á L
Þannig má spara umtalsverðan tíma við
leitina. Öllum myndagrunnni Morgun
blaðisins er lýst með um 200 milljónum
myndkenna, og mynd kennaleit að einni
mynd tók áður um 2 klukkustundir í
honum. Með NVtrénu tekur leit í honum
hins vegar aðeins örfáar sekúndur. Einn
af lykileiginleikum NVtrésins er að
leitartími er í aðalatriðum óháður stærð
myndkennasafnsins, og þess vegna
skiptir ekki máli fyrir leitina hversu stórt
myndasafnið er.
Að auki höfum við þróað frumgerð að
kerfi sem dreifir vinnunni við leitina á
margar vélar, þannig að með því að
tífalda vélakost við leitina er hægt að
tífalda afköst kerfisins, og jafnvel meira
ef vélarnar eru nógu margar til að allur
myndkennagrunnurinn komist fyrir í
samanlögðu minni þeirra.
Myndbandaleit: Eff2 Videntifier
Að undanförnu höfum við unnið að rannsóknum á notkun þessara tveggja
þátta við höfundarréttarvörn fyrir mynd bönd. Þar sem myndbönd eru í
aðalatriðum runa af myndum, sem kallaðar eru rammar, þá væri fræðilega
hægt að nota Eff2 myndkennin óbreytt fyrir myndbönd. Það hefði þó þann
galla að búa til gríðarlegt magn af mynd kennum, sem tímafrekt væri að
leita að. Enn fremur, þá eru venjulega margir líkir rammar í röð, sem óþarfi
er að lýsa öllum.
Hefðbundna aðferðin við að minnka gagna magnið er að velja ákveðna
ramma, svokallaða lykilramma, til að lýsa nánar með Eff2 myndkennum.
Við höfum hins vegar valið að fara aðra leið, að nota Eff2 myndkennin til
að finna hvenær nærliggjandi rammar eru líkir innbyrðis, þannig að hægt
sé að sleppa líkum römmum. Í raun getum við gengið enn lengra og notað
myndkennin til að finna hvenær ákveði svæði innan nærliggjandi ramma
eru lík innbyrðis, og minnka þar með gagnamagnið enn frekar. Þessi tækni
er enn í þróun, en fyrstu niðurstöður benda til þess að þannig sé hægt
að minnka gagnamagnið verulega, og þar með leitartímann, án þess að
minnka gæði leitarinnar.
Lokaorð
Um nokkurt skeið hefur markaðurinn kallað á tækni sem gerir eigendum
höfundarréttar kleift að finna stolið efni og leita þannig réttar síns. Þessi
grein hefur lýst kerfi sem þróað hefur verið við Gagnasetur Háskólans og
getur fundið stolnar myndir og stolin myndbönd á mjög hraðvirkan og
áreiðan legan hátt. Þessi vinna, sem meðal annars hefur verið styrkt af
Rannsóknarsjóði, hefur verið kynnt á nokkrum alþjóðlegum ráðstefnum,
auk þess sem við höfum sýnt hana á Vísindavöku og við önnur tækifæri hér
innanlands. Mjög margir hafa komið að þessu verkefni, og ber þar einkum
að þakka Laurent Amsaleg hjá IRISA og Friðriki Heiðari Ásmundssyni, auk
þeirra fjölmörgu M.Sc. og B.Sc. nema sem komið hafa að verkefninu á
einn eða annan hátt. Nú höfum við ráðist í stofnun fyrirtækis um framþróun
tækninnar, Eff2 Technologies, sem er fyrsta sprotafyrirtækið sem sprettur
upp úr rannsóknum við tölvunarfræðideild Háskólans í Reykjavík.
SIFT aðferðin er best þekkt til að lýsa innihaldi mynda. Hún virkar þannig að fundin eru lítil svæði í myndinni þar
sem mikil breyting á sér stað í innihaldinu. Hverju svæði er svo varpað yfir í 128 tölur, sem saman lýsa birtu- og
skerpubreytingum á svæðinu. Þær eru kallaðar myndlýsingar.
Í öðru lagi þarf að nota
myndgreininaraðferðir til að „lýsa“ efninu,
sem eru ekki viðkvæmar fyrir hvers konar
breytingum og bjögun á efninu
Loks þarf að nota öflugan gagnagrunn,
annars vegar til að geyma slíkar lýsingar
fyrir efni sem verja á og hins vegar til að
leita í með lýsingum á efni sem grunur
leikur á um að sé stolið