Tölvumál


Tölvumál - 01.02.2008, Side 54

Tölvumál - 01.02.2008, Side 54
5 4 | T Ö L V U M Á L Þannig má spara umtalsverðan tíma við leitina. Öllum myndagrunnni Morgun­ blaðisins er lýst með um 200 milljónum myndkenna, og mynd kennaleit að einni mynd tók áður um 2 klukkustundir í honum. Með NV­trénu tekur leit í honum hins vegar aðeins örfáar sekúndur. Einn af lykileiginleikum NV­trésins er að leitartími er í aðalatriðum óháður stærð myndkennasafnsins, og þess vegna skiptir ekki máli fyrir leitina hversu stórt myndasafnið er. Að auki höfum við þróað frumgerð að kerfi sem dreifir vinnunni við leitina á margar vélar, þannig að með því að tífalda vélakost við leitina er hægt að tífalda afköst kerfisins, og jafnvel meira ef vélarnar eru nógu margar til að allur myndkennagrunnurinn komist fyrir í samanlögðu minni þeirra. Myndbandaleit: Eff2 Videntifier Að undanförnu höfum við unnið að rannsóknum á notkun þessara tveggja þátta við höfundarréttarvörn fyrir mynd bönd. Þar sem myndbönd eru í aðalatriðum runa af myndum, sem kallaðar eru rammar, þá væri fræðilega hægt að nota Eff2 myndkennin óbreytt fyrir myndbönd. Það hefði þó þann galla að búa til gríðarlegt magn af mynd kennum, sem tímafrekt væri að leita að. Enn fremur, þá eru venjulega margir líkir rammar í röð, sem óþarfi er að lýsa öllum. Hefðbundna aðferðin við að minnka gagna magnið er að velja ákveðna ramma, svokallaða lykilramma, til að lýsa nánar með Eff2 myndkennum. Við höfum hins vegar valið að fara aðra leið, að nota Eff2 myndkennin til að finna hvenær nærliggjandi rammar eru líkir innbyrðis, þannig að hægt sé að sleppa líkum römmum. Í raun getum við gengið enn lengra og notað myndkennin til að finna hvenær ákveði svæði innan nærliggjandi ramma eru lík innbyrðis, og minnka þar með gagnamagnið enn frekar. Þessi tækni er enn í þróun, en fyrstu niðurstöður benda til þess að þannig sé hægt að minnka gagnamagnið verulega, og þar með leitartímann, án þess að minnka gæði leitarinnar. Lokaorð Um nokkurt skeið hefur markaðurinn kallað á tækni sem gerir eigendum höfundarréttar kleift að finna stolið efni og leita þannig réttar síns. Þessi grein hefur lýst kerfi sem þróað hefur verið við Gagnasetur Háskólans og getur fundið stolnar myndir og stolin myndbönd á mjög hraðvirkan og áreiðan legan hátt. Þessi vinna, sem meðal annars hefur verið styrkt af Rannsóknarsjóði, hefur verið kynnt á nokkrum alþjóðlegum ráðstefnum, auk þess sem við höfum sýnt hana á Vísindavöku og við önnur tækifæri hér innanlands. Mjög margir hafa komið að þessu verkefni, og ber þar einkum að þakka Laurent Amsaleg hjá IRISA og Friðriki Heiðari Ásmundssyni, auk þeirra fjölmörgu M.Sc. og B.Sc. nema sem komið hafa að verkefninu á einn eða annan hátt. Nú höfum við ráðist í stofnun fyrirtækis um framþróun tækninnar, Eff2 Technologies, sem er fyrsta sprotafyrirtækið sem sprettur upp úr rannsóknum við tölvunarfræðideild Háskólans í Reykjavík. SIFT aðferðin er best þekkt til að lýsa innihaldi mynda. Hún virkar þannig að fundin eru lítil svæði í myndinni þar sem mikil breyting á sér stað í innihaldinu. Hverju svæði er svo varpað yfir í 128 tölur, sem saman lýsa birtu- og skerpubreytingum á svæðinu. Þær eru kallaðar myndlýsingar. Í öðru lagi þarf að nota myndgreininaraðferðir til að „lýsa“ efninu, sem eru ekki viðkvæmar fyrir hvers konar breytingum og bjögun á efninu Loks þarf að nota öflugan gagnagrunn, annars vegar til að geyma slíkar lýsingar fyrir efni sem verja á og hins vegar til að leita í með lýsingum á efni sem grunur leikur á um að sé stolið

x

Tölvumál

Direkte link

Hvis du vil linke til denne avis/magasin, skal du bruge disse links:

Link til denne avis/magasin: Tölvumál
https://timarit.is/publication/239

Link til dette eksemplar:

Link til denne side:

Link til denne artikel:

Venligst ikke link direkte til billeder eller PDfs på Timarit.is, da sådanne webadresser kan ændres uden advarsel. Brug venligst de angivne webadresser for at linke til sitet.