Tölvumál - 01.02.2008, Qupperneq 53
T Ö L V U M Á L | 5 3
í þeim og valdir úr rammar til nánari skoðunar (skref 23). Þá eru búnar til
lýsingar á innihaldinu, eins og gert var í upphafi fyrir efnið sem verja átti
(skref 4) og leitað að þeim í gagnagrunninum (skref 5). Niðurstöðurnar eru
svo notaðar við að ákveða hvort mögulega er um að ræða stolið myndbönd
eða ekki (skref 6).
Lykilatriði í slíkum kerfum er að þau virki mjög hratt, jafnvel þótt um
mjög mikið gagnamagn sé að ræða. Við Gagnasetur HR hafa farið fram
rannsóknir á gagnagrunnsþætti og myndgreiningarþætti þessa kerfis, og
verður þessum þáttum lýst hér að neðan.
Myndgreiningarþáttur: Eff2 myndkenni
Margar aðferðir hafa verið þróaðar til að lýsa innihaldi mynda fyrir höfundar
réttarvörn. Sú aðferð sem er best þekkt heitir SIFT. Hún var upphaflega
þróuð fyrir stafrænar myndir og virkar þannig að fundin eru lítil svæði í
myndinni þar sem mikil breyting á sér stað í innihaldinu. Hverju svæði er
svo varpað yfir í 128 tölur, sem saman lýsa vel birtu og skerpubreytingum
á svæðinu. Þessar tölur saman eru kallaðar myndlýsingur (e. image
descriptor) eða myndkenni, og má segja að sé nokkurs konar fingrafar
svæðisins. SIFT aðferðin er þannig úr garði gerð að hún þolir vel að myndir
séu bjagaðar á ýmsan hátt, svo sem með því að snúa þeim, minnka þær
eða stækka, klippa þær til, breyta birtu eða skerpu, þjappa þeim saman í
gagnamagni, o.s.frv.
Fyrsta skrefið við rannsóknir á notkun SIFT aðferðarinnar við höfundar
réttarvörn var að bæta eiginleika hennar þegar um mikið gagnamagn er að
ræða. Við fengum að láni myndagrunn Morgunblaðsins, sem telur um 300
þúsund myndir, og sáum tvo megingalla á aðferðinni. Í fyrsta lagi bjó SIFT í
mörgum tilfellum til gríðarlegan fjölda myndlýsinga, sem tók umtalsverðan
tíma og reikniafl. Í öðru lagi voru gæði aðferðarinnar ekki nægilega góð
þegar um svo mikið gagnamagn var að ræða, en áður hafði hún aðeins
verið prófuð með nokkrum hundruðum mynda.
Til að laga þessi atriði settum við fram bætta aðferð, sem við köllum Eff2
myndkenni, sem varpar hverju svæði aðeins í 72 tölur, en skilar umtalsvert
betri niðurstöðum en SIFT þrátt fyrir að bæði gerð myndkennanna og leit að
þeim sé um helmingi hraðvirkari3. Í tilraunum okkar fundu Eff2 myndkennin
meira en 99% myndanna aftur, og fundu jafnvel mjög illa bjagaðar myndir.
Mynd 2 sýnir dæmi um hvernig Eff2 myndkenni para saman svæði úr
upprunalegri mynd og bjagaðri mynd, sem búið er að stækka, snúa, klippa
til og bæta texta inn á.
Leit að slíkum myndkennum fer þannig fram að fyrir hvert myndkenni úr
grunsamlegri mynd, er leitað að líkustu myndkennunum í mynd kenna
grunninum. Þau myndkenni eru tengd ákveðinni mynd, sem þar með fær
eitt atkvæði. Sú mynd sem fær flest atkvæði er svo talin líkust. Þegar um
höfundarréttarbrot er að ræða fær upprunalega myndin venjulega nokkur
hundruð atkvæði en aðrar aðeins fá atkvæði.
Gagnagrunnsþáttur: NVtréð
Þegar um er að ræða gögn eins og SIFT og Eff2 myndkennin, sem kölluð eru
margvíð gögn, þá koma hefðbundnir töflugagnagrunnar (eins og Oracle og
SQL Server) ekki að neinum notum. Þegar rannsóknir okkar hófust var í raun
ekki til nein aðferð sem gat ráðið vel við svo mikið gagnamagn. Þess vegna
fundum við upp nýja gagnagrind til að auðvelda leit í myndkennagrunninum,
sem við köllum NVtré4.
NVtréð byggist á því að varpa gögnunum á handahófskenndar línur gegn
um 72vítt rými (eða 128vítt fyrir SIFT) og nota þessa vörpun til að greina
gögnin gróflega í nokkra flokka. Hver flokkur er síðan tekinn og varpað á
aðra línur, og greindur aftur í sundur. Þetta er endurtekið þar til hver undir
flokkur er orðinn nægilega stór til að komast fyrir í einum lestri af hörðum
diski. Þegar leitað er að ákveðnu myndkenni úr grunsamlegri mynd er
sama vörpun framkvæmd, þar til fundinn er einn undirflokkur og leitað er
að líkum myndkennum þar, í stað þess að leita í öllum gagnagrunninum.
Kerfi sem verja höfundarrétt út frá innihaldi efnis hafa
þrjá meginþætti
Í fyrsta lagi þarf að finna efnið og þá helst með
sjálfvirkum hætti
3 Sjá Lejsek, Ásmundsson, Jónsson og Amsaleg. Scalability of local image descriptors: A comparative study. Proceedings of the ACM Multimedia Conference. Santa Barbara, CA, USA, Október 2006.
4 Sjá Lejsek, Ásmundsson, Jónsson og Amsaleg. NVtree: An efficient diskbased index for approximate search in very large highdimensional collections. Tækniskýrsla RUTRCS07002, júlí 2007.