Tölvumál


Tölvumál - 01.02.2008, Qupperneq 53

Tölvumál - 01.02.2008, Qupperneq 53
T Ö L V U M Á L | 5 3 í þeim og valdir úr rammar til nánari skoðunar (skref 2­3). Þá eru búnar til lýsingar á innihaldinu, eins og gert var í upphafi fyrir efnið sem verja átti (skref 4) og leitað að þeim í gagnagrunninum (skref 5). Niðurstöðurnar eru svo notaðar við að ákveða hvort mögulega er um að ræða stolið myndbönd eða ekki (skref 6). Lykilatriði í slíkum kerfum er að þau virki mjög hratt, jafnvel þótt um mjög mikið gagnamagn sé að ræða. Við Gagnasetur HR hafa farið fram rannsóknir á gagnagrunnsþætti og myndgreiningarþætti þessa kerfis, og verður þessum þáttum lýst hér að neðan. Myndgreiningarþáttur: Eff2 myndkenni Margar aðferðir hafa verið þróaðar til að lýsa innihaldi mynda fyrir höfundar­ réttarvörn. Sú aðferð sem er best þekkt heitir SIFT. Hún var upphaflega þróuð fyrir stafrænar myndir og virkar þannig að fundin eru lítil svæði í myndinni þar sem mikil breyting á sér stað í innihaldinu. Hverju svæði er svo varpað yfir í 128 tölur, sem saman lýsa vel birtu­ og skerpubreytingum á svæðinu. Þessar tölur saman eru kallaðar myndlýsingur (e. image descriptor) eða myndkenni, og má segja að sé nokkurs konar fingrafar svæðisins. SIFT aðferðin er þannig úr garði gerð að hún þolir vel að myndir séu bjagaðar á ýmsan hátt, svo sem með því að snúa þeim, minnka þær eða stækka, klippa þær til, breyta birtu eða skerpu, þjappa þeim saman í gagnamagni, o.s.frv. Fyrsta skrefið við rannsóknir á notkun SIFT aðferðarinnar við höfundar­ réttarvörn var að bæta eiginleika hennar þegar um mikið gagnamagn er að ræða. Við fengum að láni myndagrunn Morgunblaðsins, sem telur um 300 þúsund myndir, og sáum tvo megingalla á aðferðinni. Í fyrsta lagi bjó SIFT í mörgum tilfellum til gríðarlegan fjölda myndlýsinga, sem tók umtalsverðan tíma og reikniafl. Í öðru lagi voru gæði aðferðarinnar ekki nægilega góð þegar um svo mikið gagnamagn var að ræða, en áður hafði hún aðeins verið prófuð með nokkrum hundruðum mynda. Til að laga þessi atriði settum við fram bætta aðferð, sem við köllum Eff2 myndkenni, sem varpar hverju svæði aðeins í 72 tölur, en skilar umtalsvert betri niðurstöðum en SIFT þrátt fyrir að bæði gerð myndkennanna og leit að þeim sé um helmingi hraðvirkari3. Í tilraunum okkar fundu Eff2 myndkennin meira en 99% myndanna aftur, og fundu jafnvel mjög illa bjagaðar myndir. Mynd 2 sýnir dæmi um hvernig Eff2 myndkenni para saman svæði úr upprunalegri mynd og bjagaðri mynd, sem búið er að stækka, snúa, klippa til og bæta texta inn á. Leit að slíkum myndkennum fer þannig fram að fyrir hvert myndkenni úr grunsamlegri mynd, er leitað að líkustu myndkennunum í mynd kenna­ grunninum. Þau myndkenni eru tengd ákveðinni mynd, sem þar með fær eitt atkvæði. Sú mynd sem fær flest atkvæði er svo talin líkust. Þegar um höfundarréttarbrot er að ræða fær upprunalega myndin venjulega nokkur hundruð atkvæði en aðrar aðeins fá atkvæði. Gagnagrunnsþáttur: NV­tréð Þegar um er að ræða gögn eins og SIFT og Eff2 myndkennin, sem kölluð eru margvíð gögn, þá koma hefðbundnir töflugagnagrunnar (eins og Oracle og SQL Server) ekki að neinum notum. Þegar rannsóknir okkar hófust var í raun ekki til nein aðferð sem gat ráðið vel við svo mikið gagnamagn. Þess vegna fundum við upp nýja gagnagrind til að auðvelda leit í myndkennagrunninum, sem við köllum NV­tré4. NV­tréð byggist á því að varpa gögnunum á handahófskenndar línur gegn­ um 72­vítt rými (eða 128­vítt fyrir SIFT) og nota þessa vörpun til að greina gögnin gróflega í nokkra flokka. Hver flokkur er síðan tekinn og varpað á aðra línur, og greindur aftur í sundur. Þetta er endurtekið þar til hver undir­ flokkur er orðinn nægilega stór til að komast fyrir í einum lestri af hörðum diski. Þegar leitað er að ákveðnu myndkenni úr grunsamlegri mynd er sama vörpun framkvæmd, þar til fundinn er einn undirflokkur og leitað er að líkum myndkennum þar, í stað þess að leita í öllum gagnagrunninum. Kerfi sem verja höfundarrétt út frá innihaldi efnis hafa þrjá meginþætti Í fyrsta lagi þarf að finna efnið og þá helst með sjálfvirkum hætti 3 Sjá Lejsek, Ásmundsson, Jónsson og Amsaleg. Scalability of local image descriptors: A comparative study. Proceedings of the ACM Multimedia Conference. Santa Barbara, CA, USA, Október 2006. 4 Sjá Lejsek, Ásmundsson, Jónsson og Amsaleg. NV­tree: An efficient disk­based index for approximate search in very large high­dimensional collections. Tækniskýrsla RUTR­CS07002, júlí 2007.
Qupperneq 1
Qupperneq 2
Qupperneq 3
Qupperneq 4
Qupperneq 5
Qupperneq 6
Qupperneq 7
Qupperneq 8
Qupperneq 9
Qupperneq 10
Qupperneq 11
Qupperneq 12
Qupperneq 13
Qupperneq 14
Qupperneq 15
Qupperneq 16
Qupperneq 17
Qupperneq 18
Qupperneq 19
Qupperneq 20
Qupperneq 21
Qupperneq 22
Qupperneq 23
Qupperneq 24
Qupperneq 25
Qupperneq 26
Qupperneq 27
Qupperneq 28
Qupperneq 29
Qupperneq 30
Qupperneq 31
Qupperneq 32
Qupperneq 33
Qupperneq 34
Qupperneq 35
Qupperneq 36
Qupperneq 37
Qupperneq 38
Qupperneq 39
Qupperneq 40
Qupperneq 41
Qupperneq 42
Qupperneq 43
Qupperneq 44
Qupperneq 45
Qupperneq 46
Qupperneq 47
Qupperneq 48
Qupperneq 49
Qupperneq 50
Qupperneq 51
Qupperneq 52
Qupperneq 53
Qupperneq 54
Qupperneq 55
Qupperneq 56
Qupperneq 57
Qupperneq 58
Qupperneq 59
Qupperneq 60
Qupperneq 61
Qupperneq 62
Qupperneq 63
Qupperneq 64
Qupperneq 65
Qupperneq 66
Qupperneq 67
Qupperneq 68
Qupperneq 69
Qupperneq 70
Qupperneq 71
Qupperneq 72
Qupperneq 73
Qupperneq 74
Qupperneq 75
Qupperneq 76
Qupperneq 77
Qupperneq 78
Qupperneq 79
Qupperneq 80
Qupperneq 81
Qupperneq 82
Qupperneq 83
Qupperneq 84

x

Tölvumál

Direct Links

Hvis du vil linke til denne avis/magasin, skal du bruge disse links:

Link til denne avis/magasin: Tölvumál
https://timarit.is/publication/239

Link til dette eksemplar:

Link til denne side:

Link til denne artikel:

Venligst ikke link direkte til billeder eller PDfs på Timarit.is, da sådanne webadresser kan ændres uden advarsel. Brug venligst de angivne webadresser for at linke til sitet.