Tölvumál


Tölvumál - 01.02.2008, Blaðsíða 53

Tölvumál - 01.02.2008, Blaðsíða 53
T Ö L V U M Á L | 5 3 í þeim og valdir úr rammar til nánari skoðunar (skref 2­3). Þá eru búnar til lýsingar á innihaldinu, eins og gert var í upphafi fyrir efnið sem verja átti (skref 4) og leitað að þeim í gagnagrunninum (skref 5). Niðurstöðurnar eru svo notaðar við að ákveða hvort mögulega er um að ræða stolið myndbönd eða ekki (skref 6). Lykilatriði í slíkum kerfum er að þau virki mjög hratt, jafnvel þótt um mjög mikið gagnamagn sé að ræða. Við Gagnasetur HR hafa farið fram rannsóknir á gagnagrunnsþætti og myndgreiningarþætti þessa kerfis, og verður þessum þáttum lýst hér að neðan. Myndgreiningarþáttur: Eff2 myndkenni Margar aðferðir hafa verið þróaðar til að lýsa innihaldi mynda fyrir höfundar­ réttarvörn. Sú aðferð sem er best þekkt heitir SIFT. Hún var upphaflega þróuð fyrir stafrænar myndir og virkar þannig að fundin eru lítil svæði í myndinni þar sem mikil breyting á sér stað í innihaldinu. Hverju svæði er svo varpað yfir í 128 tölur, sem saman lýsa vel birtu­ og skerpubreytingum á svæðinu. Þessar tölur saman eru kallaðar myndlýsingur (e. image descriptor) eða myndkenni, og má segja að sé nokkurs konar fingrafar svæðisins. SIFT aðferðin er þannig úr garði gerð að hún þolir vel að myndir séu bjagaðar á ýmsan hátt, svo sem með því að snúa þeim, minnka þær eða stækka, klippa þær til, breyta birtu eða skerpu, þjappa þeim saman í gagnamagni, o.s.frv. Fyrsta skrefið við rannsóknir á notkun SIFT aðferðarinnar við höfundar­ réttarvörn var að bæta eiginleika hennar þegar um mikið gagnamagn er að ræða. Við fengum að láni myndagrunn Morgunblaðsins, sem telur um 300 þúsund myndir, og sáum tvo megingalla á aðferðinni. Í fyrsta lagi bjó SIFT í mörgum tilfellum til gríðarlegan fjölda myndlýsinga, sem tók umtalsverðan tíma og reikniafl. Í öðru lagi voru gæði aðferðarinnar ekki nægilega góð þegar um svo mikið gagnamagn var að ræða, en áður hafði hún aðeins verið prófuð með nokkrum hundruðum mynda. Til að laga þessi atriði settum við fram bætta aðferð, sem við köllum Eff2 myndkenni, sem varpar hverju svæði aðeins í 72 tölur, en skilar umtalsvert betri niðurstöðum en SIFT þrátt fyrir að bæði gerð myndkennanna og leit að þeim sé um helmingi hraðvirkari3. Í tilraunum okkar fundu Eff2 myndkennin meira en 99% myndanna aftur, og fundu jafnvel mjög illa bjagaðar myndir. Mynd 2 sýnir dæmi um hvernig Eff2 myndkenni para saman svæði úr upprunalegri mynd og bjagaðri mynd, sem búið er að stækka, snúa, klippa til og bæta texta inn á. Leit að slíkum myndkennum fer þannig fram að fyrir hvert myndkenni úr grunsamlegri mynd, er leitað að líkustu myndkennunum í mynd kenna­ grunninum. Þau myndkenni eru tengd ákveðinni mynd, sem þar með fær eitt atkvæði. Sú mynd sem fær flest atkvæði er svo talin líkust. Þegar um höfundarréttarbrot er að ræða fær upprunalega myndin venjulega nokkur hundruð atkvæði en aðrar aðeins fá atkvæði. Gagnagrunnsþáttur: NV­tréð Þegar um er að ræða gögn eins og SIFT og Eff2 myndkennin, sem kölluð eru margvíð gögn, þá koma hefðbundnir töflugagnagrunnar (eins og Oracle og SQL Server) ekki að neinum notum. Þegar rannsóknir okkar hófust var í raun ekki til nein aðferð sem gat ráðið vel við svo mikið gagnamagn. Þess vegna fundum við upp nýja gagnagrind til að auðvelda leit í myndkennagrunninum, sem við köllum NV­tré4. NV­tréð byggist á því að varpa gögnunum á handahófskenndar línur gegn­ um 72­vítt rými (eða 128­vítt fyrir SIFT) og nota þessa vörpun til að greina gögnin gróflega í nokkra flokka. Hver flokkur er síðan tekinn og varpað á aðra línur, og greindur aftur í sundur. Þetta er endurtekið þar til hver undir­ flokkur er orðinn nægilega stór til að komast fyrir í einum lestri af hörðum diski. Þegar leitað er að ákveðnu myndkenni úr grunsamlegri mynd er sama vörpun framkvæmd, þar til fundinn er einn undirflokkur og leitað er að líkum myndkennum þar, í stað þess að leita í öllum gagnagrunninum. Kerfi sem verja höfundarrétt út frá innihaldi efnis hafa þrjá meginþætti Í fyrsta lagi þarf að finna efnið og þá helst með sjálfvirkum hætti 3 Sjá Lejsek, Ásmundsson, Jónsson og Amsaleg. Scalability of local image descriptors: A comparative study. Proceedings of the ACM Multimedia Conference. Santa Barbara, CA, USA, Október 2006. 4 Sjá Lejsek, Ásmundsson, Jónsson og Amsaleg. NV­tree: An efficient disk­based index for approximate search in very large high­dimensional collections. Tækniskýrsla RUTR­CS07002, júlí 2007.
Blaðsíða 1
Blaðsíða 2
Blaðsíða 3
Blaðsíða 4
Blaðsíða 5
Blaðsíða 6
Blaðsíða 7
Blaðsíða 8
Blaðsíða 9
Blaðsíða 10
Blaðsíða 11
Blaðsíða 12
Blaðsíða 13
Blaðsíða 14
Blaðsíða 15
Blaðsíða 16
Blaðsíða 17
Blaðsíða 18
Blaðsíða 19
Blaðsíða 20
Blaðsíða 21
Blaðsíða 22
Blaðsíða 23
Blaðsíða 24
Blaðsíða 25
Blaðsíða 26
Blaðsíða 27
Blaðsíða 28
Blaðsíða 29
Blaðsíða 30
Blaðsíða 31
Blaðsíða 32
Blaðsíða 33
Blaðsíða 34
Blaðsíða 35
Blaðsíða 36
Blaðsíða 37
Blaðsíða 38
Blaðsíða 39
Blaðsíða 40
Blaðsíða 41
Blaðsíða 42
Blaðsíða 43
Blaðsíða 44
Blaðsíða 45
Blaðsíða 46
Blaðsíða 47
Blaðsíða 48
Blaðsíða 49
Blaðsíða 50
Blaðsíða 51
Blaðsíða 52
Blaðsíða 53
Blaðsíða 54
Blaðsíða 55
Blaðsíða 56
Blaðsíða 57
Blaðsíða 58
Blaðsíða 59
Blaðsíða 60
Blaðsíða 61
Blaðsíða 62
Blaðsíða 63
Blaðsíða 64
Blaðsíða 65
Blaðsíða 66
Blaðsíða 67
Blaðsíða 68
Blaðsíða 69
Blaðsíða 70
Blaðsíða 71
Blaðsíða 72
Blaðsíða 73
Blaðsíða 74
Blaðsíða 75
Blaðsíða 76
Blaðsíða 77
Blaðsíða 78
Blaðsíða 79
Blaðsíða 80
Blaðsíða 81
Blaðsíða 82
Blaðsíða 83
Blaðsíða 84

x

Tölvumál

Beinir tenglar

Ef þú vilt tengja á þennan titil, vinsamlegast notaðu þessa tengla:

Tengja á þennan titil: Tölvumál
https://timarit.is/publication/239

Tengja á þetta tölublað:

Tengja á þessa síðu:

Tengja á þessa grein:

Vinsamlegast ekki tengja beint á myndir eða PDF skjöl á Tímarit.is þar sem slíkar slóðir geta breyst án fyrirvara. Notið slóðirnar hér fyrir ofan til að tengja á vefinn.