Tölvumál - 01.12.1998, Qupperneq 12
Myndrænar upplýsingar
Nauðsynlegt er að
vinsa út þau marg-
miðlunargagnasöfn
sem eru líklegust til
að innihalda mynd-
efnið sem leitað er að
Gagnasafn gagna-
þjónsins er byggt upp
sem stigveldi snið-
máta sem tákna mynd-
ræna eiginleika gagn-
anna.
i SKRÁARENDING TEG. GAGNA LÝSING
gif Mynd Compuserve mynd snið
jpg, jpeg, jpe, jfif, pjpeg, pjp Mynd JPEG mynd snið
qt, mov, moov Kvikmynd Quicktime kvikmynda snið
mpeg, mpg, mpr, mpv, vbs, mpegv Kvikmynd MPEG kvikmynda snið
avi Kvikmynd Microsoft kvikmynda snið
Tafla 1. Yfirlit yfir helstu skráarendingar myndrænna upplýsinga á vefnum. [5]
að finna á Intemetinu. Leitarvélamar skanna
vefinn með reglulegu millibili, greina skjölin
út frá textainnihaldi þeirra og búa til saman-
tekt þar sem vísað er í vefsíðurnar. Þannig
geta vefnotendur nálgast upplýsingar á
vefnum á einfaldan hátt með því að leita
eftir ákveðnum textalykilorðum eða nálg-
ast upplýsingar eftir efnisflokkum, s.s.
íþróttir, skemmtanir osfrv.151
Hægt er að nota svipaða aðferð til að
taka saman allt myndrænt efni á vefnum í
því skyni að gera það aðgengilegra fyrir
vefnotendur. Leitarvél skannar vefmn á
sama hátt og hefðbundnar leitarvélar, en
skráir aðeins þær skrár sem eru líklegar til
að innihalda myndrænar upplýsingar í
stað þess að skrásetja allar vefsíður og
greina þær eftir textainnihaldi. Einfaldast
er að ákvarða innihald skráa með því að
líta á endingar skráarnafna. Skrár með
myndrænum upplýsingum hafa í dag ein-
hverja af þeim endingum sem gefnar eru
upp í Töflu 1.
Eftir að búið er að finna skrárnar þarf
að greina og skrásetja þær eftir innihaldi.
Hægt er að flokka myndrænar upplýsingar
á grófan hátt út frá skráarheitum ef þau
eru nægjanlega lýsandi. Einnig er hægt að
flokka skrárnar eftir ALT HTML taginu,
sem oft er notað til að lýsa myndefni ef
vefrýnir getur ekki birt viðkomandi mynd.
Þessi flokkunaraðferð er þó ekki áreiðan-
leg þar sem ekki er hægt að ganga út frá
því vísu að skráarheiti myndefnis séu
lýsandi og að ALT tagið sé almennt notað
til frekari upplýsinga. Dæmi um slíka
leitarvél er WebSeek [5], sjá mynd 7.
Leit að myndrænum upplýsingum
með aðstoð gagnaþjóna
Fyrrgreind leitaraðferð að myndrænum
upplýsingum á vefnum er einföld í
útfærslu en er hún næganlega öflug?
Viljum við ekki geta komið með fyrir-
spurn sem segir til dærnis „Finndu tilvís-
anir í allar myndir sem líkjast þessari“?
Þetta flækir málið því til að svara slíkri
fyrirspurn þarf að bera myndina (sýnis-
hornið) saman við allar myndrænar upp-
lýsingar á vefnum á myndrænan hátt.
Slíkur samanburður er mjög reiknifrekur
þannig að ekki er hægt að senda slíka
fyrirspurn út á vefinn til allra hugsanlegra
gagnasafna sem gætu innihaldið umbeðna
mynd. Slík aðgerð væri alltof tímafrek
jafnvel fyrir textaleit.
Því er nauðsynlegt að geta á einhvern
hátt vinsað út þau margmiðlunargagna-
söfn sem eru líklegust til að innihalda
myndefnið sem leitað er að, þ.e. fundið
vægi þein'a út frá ákveðinni fyrirspurn.
Þetta er hægt með því að nota svokölluð
lýsigögn (e. metadata) til að búa til yfirlit
yfir þau myndrænu gögn sem eru aðgengi-
leg á vefnum.
Mynd 2 sýnir dæmi um högun slíks kerfis.
Gagnaþjóninn, sem samanstendur af fyrir-
spurnarþjóni, leitarvél og gagnasafni, tekur
við fyrirspurn frá vefnotanda og ber hana
saman við lýsigögn í gagnasafni sínu. Sam-
anburðurinn skilar lista yfir þau margmiðl-
unargagnasöfn sem til greina koma fyrir við-
komandi fyrirspurn, það er vægi safnanna
er metið út frá lýsigögnum gagnaþjónsins.
Notandinn velur eitt eða fleiri söfn úr list-
anum og gagnaþjóninn sér um að beina
fyrirspurn hans áfram til þeirra. Valin marg-
miðlunargagnasöfn taka við fyrirspurninni,
leita að myndefninu hvert í sínu gagna-
safni og senda niðurstöðuna til notandans.
En hvernig eru lýsigögnin búin til?
Lýsigögn
Lýsigögn eru notuð til að lýsa innihaldi
12
Tölvumál