Sagnir - 01.06.2007, Page 54
A ég að gæta blogg bróður míns
Hvort svo sem öll mannleg þekking er að safnast fyrir á vefnum eða ekki
er óumdeilanlegt að vefurinn vex með gríðarlegum hraða. I aprílbyrjun
eru vefsíður taldar hafa verið 113.658.468 talsins og höfðu þá rúmlega
3 milljónir nýrra vefsíðna bæst við frá því talið var mánuðinn áður.8
Þó svo Intemet Archive geymi aðeins brot af þeim vefsíðum sem til
hafa verið er Intemet Archive í dag ekki aðeins heimsins stærsta safn
stafrænna heimilda heldur stærsta upplýsingasafn veraldar. Eftir því sem
áherslan á rafræna miðlun hefur aukist hefur vægi Intemet Archive orðið
augljósara og samstarf um afmörkuð verkefni tekist við hefðbundnari
söfn á borð við Library of Congress og Smithsonian stofnunina. Hér er
t.d. um að ræða söfnun efnis tengdu tilteknum viðburðum á borð við
kosningar eða 11. september.9 Markmið Intemet Archive hafa einnig
verið víkkuð út og nær efnissöfnun nú til alls stafræns menningarefnis
sem ekki er annað hvort komið úr höfundarétti eða hefur verið gefið út
með leyfisskilmálum sem heimila slíka söfnun. Hér er um að ræða bæði
kvikmyndir, tónlist, forrit og listrænt efhi svo eitthvað sé nefnt.
Aftur til fortíðar
The Intemet Archive veitir aðgang að safiikosti sínum í gegnum
notendaviðmót sem kallað er því skemmtilega nafni The Way Back
Machine. Tímavél þessi sýnir hvemig tiltekin vefslóð leit út á tilteknum
tímapunkti. Sú sýn sem the Way Back Machine veitir er þó takmörkuð
við eldra efni en að jafnaði líða sex til tólf mánuðir frá því the Intemet
Archive safnar upplýsingum um vefsíður og þangað til afrit þeirra
verða aðgengileg í gegnum The Way Back Machine. The Way Back
Machine gagnast því ekki þeim sem vilja vísa í varðveitt eintök nýlega
birts efnis. Öllu meira svekkir þó sú staðreynd að aðrar aðgangsleiðir
að efni safnsins em ekki í boði. Safii Intemet Archive er hvorki flokkað
eftir efni né er hægt að keyra ffjálsa textaleit. Því er ekki hægt að leita
í þessu gríðarlega heimildasafni að málefnum eða persónum. Til þess
að nýta sér það íslenska efni sem er í safni Intemet Archive þyrfti hinn
ímyndaði sagnfræðingur því að vita á hvaða lénum það hefði birst. Hann
gæti ekki gúglað í safninu eftir því hvort Laxness framtíðarinnar hefði
bloggað sem ungur maður eða hvort einhver hefði bloggað um hann.
Það er markmið Intemet Archive að einn daginn verði hægt að veita
slíkan aðgang en sökum takmarkaðra fjárráða Intemet Archive er það
enn sem komið er aðeins fjarlægur draumur. Eins og svo mörg önnur
söfn hefur Intemet Archive átt í erfiðleikum með að fjármagna rekstur
sinn og ef ekki væri fyrir bein framlög Kahle sjálfs er óvíst að Intemet
Archive hefði orðið að veruleika. Þess er vert að geta að gríðarlegur
árangur stofnunarinnar byggir ekki hvað síst á útsjónarsemi hvað
útfærslu söfnunar og varðveislu varðar, notast er við frjálsan hugbúnað
og söfnun og varðveisla keyrð á ódýmm fjöldaframleiddum vélbúnaði í
stað þess að keypt sé sérhæfð uppsetning.10
En hver er sú mynd sem netsöfnun Intemet Archive dregur upp af
vefnum? A meðan íslenska netsöfnunin safnar einfaldlega öllu því efni
sem er hýst á íslenskum lénum og telst þannig óneitanlega lýsandi fyrir
það efni sem þjóðarlénið hefúr að geyma, byggir netsöfnun Intemet
Archive á upplýsingum sem netgreiningarfyrirtækið Alexa lætur
stofnuninni endurgjaldslaust í té. Starfssemi Alexa snýst um söfnun
upplýsinga um nethegðan einstaklinga og greiningu þessara upplýsinga.
Hér er þó ekki um njósnir að ræða heldur sjálfviljuga þátttöku fjölda
einstaklinga en fyrirtækið fylgist með því hvemig einstaklingar flakka
um vefinn fyrir tilstilli forrits sem einstaklingar geta bætt inn við
vafrann sinn. Akkur notendanna af því að leyfa Alexa að fylgjast með
nethegðan sinni er sá að vafraviðbót Alexa sýnir í sérstökum glugga
topp tíu síður sama efnis og sú síða sem skoðuð er hverju sinni. Einnig
sýnir hún notandanum ýmiskonar upplýsingar um þá síðu sem skoðuð
er hverju sinni, hvem hún sé skráð á, hversu margar undirsíður hún
innihaldi, hversu margar siður vísi á hana og hversu oft hún sé uppfærð
svo nokkur dæmi séu nefnd11.
50 - Sagnir
Safn Intemet Archive byggir þannig á því efni sem Alexa hópurinn
skoðar. Nafnleysi þátttakendanna er virt og upplýsingar um samsetningu
hópsins liggja því ekki fyrir frá hendi Alexa. Utanaðkomandi aðilar
hafa þó sýnt fram á svo óyggjandi er að ekki er hægt að ætla að þessi
hópur sé dæmigerður fyrir intemetnotendur almennt. Peter Norvig,
yfirmaður hjá Google, sýndi fram á það með samanburðarrannsókn að
notendur Alexaviðbótarinnar séu líklegri til að starfa á sviði tækni- og
markaðsmála en við önnur störf. Það er enda rökrétt, það er fyrst og
fremst þessi hópur sem sér sér hag í því að nota viðbótina í tengslum
við starf sitt. Þannig er líklegra að síður sem innihalda slíkt efni hafi
hlutfallslega meira vægi í tölffæði Alexa en aðrar síður.12 í öðm lagi þarf
ákveðna kunnáttu til þess að sækja viðbótina og setja hana upp og því
er líklegt að tæknileg fæmi þeirra sem nota viðbótina sé yfir meðallagi.
í þriðja lagi virkar viðbótin aðeins með Intemet Explorer vafranum og
aðeins í stýrikerfi Windows.13 Ekki er því hægt að öllu leyti að bera
söfnun Intemet Archive saman við þá hugmynd um skylduskil sem
íslenska netsöfnunin byggir á enda ef til vill ósanngjamt að bera söfhun
efnis á svo litlu málsvæði saman við netsöfnun á heimsvísu.
Til viðbótar þeim áhrifúm sem samsetning Alexa hópsins hefúr á
netsöfnun Intemet Archive má geta þess að það er miserfitt að safna
vefsíðum. Hin sjálfvirku söfnunarforrit ná t.d. ekki að varðveita á
heildstæðan hátt síður sem byggja á gagnvirkni. Að lokum má nefna
að líkt og gildir um íslensku vefsöfnunina sneiða söfnunarvélar Intemet
Archive hjá vefsíðum sem meina sjálfvirkum söfnunarvélum aðgang og
fjarlægir fuslega efni úr safni sínu óski höfúndar þess eftir því.
í síkvikum heimi
Það er auðvelt að færa rök fyrir því að safna ætti íslensku bloggi
skipulega. Reyndar hafa málvísindamenn fyrir nokkm hafið söfnun
á völdum bloggum í því skyni að safna heimildum um þróun
íslensks máls.14 Islenskt samfélag er lítið og með tilkomu hins
svokallaða Moggabloggs fyrir nokkmm mánuðum virðast síðustu
eftirlegukindumar hafa verið bloggvæddar. Þegar horft er til þeirrar
staðreyndar að íslenska netsöfnunin varðveitir aðeins efni frá og með
árinu 2004 er hinsvegar augljóst að sú sýn sem íslenska netsöfnunin
birtir af íslenskum bloggheimum er ekki dæmigerð fyrir íslenskt
blogg í heild sinni. Islensku bloggveitumar em mun yngri en íslenska
bloggsprengjan sem fór að mestu leyti ffam á hinum stóm erlendu
bloggveitum. Til þess að sagnfræðingar ffamtíðarinnar geti komist
nálægt því að öðlast mynd af íslenskum bloggheimum, eða notað
blogg til að rannsaka islenskt samfélag, þyrffu þeir að hafa aðgang að
heimildasafni sem hefði að geyma íslenskt blogg vistað bæði innan og
utan þjóðarlénsins. Aðstandendur íslensku netsöfnunarinnar hafa horft
til samstarfs við erlenda aðila sem hafa vefsöfnun með höndum, og þá
sér í lagi Intemet Archive, en stofnunin tungumálagreinir allt efni sem
safnað er og ætti því fræðilega séð að eiga auðvelt með að afhenda afrit
af íslensku efni sem hún safnar eða a.m.k. upplýsingar um það á hvaða
lénum þetta efni sé að finna. Slíkar umleitanir hafa þó strandað á því að
Landsbókasafni - Háskólabókasafni er ekki lagalega heimilt að láta í
býttum affit af því efiti sem safnað er í þeirra söfnunum.15
Það verður þó að segjast eins og er að allar líkur em þó á því að bloggið
líði undir lok áður en við náum að gera það upp við okkur hvemig
best væri að söfhun þess staðið. A meðan að kunnátta í vefsíðugerð
var skilyrði þess að koma sér upp bloggsíðu var bloggið sérviskulegt
áhugamál fárra og bloggsíðumar eins misjafnar og þær vom margar. Eins
og bent var á hér framar varð bloggið fyrst vinsælt þegar til sögunnar
komu bloggveitur sem buðu upp á forsniðnar bloggsíður, tilbúnar til
notkunar. Hefur notendaviðmót þessarar þjónustu orðið aðgengilegra
með hverju árinu sem líður og þeim möguleikum sem notendum standa