Bókasafnið - 01.01.2004, Blaðsíða 20
ákveðnum atburðum. Kanada, Tasmanía og Nýja
Sjáland eru einnig að kanna möguleika á vefsöfnun.
Sumarið 1997 hófu norrænu þjóðbókasöfnin
óformlegt samstarf um að safna vefsíðum hvers
lands og vista til frambúðar. sSeinni hluta árs 1998
varð verkefnið að formlegu samstarfi og árið 2000 var
ákveðið að auk þess að skiptast á tækniþekkingu og
aðferðum við söfnunina myndu þjóðbókasöfnin
sameinast um að þróa forrit og aðferðir til að veita
aðgang að vefsíðunum og gera notendum þannig
kleift að vinna með vefsafnið á svipaðan hátt og hinn
raunverulega Vef. Sumarið 2000 sóttu þjóðbókasöfnin
sameiginlega um styrk til Nordunet2 [7] (nefnd
Norðurlandráðs sem veitti styrki til upplýsinga-
tækniverkefna á fjórum sviðum, þ.m.t. stafrænna
bókasafna) til þess að þróa sameiginlegt aðgangs-
forrit fyrir vefsíður hvers lands. Nordunet2 veitti
verkefninu 14 milljóna króna styrk en þjóðbóka-
söfnin sjálf lögðu fram 6 milljónir króna.
Verkefnið var nefnt Nordic Web Archive (NWA) [8] en
markmið þess var að veita aðgang að vefsafni með því
að safna texta sem finnst í þeim vefskjölum sem safnað
er, gera efnisyfirlit yfir textann og búa til vefviðmót sem
gerir það kleift að leita í efnisyfirlitinu, skoða hvaða
vefsíðu sem er og ferðast um vefsafnið í tíma og rúmi.
Þessum áfanga lauk síðsumars 2002. Þar sem hug-
búnaðurinn þótti ekki nógu góðurogýmis önnur vanda-
mál óleyst, var þá um haustið skilgreint framhalds-
verkefnið NWAII og fékkst til þess styrkur frá
NORDINFO [9]. Verkið hófst í byijun árs 2003 og því mun
ljúka í apríl 2004. í árslok 2003 var NWAII hugbúnaður-
inn gerður aðgengilegur öllum sem „opinn hugbúnaður"
(Open Source) og lofar hann góðu þótt full reynsla sé ekki
komin á hann. Öll þjóðbókasöfn Norðurlanda, þ.m.t.
Landsbókasafn hafa lagt til starfsmenn við verkið.
Þótt Norðurlöndin hafi unnið saman að þróun
verkefnisins er ekki gert ráð fyrir að svo verði um
rekstur þess heldur mun hvert land sjá um sitt vef-
safn. Aðstæður eru ólíkar og uppbygging stafrænna
bókasafna og vefsafna einstakra landa ólík.
Árið 2003 tók Landsbókasafn þátt í alþjóðlegu
samstarfi um framtíðarvarðveislu Vefsins og árangur
af því er m.a. sá að í júlí 2003 stofnuðu 11 þjóð-
bókasöfn og Internet Archive samtökin International
Internet Preservation Consortium (IIPC) [10].Markmið
samtakanna er að skilgreina hvað þarf til að varð-
veita vefsíður einstakra landa (og þegar fram í sækir
allar vefsíður) svo vitrænt og menningarlegt innihald
Vefsins fari ekki forgörðum.
Þetta samstarf leiddi til þess að haustið 2003 hófu
norrænu þjóðbókasöfnin samvinnu við Internet
Archive um gerð nýs fullkomins vefsöfnunarforits.
Unnið er að því í San Francisco og fóru tveir starfs-
menn Norðurlandanna þangað í sex mánuði og var
annar þeirra frá Landsbókasafni. Gert er ráð fyrir að
fyrsta áfanga verksins ljúki í lok apríl 2004.
Söfnun vefsíðna, framtíðarvarðveisla þeirra og
aðgangur að vefsafni er stórt og mjög flókið verkefni
og verður stöðugt að vinna að því að þróa hugbúnað-
inn svo hann haldi í við þróun Netsins og Veraldar-
vefsins. Þegar Landsbókasafn hefur lokið uppsetn-
ingu og aðlögun NWAII hugbúnaðar og nýs söfnunar-
forrits ásamt nauðsynlegri forritun til að samræma
þau gögn sem þegar eru til við nýja tækni, verður til
mikilvægt safn íslenskra vefsíðna og vefskjala sem,
ásamt því efni sem safnast á næstu árum, myndar
ómetanlegt safn íslenskra vefverka sem mun nýtast
öllum landsmönnum og fræðimönnum sem hafa
áhuga á íslenskri menningu og þróun Vefsins og
Netsins.
Söfnun vefsíðna
Sú venja hefur verið um skylduskil hefbundinna
útgefinna verka, þ.e. verk sem eru á „föstu formi“, að
útgefanda ber skylda til að afhenda varðveislusafni
ákveðinn fjölda eintaka. Þannig myndast grunnur að
safni sem er síðan aukið með keyptum aðföngum.
Það mætti auðvitað hugsa sér að hafa sama hátt um
verk útgefin á rafrænu formi á almennu tölvuneti og
hefur það verið reynt, t.d. í Danmörku. Það gaf ekki
góða raun því erfitt er að henda reiður á hinum fjöl-
mörgu verkum sem útgefin eru og eins eru útgef-
endur fjölmargir og erfitt að halda utan um þá alla. í
Ástralíu hefur verið farin sú leið að þjóðbókasafnið
hefur skilgreint og valið þá vefi sem það telur áhuga-
vert að safna. Valið byggir á huglægum forsendum
um hvaða efni er mikilvægt og einnig er reynt að sýna
nokkurt yfirlit yfir hvað finnst á ástralska Vefnum.
Náið samband er haft við útgefendur verkanna og eru
vefirnir skráðir bókfræðilega.
Það er almennt viðurkennt að eina raunhæfa
leiðin til að safna miklu vefefni, t.d. öllum íslenskum
vefsíðum, er að nota söfnunarforrit, þ.e. forrit sem
fylgir vefslóðum og afritar allt efni sem það nær til á
hvaða formi sem er. Tæknilega séð er þetta mjög
flókið því margs þarf að gæta og erfitt að sjá fyrir öll
þau tilvik sem upp geta komið. Forritið þarf að ráða
við sem flest form netverka, en þau eru yfir 400, þótt
þau algengustu, svo sem HTMLJPEG, GIF, PDF og ýmis
textaform nái til yfir 90% verkanna. Vefurinn verður
einnig sífellt flóknari með tilkomu gagnvirkni og
forritabúta af ýmsu tagi, og einnig er það síður en svo
að allar vefsíður séu gerðar samkvæmt þeim stöðlum
sem eiga að gilda um vefforrit. Það er því flókið verk
að gera gott forrit til söfnunar á vefsíðum og ekki um
mörg að velja. í fyrrgreindri könnun kom í ljós að
aðeins 4-5 þeirra eru aðgengileg og ekkert þeirra í
raun nógu gott. Landsbókasafn notar forrit sem
nefnist NEDLIB [11] og er það einna útbreiddast og
notað í nokkrum löndum.
18
BÓKASAFNIÐ 28. ÁRG. 2004