Bókasafnið - 01.01.2004, Síða 21
Mynd 1
Vefsafn
http//..
http//..
http//..
http//..
Óháð tækni er eðlilegt að rætt sé hvaða efni skuli
safna og ef svo er hvort setja eigi reglur um það, þ.e.
skilgreina hvaða efni á að safna. Norðurlöndin hafa
fylgt þeirri stefnu að safna öllu efni sem til næst og
vista það. Mörgum finnst þetta ekki við hæfi og benda
á að bæði verði efnismagnið óhemju mikið og enn-
fremur að mikill hluti þess sé lítils virði, jafnvel rusl
og því ekki rétt að varðveita það. Það er talsvert til í
því en þá kemur upp það vandamál að velja „rétt“
efni. Hver á að skera úr um hvaða efni verður verð-
mætt eftir 10 ár, 25 ár eða 100 ár. Það er ekki einfalt
því efnismat og áhugamál notenda breytast með
tímanum og því er ekki víst að það efni sem við
teljum markverðast nú haldi gildi sínu. Á sama hátt
getur efni fengið aukið vægi í framtíð. Fræðilegt efni
endist misvel allt eftir fræðigrein en mikilvægt er að
efni sem vitnað er í varðveitist því annars tapast
mikilvægur hlekkur. Mitt sjónarmið er að meðan það
er tæknilega framkvæmanlegt, eigi að safna öllum
vefsíðum að því marki sem unnt er. Með því að velja
ákveðna vefi eða vefsíður næst aðeins til brots af því
efni sem birt er á vefnum og er slíkt val bæði erfitt og
dýrt í framkvæmd. Ef öllum vefsíðum sem til næst er
safnað t.d. 3-4 sinnum á ári fæst nokkuð góður
þverskurður af Vefnum. Jafnframt má færa gild rök
fyrir því að ástæða er til að safna vissum vefsetrum
oftar en öðrum. Fréttavefum, svo sem mbl.is, visir.is
og ruv.is, þarf helst að safna daglega og umræðu-
vefum sem fjalla um menningar- og þjóðfélagsmál,
svo sem murinn.is, tikin.is og kreml.is, þarf e.t.v. að
safna einu sinni í viku. Undanskilið söfnun (í upphafi
a.m.k.) eru ýmsir markverðir hlutar Vefsins og Net-
sins, t.d. tölvupóstur, spjallrásir og innri vefir fyrir-
tækja og stofnana. Tæknilega séð er erfitt að safna
gagnvirkum vefsíðum og jafnframt gagnagrunnum
(svokölluðum djúpvef) sem oft er erfitt að nálgast og
einnig er umdeilanlegt að hvaða marki hagkvæmt er
að safna efni þeirra.
Söfnun vefsíðna er yfirleitt framkvæmd þannig að
söfnunarforritið er í upphafi matað á talsverðum
fjölda vefslóða og fylgir það svo öllum slóðum
(innanlands a.m.k.) sem það finnur og afritar allar
vefsíður, þ.m.t. myndir og annað efni sem tengist
vefsíðunum. NEDLIB forritið ber saman vefsíður og
vistar aðeins þær vefsíður sem hafa breyst frá því að
síðast var safnað. Ýmis önnur forrit kanna ekki hvort
vefsíða hefur breyst en vista allt. Báðar aðferðir hafa
kosti og ókosti. Helsti kosturinn við að vista aðeins
breytingar er að umtalsvert minna pláss þarf fyrir
vefsafnið en helsti ókosturinn er sá að söfnunin tekur
lengri tíma og verður yfirferð því minni. Ef allt er
vistað næst mun meiri yfirferð en vefsafnið tekur
meira pláss og er nauðsynlegt að gera sérstakar
ráðstafanir í aðgangsviðmóti til að óbreytt síða birtist
ekki mörgum sinnum.
Talsvert er um að aðgangur að vefsetri eða vef-
síðum sé í raun heimill öllum en gegn gjaldi eins og
t.d. á við um síðustu þrjú ár greinasafns Morgun-
blaðsins. f þeim tilvikum kveður reglugerð á um að sá
sem birtir verk á stafrænu formi á almennu tölvuneti
skuli veita móttökusafni aðgang að verkinu og láta í
té aðgangsorð og aðrar upplýsingar sem nauðsyn-
legar eru til þess að safnið fái aðgang að verkinu.
Þannig getur Landsbókasafn farið fram á að fá afhent
nauðsynleg aðgangsorð, en afhendingarskyldu telst
einmitt fullnægt ef safninu er gert kleift að taka til sín
stafrænt eintak af verkinu.
Landsbókasafn hóf eins og áður er getið undir-
búning að söfnun vefsíðna með því að taka þátt í
samvinnu norrænu þjóðbókasafnanna um að skil-
greina kröfur til vefsöfnunarforrits og vefsafns, að
gera hugbúnað til að gera efnisyfirlit yfir texta vef-
síðna í vefsafninu og veita aðgang að vefsafninu um
Vefinn. Fyrstu tilraunir með vefsöfnun voru gerðar
haustið 2001 en hugbúnaðurinn reyndist ófullnægj-
andi. í árslok 2002 var hafin söfnun á ný og hefur
síðan verið safnað eftir því sem unnt er, en hugbún-
aðurinn er enn óstöðugur og því falla ávallt úr dagar.
í vor, 2004, mun það forrit sem Landsbókasafn tekur
þátt í að þróa verða tekið í notkun og þá má búast við
mun betri árangri við vefsöfnun en hingað til. Þá mun
reyna á þau ákvæði reglugerðarinnar sem kveða á um
að safnið skuli leita eftir nánu samstarfi við þann
aðila sem annast skráningu og stjórnun á þjóðar-
léninu .is og einnig sérstaklega við rekstraraðila
stærstu léna sem skylduskil taka til, um framkvæmd
og tilhögun söfnunar þeirra verka sem birt eru á
vefnum.
í reglugerðinni sem fjallað var um hér að framan
er ennfremur kveðið á um að safnið skuli leita eftir
samstarfi við aðila sem birta verk á almennu tölvu-
neti um að þeim fýlgi sem best lýsigögn. Því miður er
það svo að lýsigögn fylgja almennt ekki vefsíðum og
verður það því mikið verk að ná til þeirra sem gefa
verkin út. Til að byrja með verður reynt að ná til
opinberra stofnana og stærri fýrirtækja um að þau
setji lýsigögn inn í vefsíður sínar.
BÓKASAFNIÐ 28. ÁRG. 2004
19