Bókasafnið - 01.01.2004, Blaðsíða 19
veita vefsíður og önnur rafræn skjöl á Netinu. í könn-
un sem greinarhöfundur gerði fyrir CoBRA (undir-
nefnd samtaka evrópska þjóðbókasafna), í janúar
2003 kom í ljós að einungis 5 lönd í Evrópu, Danmörk,
ísland, Litháen, Noregur og Svíþjóð, höfðu löggjöf um
skylduskil verka á rafrænu formi á almennu tölvu-
neti. Utan Evrópu hefur höfundur ekki fundið dæmi
um það.
Þetta er athyglisvert og spyrja má af hverju þjóðir
bregðist svo seint við. Svarið er ekki einhlítt og skýr-
ingar mismunandi eftir löndum, ýmist tæknilegar,
lagalegar, eða hugmyndafræðilegar. Það er tæknilega
mjög flókið og erfitt að ná inn efni Vefsins og varð-
veita það, sérstaklega fyrir fjölmennar þjóðir. Eðli
Vefsins hefur vafist fyrir löggjafanum og mikil um-
ræða verið um hvernig taka beri á ýmsum álita-
málum bæði varðandi söfnun efnis og aðgang að því
efni sem safnað er. Þá ber að nefna að eitt aðal-
einkenni Vefsins er að hver sem er getur án mikils
kostnaðar eða fyrirhafnar útbúið efni og birt það á
Vefnum, og því má staðhæfa að þar finnist óhemju
mikið efni sem er lítils virði. Það er andstætt hug-
myndafræði margra að safna slíku efni og varðveita
það. Hvað sem þessum vangaveltum líður er augljóst
að nú finnst talsvert efni eingöngu á Netinu og í
framtíð verður sífellt stærri og þýðingarmeiri hluti
menningarefnis og þjóðmálaumræðu þjóðarinnar
eingöngu birt á Vefnum. Ef hugmyndir um skylduskil
eiga rétt á sér er ljóst að það er knýjandi nauðsyn að
safna þessu efni og þar með að láta lög um skylduskil
einnig ná til Vefsins og Netsins. Ef vefsíðum er ekki
safnað á skipulegan hátt glatast þær og þar með
mikilvægur hluti íslensks menningararfs ásamt upp-
lýsingum um, eða skjölun á, þeim menningar- og
þjóðfélagsbreytingum semeiga sér stað. Benda má á
að mikill hluti útvarps- og sjónvarpsefnis fyrri hluta
síðustu aldar hefur ekki verið varðveittur.
Varðveisla verka á rafrænu formi á almennu
tölvuneti, þ.e. íslenskra vefsíðna í vefsafni, byggist á
sömu atriðum og varðveiðsla almenns efnis svo sem
bóka, handrita, tímarita og blaða, þ.e. á söfnun efnis-
ins og vistun þess, varðveislu til framtíðar, og að veita
greiðan aðgang að því efni sem safnað er. Með þetta
að leiðarljósi hefur Landsbókasafn sett sér það mark-
mið að safna sífellt öllum íslenskum vefsíðum, vista
þær í gagnagrunni og varðveita þær þar til framtíðar
og veita almenningi, fræðimönnum og áhugamönn-
um um þróun íslensks þjóðfélags, menningar og
tungu aðgang að vefsíðunum. Ávinningur er bæði
menningarlegur, fræðilegur og hagnýtur. Mikilvægt er
að tryggja varðveislu menningarefnis sem birt er á
Vefnum og möguleika fræðimanna framtíðar til að
nota það efni. Vefurinn er sjálfstæður miðill og er nú
þegar mörgum rannsóknarefni. Áríðandi er einnig að
tryggja að fræðilegt efni, s.s.s. greinar sem eingöngu
eru birtar á Vefnum glatist ekki og að hugsanlegar
tilvitnanir í efnið haldi gildi sínu, en það er nú þegar
vandamál. Hagnýtur ávinningur felst m.a. í því að
nota vefsafnið til rannsókna í upplýsingatækni en
vefsafnið mun geyma gífurlegt magn af nútíma texta
á öllum sviðum sem nota má í ýmsum tilgangi, svo
sem tungutækniverkefnum.
Forsaga
Upphaf þess að safna vefsíðum og varðveita þær má
rekja til ársins 1996 er Brewster Kahle stofnar fyrir-
tækið Internet Archive [3] í San Francisco með það að
leiðarljósi að skapa varanlegt alheimsvefsafn, að-
gengilegt öllum án endurgjalds. Fyrirtækið hefur starf-
að æ síðan og um síðustu áramót var vefsafnið um 300
terabyte (300.000 Gigabyte) að stærð og stækkar um 12
Tb á mánuði. Þetta er óhemju mikið og mun meira
gagnamagn en varðveitt er í stærsta bókasafni heims,
Library of Congress í Washington DC í Bandaríkjunum.
(Ekki verður fullyrt neitt um gæði eða verðmæti gagn-
anna). Allt efnið er geymt á seguldiskum og er það
aðgengilegt öllum beint um vefslóðina http://web.
archive.org/collections/web/advanced.html. Ekki hefur
þó verið lögð megináhersla á gott leitarforrit og not-
endaviðmót. Þarna er að finna fjölmargar íslenskar
vefsíður, m.a vefsíður Landsbókasafns frá árinu 1996.
Brewster Kahle er mikill hugsjónamaður og eftir að
hann efnaðist vel á ýmsum verkefnum og uppfinn-
ingum á sviði upplýsingatækni hefur hann efni á að
vinna að hugðarefnum sínum, þ.m.t. varðveislu vef-
sins. Hann hefur sagt að hvatinn að þessu safni sé
m.a. afdrif bókasafnsins í Alexandríu til forna sem
brannsem kunnugt er til ösku.
Sama ár og Internet Archive var stofnað (1996)
hófst þjóðbókasafn Svía (KB í Stokkhólmi) handa
við verkefnið Kulturarw3 [4] með það að markmiði
að safna öllum sænskum vefsíðum eða öllu heldur
að taka nokkurs konar augnabliksmynd af Vefnum
með því fara yfir sænska Vefinn þar til náðst hafði
til allra vefsíðna, og varðveita þær til framtíðar.
Þetta hefur nú verið gert 10 sinnum og er vefsafnið
nú um 8 Tb að stærð og þar eru um 55 milljón
vefskjöl. Þróaðar voru aðferðir til að safna vefsíðum
og vista þær en ekki voru gerð forrit til að vinna með
hið safnaða efni. Þjóðbókasafn Ástralíu hóf einnig
árið 1996 að safna vefsíðum en í mun minna mæli
en þar var valin sú leið að safna einungis völdum
vefum. Verkefnið nefnist Pandora [5]og er vefsafnið
nú um 554 Gb að stærð og þar eru um 17,7 milljón
vefskjöl.
í fyrrgreindri könnun kom í ljós að alls hafa 15
Evrópulönd gert tilraunir með eða hafið vefsöfnun
en þau eru, auk Norðurlanda: Austurríki, Bretland,
Frakkland, Þýskaland, Lettland, Litháen, Holland,
Slóvenía, Sviss og Tékkland. Auk fyrrgreindra safna
hefur Library of Congress unnið að Minerva [6] verk-
efninu þar sem safnað er vefsíðum sem tengjast
BÓKASAFNIÐ 28. ÁRG. 2004
17