Bókasafnið - 01.10.2008, Page 10
BÓKASAFNIÐ 32. ÁRG. 20088
TELplus er 27 mánaða verkefni sem hófst 1. október 2007. Það er styrkt af ESB en eins og nafnið ber með sér (TEL - The European
Library) er það unnið í mjög nánum tengslum við
Evrópubókasafnið. Heildarkostnaður er áætlaður
um 2,1 milljónir evra en Landsbókasafn fær um
94.700 evrur í sinn hlut vegna 25 mannmánaða vinnu-
framlags, ferðakostnaðar og kaupa á hugbúnaði vegna
ljóslesturs. Alls taka 27 stofnanir þátt í verkefninu og
eru þar á meðal tuttugu þjóðbókasöfn, sex rannsókn-
arstofnanir og eitt einkafyrirtæki sem er umsjónaraðili
verkefnisins. Aðalmarkmiðin eru að:
• Nota ljóskennsl (Optical Character Recognition)
til að ljóslesa stafrænar myndir af prentefni og
koma texta þeirra þannig á tölvutækt form.
• Varpa lýsigögnum þeirra gagnasafna sem unnið
er með í staðlað OAI lýsigagnasnið og gera
Evrópubókasafninu kleift að safna þeim og
ljóslesnum texta til að veita aðgang að efninu
um TEL gáttina. Verður þá bæði hægt að leita í
lýsigögnunum og textanum.
• Stuðla að því að varpa lýsigögnum þess efnis
sem TEL gáttin veitir nú eingöngu Z39.50
aðgang að í OAI lýsigagnasnið til þess að hægt
sé að gera miðlægt efnisyfirlit yfir efnið.
• Gera þjóðbókasöfn Búlgaríu og Rúmeníu full-
gilda meðlimi að Evrópubókasafninu.
Verkefnið skiptist í átta verkþætti en þeir eru: (1)
ljóslestur, (2) vörpun lýsigagna í OAI lýsigagnasnið,
(3) þýðingar og notkun tungutækni, (4) þjónusta
við notendur, (5) sérhæfð notendaþjónusta, (6) inn-
leiðing Búlgaríu og Rúmeníu í TEL, (7) kynning á
verkefninu og (8) umsýsla og eftirlit. Landsbókasafn
tekur þátt í verkþætti eitt með tuttugu mannmánaða
vinnuframlagi og verkþætti tvö með fimm mánaða
vinnuframlagi.
Ljóskennsl er aðferð við að gera texta í stafrænni
mynd tölvutækan, þ.e. að nota forrit til að ljóslesa
myndina og skila texta sem þar er á tölvutæku formi
og þar með nýtanlegan til leitar eða flutnings, t.d. í rit-
vinnsluforrit. Í Landsbókasafni gerist þetta þannig að
við stafræna endurgerð blaða og tímarita eru stafrænu
myndirnar ljóslesnar í sérhæfðu forriti sem nefnist
FineReader og er texti hverrar blaðsíðu vistaður sér-
staklega og tengdur stafrænni mynd af blaðsíðunni.
Þorsteinn Hallgrímsson
TELplus
Gert er efnisyfirlit yfir textann og það má nota til
að leita að orðum sem koma fyrir í textanum og nið-
urstöður segja til um í hvaða eintaki og blaðsíðu hann
finnst.
Í ársbyrjun 2008 hafði Landsbókasafn myndað
um 1,64 milljónir blaðsíðna tímarita og dagblaða, sjá
http://timarit.is/, og þar af hafa um 800.000 síður
verið ljóslesnar. Þegar TELplus lýkur í árslok 2009
er gert ráð fyrir að Landsbókasafn hafi myndað og
ljóslesið alls um 2,5 milljónir blaðsíðna.
Í heild er áætlað að við lok TELplus verði yfir
tuttugu milljónir ljóslesinna blaðsíðna aðgengilegar
um TEL gáttina og að lýsigögn flestallra gagnasafn-
anna verði komin á OAI form. Þá verður hægt
að leita samtímis í OAI lýsigögnum og ljóslesnum
texta. Einnig er gert ráð fyrir að þýða lýsingu á þeim
gagnasöfnum sem aðgangur er að á tungumál allra
aðildarríkja. Allar líkur eru á að þessi markmið gangi
eftir. Hvað önnur markmið varðar, þ.e. ýmislegt sem
varðar tungutækni, viðbótarþjónustu og endurbætur
á TEL gáttinni, er of snemmt að segja til um árang-
ur.
Fyllri upplýsingar um TELplus verkefnið fást með
því að smella á tengilinn: http://www.theeuropeanli-
brary.org/portal/organisation/cooperation/telplus/
Abstract
TELplus
TELplus is a TEL project funded by the European
Commission under the eContentplus Programme and
coordinated by the National Library of Estonia. There
are 27 participants taking part in. the project what started
in September 2007 and will finish at the end of 2009. It
is another building brick in the creation of Europeana,
the European digital library, museum and archive, and is
aimed to strengthen, extend and improve The European
Library service. This will be achieved by addressing a
number of key issues, including improving access through
OAI compliancy, making more than 20 million pages
from the European National Libraries' digital content
available with OCR, improving multilingual search and
retrieval and adding services for the manipulation and
use of content. The participation in TEL by the National
and University Library of Iceland is explained especially
concerning the expected outcome, work effort, costs and
financial benefits.