Orð og tunga - 01.06.2013, Side 59
Þórdís Úlfarsdóttir: islex - norræn margmála orðabók
49
ætlaður fyrir upplýsingar um íslensku auk kerfislegra atriða, en hinn
helmingurinn er fyrir ýmis gögn er varða markmálin fimm. Þar eru
sjálfar þýðingarnar vitaskuld fyrirferðarmestar en einnig eru þar
notkunarupplýsingar af ýmsu tagi og beygingarendingar jafnheita,
allt sundurgreint eftir tungumálum.
5.1 Textasöfn og önnur hjálpargögn
Rafræn textasöfn hafa á undanförnum áratugum leyst af hólmi hefð-
bundna orðtöku sem öll viðamikil orðabókarvinna hefur óhjákvæmi-
lega útheimt í gegnum tíðina, þar sem tilgangurinn hefur verið að
leita uppi sem mest af heimildum um tiltekið orð, s.s. merkingu þess,
notkun, aldur, útbreiðslu, beygingu o.s.frv. (Um kosti og galla texta-
safna við orðabókargerð má t.d. benda á Svensén 2004:56-59).
Vitnisburður textasafna hefur fjölþætt gildi í orðabókarvinnu:
• Textarnir gefa vísbendingu um hversu algengt eða sjaldgæft
orðið er í málinu.
• Upplýsingar fást um aldursdreifingu orðsins og notkunarsvið
þess.
• Hægt er að ákvarða merkingu orðs (stundum fleiri en eina) út
frá samhengi þess í setningum.
• Ákveðin mynstur orða geta komið í ljós í röðuðum niðurstöð-
um textasafnsleitar, þ.e. mynstur um fasta orðanotkun sem
gera þarf skil í orðabók en auðvelt væri að yfirsjást með öðrum
hætti.
• Fjölbrey ttir textar eru mikilvæg hjálp þegar búa þarf til notkun-
ardæmi um orðin.
islex telst til þeirra orðabóka sem eru að miklu leyti grundvallaðar á
textasöfnum, og búum við svo vel að hafa aðgang að fjölbreytilegum,
rafrænum íslenskum textum. Einkum hafa tvö stór textasöfn verið
mikilvæg hjálpartæki í starfinu.
Um svipað leyti og starfið við islex hófst var Islensku textasafni komið
fyrir á vef stofnunarinnar. Textasafnið hefur aukist jafnt og þétt með
árunum og er stærð þess um mitt ár 2012 um 67 milljónir lesmálsorða.
Það hefur að geyma efnisflokkaða og að nokkru leyti aldursflokkaða
texta þar sem leitað er að stökum orðum, í einum efnisflokki eða
fleirum í senn. Efnisflokkar textasafnsins eru t.d. skáldrit, fornrit,
SAGA Og HEIMSPEKI, LÍFFRÆÐI, RAUNGREINAR Og MATREIÐSLA. Mynd 4
sýnir bút af niðurstöðu leitar í Islensku textasafiii.