Orð og tunga - 01.06.2013, Page 40
30
Orð og tunga
áherslupenni
barnaís
bleksprautuprentari
buxnadragt
eldislax
fjárlagahalli
flísefni
grasrótarhreyfing
heimasíða
húsbréfalán
kapalkerfi
krókaleyfi
leikskólakennari
líkamsklukka
ljósleiðari
margmiðlun
myndlykill
raðgreiðsla
ríkisvíxill
talhólf
Tafla 1. Dæmi um orðtöku úr Morgunblaðinu.
Orðtakan var mjög tímafrek og var unnin með hefðbundnum aðferð-
um, þ.e. textarnir voru lesnir og leitað að orðum sem þóttu hafa gildi
í orðabók. Virkar samsetningar voru ekki teknar með. Afraksturinn
varð nokkur þúsund orð, dýrmæt og dýr.
Alls eru 241.784 flettiorð í Norræna verkefninu og eru þau flokkuð
eftir orðgerð, þ.e. í ósamsett, afleidd og samsett orð, og eftir flettugildi,
þ.e. eftir því hversu mikið erindi orðin eru talin eiga í orðabók. Þar
er gerður greinarmunur á virkum samsetningum og orðgervingum
(lexíkalíseruðum orðum) og einnig tekið tillit til tíðni og notkunar
orða, eftir því sem gerlegt var á þeim tíma þegar verkið var unnið en
þá var ekki um greiðan aðgang að tíðnitölum að ræða.
í Norræna verkefninu var reynt að sameina allar heimildir sem
tiltækar voru á OH á þeim tíma sem verkið var unnið. Þetta var í þann
mund sem aðgangur að tölvutækum textum var að opnast en engar
aðferðir voru tiltækar til þess að nýta þá til orðtöku umfram það sem
gert var í íslenskri orðtíðnibók. Ekki fékkst styrkur til þess að halda
vinnu við Norræna verkefnið áfram árið 1996 og það lagðist í dvala.
Þar varð samt til mikið orðasafn sem að mestu var tekið saman með
hefðbundnum aðferðum og það er þess vegna gott til samanburðar við
efni sem aflað verður með nýrri aðferðum. Þórdís Ulfarsdóttir (2013)
tekur fram að 86% af orðaforðanum í Islex sé úr Norræna verkefninu
þannig að efnið nýttist ágætlega í því verki.
3 Nýjar heimildir og nýjar aðferðir við orðtöku
Með tilkomu tölvutækra texta breyttist heimur orðabókarmannsins. í
stað hefðbundinnar orðtöku þar sem textar eru lesnir á pappír, kem-
ur vélræn orðtaka sem byggist á því að láta tölvu finna orð eða orð-
myndir í rafrænum textum sem ekki eru í samanburðarefni. Milli-
stigið er að orðtaka úr rafrænum texta á skjá, með því að lesa textann,