Orð og tunga - 01.06.2007, Page 122
112
Orð og tunga
(1) Orðasafn íslensks orðasjóðs er „öðru vísi" orðabók
sem inniheldur upplýsingar um heildartíðni og hlut-
fallslega tíðni orðmynda, notkunardæmi, merkingar-
og textaumhverfi, þ.e. hægri og vinstri nágranna í
textum og orð með marktæka tíðni í sömu setningum
og leitarorðið. Orðasafnið er í íslensku notendaum-
hverfi sem ætlað er almennum íslenskum notendum.
(2) Textagrunnar eru mikilvægt hjálpartæki í tungu-
málarannsóknum og tungutækniverkefnum. íslensk-
ur orðasjóður er einn umfangsmesti textagrunnur á
íslensku sem er ætlaður til notkunar í rannsóknum á
íslensku nútímamáli, en öflugar rannsóknir eru mik-
ilvæg undirstaða varðveislu og eflingar íslenskrar
tungu. Sem dæmi um rannsóknir sem eru í undirbún-
ingi má nefna tíðnirannsóknir á íslenskum orðtök-
um og rannsóknir á nýyrðum, orðmyndunarmögu-
leikum og úreltum orðum í íslensku.
2.3.1 Almennir notendur
Notendahópur þýska orðasjóðsins er mjög fjölbreyttur. Allir sem eitt-
hvað hafa með málnotkun (skrifa og þýða texta), þýskukennslu eða
tungumálarannsóknir að gera virðast nota hann og hafa gagn af hon-
um, bæði notendur með þýsku sem móðurmál og einnig þeir sem eru
að læra þýsku. Miðað við notendahóp þýska orðasjóðsins má ætla að
Islenskur orðasjóður muni einnig nýtast mjög fjölbreyttum íslenskum
notendahópi og jafnvel einnig málnotendum sem eru að læra íslensku
sem erlent tungumál.
2.3.2 Sérhæfðir notendur
Það er viðurkennd staðreynd að textagrunnar eru nauðsynleg hjálp-
artæki í tungumálarannsóknum (sbr. Quasthoff, Richter og Biemann
2006). Textasafn Orðabókar Háskólans inniheldur samtals um 52 millj-
ónir lesmálsorða úr fjölbreyttum textum (sbr. upplýsingar á heimasíðu
Orðabókar Háskólans, http://www.lexis.hi.is/ts_umsafnid.htm) en vegna
höfundarréttar er vefaðgangur2 að safninu einskorðaður við texta án
2Starfsmenn Orðabókarinnar hafa reynst mjög hjálpsamir við aðstoð við og að-
stöðu fyrir rannsóknarverkefni, þ.e. aðgangur að öllu textasafninu hefur verið mögu-