Orð og tunga - 01.06.2007, Page 39
Ásta Svavarsdóttir: Talmál og málheildir — talmál og orðabækur 29
aðgengilegt til leitar (sbr. (1)4) en það stendur tíl bóta.5 Textasafn ís-
lendingasagna, sem áður hefur verið nefnt, getur líka kallast málheild
í þeim skilningi að það nær tíl allra tiltækra texta af tilteknu tagi og
þeir hafa verið greindir m.t.t. uppflettiorðs og orðflokks (sjá t.d. Eirík
Rögnvaldsson 1990), upplýsingar um gerð safnsins liggja fyrir og það
er aðgengilegt til leitar, því það hefur bæði verið gefið út á geisladiski
(/slendinga sögur 1996) og á vefsetri Eddu útgáfu undir nafninu Sagna-
lykill.
Víkjum nánar að samsetningu málheilda. Tiltölulega litlar mál-
heildir sem taka til skýrt afmarkaðs sviðs fela sumar í sér alla texta sem
um er að ræða og gefa þar með heildarmynd af málinu á viðkomandi
sviði. Þetta eru einkum sérhæfðar málheildir sem spanna t.d. ákveðna
textategund eða tiltekið tímabil í sögu málsins sem tiltölulega fáir text-
ar tilheyra. Sem dæmi um söfn af þessu tagi eru íslenska lagasafnið og
textasafn íslendingasagna6 sem áður eru nefnd (þótt hvorugt þeirra
getí talist fullgild málheild m.t.t. áðurgreindra viðmiða). Málið vand-
ast hins vegar í málheildum sem er ætlað að endurspegla málnotkun
á sviði sem útílokað er að ná utan um í heild sinni, t.d. málheild með
íslensku ritmáli á 20. öld eða íslensku samtímamáli. í slíkum tilvikum
verður að velja hæfilegt magn úr öllum þeim textum sem völ er á með
það markmið í huga að efniviðurinn sé dæmigerður fyrir málnotkun
almennt og endurspegli málið innan þess ramma sem málheildinni er
settur.
Mikið hefur verið rætt og ritað um val á textum þannig að mál-
heildir birti eðlilegt þversnið af því tungumáli sem þær geyma. For-
senda þess að draga megi almennar ályktanir um mál og málnotk-
un af niðurstöðum rannsókna sem byggðar eru á tiltekinni málheild
er að samsetning hennar endurspegli raunverulega málnotkun í öll-
um sínum fjölbreytíleika (sjá t.d. Teubert & Cermáková 2004:112-118,
Biber, Conrad & Reppen 1998:246-250 og Landau 2001:323 o.áfr.). Hér
5Sumarið 2006 vann Sigríður Andrea Ásgeirsdóttir að því undir stjóm Sigrúnar
Helgadóttur að ganga þannig frá textasafninu að hægt sé að leita í því með hugbún-
aðarpakkanum Xaira. Að því búnu getur bæði textinn sjálfur og mörkin nýst að fullu.
Ef leyfi fæst frá rétthöfum textanna er ætlunin að opna aðgang að safninu í því formi
á vefsíðu stofnunarinnar. Verkefnið var styrkt af Nýsköpunarsjóði námsmanna.
6Hér er horft fram hjá textafræðilegum atriðum varðandi form textanna. Textarnir
í safninu eru allir með nútímastafsetningu og það takmarkar notkun þess við atriði
þar sem ritháttur skiptir litlu máli. En það dugar t.d. ágætlega við rannsóknir á tíðni
orða, orðaröð og setningagerð í fomu máli, a.m.k. í máli sagnanna.