Orð og tunga - 01.06.2007, Síða 65
Eiríkur Rögnvaldsson: Textasöfn og setningagerð: greining og leit 55
um hvort tiltekin setning sé tæk eða ekki. Þeir sem fást við sögulega
setningafræði eiga aftur á móti ekki þessa útleið - þeir verða að reiða
sig algerlega á textana (sjá umræðu um þetta hjá Eiríki Rögnvaldssyni
1998). Stundum hafa menn reynt að bæta sér það upp með einhverjum
ráðum, eins og t.d. því sem kallað hefur verið „lögmál ónýttra tæki-
færa" (Principle of missed opportunities) og er orðað svo:
(1) If a certain syntactic form is used regularly in a given funct-
ion or type of context C in a living language L, and if F is
absent in C at an earlier stage of the language, OL, then
there is good reason to assume that F does not exist in OL
(Faarlund 1990:17).
Þetta getur þó aðeins verið viðmið sem verður að beita af mikilli var-
færni. Hvernig getum við t.d. fullyrt að eitthvað sé „absent [...] at an
earlier stage of the language" - hvernig skilgreinum við „language"
þarna? Við höfum ekki annað til að miða við en þá texta sem varð-
veittir eru eða við höfum aðgang að - og þeir eru ekki alltaf miklir. En
við þurfum líka að gæta þess að skoða þá alla áður en við fullyrðum
nokkuð, gæta þess að ekki komi eitthvað annað til sem geti valdið því
að viðkomandi setningagerð finnst ekki á eldra málstigi, o.s.frv.
Hér á undan var sagt að hægt væri - að vissu marki - að nota texta-
söfn til að úrskurða tiltekna setningagerð tæka. En þar verður líka að
hafa fyrirvara. Því fer nefnilega fjarri að allar setningar sem koma fyrir
í textasöfnum séu tækar í raun og veru, þ.e. samræmist málkerfi flestra
málnotenda. McEnery og Wilson (1996:13) hafa eftir Chomsky að allt
að 95% allra segða (utterances) séu í raun málfræðilega ótækar. Þar er
væntanlega miðað við talmál og hlutfallið örugglega mim lægra í rit-
uðu máli - og McEnery og Wilson vilja líka meina að tala Chomskys
sé alltof há. En jafnvel þótt við lítum framhjá mállýskumun er ljóst að
í rituðu máli er nokkuð um setningar sem flestir myndu telja ótæk-
ar - setningar þar sem fyrir koma ýmiss konar pennaglöp, mistök í
ritvinnslu, prent- og ásláttarvillur, einstaklingsbundið málfar, o.s.frv.
Dæmi um þetta má sjá í eftirfarandi setningu af mbl.is:
(2) Alls voru um 179 tonn af hvalaúrgangi af þeim sem sjö
langreyðum sem veiddust við landið í haust urðað að Fífl-
holtum á Mýrum. [Undirstrikun mín, ER]
http://zmviv.mbl.is/mm/frettir/frett.html?nid=1245425
Þarna eru - að flestra mati, geri ég ráð fyrir - tvær villur; sem ofauk-
ið og sambeygingu vantar. Þegar við lesum leiðréttum við þetta með