Gripla - 20.12.2012, Page 345
343
vitum hefur ekki verið gerð nákvæm athugun á tíðni og þróun þessarar
notkunar. Með hjálp trjábankans er hins vegar auðvelt að fá yfirlit um
þetta. Þar má nota eftirfarandi leitarskipun í CorpusSearch:
(3) nP* idoms one-*
AND nP* idoms n-*
AND one-* iprecedes n-*
* (stjarna) er algildisstafur sem stendur fyrir hvaða staf eða stafastreng sem
er –nP* táknar því nafnlið af hvaða gerð sem er (frumlag, andlag, o.s.frv.).
orðið einn fær sér merkingu í bankanum, one, enda oft erfitt að greina
það í orðflokk. stjarnan er sett aftast í one-* til að fá öll dæmi um orðið,
óháð falli. sömuleiðis er stjarna sett á n-* til að fá öll nafnorð í eintölu,
óháð falli. idoms táknar „immediately dominates“, þ.e. „beint yfirskipað“,
og iprecedes táknar „immediately precedes“, þ.e. „fer næst á undan“. Hér er
því leitað að dæmum þar sem einn og nafn orð í eintölu eru beinir stofn-
hlutar í nafnlið, og einn fer næst á undan nafnorðinu.
Þessi leit skilar á skjáinn öllum setningum sem falla að leitarskilyrð-
unum – alls 1518. ein þeirra er „í annan stað leit hann á einn kastala“ úr
Ectors sögu frá 15. öld, sem lítur svona út í trjábankanum:4
(4) ( (IP-MAt (PP (P í-í)
(nP (otHeR-A annan-annar) (n-A stað-staður)))
(vBDI leit-líta)
(nP-sBj (PRo-n hann-hann))
(PP (P á-á)
(nP (one-A einn-einn) (n-A kastala-kastali)))
(. .-.))
(ID 1450.eCtoRssAGA.nAR-sAG,.1016))
Aftan við setningarnar kemur svo yfirlitstafla þar sem sést hversu mörg
dæmi fundust í hverjum hinna 60 texta í bankanum. Þessa töflu er auðvelt
að líma inn í töflureikni eins og excel og vinna þar með tölurnar á ýmsan
hátt – reikna út tíðni og hlutfall dæma eftir öldum, textategundum o.fl.
4 Athugið að mörkin (skammstafanirnar) tákna ýmist setningarliði eða orðflokka (tegundir
orða). Í mörkum sumra setningarliða kemur fram bæði eðli liðarins (NP = „Noun Phrase“,
nafnliður) og hlutverk (SBJ = „Subject“, frumlag). IPMAT táknar aðalsetningu („Inflection
Phrase“, „matrix“), VBDI sögn (VB) í þátíð (D) og framsöguhætti (I). Aðrar skammstafanir
eru væntanlega auðskildar; A aftan við táknun orðflokks merkir þolfall.
SÖGULEGI ÍSLENSKI TRJÁBANKINN