Orð og tunga - 01.06.2007, Page 70
60
Orð og tunga
vinnsluforrit bjóða upp á sérhæfðari möguleika. í WordCruncher er t.d.
hægt að leita að orðum sem koma fyrir nálægt hvort öðru, með til-
greindum hámarksstafafjölda á milli. Þar er líka hægt að hlaða orðum
inn í bálka og leita að dæmum þar sem eitthvert orð úr öðrum bálkin-
um kemur fyrir í grennd við eitthvert orð úr hinum. Svona mætti lengi
halda áfram að telja upp þá möguleika sem finnast í ýmsum forritum
og auðvelda manni leitina.
Leit af þessu tagi er þó alltaf þeim takmörkunum háð að hún er
bundin við orð. Það veldur því að erfitt er að nýta hana við leit að til-
teknum setningagerðum - það er því aðeins hægt að unnt sé að tengja
setningagerðir við ákveðin orð. Þannig er t.d. hægt að nýta slíka leit að
vissu marki til að skoða afturbeygingu, með því að leita að myndum
afturbeygða fornafnsins sig/sér/sín, og afturbeygða eignarfornafnsins
sinn/sín/sitt. En jafnvel hér er þessi aðferð ófullnægjandi. í fyrsta lagi
vegna þess að sumar myndir afturbeygða fomafnsins og afturbeygða
eignarfornafnsins falla saman við beygingarmyndir annarra orða (sér
getur verið 3. pers. et. fh. nt. af sjá, og sinn getur verið hvorugkyns-
nafnorðið sinn). Því þarf að fara gegnum öll dæmin sem finnast við
slíka leit og vinsa úr þeim. Það er seinlegt en ekki frágangssök. En til
að fá góða mynd af notkun afturbeygingar þarf líka að skoða setningar
þar sem afturbeygð fornöfn eru ekki notuð, heldur persónufornöfn. Þá
vandast málið; því að persónufornöfn eru vitanlega notuð við miklu
fjölbreyttari aðstæður. Þau eru svo algeng að það borgar sig ekki að
leita að þeim; það væri svo mikið verk að vinsa úr leitarniðurstöðun-
um að það er alveg eins gott að lesa bara textann í heild.
Ég hef mikla reynslu af því að nota textaleit, einkum með hjálp
WordCruncher, í setningafræðilegum rannsóknum á forníslenskum
textum. Þeir textar sem ég vann með voru að mestu leyti ógreindir,
þótt vissulega megi hafa nokkurt gagn af greiningunni í Orðstöðidykli
íslendinga sagna (Bergljót S. Kristjánsdóttir o.fl. 1996). Textaleitin hef-
ur vissulega skilað ágætum árangri í mörgum tilvikum. Þannig hef
ég t.d. leitað að dæmum um aukafallsfrumlög (Eiríkur Rögnvaldsson
1996) og boðháttarsagnir (Eiríkur Rögnvaldsson 2000). í fyrra tilvikinu
lá fyrir hverjar væru helstu sagnir sem kæmu til greina að tækju auka-
fallsfrumlög, og því var leitað að þeim; í því síðara var leitað að dæm-
um um boðháttarmyndir algengra sagna. í báðum tilvikum dugði að
finna (sem flest) dæmi; ekki var ætlunin að setja fram neina tölfræði á
grundvelli þeirra, og því var aðferðin fullnægjandi.