Orð og tunga - 01.06.2007, Page 71
Eiríkur Rögnvaldsson: Textasöfn og setningagerð: greining og leit 61
En ég hef líka notað þessa aðferð til að skoða orðaröð í sagnlið
og leita þar að tilteknum orðaraðarmynstrum (Eiríkur Rögnvaldsson
1994-95). Þar reyndi ég að sýna fram á að tiltekin mynstur kæmu fyrir
innan flókinna sagnliða (einkum liða sem hafa að geyma tvær fallhátt-
arsagnir og tvö andlög) en önnur ekki, og það væri kerfi í því hvað
kæmi fyrir og hvað ekki. í þessu tilviki var ekki einfalt að nota ein-
stök orð í leitinni. Eg nýtti mér það að tveggja andlaga sagnir eru ekki
óendanlega margar, og leitaði að dæmum um fallhætti eins margra
þeirra og ég gat. Með því móti hafði ég fjölmörg dæmi upp úr krafs-
inu, og sú leit skilaði niðurstöðum sem ég þóttist sjá kerfi í.
En hvort sem ég hef nú rambað á rétta niðurstöðu í þessu tilviki
eða ekki (ég hef ekki rekist á neitt síðan sem kollvarpi henni) þá er ljóst
að þessi aðferð er ófullnægjandi. Ein ástæða er sú að hún er afskaplega
seinleg; ég þurfti að slá inn margar sagnir og leita hvað eftir annað.
Önnur ástæða er sú að mikil hætta er á villum; leitin skilar mörgum
dæmum sem flest koma ekki málinu við og þegar farið er yfir þau má
búast við að eitthvað fari fram hjá manni. Þriðja ástæðan er svo sú
að þau orðaraðarmynstur sem ég fann engin dæmi um gæti verið að
finna hjá einhverri sögn sem mér datt ekki í hug að leita að.
3.2 Trjábankar
Enn vandast málið ef við ætlum að leita að dæmum um setningagerð-
ir á við kjarnafærslu andlags í aukasetningum, þ.e. dæmum þar sem
andlag stendur næst á eftir aukatengingu, eins og í (4):
(4) Ég veit að þennan mann þekkir þú ekki.
Vissulega tengist þessi setningagerð afmörkuðum hópi orða, þ.e.
aukatengingum, en vandinn er sá að dæmin um þær eru gífurlega
mörg og ef þarf að skoða þau öll jafngildir það því að fara gegnum all-
an textann. Auðvitað er hægt að þrengja leitina með því að tilgreina til-
tekin andlög, en þar með verður leitin líka mjög tilviljanakennd. Þarna
dugir orðaleitin því ekki, heldur þyrftum við að geta leitað eftir setn-
ingafræðilegu hlutverki - leitað að andlagi í upphafi aukasetningar. En
til að leita á þann hátt þyrftum við að hafa setningafræðilega greinda
texta eða málheild.
Slíkar málheildir eru sums staðar til og mjög víða í smíðum um
þessar mundir. Þær eru yfirleitt kallaðar treebanks, trjábankar, með vís-