Orð og tunga - 01.06.2007, Blaðsíða 72
62
Orð og tunga
un til þeirrar vel þekktu aðferðar að sýna setningafræðilega form-
gerð með trjám eða hríslum. Þessir trjábankar eru þó með ýmsu móti
og því fer fjarri að í þeim öllum sé formgerð greind á sama hátt og
gert er í hríslum. í sumum trjábönkum (t.d. þeim búlgarska, sjá Os-
enova og Simov 2003) byggist greiningin á ákveðnu setningafræði-
legri kenningakerfi - margir trjábankar sem nú eru í smíðum byggjast
t.d. á HPGS, head-driven phrase structure grammar, eða hausastýrðri
liðgerðarmálfræði ef við þýðum það á íslensku. Það er sama kenn-
ingakerfi og byggt var á í setningagreiningarverkefni því sem unnið
var að hjá Friðriki Skúlasyni í nokkur ár (sjá Maren Albertsdóttur og
Stefán Einar Stefánsson 2004). Aðrir trjábankar byggjast á venslamál-
fræði (dependency grammar), t.d. nýr danskur trjábanki (sjá Krom-
ann 2003). í enn öðrum trjábönkum er áhersla lögð á að hafa grein-
inguna óháða setningafræðilegum teoríum, og þá verður hún yfirleitt
ekki jafn smámunasöm (sjá t.d. Nivre 2002).
Astæðan fyrir því að nú er víða verið að koma upp trjábönkum
er sú að úr þeim má vinna mjög margvíslegar upplýsingar um setn-
ingagerð - upplýsingar sem ekki fást á annan hátt. Þessar upplýsingar
eru ekki síst notaðar í ýmsum verkefnum innan tungutækni, s.s. við
málfarsleiðréttingar, vélrænar þýðingar o.fl., en vitanlega nýtast þær
einnig við setningafræðirannsóknir, í orðabókagerð o.s.frv. Vandinn
er hins vegar sá að setningafræðileg greining samfelldra texta er mjög
snúin og tímafrek og stofnkostnaður trjábanka því mjög hár. Reyndar
var um tíma í gangi norrænt samstarfsnet um trjábanka, Nordic Tree-
bank Netivork. í því var gerð tilraun með setningafræðilega greiningu
og samanburð á fyrstu köflunum úr Veröld Soffíu eftir Jostein Gaarder -
Gunnar Hrafn Hrafnbjargarson sá um greiningu á íslenska textanum.
En ekki er fyrirsjáanlegt neitt framhald á þessari tilraun hér á landi.
3.3 Setningafræðileg nýting málfræðilegrar mörkunar
3.3.1 Setningafræði í beygingargreiningunni
En þótt setningafræðilega greind íslensk málheild sé ekki til hefur
mikill árangur náðst í málfræðilegri (þ.e., einkum beygingarlegri)
greiningu íslenskra texta, eins og m.a. kemur fram í grein Sigrúnar
Helgadóttur (2007) í þessu hefti. Hér má sjá dæmi um málsgrein sem
búið er að marka.