Orð og tunga - 01.06.2007, Page 81
Eiríkur Rögnmldsson: Textasöfn og setningagerð: greining og leit 71
4 Lokaorð
í fyrri hluta þessarar greinar var sagt lauslega frá mismunandi við-
horfum til gildis textadæma í setningafræði undanfarna áratugi. Til-
koma generatífrar málfræði fyrir hálfri öld olli því að dæmaleit í text-
um naut lítillar virðingar um langt skeið, og málfræðingar skiptust í
fylkingar sem höfðu mjög andstæðar skoðanir á þessu sviði, þótt sá
ágreiningur hafi að verulegu leyti verið sýndarágreiningur og stafað
af því að menn voru að bera saman epli og appelsínur. En með til-
komu viðamikilla rafrænna textasafna og málheilda, og ekki síst mik-
ils magns veftexta, hafa skilin milli fylkinganna dofnað og nú þykir
ekki lengur neitt að því að safna dæmum úr textum. En ýmislegt er að
varast við notkun dæmanna og gæta verður varúðar í túlkun þeirra,
eins og bent er á í greininni.
Meginviðfangsefni greinarinnar var að skoða hvernig hægt er að
standa að verki við leit að dæmum um tilteknar setningagerðir í raf-
rænum íslenskum textasöfnum. Bent var á að hægt er að nýta hráa
texta, án nokkurrar sérstakrar mörkunar, að vissu marki, en þó því
aðeins að leitað sé að setningagerðum sem tengjast ákveðnum orðum.
Með tilkomu beygingarlega markaðra málheilda og mörkunarforrita
hafa aðstæður til setningafræðilegrar leitar hins vegar gerbreyst.
Vegna eðlis íslenska beygingakerfisins má lesa miklar setningafræði-
legar upplýsingar út úr hinum beygingarlegu mörkum, og þær upp-
lýsingar má síðan nýta í leit að ákveðnum setningagerðum. Sýnd voru
þrjú dæmi um hvernig hægt er á einfaldan og fljótvirkan hátt að leita
að dæmum um þrjár setningagerðir; kjarnafærslu í aukasetningum,
nýja þolmynd, og það-lepp með áhrifssögnum. í öllum tilvikum skil-
aði leitin niðurstöðum sem tekið hefði fleiri daga að fá með þeim að-
ferðum sem áður var völ á, en nú tók leitin aðeins fáeinar mínútur.
í lok greinarinnar er svo sagt frá verkefni sem enn er ólokið og felst
í gerð hlutaþáttara fyrir íslensku. Ef það verkefni skilar tilætluðum ár-
angri er hægt að fara að gera raunhæfar áætlanir um smíði viðamikils
íslensks trjábanka sem myndi verða öllum sem fást við rannsóknir á
íslenskri setningafræði að ómetanlegu gagni.