Són - 01.01.2009, Blaðsíða 149
SAMSPIL MÁLS OG BRAGS Í ÍSLENSKUM KVEÐSKAP 149
undir yfirskriftinni: Samspil bragkerfis, hljóðkerfis og setningagerðar (verk-
efnisstjóri Þórhallur Eyþórsson), og er sú vinna í gangi. Úr Rann-
sóknasjóði Háskóla Íslands hafa fengist styrkir síðastliðin þrjú ár.
Þessir styrkir tengjast sérstökum rannsóknaráhuga verkefnisstjór-
anna, en Kristján hefur lagt sig eftir að rannsaka bragkerfi og tengsl
mállegra og braglegra þátta, svo sem stuðla og hrynjandi, en Þór-
hallur hefur stundað rannsóknir á setningaformum í eldri germönsk-
um málum, t.d. gotnesku. Í báðum þessum verkefnum hefur Bjarki
Már Karlsson séð um tölvumálin.
Konungsbók eddukvæða
Styrkfé hefur hingað til verið varið til að safna kveðskapartextum í
gagnagrunn og var byrjað á eddukvæðum. Texti Konungsbókar
eddukvæða er fenginn frá Stofnun Árna Magnússonar í íslenskum
fræðum. Þeir sem þar á bæ hafa haft umsjón með textanum eru
Guðvarður Már Gunnlaugsson, Haraldur Bernharðsson og Vésteinn
Ólason. Þessi véltæki texti er unninn í samvinnu við Menota (Medi-
eval Nordic Text Archive). Um er að ræða bæði stafréttan og tákn-
réttan texta, auk texta með samræmdri stafsetningu (miðað við mál-
stigið á 13. öld), og á hann að vera vandaður að öllu leyti. Og ekki er
síður mikilvægt að textinn, sem fæst frá Árnastofnun, er lemmaður,
þ.e. greindur í flettur eða uppflettiorð, orðflokkagreindur og mark-
aður með málfræðilegum upplýsingum á XML (Extensible Markup
Lanugage). Ætlunin er að setningafræðigreiningin og braggreiningin
tengist orðflokkagreiningunni sem fyrir er.
Gagnagrunnurinn snýst um að safna tvenns konar upplýsingum.
Annars vegar er um að ræða bragfræðileg atriði eða breytur og hins
vegar málkerfislegar breytur. Bragfræðilegu breyturnar taka til brag-
formanna; t.d. stuðlasetningar (hvar eru stuðlar?), risa (hvaða at-
kvæði eða orð bera ris) og fjölda bragliða, orða og atkvæða í línum.
Hinar almennu málfræðilegu breytur lúta að máleinkennum textans,
hljóðkerfiseinkennum (s.s. atkvæðaþunga og flokkun stuðla), beyg-
ingareinkennum og setningafræðilegum einkennum, svo sem mis-
munandi orðaröð í ólíkum tegundum setninga.
Þegar þetta er ritað má segja að lokið sé innlestri og bragfræðilegri
greiningu eddukvæðanna. Þar sem mörkun beint í XML er afar sein-
leg var valinn sá kostur að hanna sérstakt innsláttarviðmót, sem sér-
fróðir menn geta notað (án þess að beita XML-táknum). Þegar hefur
verið gengið frá þessu viðmóti hvað varðar stuðlasetningu, mörkun