Són - 01.01.2009, Blaðsíða 150
KRISTJÁN ÁRNASON150
risa og „vindandinnar fornu“ (sem Ólafur Hvítaskáld nefnir svo, þ.e.
þegar stuðlað er við v sem síðar hvarf úr orðum eins og vreiðr). Bjarki
M. Karlsson þróaði þetta viðmót og er afar fljótlegt að skrá upplýs-
ingar í gagnagrunninn; sumt er algerlega vélrænt, svo sem atkvæða-
greining, þar sem atkvæði eru flokkuð sem létt eða þung samkvæmt
gamalli hljóðdvöl, en annað er unnið af sérfróðum starfsmönnum
með aðstoð tölvu.
Hrynjandi eddukvæðanna er greind þannig að sérfróður starfs-
maður fer yfir texta hvers kvæðis og merkir við þá staði þar sem gera
má ráð fyrir að ris standi. Þannig er langlína eins og |Þrymr sat á |haugi
|þursa |dróttinn mörkuð svo að ris eru talin vera á orðunum Þrymr,
haugi, þursa og dróttinn. Með hliðstæðum hætti eru stuðlar markaðir á
orðunum Þrymr og þursa. (Gert er ráð fyrir því að í einstökum, jafn-
vel mörgum, tilvikum geti verið vafamál hvernig skilja beri hrynj-
andina og hvort telja eigi að orð beri hljóðstaf, og er þá hægt að ein-
kenna einstök atkvæði sem „vafaatkvæði“, með tilliti til styrks eða
stuðlunar, ellegar heilar línur sem vafalínur.)
Atkvæðaþungi samkvæmt fornum hljóðdvalarlögmálum, þ.e. grein-
armunur milli léttra áhersluatkvæða eins og í tala og vana og þungra
eins og í tála og vanda, skipti máli í bragnum. Þar sem þetta einkenni
fylgir tilteknum vel skilgreindum reglum er hægt að greina það vélrænt
á grundvelli texta sem ritaður er með samræmdri stafsetningu. Þar
hefur Bjarki hannað algóritma sem greinir vélrænt, en sérfræðingur fer
síðan yfir alla vélrænu greininguna og lagfærir það sem rangt er greint,
sem raunar er mjög sjaldgæft.
Þessar upplýsingar um braglega og hljóðkerfislega þætti, þ.e. stuðla-
setningu, ris og atkvæðaþunga, verða síðan tengdar öðrum málfræði-
legum upplýsingum með XML-kóðum, bæði þeim sem fyrir eru í
Konungsbókargrunninum frá Árnastofnun og þeim sem bætt er við
með setningafræðigreiningunni. Með því móti fást t.d. upplýsingar um
hvaða orð og setningarhlutar standa í risi, hvaða orð taka þátt í stuðla-
setningu og hvort þau hafa þung eða létt atkvæði. Á grundvelli þessa
verður síðan hægt að taka saman tölfræðilegar upplýsingar um allt
safnið og einstök kvæði eða kvæðaflokka. Einnig er hægt að tengja
upplýsingar um setningagerð við þá orðhlutamörkun sem fyrir er í
XML-kerfinu sem fékkst með Konungsbókartextanum.