Skírnir - 01.09.2017, Page 24
reiknaður svokallaður kósínus samanburður (e. cosine similarity).20
Útreikningarnir voru endurteknir fyrir breytilegan fjölda algeng-
ustu orða á bilinu 500 til 5000 orð (alls 15 ólíkir útreikningar) án
teljandi áhrifa á niðurstöður. Til að byrja með beindum við athygl-
inni að Heimskringlu og Eglu.
Á mynd 1 er viðmiðið Ólafs saga helga, sem er lengsta sagan í
Heimskringlu, og sýnt með mislöngum sneiðum á skífu hve fjarri
henni aðrar sögur í málheildinni liggja stíllega. Í ljós kemur að engir
textar eru jafnlíkir Ólafs sögu helga og aðrar mældar frásagnir
Heimskringlu, ef frá er talin Egla. Mælingin bendir til að eðilegt sé
að líta á Heimskringlu sem heildstætt bókmenntaverk; kósínus-
delta-fjarlægð (kd) mældra sagna er á bilinu 0,54–0,83 sé miðað við
Ólafs sögu helga. Sá stílmælanlegi munur sem er á einstökum sögum
í Heimskringlu kann að stafa af því að á köflum hafi sá sem skrifaði
verið fremur í hlutverki samsetjara eða ritskýranda en eiginlegs höf-
undar. Stærstu tíðindi þessarar mælingar felast í því að Egla (kd.
0,54), ásamt Ólafs sögu Tryggvasonar (kd. 0,54) og Haraldar sögu
Sigurðssonar (kd. 0,56), skuli vera sá texti sem sýnir mest stílleg lík-
indi við Ólafs sögu helga.
Á mynd 2 eru sýnd þau orð sem mest áhrif hafa á stílleg líkindi
Ólafs sögu helga og Eglu annars vegar og Ólafs sögu helga og Ólafs
sögu Tryggvasonar hins vegar. Þar má sjá framlag einstakra orða í
288 jón, sigurður, steingrímur skírnir
20 Kósínus-samanburður er mælikvarði á fjarlægð milli vektora, , en sá teng-
ist stærð hornsins, θ, á milli þeirra og í 1000-víðu rúmi reiknast sem:
Þar sem örvarmerkið táknar vektor en seinni fótskriftin stökin í vektornum. Not -
ast var við hefðbundna framsetningu sem er að reikna kósínus-samanburð sem
1 – cos θ og var mælikvarðinn því stilltur þannig af að hann er núll þegar orðin 1000
eru öll með samskonar frávik og einn þegar frávikin eru handahófskennd. Styrkur
þessarar aðferðar umfram Evklíðskan fjarlægðamælikvarða (líkt og fjarlægð er
jafnan mæld í lægri víddum) felst í því að það er eðli margvíðra rúma þar sem fjöldi
vídda er há tala að tveir vektorar valdir af handahófi eru nánast örugglega horn-
réttir og, 1 – cos θ = 1, því sem næst örugglega á meðan fjarlægðir mældar með
Evklíðskum mælikvarða greina síður milli handahófskenndra vektora og ann arra.
Sjá Cho 2013, og Aggarwal, Hinneburg og Keim 2001.
og
Skírnir HAUST 2017 (13.10.2017).qxp_Layout 1 20.10.2017 13:46 Page 288