Lesbók Morgunblaðsins - 22.11.2003, Side 11
LESBÓK MORGUNBLAÐSINS ˜ MENNING/LISTIR 22. NÓVEMBER 2003 11
Hversu mikið er hægt að þjappa
gögnum?
SVAR: Í stuttu máli er svarið að það eru
engin sérstök neðri mörk á því hversu mikið
hægt er að þjappa gögnum. Það er þó ekki
hægt að þjappa þeim niður í ekki neitt, því
að gögnin verða að komast til skila. En það
fer eftir eðli gagnanna og þeim forsendum
sem við gefum okkur, hversu mjög við get-
um þjappað.
Tökum einfalt dæmi: Við ætlum að senda
aðra af tveimur textaskrám til vinkonu okk-
ar. Hvor skráin um sig er um 500 KB, segj-
um að önnur innihaldi allan texta Njálssögu,
en hin texta Grettissögu. Ef móttakandinn
veit fyrirfram að við ætlum að senda honum
aðra hvora skrána, þá þurfum við ekki að
senda honum alla skrána, heldur bara einn
bita, þar sem 0 stendur fyrir Njálssögu, en
1 fyrir Grettissögu. Með þessu höfum við
„þjappað“ 500 KB skrá niður í einn bita!
Ef móttakandinn hefur ekki þessa vitn-
eskju, það er að segja að hann veit ekkert
um gögnin sem á að senda, þá náum við
auðvitað ekki þessari miklu þjöppun. En at-
hugið að ég hef í raun þjappað Njálssögu
niður í 9 bókstafi með því að nota orðið
„Njálssaga“ um eitthvað sem er í raun um
500 KB texti! Þú sem lesandi þarft ekki að
vita meira, heldur get ég vísað í sameig-
inlega þekkingu okkar.
En þá má kannski umorða spurninguna
og spyrja hversu mikið hægt sé að þjappa
gögnum án þess að nota sér sameiginlega
þekkingu. Flest gagnaþjöppunarforrit á
tölvum eru þannig úr garði gerð að þar er
ekki notuð nein utanaðkomandi vitneskja.
Þetta er gert bæði til þess að þjappaða
skráin geti staðið sjálfstætt og einnig til
þess að ekki verði gerðar of miklar kröfur
til afþjöppunarhluta forritsins. Það væri þó
ekkert úr vegi fyrir þjöppunarforrit að
reyna að átta sig á því hvers konar skrár er
um að ræða (til dæmis Word 2000 skrá,
EXE-skrá, eða JPEG-skrá) og senda þær
upplýsingar sem kóða til að ná betri þjöpp-
un. Afþjöppunarforritið yrði þá að vita hvað
hver kóði þýddi og við værum ekki með eins
almenna þjöppun. Það koma til dæmis öðru
hverju út nýjar útgáfur af MS Word, sem
búa til skrár með annarri uppbyggingu en
fyrri útgáfur og þá þarf að uppfæra öll
þjöppunarforrit.
Ef við skoðum eingöngu þjöppun án ut-
anaðkomandi þekkingar, þá er hægt að
skipta henni í tvo flokka eftir því hvort
gögnin varðveitist öll eða tapist að einhverju
leyti. Svonefnd viðsnúanleg þjöppun (e. loss-
less compression) varðveitir upplýsingarnar
í gögnunum nákvæmlega. Við afþjöppun
fæst nákvæmlega sama bitaruna og sú sem
þjappað var. Tapandi þjöppun (e. lossy com-
pression) nær fram meiri þjöppun með því
að breyta upplýsingunum. Í mörgum til-
fellum er óþarfi að nota nákvæmlega sömu
bitarunu, því að notandinn sér lítinn eða
engan mun á upphaflegu gögnunum og af-
þjöppuðu gögnunum. Slíkt á til dæmis við
um tónlist, ljósmyndir og kvikmyndir.
Tapandi þjöppun hefur í raun engin eig-
inleg neðri mörk. Við getum tekið dæmi af
þjöppun á stafrænni ljósmynd þar sem blár
himinn þekur stórt svæði. Hægt væri að
þjappa svæðinu með því að skilgreina það
sem til dæmis „200x200 blátt“ í stað þess að
telja upp alla 40 þúsund myndpunktana á
svæðinu og segja nákvæmlega hvaða tón af
bláum lit þeir hefðu. Það kemur auðvitað
ekki alveg sama mynd út, en ef þetta er góð
nálgun þá tekur enginn eftir því. Sama má
segja um tónlist. Mannseyrað hefur
ákveðnar takmarkanir sem hægt er að nýta
sér við þjöppun tónlistar. Til dæmis nemur
eyrað ekki hvað gerist næstu millisekúndur
eftir að mjög hátt hljóð heyrist. Það má því
henda út heilu bútunum úr lögum án þess
að nokkur heyri mun á því!
Viðsnúanlegri þjöppun er heldur þrengri
stakkur skorinn, því þar má ekki einn ein-
asti biti breytast eftir þjöppun og af-
þjöppun. Undir vissum kringumstæðum er
þetta nauðsynlegt, til dæmis ef þjappa á
keyrsluskrá (EXE-skrá). Keyrsluskrá sam-
anstendur af skipunum sem örgjörvinn á að
framkvæma og breyting á einum bita getur
orðið til þess að skipunin hefur allt aðra
merkingu en áður. Forritið mundi þá gefa
aðra niðurstöðu eða, sem er líklegra, ekki
geta lokið keyrslu. Það er óviðunandi fyrir
notendur að keyrsluskrá sem hefur verið
þjöppuð og síðan afþjöppuð, verki ekki leng-
ur. Sama gildir um textaskrár, Excel-skjöl
og ýmsar fleiri gerðir gagna.
Viðsnúanleg þjöppun verður því aldrei
eins mikil og tapandi þjöppun. Hversu mikil
þjöppunin getur orðið ræðst af eðli
gagnanna. Þá skiptir mestu máli hversu
mikið er af endurtekningum (e. redundancy)
í gögnunum. Skoðið eftirfarandi tvær 20
stafa talnarunur:
77777777777777777777
og
35897932384626433832.
Hvora rununa er auðveldara að muna? Þá
fyrri, auðvitað, því við getum lýst henni í
styttra máli („tuttugu eintök af 7“). Það
virðist engin regla vera í seinni rununni og
engar endurtekningar. Fyrri talnarunan
þjappast því betur en sú seinni. Reyndar er
til önnur lýsing á seinni rununni, „tölustafir
númer 10 til 29 í pí“. Sú „þjöppun“ mundi
reyndar nota sér utanaðkomandi þekkingu,
sem er vitneskja um töluna pí.
Hægt er að prófa þetta með því að búa til
eina skrá með 10 þúsund eintökum af tölu-
stafnum 7 og aðra með fyrstu 10 þúsund
tölustöfunum í pí. Hvor skrá um sig er
10.000 bæti. Þegar skránni með tölustöfum
úr pí er þjappað með forritinu WinZip þá
verður hún 5.209 bæti, sem er um 52% af
upphaflegri stærð. En skráin með 10 þús-
und eintökum af 7 fer niður í 143 bæti, sem
er aðeins 1,4% af upphaflegri stærð skrár-
innar. Í forritum eins og WinZip er alltaf
einhver lágmarksstærð úttaksskráa, þannig
að þjöppunin yrði hlutfallslega meiri eftir
því sem skráin stækkaði. Til dæmis verður
skrá með 100 þúsund eintökum af 7 ekki
nema 247 bæti, eða 0,25% af upphaflegri
stærð.
Hjálmtýr Hafsteinsson, dósent
í tölvunarfræði við HÍ.
ÞJÖPPUN
GAGNA
Hver er saga rappsins, hvað er fasismi, hvenær
var byrjað að rita á Íslandi og hvernig skrifar
maður og stillir efnajöfnu? Þessum spurningum og fjölmörgum öðrum
hefur verið svarað að undanförnu á Vísindavefnum og hægt er að lesa
svörin á slóðinni www.visindavefur.hi.is.
VÍSINDI
Morgunblaðið/Brynjar Gauti
Ekki er hægt að þjappa gögnum niður í ekkert.
K
aunrúnin þótti hættulegt niðurrifsafl á sautjándu öld, enda vísar nafn
hennar á kýli, sár, graftarhrúður. Merking þessa heitis kann þó að hafa
verið margslungnara áður fyrr. Á fornnorrænni rúnaristu er til dæmis að
finna mannsnafnið „Keþan“ og í Landnámu og Þórðar sögu hreðu er það
notað sem karlmannsnafn. Hugsast getur að nafnið hafi upphaflega verið
auknefni, „hinn kaunum hlaðni“, þótt það sé nú talið vafasamt. Í enska
rúnakvæðinu er rúnin kennd við kyndil og bjartan eld, en stafurinn K var
í fornensku nefndur „cean“ eða „cen“, „kien“ á fornþýsku, sem stóð fyrir
sígrænt barrtré, þin eða furu. Rúnaspeki samtímans hefur túlkað rúnina í ljósi þessa.
Þetta kunni að vera rún verkvits eða virkrar sköpunargáfu, táknuð með tömdum eldi
(kyndli), enda liggi slíkur eldur tæknilegri þekkingu til grundvallar. Sé svo þá er þetta rún
hins haga listasmiðs, Völundar og Loka, en hafa verður hugfast að sköpun byggist alltaf á
sundrun, til dæmis fyrir tilstilli elds. Slík upplausn er nauðsynleg svo endursköpun eða ný-
myndun geti átt sér stað. Kaunrúnin er í ljósi þessa hluti af ferli er hófst með Óssrúninni og
lá um Reiðarrúnina; innblæstri eða þekkingu er með tæknilegri aðferð hrundið í fram-
kvæmd um sundrun þess sem fyrir var.
Tengsl Kaunrúnar við sígrænt barr vekja grun um merk-
ingartengsl við Yggdrasil, veraldartré heiðinnar goðafræði,
en þegar guðirnir höfðu mótað alheim úr efni frumverunnar,
skipað rúmi og tíma, þá birtist askurinn, táknun hins nýja
heims, veglegur viður sem náði til himins og undirheima.
Þessi mynd á sér hliðstæðu í ævafornum hugmyndum um
stólpa eða möndul sem stóð undir alheiminum, en í heim-
ildum er oft greint frá heilögum trjám. Hjá Adam frá Brim-
um (11. öld) kemur fram að nálægt hofinu í Uppsölum stæði
veglegt tré sem væri grænt bæði vetur og sumar. Þar væri
einnig heilög kelda þar sem blót voru framin og kvikum
mönnum fórnað. Nafn Yggdrasils merkir hest eða gálga Óð-
ins enda nam hann rúnir í trénu; hékk hann níu nætur á
vindga meiði, samkvæmt Hávamálum, geiri undaður og gef-
inn sjálfum sér.
Næturnar níu má tengja heimunum níu sem getið er um í Völuspá og Vafþrúðnismálum,
en ekki er vitað fyrir víst hverjir þeir voru né hvort þeir tengdust asknum. Eftirfarandi til-
gátu verður að skoða í því ljósi. Vitað er að Miðgarður (efnisheimurinn) er í miðju Ginn-
ungagapi, en fyrir norðan hann er Niflheimur, sunnan megin Múspellsheimur; til austurs
liggur Jötunheimur og fyrir vestan er Vanaheimur. Öðrum heimum er komið fyrir á mið-
súlunni er liggur um miðjan Miðgarð. Undir honum er Svartálfaheimur, en þar fyrir neðan
Hel; næst fyrir ofan Ljósálfaheimur, en efst trónir Ásgarður. Heimunum er eftir þessu að
dæma komið fyrir í þrívíðu rými, en deila má um skipan hvers og eins. Sumir mundu koma
Múspelli og Niflheimi fyrir á miðsúlunni svo dæmi sé tekið. Þessi frumskipan tekur til mis-
munandi andstæðutvennda, því súlan kann að tengja meðvitund og hið ómeðvitaða, ljós og
myrkur sálar eða veru, en þverásinn spannar útþensluorku eldsins og segulmátt íssins,
samruna og klofnun efnislegra reginafla. Athyglisvert er að á milli heimanna níu liggja 24
brautir, jafnmargar og stafir gamla rúnastafrófsins voru.
Sé túlkun þessi rétt býr stafróf alheimsins í fyrstu röð rúnastafrófsins. Ræða má um
framvindu frá rúnum frumorku (Úr) og frumefnis (Þurs), um rúnir frumvitundar (Óss) og
frumtíma (Reiðar) til skipulegs alheims (Kaunar). Ljóst er að þessi merking hefur glatast,
því í heimildum síðmiðalda og árnýaldar tengist Kaunrúnin kvöl, sjúkleika og dauða. Um
Kaun er sagt í íslenska rúnakvæðinu:
Kaun er barna böl
og bardaga för
og holdfúa hús.
flagella konungur.
Nafn Kaunrúnar er þýtt með „flagella“ í þessu kvæði, en um það orð segir í íslensku
fræðiriti frá 1630: „Tamerlanes Schytakóngur, sem alla Austurálfuna heimsins plágaði
með blóðsúthellingum og stríði, þá hann eitt sinn var beðinn að hlífa og vægja einu þorpi,
þá svaraði hann og sagði: „Vitið þér ekki að eg er flagellum dei?“ Það er: „Vitið þér ekki að
eg er vöndur guðs?“ Hver titill lagðist líka til þeim mektuga Attila Húnakóngi, að hann
væri flagellum domini.“
Kaun hefur líkt og Þurs verið rún niðurbrots og óreiðu, enda olli hún sárum, útbrotum,
kýlum og meinum; „Kaun er barna bölvan;/ böl gerir ná fölvan,“ stendur í norska rúna-
kvæðinu. Það sætir því engri furðu að í Íslenskri galdrabók (17. öld) er að finna galdur þar
sem rún þessi er rist með launstöfum, mögnuð með Þursrún og send með Reið í árás-
arskyni.
RÚNAMESSA LESBÓKAR
„Tengsl Kaunrúnar við sígrænt barr vekja grun um merkingartengsl við Yggdrasil, verald-
artré heiðinnar goðafræði.“
KAUN
RÚNALÝSING 6:16
M AT T H Í A S V I Ð A R S Æ M U N D S S O N