Tölvumál - 01.04.1991, Síða 18
Apríl 1991
Rítr sínum stöfum hver þjóð sína tungu
Um tölvustafróf og stafatöflur eftir Jóhann Gunnarsson
"En af því at tungumar em ólíkar
hver annarri, þær þegar er ór
einni ok inni sömu tungu hafa
gengizk eða greinzk, þá þarf
ólíka stafí í at hafa, en eigi ina
sömu alla í öllum, sem eigi rita
grikkir látínustöfum girzkuna ok
eigi látinumenn girzkum stöfum
látínu, né enn heldr ebreskir menn
ebreskuna hvárki girzkum stöfam
né látínu, heldr rítr sínum stöfum
hver þjóð sína tungu" (Fyrsta
málfræðiritgerðin).
Þessi sannindi hafa legið eins og
þungt farg á herðum gagna-
vinnslu- og tölvufólks, allt frá
því að fyrstu töflugerðarvélarnar
komu til landsins upp úr 1950.
Ég ætla reyndar ekki að rekjahér
sögulega þróun. Henni hafa verið
gerð nokkur skil í rituðu máli, til
dæmis nokkuð ítarlega í BS-
ritgerð Ólafs Guðmundssonar í
tölvunarffæði, líklega árið 1986.
Ég fer hér á eftir með ýmis hug-
tök án þess að skýra þau í trausti
þess að flestir lesendur séu um-
ræðuefninu nægilega kunnugir
til þess að ekki komi að sök. Ég
ætla að lýsa ástandi mála varðandi
tölvustafróf eins og það horfir
við okkur íslendingum um þessar
mundir. Fram kemur að málið er
nokkuð flókið. Við ráðum ekki
ferðinni nema að mjög litlu leyti,
en getum þó haft viss áhrif á
þróun mála ef þeim er beitt á
réttan hátt. Miklu máli skiptir að
við séum sammála innbyrðis um
hvaða leiðir skuli halda.
Ættir tölvustafrófa
Skipta má þeim tölvustafrófum,
sem nú eru f notkun, í nokkrar
ættir. Um skilgreiningu þeirra
leyfi ég mér að vitna í Danann
Keld-Jorn Simonsen, sem er einn
af samherjum mínum í baráttunni
fyrir einfaldari skipan þessara
mála í heiminum (úr grein í
EUUGN, 4. hefti 10. árgangs
veturinn 1990). Innskot frá mér
standa í hornklofum.
1. ISO 646, 7 bita ættin
Hér er ASCII-staffófið [American
standard code for information
interchange, alls 128 sæti fyrir
tákn] mikilvægast ættingja. IISO
646 eru 10 sæti óskilgreind auk
þess sem í 2 sætum (# og $) má
skipta um stafi. Þetta hefur verið
notað til að skilgreina ógrynni
þjóðlegra afbrigða, sem náð hafa
mismikilli útbreiðslu. Á Norður-
löndum (utan íslands) hafa lands-
útgáfurnar af ISO 646 verið
hlutfallslega mikið notaðar, en
aftur á móti tiltölulega lítið bæði
íÞýskalandiog Frakklandi. [Um
hinn enskumælandi heim, á Ítalíu
og víðar var þetta stafróf einnig
mjög útbreitt.] Þar sem vél-
búnaður fyrir 8 bita stafróf er nú
að verða nær einráður á mark-
aðnum fer þýðing 7 bita stafróf-
anna ört minnkandi. Enn mun þó
búnaður gerður fyrir 7 bita staf-
róf, bæði forrit, gögn og vélar,
verða í notkun um langan tíma
víða um heim. Samtök tölvuffam-
leiðenda í Evrópu (ECMA) halda
skrá yfir tölvustafróf. Þar eru
skráð yfir tuttugu 7 bita afbrigði.
2. ISO 8859 ættin
Til þessarar ættar teljast nálægt
tíu 8 bita stafróf (og tillögur um
nokkur enn eru til umræðu). Þau
eru hvert um sig sniðin að þörfum
vissra svæða í Evrópu og reyndar
annarra heimshluta, þar sem
latínuletur, grískt, kýrilliskt,
arabískt og hebreskt letur eru
notuð. Sameiginlegt með öllum
útgáfum er ASCII-stafrófið í
fýrstu 128 sætunum, og rúm er
ætlað fyrir stýritákn samkvæmt
skilgreiningu staðalsins ISO 6429
í sætum 0-31 og 127 til 159. í
ISO 8859 er hver stafur [256
sæti alls] táknaður með einu 8
bita bæti.
3. Önnur 8 bita stafróf
Ýmsir tölvuframleiðendur hafa
skilgreint sín eigin 8 bita stafasett.
Nefna má DEC, HP og APPLE,
að ógleymdu IBM, sem reyndar
er langsamlega uppfmninga-
samast á þessu sviði. IBM hefur
skilgreint nokkur stafróf fyrir
PC-tölvur [kölluð stafrófssíður,
á ensku codepage], þar sem ekki
er rúm fyrir síðari stýritákna-
raðirnar samkvæmt ISO 6429.
IBM hefur einnig skilgreint
allmörg 8 bita EBCDIC-stafróf,
sem það notar á miðlungs- og
stórtölvum sínum. EBCDIC-
stafatöflurnar eru ekki á neinn
hátt líkar ASCII að uppbyggingu,
og eru þær einu þessara
seljendataflna, sem ekki hafa
ASCII-táknin [7 bita stafrófið]
fyrir raunverulegt undirmengi.
[Hér á landi eru í notkun tvær
mismunandi gerðir af EBCDIC-
stafatöflum].
4. ISO 6937 8/16 bita ættin
Þessi ætt er einnig 8 bita að
náttúru til, og hefur líka 7 bita
ASCII-töfluna fyrir undirmengi.
Allmargir stafir eru þó táknaðir
með hreyfingarlausum broddi og
aðalstafnum á eftir. Því verður
að skoða ýmist 8 eða 16 bita til
að þekkja hvaða stafur er á
ferðinni. Þetta flækir tilveruna
18 - Tölvumál