Tölvumál - 01.12.1991, Síða 7
Desember 1991
Alheimsstafrófið mikla
- nýjustu fréttir
Jóhann Gunnarsson, fjármálaráðuneyti
Eins og drepið var á í grein
minni um stafróf og stafatöflur í
Tölvumálum fyrr á þessu ári (4.
tbl.) var því spáð að línur myndu
skýrast á árinu hvað varðar slaginn
um "stóru" stafatöflumar, staðal-
tillöguna ISO DIS 10646
annarsvegar og Unicode
hinsvegar (meira rétt bráðum um
hvort um sig). Þegar þetta er
skrifað seinni hluta ágiistmán-
aðar má telja víst að samkomu-
lag sé að takast um að tefla ekki
fram tveimur mismunandi
stafatöflum sem báðar hafi þann
tilgang að sigra heiminn, heldur
verði hinu besta úr báðum steypt
saman í nýja tillögu, sem eftir
öllum sólarmerkjum að dæma
gæti orðið að alþjóðlegum ISO-
staðli síðari hluta næsta árs.
Rætist þessi von er úr sögunni
mikil óvissa, sem rfkt hefur
undanfarin ár. Framleiðendur
véla og hugbúnaðar geta nú búið
sig undir að þjóna þörfum allra
þjóða heimsins fyrir ritað mál I
tölvum með samræmdum hætti.
Svíinn Olle Járnefors sat fyrir
hönd INSTA/IT (norræna
staðlasamstarfsins) þá tvo fundi
hjálSO ÍSC2/WG1 (vinnuhópi
2 í undirnefnd 2 undir sameinaðri
tækninefnd 1 eins og þetta heitir
fullum stöfúm á ISO-sku), þar
sem gengið var frá öllum
aðalatriðum hins sögulega sam-
komulags um efni nýrrar
staðaltillögu. Hér fer á eftir
meginþráðurinn í skýrslu hans
um fundinn.
Fyrri staðaltillaga ISO
DIS 10646
DIS (Draft intemational standard)
10646(4. nóv. 1990)kvaðáum
að hvert rittákn skyldi kódað
með fjórum átta bita bætum. Því
gífurlega rúmi, þ.e. rúmlega
fjórum milljörðum mögulegra
rittákna, skyldi skipt f 256 flokka
(groups). Flokkur 032 nær til
dæmis yfir öll þau sæti í töflunni
þar sem fyrsta bætið er 032 í
tugakerfi. Hverjum flokki er á
sama hátt skipt í 256 arkir
(planes), þar sem bæti númer 2
hefur tiltekið gildi fyrir hverja
örk. í hverri örk eru 256 línur
(rows), og hefur hver lfna 256
sæti. Hvert sæti er auðkennt
með ákveðnu fjögurra bæta gildi.
í þeim tilgangi að létta notendum
yfirfærsluúrþeim7,8og 14 bita
stafatöflum, sem f notkun eru
nú, yfir í ISO 10646 var í
tillögunni kveðið svo á að ekkert
þeirra fjögurra bæta, sem notuð
eru til að tákna rittákn, skyldi
hafa gildi sem hugsanlega væri
unnt að túlka sem stýritákn. Þetta
er kallað C0 - C1 takmörkunin,
en vegna hennar minnkar fjöldi
nothæfra sæta um 69% og verður
"aðeins" 1.330.863.361.
Öllum rittáknum í DIS 10646
öðrum en myndmálstáknum úr
kínversku, japönsku og kóresku
er komið fyrir í fyrstu nothæfú
örkinni, þ.e. örk 032 í flokki
032. Af þvf hlaut hún heitið
"grunnörk" (basic multiligual
plane, BMP). Ofannefhdum
myndmálstáknum var komið fyrir
í öðrum örkum í flokki 032.
Þar sem einungis lftill hluti
nothæfra sæta í DIS 10646 var í
raun notaður voru skilgreind
nokkur þjöppunarform sem nota
mátti fyrir tiltekinn hluta
töflunnar.
* Samkvæmt þjöppunar-
formi 1 mátti tákna hvern staf
með einu bæti, en þá var heldur
ekki unnt að nota nema eina línu
töflunnar í einu. Sjálfgefið var
að nota lfnu 032 í BMP, sem er
nákvæm eftirmynd af ISO 8859-
1 (sem við þekkjum öll).
* Samkvæmt þjöppunar-
formi 2 var hver stafur táknaður
með tveimur bætum, samsvarandi
einni örk. Að jafnaði var örkin
BMP, en aðferðir voru skil-
greindar til að skipta um hluta af
BMP og nota í staðinn kínversk,
japönsk eða kóresk tákn tekin úr
örkum hvers tungumáls fyrir sig.
* Þjöppunarform 3 var
einnig til án þess að það hafi
þýðingu fyrir þessa frásögn.
* Það sem nefnt var
þjöppunarform 4 var í raun það
að tákna hvert rittákn fullum
stöfúm með fjögurra bæta kódun.
* Samkvæmt hinu breyti-
lega þjöppunarformi 5 var unnt
með hjálp tveggja nýrra stýri-
tákna, HOP og PAD, að skipta
að vild og hvenær sem var um
þjöppunarform og eins að velja
tákn úr hvaða línu, örk eða flokki
sem óskað kynni að verða eftir.
7 - Tölvumál