Tölvumál - 01.03.1999, Síða 8
Stöðlun í upplýsingatækni
Um staðla, tungumdl og íslensku
Þorgeir Sigurðsson
Latin 1 (ISO/IEC
JTCl 8859-1) og
náði mikilli útbreiðslu
með hiálp
Infernetsins.
I þessari töflu eru sex
stafir sem eingöngu
þjóna þörfum
Islendinga. Þeir eru:
ý, Ý, þ, Þ, ð, Ð
Framleiðendur tölva
sameinuðust í
samtökunum UNI-
CODE um að gera
16 bita stafatöflu
með öllu letri sem
notað er í lifandi rit-
málum þióða heims
Um sögu íslenskra bókstafa og stafa-
taflna er liér vísað til vefsíðna á ensku
http://www.stri.is/STRI/enska/Iceletters. s
htinl
Þó að tölvur hafi í upphafi verið
smíðaðar til útreikninga hefur
notkun þeirra í ýmiss konar
meðferð texta orðið æ mikilvægari. Til að
gera þetta kleift hafa framleiðendur tölva
smíðað margvísleg kerfi sem byggjast á
tungumálakunnáttu. Staðlar hafa orðið til
um þetta og eru sumir þeirra opinberir
staðlar, evrópskir eða alþjóðlegir, en aðrir
eru í einkaeign einstakra framleiðenda.
Staðall er í eðli sínu samkomulag hags-
munaaðila um hvernig eitthvað skuli gert
og þarf því ekki að semja staðal nema
hagsmunaaðilarnir séu fleiri en einn.
Þegar t.d. er skipst á gögnum um netið
milli ólíkra vélartegunda er hagkvæmt að
fylgja staðli en innan stýrikerfís einnar
vélar er minni ástæða til að hafa gögn á
öðru formi en því sem hverjum fram-
leiðanda hentar best.
Hér verða taldar upp gerðir staðla sem
snerta viðfangsefnið tungutækni.
1 Stafatöflur. I stafatöflum er hverjum
staf gefíð nafn og honum er úthlutað
sæti eða númeri í töflunni. T.d. er
stafnum SMALL LATIN LETTER
THORN gefið númerið 239 (EF) í
stafatöflunni Latin 1 (ISO/IEC JTCl
8859-1). Stafatöflur skilgreina ekki
útlit stafa, heldur ræðst útlitið af
leturgerðum.
2 Leturgerðir. í hverri leturgerð er útlit
stafs skilgreint. T.d. er stafurinn g birtur
þannig g í Arial. Flestar leturgerðir eru
í einkaeigu en ISO staðall er til um
leturgerðir fyrir tölvulestur (OCR-B).
3 Hnappaborð. Staðsetning stafa á
hnappaborðum fer eftir þörfum og
venjum hverrar þjóðar. Um hnappaborð
eru til landsstaðlar, t.d. ÍST 125 um
íslenskt hnappaborð.
4 Stafrófsröð, ritun upphæða, ritun
dagsetninga, og margt fleira.
Framleiðendur safna upplýsingum um
þarfir hvers málsvæðis ásamt upp-
lýsingum um hnappaborð og mynda
það sem kallað er ,,locale“. Helstu
staðlar um þetta eru í eigu einstakra
framleiðenda. Islendingar hafa gert
íslenskan forstaðal FS130 um þessi
atriði.
Alþjóðavæðing og stafatöflur
Stafatöflur voru litlar í upphafi tölvu-
aldar, notuðu aðeins 7 bita og gátu ein-
ungis geymt 128 stafi. í ASCII
stafatöflunni voru litlir og stórir stafir
enska stafrófsins auk greinarmerkja og
sérstakra tákna fyrir tölvur. Með því að
nota 8 bita var hægt að fjölga stöfum,
þannig að unnt var að koma fyrir í einni
töflu flestum latínustöfum sem notaðir eru
í opinberri stafsetningu þjóða Vestur-
Evrópu. Sú tafla er kölluð Latin 1
(ISO/IEC JTCl 8859-1) og náði mikilli
útbreiðslu með hjálp Internetsins þar sem
hún er gjarnan notuð sem sjálfgefin
(default) tafla í helstu tölvupóstforritum. í
þessari töflu eru sex stafir sem eingöngu
þjóna þörfum íslendinga. Þeir eru: ý, Ý, þ,
Þ, ð, Ð.
Aðrar töflur voru búnar til fyrir grískt
og kyrjálskt letur og fyrir latínuletur í
Mið- og Suður-Evrópu, en engin þeirra
náði mikilli útbreiðslu. Flestar þjóðir
kjósa að hafa töflu með stöfum helstu
stórvelda í Evrópu. T.d. hafa áhrifamenn í
Eistlandi heldur viljað nota Latin 1 töfluna
en töflu sem gerð var fyrir Eystrasalts-
lönd, jafnvel þótt það kosti að Eistar geti
ekki skrifað nokkra stafi í opinberri
stafsetningu sinni og ekki heldur marga
stafi í ritmálum nágranna sinna, Letta og
Litháa. I staðinn geta þeir t.d. skrifað
frönsku, spænsku og portúgölsku ásamt
sínu eigin tungumáli. Tyrkir voru ósáttir
við að nota stafatöflu sem gerð var fyrir
Suðaustur-Evrópu og fengu því framgengt
að gerð var ný tafla, Latin 5, þar sem í
stað íslensku stafanna ý, Ý, þ, Þ, ð, Ð voru
settir tyrkneskir stafir. Latin 1 taflan hefur
þó haldið yfirburðastöðu sinni.
Fyrst og fremst vegna þarfa í Austur-
8
Tölvumál