Mímir - 01.06.2007, Qupperneq 52
sömuleiðis skrifaðar með ákveðnum rithætti og
oftast er tvípunktur á milli tveggja talna. Þegar
skrifaðar eru markatölur er þó stundum band-
strik á milli og stundum hafður punktur í stað
tvípunkts þegar ritað er hvað klukkan er:
(ll)a. Liðið vann sigur á Calgary Flames, 2:1 (tvö
eitt) í sjöunda leik liðanna í úrslitum og
viðureignina því 4:3 (fjögur þrjú) (mbl.is
8.6.2004c).
b. Staðan er 2-1 (tvö eitt) Detroit í vil (mbl.is
11.6.2004a).
c. I Suðurkjördæmi lauk talningu klukkan
4:55 (fjögur fimmtíu og fimm) og um 5:30
í Norðausturkjördæmi [...] (mbl.is 27.6.
2004a).
d. Verið var að vinna við þakið þegar eldur-
inn kviknaði um kl. 19:44 (nítján ijörutíu
og fjögur) (mbl.is 12.7.2004a).
e. Tilkynning barst Neyðarlínunni kl. 21.55
(tuttugu og eitt fimmtíu og fimm) í gær-
kvöld (mbl.is21.7.2004).
Flokkurinn „aðrar tölur“ hefur því engin sérstök
beygingarleg og setningarleg einkenni heldur em
fremur einstakir flokkar innan hans sem hafa ef
til vill sérstök einkenni og standa með ákveðn-
um orðum.
3. Vandamál í tungutækni
I íslensku getur verið flókið að bera fram tölu
eins og 1848 og erfitt að sjá hvort um er að ræða
ártal (átján hundruðjjörutíu og áttd), fjölda (eitt
þúsund átta hundruð jjörutíu og átta) eða síma-
númer (átján jjörutíu ogátta). Við þetta bætist
að tölur í íslensku beygjast í kyni og falli eins
og lýst er hér að framan og er hægara sagt en
gert að láta tölvur átta sig á því hvernig beyg-
ingarkerfi íslenskunnar virkar.
I tölumálheildinni sem áður hefur verið
kynnt til sögunnar er að finna aragrúa máls-
greina sem innihalda tölur og er gott að nota
hana til að átta sig á hvers kyns vandamál þarf
að leysa. Málsgreinunum var skipt í 13 flokka
eftir efni og alls voru 11.477 tölur í málheild-
inni. Við athugun kom í ljós að hægt er að setja
fram einfaldar reglur fyrir margar talnanna í
flokkunum þar sem sagt er hvernig þær eigi að
beygjast í ákveðnu umhverfi. Þannig segir ein
reglan að í hvert skipti sem orðmyndin ára
stendur á eftir tölu eigi talan að vera í hvorug-
kyni, eignarfalli, sbr. tveggja ára. Reglurnar voru
settar formlega fram eftir samhengisfrjálsri mál-
fræði (e. context-jreegrammar) til þess að auðvelt
yrði að meðhöndla þær í tölvum en ekki verður
farið nánar út í það hér hvernig þær virka. Þessi
leið er tiltölulega einföld og með henni er ekki
aðeins hægt að skoða sambeygingu, líkt og hægt
væri með öðrum aðferðum, heldur einnig taka
tillit til þess á hvaða formi tölurnar eru skrifað-
ar og hvaða orð standa á undan tölunum.
3.1 Frumtölur
Helstu flokkar frumtalna í tölumálheildinni
voru aldur, ártöl, jjöldi, prósent, upphæðir, tími,
veður og mælieiningar (þyngd og lengd). I þess-
um flokkum eru tölurnar nánast alltaf hliðstæð-
ar nema kannski í flokki ártala. Tölurnar standa
með orðum eins og ár,prósent, krónur, mínútur
og öðrum nafnorðum sem fjöldi á við.
Efbyrjað er á því að skoða tölur sem standa
með nafnorðum má sjá að töluorð sambeygjast
nafnorðunum sem þau standa með eins og fram
kom hér að framan. Þetta er þó ekki alltaf svo
einfalt. Tölur standa ekki alltaf næst á undan
nafnorðinu þannig að tölvan getur þurft að leita
lengra að því:
(12)a. Það sem af er golfárinu 2004 hafa 34 (þrjá-
tíu og fjórir (nf.kk.)) íslenskir (lo.)
kylfingar (nf.kk.) náð því sem kallað er
draumahögg allra kylfinga - það er að fara
holu í höggi (mbl.is 5.7.2004b).
b. I fyrra voru leyfin alls 2.447, en á tímabil-
inu janúar-maí á þessu ári hafa leyfin
(nf.hk.) einungis verið 554 (fimm hundruð
fimmtíu og fjögur (nf.hk.)) (mbl.is 6.7.
2004a).
50