Orð og tunga - 01.06.2012, Blaðsíða 42
32
Orð og timga
verið t.d. tilfinninc eða hlutur. Þannig mætti hugsa sér að í íslensku
hefði orðið ofsaglcði yfirheitiðg/eð; sem aftur tengdist grunnhugtakinu
TILFINNING.
Formgerð íslenska merkingarbrunnsins hefur ekki verið greind að
fullu en eins og sjá má hér að ofan eru merkingarupplýsingarnar um
einstök orð margvíslegar og ekki alltaf nákvæmlega skilgreinanlegar.
Olíklegt er einnig að merkingarbrunnurinn myndi heildstætt net orða.
Frekar má búast við að orð innan einstakra merkingarsviða tengist
innbyrðis og myndi þannig þyrpingar sem eru einangraðar að mestu
leyti.
Einstök hefðbundin merkingarsvið geta svo myndað einskonar
undirsvið. I tengslum við dæmin í kafla 3, orð sem tengjast þorskur,
má til dæmis nefna að merkingarsviðinu ,fiskur' má mögulega
skipta í þrjú svið eftir niðurstöðunum: a) svið sem tengist umræðu
um fiskveiðar og útgerð (þorskur; loðna, kolmunni), b) svið sem teng-
ist sportveiði (lax, sjóbirtingur, silungur) og c) svið sem tengist mat
(ýsa, skötuselur, rauðspretta). Þannig fást viðbótarupplýsingar sem
tengjast daglegu máli og almennri þekkingu, sem sjaldan er að finna
í hefðbundnum orðabókum. Islensk orðabók til að mynda skilgreinir
orðin ýsfl og kolmunni á samahátt: „fiskur [latnesktheiti] af þorskaætt"
(Snara, 30.06.2011). I merkingarbrunninum hins vegar er að finna upp-
lýsingar um að ýsa sé borðuð, ýmist steikt, soðin eða djúpsteikt, geti
verið í kvöldmatinn og verið með kartöflum. Orðið kolrnunni tengist
hins vegar eingöngu öðrum fisktegundum og orðum tengdum útgerð
og fiskveiðum.
Merkingarnetið ConceptNet (Havasi, Speer og Alonso 2007) inni-
heldur merkingarvensl milli hugtaka. Takmark höfunda þess er að til
verði gagnagrunnur sem nýta má í ýmsum hugbúnaði sem þarfnast
merkingarupplýsinga sem tengjast almennri reynslu og þekkingu.
Stór hluti af hæfileikum okkar til þess að skilja skilaboð byggist á því
sem við vitum og höfum reynt í umhverfinu, þekkingu sem oft er
sameiginleg hverju samfélagi. Ef einhver segir til að mynda ég bakaði
köku í gær er ólíklegt að hann taki sérstaklega fram að kakan hafi
verið bökuð í ofni, því það er sjálfgefið að bakstur fer fram í ofni.
Þekking af þessu tagi þarf hins vegar að vera fyrir hendi í tölvutækum
merkingarnetum því tölvan býr ekki yfir neinni fyrirfram gefinni
þekkingu.
A mynd 2 er lítið dæmi úr ConceptNet. Grunneiningin er hugtak
en ekki orð eins og í merkingarbrunninum og því er að finna fleiryrtar
framsetningar eins og satisfy hunger og follow recipe. ConceptNet