Orð og tunga - 01.06.2007, Page 31
21
Anna Björk Nikulásdóttir: Sjálfvirk greining merkingarvensla
(33) a. smástrákur (lítill) ungur drengur
b. stráklingur lítill, ungur drengur
c. prammi (lítill eða) stór flatbotna bátur [...]
d. sproti (lítill eða allvænn) silungur
e. sprotasilungur (lítill) silungur
f. branda (lítill) fiskur
g. skítseiði lítill fiskur
I (33a) gæti smástrákur þýtt til dæmis a. lítill og ungur drengur, b. lít-
dl eða ungur drengur (orð í sviga kemur í stað orðs utan hans) eða
c- ungur drengur, yfirleitt lítill. Til samanburðar má líta á skýringuna
við stráklingur og leiða að því getur að sviginn í (33a) sé í raun óþarf-
ur. I (33c) virðist lýsingarorðunum vera ofaukið því væntanlega get-
ur prammi líka lýst bát sem hvorki er stór né lítill, flatbotna er hér
lýsingarorðið sem skiptir máli. Sama á við í (33d) en hér er sviginn
settur utan um bæði lýsingarorðin. í greiningu merkingarvensla get-
ur komið til mótsagna þegar skýringar eru orðaðar á þennan hátt:
EIGINLEIKI (prammi, lítill), EIGINLEIKI (prammi, stór). Eins og áður
segir er þessum skýringum sleppt í greiningunni eins og er. Annað
dæmi um sviganotkun er þegar yfirheiti og undirheiti er í raun skeytt
saman: (ára)bátur, (vín)sopi eða orðum eins og breyting - tilbreyting:
(til)breyting, skipti - umskipti (um)skipti. Þetta skapar ákveðin vanda-
mál við vélræna greiningu þar sem textanum er skipt upp í tóka fyrir
mörkun. Þá stendur eitt orð eða eitt greinamerki í hverri línu. Fyrir
orðið (til)breyting lítur það svona út:
(
til
)
breyting
Ekki er lengur hægt að sjá hvort orð í sviga tilheyra eftirfarandi
orði (eins og í dæmunum hér á undan), undanfarandi orði eða eru
sjálfstæð orð. Mögulega er hægt að skrifa reglur sem leysa úr þessu en
það hefur ekki verið kannað til hlítar.
Þó hér hafi verið bent á dæmi um form skýringartexta, sem skapa
vandamál við vélræna greiningu, er rétt að benda aftur á að 92,61%
skýringarhlutanna voru greindir af MerkOr (sjá töflu 1).