Orð og tunga - 01.06.2007, Page 99
Sigrún Helgadóttir: Mörkun íslensks texta
89
Niðurstöður mörkunar voru skoðaðar og greindar til þess að finna
hvers konar villur markararnir gera og hvernig mætti bæta árangur-
inn.
Skipta má villum sem markarar gera í tvo flokka. I fyrsta lagi eru
villur sem verða vegna margræðni, þ.e. tiltekin orðmynd getur haft
fleiri en eina greiningu. I öðru lagi verða villur í greiningu óþekktra
orða þegar sú aðferð við greiningu óþekktra orða sem markarinn not-
ar gefur ekki rétta greiningu.
í töflu 5 eru sýndar 20 algengustu villur sem hver markari gerir. í
töflu 6 eru sýndar 20 algengust villur sem allir markarar eru sammála
um.
fnTBL MXPOST TnT
Safn- Safn- Safn-
markarí> tíðni markari> tíðni markari> tíðni
rétt mark Tíðni % % rétt mark Tíðni % % rétt mark Tíðni % %
aþ>ao 1.568 2,37 2,37 aþ>ao 2.218 3,44 3,44 aþ>ao 1.734 3,05 3,05
ao>aþ 1.522 230 4,68 ao>aþ 1.514 2,35 5,79 ao>aþ 1.489 2,62 5,66
nveo>nveþ 830 1,26 5,93 aa>ao 616 0,96 6,75 ao>aa 1.045 1/84 7,50
nveþ>nveo 824 1,25 7,18 ao>aa 599 0,93 7,68 aþ>aa 911 1,60 9,10
sng>sfg3fn 672 1,02 8,19 nveþ>nveo 586 0,91 8,59 nveþ>nveo 887 1,56 10,66
nheo>nhen 594 0,90 9,09 nveo>nveþ 547 0,85 9,44 nveo>nveþ 865 1,52 12,18
nhen>nheo 582 0,88 9,97 sfg3eþ>sfgleþ 503 0,78 10,22 aa>ao 689 1,21 13,39
sfg3eþ>sfgleþ 572 0,87 10,84 nhen>nheo 489 0,76 10,98 ssg>sþghen 671 1,18 14,57
aa>ao 562 035 11,69 sfg3fn>sng 446 0,69 11,67 nheo>nhen 659 1,16 15,73
nkeo>nkeþ 500 0,76 12,45 oct 392 0,61 12,28 nhen>nheo 638 1,12 16,85
aa>aþ 462 0,70 13,14 aa>aþ 378 0,59 12,86 sng>sfg3fn 599 1,05 17,91
ao>aa 449 0,68 13,82 nheo>nhen 371 0,58 13,44 sfg3eþ>sfgleþ 584 1,03 18,93
lhensf>lheosf 441 0,67 14,49 nkeþ>nkeo 360 0,56 14,00 sþghen>ssg 570 1,00 19,93
nvfo>nvfn 420 0,64 15,13 nvfronvfo 337 0,52 14,52 nkeþ>nkeo 509 0,89 20,83
nkeþ>nkeo 412 0,62 15,75 fpkeþ>fpveþ 335 0,52 15,04 lhensf>lheosf 490 0,86 21,69
fohen>foheo 401 0,61 16,36 sng>sfg3fn 334 0,52 15,56 oaa 437 0,77 22,46
nheog>nheng 392 039 16,95 aþ>aa 330 0,51 16,07 nvfo>nvfn 437 0,77 23,23
ct>c 369 036 17,51 nkeo>nkeþ 327 0,51 16,58 nkeo>nkeþ 434 0,76 23,99
ssg>sþghen 359 034 18,05 ct>c 324 0,50 17,08 nvfronvfo 424 0,75 24,73
nvfronvfo 356 034 18,59 foherofoheo 321 0,50 17,58 ct>c 393 0,69 25,42
Tafla 5. Tuttugu algengustu villur sem hver markari gerir
Algengustu villur sem markararnir gera eru af fyrri gerðinni, þ.e. or-
sakast af margræðni. Langalgengustu villurnar felast í því að rugla
saman fallstjórn forsetninga. Algengast er að rugla saman þolfalli og
þágufalli. Þar sem prófaðir eru gagnamarkarar í þessari rannsókn hafa
þeir ekki innbyggðar reglur sem segja til um samræmi í fallstjórn for-
setninga og falli eftirfarandi nafnorðs. Markararnir gætu hins vegar
búið sér til slíkar reglur út frá gögnunum. Sá þáttur hefur ekki verið
kannaður til hlítar. Næstalgengastur er ruglingur á milli beygingar-
mynda nafnorða sem hafa sömu mynd. Má þar nefna þolfall og þágu-
fall kvenkynsorða í eintölu (þf. konu; þgf. konu) og nefnifall og þolfall
hvorugkynsorða í eintölu (nf. barn; þf. barn). Ruglingur á milli fyrstu
persónu og þriðju persónu eintölu af sögnum er líka algengur þar sem
þessar beygingarmyndir líta eins út (égfer; hannfer). Einnig má nefna