Orð og tunga - 01.06.2002, Page 17
Eiríkur Rögnvaldsson o.jl.: Vélræn málfræðigreining með námfúsum markara
7
þ.e. ég. 7. reglan segir: Breytið greiningunni atviksorð/fornafn ífornafn 1. persónu,
fieirtölu, nefnifall ef orðið er við og greining eftirfarandi orðs er sögn, framsöguháttur,
germynd, fyrsta persóna, fleirtala, þátíð. Síðasta reglan er alveg eins, nema hún vísar
til nútíðarmynda sagna í stað þátíðar. Svo sjáum við tvær reglur sem breyta greiningu
sagna úr 3. persónu í fyrstu ef fyrstu persónu fomafn fer næst á undan eða eftir; og svo
mætti halda áfram.
Lítum aðeins á nokkur dæmi um algengustu villurnar í greiningunni. Þetta em allt
dæmi úr seinni greiningunni, þegar búið var að taka fallstjórnina út. I (9) sést að 10
dæmi voru um það að nafnorð í þágufalli (þ) væri greint sem þolfall (o).
(9)
10 dæmi um nveo sem ættu að vera nveþ:
327 að þeir séu sleipir í sögu
489 að fara í andaglas í tölvu
1372 ofan (sig , þessari túpu
3130 sem hún fylgdist með hverri hrevfinau
5883 einhverjum ástæðum var ömmu í nöp
6586 týndist Stóri-Jón reyndi eftir bestu getu
10351 súkkulaði og kaffi inni í stofu
4101 ætlaði að koma við í SÍODDU
5469 . einar dyr voru á framhlið
5049 var farið að svima af eftirvæntinau
. það er eiginlega ekki
. hvað þessir strákar þykjast
sem átti að liggja slétt
hetju sinnar. Alli gaf
við þessa iðju . Jóra
að segja frá ferðalaginu niður
. meira að segja Guðmundur
og . kaupa eitthvert sælgæti
hans en þær voru sjaldan
. hún rétti út höndina[-4ptj
f öllum þessum dæmum nema einu fer forsetning á undan nafnorðinu, þó ekki alltaf
næst á undan - við höfum auðkennt forsetningarnar hér til glöggvunar. Vandinn er sá
að þessar forsetningar stjórna ýmist þolfalli eða þágufalli. Auðvitað er hægt að ráða
það af samhenginu hvort fallið er rétt í hverju tilviki, en okkur finnst ekki augljóst að
hægt sé að semja reglur sem segi til um greininguna. Þær reglur yrðu oft ansi flóknar,
og eins líklegt að þær gætu af sér fleiri rangar greiningar en réttar.
(10)
9 dæmi um fphett sem ættu að vera fpheo:
6662
8193
8199
9864
10563
10600
10873
11426
11870
átti ég að vita , bað muldraði . lögregluþjónninn má ég
undir fótum sér, sá bað , heyrði það , fékk
, heyrði það , fékk bað í fangið þegar hann datt
þrjóskur. flugmaðurinn sagði mér bað . þá lýgur hann því
skotinn í henni , sérðu bað ekki ? hvíslaði Kata spekingslega
í bók að maður sjái bað á augunum í fólki.
jólafríið kemur. kennarinn segir bað . ætlar hann að kenna
já . amma mín kallaði það að krossa sig , en
skapað líf. Jesús getur bað . af því að hann
Hér em svo dæmi um að fornafn 3. persónu í hvorugkyni, það, sé greint sem nefnifall
þar sem það er í raun þolfall. í öllum dæmunum fer sögn á undan það, og því gæti manni
virst það vera tiltölulega einfalt að setja fram reglu sem segði að þegarþað kæmi á eftir
sögn bæri að greina það sem þolfall. Gallinn er hins vegar sá að reglurnar geta ekki vísað
til orðflokka, heldur vísa þær til greiningarstrengsins í heild. Það þýðir að eina reglu
þarf til að segja til um fallið á það á eftir sögn í 1. persónu eintölu framsöguhætti nútíð
germynd, aðra reglu fyrir sögn í 2. persónu eintölu framsöguhætti nútíð germynd, o.s.frv.
Þess vegna eru dæmin um hvern greiningarstreng í þjálfunarsafninu ekki nægilega mörg
til þess að markarinn læri neina reglu. Ef hægt væri að vísa til hluta strengsins, t.d. bara
fyrsta stafsins í honum sem táknar orðflokk, myndi þetta gerbreytast.