Orð og tunga - 01.06.2007, Page 64
54
Orð og tunga
Textasöfn eru þannig gagnleg til að finna ýmsar setningagerðir og
átta sig á þeim. Það er t.d. hægt að nota þau, að vissu marki, til að
úrskurða tiltekna setningagerð tæka. Það er hins vegar ekki hægt að
nota þau til að úrskurða setningagerð ótæka. Þótt hún komi ekki fyrir
í þeim textum sem við skoðum getur það verið tilviljun. Eðli málsins
samkvæmt getur textasafn okkar aldrei innihaldið allar hugsanlegar
setningar. Ef við erum að lýsa málinu (ekki málkerfinu) gerir þetta
ekkert til. Textasafnið sem við höfum undir afmarkar þá viðfangsefni
okkar, og ef tiltekin setningagerð kemur ekki fyrir í safninu er hún
ekki hluti viðfangsefnisins og kemur okkur þess vegna ekkert við.
En ef við erum að lýsa málkerfinu sjálfu horfir málið öðruvísi við.
Það málkerfi sem við lýsum á að gera okkur kleift að mynda allar
málfræðilega tækar setningar en ekki aðrar. Þess vegna nægir okkur
ekki að vita hvers konar setningar eru tækar - við þurfum líka að vita
hvers konar setningar væru ótækar. Og því svarar textasafnið ekki -
það er vitaskuld ekki hægt að takmarka mengið „tækar setningar"
við þær setningar sem fyrir koma í tilteknu safni, hversu stórt sem
það er; „it is obvious that the set of grammatical sentences cannot be
identified with any particular corpus of utterances obtained by the
linguist in his field work", segir Chomsky (1957:15) og hnykkir enn á
því síðar:
[...] though "probability of a sentence (type)" isclearand
well defined, it is an utterly useless notion, since almost
all highly acceptable sentences (in the intuitive sense) will
have probabilities empirically indistinguishable from zero
and will belong to sentence types with probabilities em-
pirically indistinguishable from zero. Thus the acceptable
or grammatical sentences (or sentence types) are no more
likely, in any objective sense of this word, than the others
(Chomsky 1965:195).
2.2 Hversu marktækir eru textarnir?
í samtímalegri setningafræði er hægt að snúa sig út úr þessum vanda
með þeim einfalda hætti að spyrja málnotendur. Þá erum við ekki háð
afmörkuðu textamengi, heldur getum búið til texta eftir þörfum, ef
svo má segja, og borið þá undir málnotendur og fengið dóma þeirra