Orð og tunga - 01.06.2017, Page 143
Heimir van der Feest Viðarsson: Málnotkun sem mælikvarði 133
3 Gagnasöfn og aðferðafræði
Tvenns konar gögn voru nýtt í athugununum hér á eftir, annars veg-
ar útgefinn ritgerðatexti nemenda Lærða skólans og hins vegar óút-
gefn ar ritgerðaleiðréttingar. Texti skólaritgerðanna er eftir útgáfu
Braga Þorgríms Ólafssonar (2004) sem aðgangur fékkst að á rafrænu,
leit ar bæru formi. Um er að ræða úrval ritgerða 170 nemenda frá
ýms um tímum, alls 189 talsins, skrifaðar á því tímabili sem skólinn
starf aði (elsta frá 1852), að einni ritgerð frátalinni frá 1906. Safnið er
u.þ.b. 83 þúsund orð og hver ritgerð því að meðaltali um 440 orð.
Rit gerð irnar átti að skrifa um tiltekið efni, t.d. „Hvaða not hafa
menn af hestunum?“ (1852) og „Að útlista þýðingu máltækisins:
„iðnin vinnur alla mennt““ (1860). Kennarar fóru síðan yfir staf-
og greinarmerkjasetningu, málfræðileg atriði, orðaforða o.s.frv. og
merktu við villur, yfirleitt með undirstrikunum. Þessar leiðréttingar
kenn ara voru þó ekki færðar inn í útgáfuna (sbr. Braga Þorgrím Ólafs-
son 2004:52). Sérathugun mín á frumtextum var því gagngert til að
fræðast nánar um leiðréttingarnar og eðli þeirra.
Til þess að greiða fyrir söfnun og flokkun dæma í köflum 4.2–4.4
voru ritgerðirnar markaðar á sjálfvirkan hátt með IceNLP-búnaðin-
um (sbr. Hrafn Loftsson og Anton Karl Ingason 2013) sem fól í sér
orðflokkagreiningu og upplýsingar um málfræðilegar formdeildir.
Við leit var notað orðstöðulykilsforritið AntConc (Anthony 2012).
Síðan var farið handvirkt yfir niðurstöðurnar en til að tryggja að villur
í sjálfvirkri mörkun hefðu ekki áhrif á gagnasöfnun voru auk þess
sér staklega kannaðar allar mögulegar orðmyndir hverrar málbreytu
sem ekki höfðu fengið þá greiningu sem leitað var að.
Í nýlegum skrifum um mælingar á áhrifum málstöðlunar hefur
verið varað við hve auðvelt sé að hrapa að ályktunum þegar sveiflur
yfir ákveðið tímabil í tíðni einstakra fyrirbæra, sem hlotið hafa þann
vafasama heiður að vera skotspónn forskriftarmálfræðinnar, eru túlk-
aðar sem sýnileg áhrif málstýringar (sjá Hinrichs o.fl. 2015). Þessir
fræðimenn mæla því með fjölþættari nálgun, t.d. með því að kanna
hvort málnotendur sem forðist tiltekið málafbrigði séu að sama skapi
líklegir til að forðast önnur óviðurkennd málafbrigði. Röksemd fyrir
árangri af málstýringu verður því tvíþætt þar sem annars vegar er
bent á breytingu á notkunarmynstri tiltekins fyrirbæris og hins vegar
á samlegð áhrifa úr ólíkum áttum sem líkleg séu til að eiga sér sömu
skýringar. Sama aðferð var upphaflega prófuð á málbreytunum
þrem ur (kaflar 4.2–4.4) en vegna smæðar gagnasafnsins reyndist
tunga_19.indb 133 5.6.2017 20:27:53