Uppeldi og menntun - 01.01.2011, Qupperneq 84
Uppeldi og menntUn/icelandic JoUrnal of edUcation 20 (1) 201184
textagerÐ Barna, Unglinga og fUllorÐinna:
orðaforða. Hér fer á eftir stutt lýsing á mælitækjunum sem notuð voru sem vísbend-
ingar um auðlegð og gæði orðaforðans sem þátttakendur virkjuðu í textagerð við
aðstæður sem leitast var við að hafa sem samburðarhæfastar (sjá kaflann Kveikja).
1. Textaþéttleiki var metinn með tveimur mælingum.
(a) Hlutfall inntaksorða var reiknað af heildarfjölda orða í hverjum texta (e. lexical
density). Þetta er vel þekkt aðferð, kennd við Ure (1971). Rannsóknir sýna að ritaður
texti hneigist til að vera þéttari en talmál samkvæmt þessum stuðli (Halliday, 1990;
Johansson, 2009; Strömqvist o.fl., 2002). Textaþéttleiki hefur sömuleiðis reynst góður
mælikvarði á þróun ritmáls hjá börnum og unglingum (Malvern o.fl., 2004; Strömqvist
o.fl., 2002).
(b) Nafnorðastuðull (e. nominal density). Hlutfall nafnorða af öllum orðum. Nafnorð
eru í senn langstærsti orðflokkurinn og sá opnasti. Hlutfall þeirra er því upplýsandi
um merkingarlegan þéttleika texta.
2. Fjölbreytileiki orðaforðans var metinn með tveimur mælingum.
(a) Forritið VocD (e. Vocabulary Diversity; sjá MacWhinney, 2000; Malvern o.fl., 2004).
Fjölbreytnistuðullinn endurspeglar í hve ríkum mæli textahöfundur notar mismun-
andi orð og orðmyndir fremur en endurtekningar á þeim sömu. Algengasta aðferðin
við mat á fjölbreytileika var lengi svokallað TTR (e. type-token ratio) eða hlutfallið
milli fjölda mismunandi orða/orðmynda (e. types) annars vegar og heildarfjölda
orða (e. tokens) í textanum hins vegar. Þessi aðferð hefur þann annmarka að niður-
stöður eru háðar lengd textanna og því ekki sambærilegar nema textarnir sem bera
á saman séu nákvæmlega jafnlangir. Það eru textarnir í þessari rannsókn ekki (sjá
Hrafnhildur Ragnarsdóttir, 2007) og aðferðin er því ekki nothæf. Í forritinu VocD í
forritasafni CLAN (Computerized Language Analysis, MacWhinney, 2000) er byggt
á sama grunni og í TTR en ýmsum ráðum beitt til að koma í veg fyrir skekkjuáhrif
textalengdarinnar á niðurstöður (mörg úrtök úr sama texta og fleira, sjá Malvern o.fl.,
2004). VocD lofar að flestra mati góðu sem mælitæki á fjölbreytni í orðaforða og hvernig
hún þróast bæði í talmáli og ritmáli hjá börnum og fullorðnum (Malvern o.fl., 2004).
McCarthy og Scott (2007) benda þó á að aðferðin sé ekki algerlega óháð textalengd;
áreiðanlegust í samanburði á textum sem eru 100–400 orð á lengd. Eins og fram kom
hér að framan eru meðaltöl elsta og yngsta hópsins rétt utan við þau mörk. Rétt er að
vekja athygli á því að VocD telur allar orðmyndir í hverjum texta og gefur þannig ekki
sömu mynd af fjölbreytni orðaforða og væri textinn lemmaður.
Í sjö þjóða samanburðarrannsókninni reyndist VocD greina kerfisbundinn mun á
textategundum en ekki á rit- og talmáli (Berman og Verhoeven, 2002). Í seinni rann-
sóknum á sænsku, hebresku og ensku gögnunum sérstaklega kom hins vegar fram
marktækur munur á fjölbreytileika orðaforða í ritmáli og talmáli (Johansson, 2009;
Ravid og Berman, 2006). Skýringar á þessum mun milli tungumála tengjast að öllum
líkindum eðlismun á málunum í sjö landa samanburðarrannsókninni. Íslenska er
dæmi um mikið beygingamál í samanburði við til dæmis ensku, sænsku og hollensku
og því mun fleiri beygingarmyndir af hverju orði í íslenskum textum en þeim síðar-
nefndu. VocD-forritið gerir ekki upp á milli orða og orðmynda, heldur telur allar
orðmyndir í hverjum texta. Af þessu leiðir að augljóslega er ekki hægt að bera saman