Bókasafnið - 01.06.2014, Blaðsíða 70
Bókasafnið 38. árg. 2014
70
verður það orð notað hér.
Í metsölubókinni Big Data: A Revolution That Will
Transform HowWe Live, Work, and Think sem fjallar um
gagnagnótt, og ég get mælt heilshugar með, fjalla höf
undarnir um margvísleg dæmi sem varpa ljósi á þessa
merkilegu þróun ﴾MayerSchönberger og Cukier, 2013﴿.
Þeir benda á að gagnagnótt er ekki í eðli sínu bundin við
tölvutækni. Löngu fyrir tíma tölvunnar hafi miklu magni
gagna verið safnað saman og úr þeim unnar verðmætar
upplýsingar á handrituðu og prentuðu sniði. Hér á eftir
verða rakin nokkur dæmi um úrvinnslu gagnagnóttar.
Í starfi sínu hjá bandaríska sjóhernum safnaði
haffræðingurinn og kortagerðarmaðurinn Matthew
Fontaine Maury ﴾18061873﴿ miklu magni gagna um haf
strauma og vindafar um miðbik 19. aldar. Þetta voru
gögn sem skipstjórar höfðu fært til bókar á ferðum sínum
um heimshöfin en lágu ónýtt í dagbókum þeirra. Með því
að safna þeim saman og greina þessi gögn gat Maury
meðal annars fundið betri siglingaleiðir en áður þekktust.
Hin nýju kort Maurys breiddust hratt út um allan heim
og urðu til að stórbæta samgöngur á sjó. Fyrir vikið var
Maury sleginn til riddara í fleiri en einu evrópsku
konungsríki ﴾MayerSchönberger og Cukier, 2013, bls.
7377﴿. Meðal annars veitti Friðrik 7. Danakonungur
honum Dannebrogsorðuna árið 1856.
Amazon
Á vaxtarárum Amazon netheildsalans undir lok síð
ustu aldar hélt fyrirtækið úti bókmenntagagnrýni.1 Hugs
unin var að þetta væri góð leið fyrir notendur Amazon til
að lesa umfjallanir um bækur og fá þá til að íhuga frekari
bókakaup. Árið 1998 sótti forritarinn Greg Linden og
deild hans hjá Amazon um einkaleyfi á aðferð sem fékk
heitið samvinnusía ﴾e. collaborative filter﴿ og byggðist á
samsafni gagna um verslunarsögu fyrri viðskiptavina.
Upplýsingarnar voru notaðar til að spá fyrir um vörur
sem líklegir viðskiptavinir gætu haft áhuga á að kaupa.
Fljótlega kom í ljós að þetta kerfi jók mjög sölu bóka og í
kjölfarið var því ákveðið að leggja niður bókmennta
gagnrýnina.2 Niðurstöður úr samvinnusíuaðferðinni
veittu mun markvissari vísbendingar um áhugasvið
líklegra viðskiptavina en gagnrýni á völdum titlum af
metsölubókalistanum. Í dag er talið að allt að þriðjungur
af sölu Amazon sé fyrir tilstilli samvinnusíunnar ﴾Mayer
Schönberger og Cukier, 2013, bls. 5052﴿.
CAPTCHA
Um sama leyti og Linden sótti um einkaleyfið var
ruslpóstur á netinu ﴾e. spam﴿ og önnur slík skilaboð orðin
útbreidd og fyrirséð að dreifing slíks efnis yrði meiriháttar
vandamál að öðru óbreyttu. Tölvunarfræðingurinn Luis
von Ahn hannaði aðferð til þess að greina á milli tölvu
forrita sem dreifa slíku efni og raunverulegra manneskja.
Hann hannaði aðferð sem nefnd er CAPTCHA
﴾Completely Automated Public Turing Test to tell
Computers and Humans Apart﴿.3 Þetta einfalda próf felst
í því að birta brenglaða mynd af bók og/eða tölustöfum
sem tölvur ná ekki að ljóslesa og er notandinn beðinn
um að slá inn stafina á myndinni. Aðferðin virkar vel og
leiða má líkum að því að henni megi þakka að talsvert
minna sé um ruslpóst en ella.
Luis Von Ahn var þó ekki sáttur við að milljónir
manna eyddu nokkrum sekúndum á hverjum degi í að
slá inn stafi sem þjónaði aðeins þessum þrönga tilgangi.
Hann lagði því höfuðið í bleyti og fann upp stórsnjalla
endurbót sem hann nefndi reCAPTCHA. Í stað þess að
birta notandanum handahófskennda stafi og tölur voru
nú valin orð úr ljóslestursverkefnum sem tölvurnar gátu
ekki ljóslesið. Vitað er hvað annað orðið stendur fyrir ﴾til
staðfestingar á að manneskja sé að fylla út﴿ en hitt er orð
Mynd 1. Kort Maury sem sýnir hafstrauma á heimshöfunum og var
gefið út um miðja 19. öld.
1 James Marcus sem var yfir ritstjórn bókmenntagagnrýni gaf út bókina Amazonia árið 2005 um reynslu sína.
2 Hér er aðeins átt við bókmenntagagnrýni samda af starfsmönnum Amazon. Notendur geta auðvitað skrifað gagnrýni um bækur á vef
Amazon.
3 Turingpróf eru aðferðir til þess að greina á milli manna og tölva kenndar við stærðfræðinginn Alan Turing ﴾19121954﴿ sem fyrstur setti
hugmyndina um slík próf fram.