Lifandi vísindi - 04.04.2016, Blaðsíða 41
arg min
S
k
∑∑
i = 1 x ∈si
|| x - μi ||
2
TÖLVUR
stungið upp á nýjum myndum, tónlist eða
bókum. Uppástungurnar grundvallast á fyrri
áhugasviðum þínum og taka þær meira að
segja mið af því hvernig áhugi hvers og eins
breytist með tímanum. Afraksturinn er sá að
tölvuforritin eru nú langtum flinkari við að
róta í gegnum feiknarlegt magn upplýsinga
og finna tilteknar niðurstöður eða mynstur í
hundrað þúsundum eða milljónum afbrota.
Þau forrit sem sjá um veðurspárnar og
sem fyrirtæki nýta sér á fjármálamarkaði
virka með sambærilegum hætti. Öll kerfin
nýta upplýsingar úr fortíðinni til þess að
segja fyrir um hvernig eitthvað kerfi – t.d. af-
brotin – muni haga sér á morgun.
Algrím flokkar atburðina
Í New York einni saman voru árið 2014 framin
meira en 100.000 afbrot; þ.e. rán, líkamsárásir,
nauðganir, bílþjófnaðir og önnur lögbrot.
Forvirka lögreglueftirlitið spáir fyrir um
framtíðina með því að flokka heilt haf af
gögnum: Auk gerðar lögbrotsins þurfa kerfin
einnig að þekkja til kyns afbrotamannsins,
aldurshóps, kyns fórnarlambsins og jafnvel
þjóðarbrot, ásamt tíma afbrotsins og stað-
setningu í borginni. Vopnað öllum þessum
upplýsingum getur algrímið flokkað gögn
sem minna hver á önnur innan tiltekinnar
landfræðilegrar afmörkunar. Fyrir hvert upp-
lýsingamagn munu finnast punktar – sam-
svarandi lögbrotum – sem liggja sérlega ná-
lægt hver öðrum í tíma og rúmi og mynda því
eins konar heitan reit: Stað þar sem tiltölu-
lega mörg afbrot hafa átt sér stað innan til-
tekins tímaramma. Svæðið er þá merkt sem
Algrím finna miðju afbrotsins
Jöfnurnar á bakvið forsagnirnar flokka gerðir afbrota með því að reikna út miðju á tilteknu svæði með hliðsjón af t.d. þjófnaði. Það
þarf gríðarlega reiknigetu til að finna miðpunkta í heilum skóg af því sem virðist vera tilfallandi upplýsingar. Þegar afbrotin eru flokk-
uð í hópa afhjúpar fjöldi þeirra í hvaða hópi hættan er mest á nýju afbroti.
S er magn af K hópum
k er fjöldi hópa. Hópur er stað-bundinn fjöldi af tiltekinni gerð
afbrota, t.d. innbrotum, þjófnaði eða
nauðgunum.
i er fjöldi útreikn-inga sem byrja
með 1 og enda
með k.
∑∑ Sigmatáknin vísa í allar þær fjarlægðir sem algrímið finnur. Fyrir hvert X reiknast fjarlægð til óþekktrar
miðju, µi. Algrímið færir µi til þar til samanlögð fjarlægð frá öllum
afbrotunum til miðjunnar er eins lítil og kostur er (arg min).
x er afbrot sem tilheyrir stærðinni Si (x ∈Si).
μi
er óþekkt miðja
í hópnum Si.
Heitir reitir staðsettir
Forritin nýta oft reikningsaðferð sem
nefnist „K-means clustering“ til að flokka
tilteknar gerðir afbrota, t.d. þjófnaði og
líkamsárásir. Þannig myndast nokkrir hópar með
sambærilegum afbrotum. Fá afbrot eru þannig
greind í ljósum litum meðan dökkir litir vísa til auk-
innar hættu á afbrotum.
Algrímið spýtir út tölu
Svokölluð smættunarregla er nýtt til þess
að framkalla stærfræðilega forsögn um
hvar næsta afbrot muni eiga sér stað. For-
sögnin gæti t.d. hljóðað: „Miklar líkur eru á því að sjö
innbrot eigi sér stað á Nørrebro í Kaupmannahöfn í
næstu viku. Hættan á því að innbrotin verði milli 3
og 12 er 90%.“
FORSAGNIR UM HAND-
TÖSKUÞJÓFNAÐ Í WAS-
HINGTON D.C.
Handtöskuþjófnaðir
í júní – júlí 2008
Svæði sem forritið
metur áhættusömust varðandi
töskuþjófnaði skv. gögnum
frá júní – júlí.
Handtöskuþjófnaðir
í ágúst – september 2008
4 5
AN
N
H
ER
M
ES
/A
P/
PO
LF
OT
O
PETER BORISSOW