Árbók VFÍ/TFÍ - 01.06.2005, Síða 214
þar sem a0 = 4,95 og - -5,37, sjá kaflann um fyrirframdreifingar. Þessi endurstikun
hefur ekki verið kynnt áður. Hugmyndin kviknaði eftir ítarlega skoðun á gildum á a og b
úr gagnasafni VM-OS. Hægt er að líta á stikann a sem margfeldi af þætti sem vegur á
móti breytilegu b, þ.e., exp(a0 + ajb) og þætti sem metur stærðargráðu rennslis miðað við
vatnshæð, þ.e. exp(e). Fylgnin í eftirádreifingu r. og b er mjög veik. I bayesískri tölfræði er
ákjósanlegra að vinna með stika sem hafa veika fylgni heldur en sterka því það gerir
hermun frá eftirádreifingunni auðveldari. Ennfremur fæst einfaldara form á dreifni Q
með því að nota stikann r2 í stað tj2 og auðveldara er að meta r2 en rj2. Meðalgildi og
dreifni rennslismælinganna í endurstikaða líkaninu eru
E(Ql) = exp(a0+aþ+£)(w!-c)b, Var(Qi) = T2(wl-c)2bv, i=\,...,n.
Líkanið sem er skilgreint samkvæmt jöfnum (3) og (4) er líkanið sem notað er til þess að
greina gögn sem kynnt verða hér fyrir neðan.
Stikamat með bayesískri tölfræði
Bayesísk tölfræði byggir á grunni líkindafræðinnar þar sem allir óþekktir stikar eru
höndlaðir sem slembibreytur. Skilgreina þarf fyrirframdreifingu fyrir óþekktu stikana og
einnig þarf að skilgreina tölfræðilegt líkan fyrir gögnin sjálf. Þetta felur í sér að stikum og
gögnum er lýst með líkindadreifingum sem hafa þekkt lokað stærðfræðilegt form.
Styrkur bayesískrar tölfræði felst meðal annars í því að geta sameinað upplýsingarnar
sem felast í gögnunum sjálfum og fyrirframþekkingu sem er fundin með því að nota fyrri
gögn og vísinda- og sérfræðiþekkingu. Ef engin gögn eða þekking er til staðar um ákveð-
inn stika er notuð fyrirframdreifing sem felur í sér eins litlar upplýsingar og hægt er.
Stærðfræðileg framsetning á bayesískri tölfræði er eftirfarandi; Látum X vera slembivigur
sem inniheldur gögnin sem koma frá líkindadreifingu sem er háð óþekkta stikavigrinum
0. Líkindadreifing X gefið 0 er táknuð með p(x | 0) og er kölluð sennileikafall (e. likelihood
function) þegar draga á ályktanir um 0 út frá gögnunum. Þekkingu um 0 áður en gögnin
koma til sögunnar er lýst á líkindafræðilegan hátt með fyrirframdreifingu 0, táknuð með
p(6). Samdreifing X og 0 er gefin með
p(x,G)= p(x\0)p(6).
Að því gefnu að gögnin taki gildið x, þá má uppfæra fyrirframdreifingu 0 með tilliti til
gagnanna með setningu Bayes, sjá t.d. [5], en þá fæst skilyrt dreifing (e. conditional distri-
bution) 0 gefið X = x,
P(6\x) =
P(x\9)p(6)
\P(x\e)p(6)dd
oc p(x\6)p(6),
sem er kölluð eftirádreifing 0. Allar ályktanir um 0 eru byggðar á p(6 \ x).
Eftirádreifingarnar verða alltaf innan sama svæðis og fyrirframdreifingarnar samkvæmt
skilgreiningu á eftirádreifingum. Því meira sem til er af gögnum því minni áhrif hefur
lögun fyrirframdreifingarinnar á eftirádreifinguna, en lögun sennileikafallsins hefur
þeim mun meiri áhrif á lögun eftirádreifingarinnar.
Eftirádreifing stikavigursins 0 = (e, b, c, y/, r2)T í líkaninu sem er gefið með jöfnum (3) og
(4) er fundin hér fyrir neðan. Til að reikna punktmat og bayesísk líkindasvæði (e. credible
regions) fyrir stikana út frá eftirádreifingunni er svokallaður Gibbs-safnari notaður til að
herma gögn frá eftirádreifingunni, sjá lýsingu á Gibbs-safnara í [6]. Astæðan fyrir því að
nota hermun er sú að yfirleitt er ekki hægt að fá formúlur á lokuðu formi fyrir metla (e.
estimators) og líkindasvæði og á það líka við hér. Athugið að bayesísk líkindasvæði svara
til öryggisbila í hefðbundinni tölfræði. Hér er meðalgildi eftirádreifingarinnar notað sem
metill fyrir stikavigurinn 0.
212i Arbók VFl/TFl 2005