Kuntavaalien yksi jännitysmomentti on se, että minkäköhän ehdokasnumeron saa. Numerothan arvotaan ensi torstaina. Asialla ei ole minkäänlaista merkitystä mihinkään, mutta niin sitä vain itsekin pohtii, ihminen kun on irrationaalinen psykofyysinen entiteetti. Jotta saisin niskaotteen irrationaalisesta puolestani, tein viikonloppuna pienen simulaation, jolla asiaa voisi koittaa ennustaa. Ehdokasnumerojen jakauma ei nimittäin ole millään tavalla satunnainen, vaikka toisin voisi kuvitella!
(Kommentti 14.5.: ehdokasnumeroni on nyt lopulta 424, mikä tarkoittaa että olisin menettänyt kaikki rahani jos olisin tämän blogin mukaisesti lyönyt vetoa. Mutta siihen oli noin 60% todennäköisyys. Vuoden 2029 vaaleissa vasta aletaan nähdä, osaanko hommani).
Turun Sanomien mukaan ehdokkaita on yhteensä 670, ja listoja on kaikkiaan 14. Täyden sadan ehdokkaan listat on viidellä puolueella (Vihreät, SDP, Vasemmistoliitto, PS, Kokoomus+KD). Pienempiä listoja ovat RKP (71), Liike Nyt (21), SKP (8), Piraatit (4), Kristallipuolue (4), Liberaalit (2), Kansalaispuolue (1) ja Avoin puolue (1).
Ehdokasnumero jaetaan listan sisällä aakkosjärjestyksessä. Itse olen Turun Vihreiden mainiolla listalla aakkosjärjestyksessä viideskymmenneskuudes ehdokas. Ehdokasnumerointi aloitetaan aina numerosta 2, ja listojen järjestys arvotaan. Jos siis Vihreät satuttaisiin arpomaan ensimmäiseksi, oma ehdokasnumeroni olisi 57. Jos kokoomus sattuisi kiilaamaan edelle ja Vihreät sitten, numeroni olisi 157. Jos kaikki listat olisivat täysiä sadan hengen listoja, ennuste olisi helppo: kaksi viimeistä numeroa ovat 57.
Pienet listat vain sotkevat asiaa merkittävästikin. Järjestysnumero riiippuu siitä, missä järjestyksessä listat arvotan. Jos esimerkiksi Kansalaispuolue kiilaisi Vihreiden eteen, järjestysnumeroni olisi 58. Jos Piraatit, se olisi 61. Jos liberaalit, se olisi 59 — sama arvo, joka sillä olisi jos sekä Kansalaispuolue että Avoin puolue kiilaisivat edelle.
Jos todennäköisyydet haluaa laskea tarkkaan, tehtävästä tuleekin mieltä raastavan hankala. Periaatteessa pitää määritellä jokainen mahdollinen permutaatio listojen järjestyksiä, ja katsoa mikä ehdokasnumero syntyy milläkin numerolla. Ongelmaksi muodostuu, että näitä permutaatioita on 14! (14:n kertoma), eli 87 178 291 200 kappaletta. Periaatteessa simuloitavissa hyvällä tietokoneella, käytännössä tuskaa.
Pientä helpotusta tuo se, että osalla listoista on sama määrä ehdokkaita. Viidellä puolueella on 100 ehdokasta, kahdella 4 ja kahdella 1. Tämä tarkoittaa, että kaikkia 87 miljardia tapausta ei tarvitse laskea erikseen. Jos esimerkiksi Piraattipuolue ja Kristallipuolue vaihtavat paikkaa keskenään, muut puolueet eivät huomaa mitään vaikutusta. Vastaavasti, jos kokoomus, SDP ja Vasemmistoliitto leikkivät piirileikkiä, muiden ehdokasnumerot pysyvät samoina.
Toisin sanottuna esimerkiksi permutaatio {4, 71, 100, 58, 4, 1, 100, 8, 100, 100, 21, 1, 2, 100} täytyy laskea vain kerran. Se voi vastata useita erilaisia puoluejärjestyksiä: ykkösenä voi olla Piraatit tai Kristallipuolue, kolmantena jokin viidestä suurestä, jne. Kaiken kaikkiaan tämä tarkoittaa, että täysin erilaisia permutaatioita tarvitseekin laskea vain 8! eli 40320 kappaletta.
Yllä olevassa permutaatiossa Vihreät voivat olla missä tahansa viidestä eri slotista. Oma numeroni voisi siis olla yhtä suurella todennäköisyydellä 131, 294, 402, 502 tai 626. Kun käydään läpi kaikki 40320 permutaatiota, saadaan laskettua todennäköisimmät ehdokasnumeroni.
Joku ehkä osaisi laskea todennäköisyydet suljetussa muodossakin, itse päädyin simuloimaan. Koodi ei ole kaunista, mutta löytyy Githubista. Käytännössä otin 40320 satunnaista permutaatiota listoista ja listasin mitkä olisivat omat viisi mahdollista ehdokasnumeroani sillä permutaatiolla. Näytän tässä vain lopputulokset. Kuten huomataan, muutama ehdokasnumero on aivan erityisen todennäköinen
Todennäköisyydet löytyvät taulukkomuodossa csv-tiedostona: Todennakoisyydet. Kaksikymmentä todennäköisintä ehdokasnumeroa on taulukoitu alle, yhdessä kumulatiivisen prosentin kanssa. Ensimmäinen luku (57) on pienin mahdollinen ehdokasnumeroni mutta sen todennäköisyys on suurin, koska on paljon erilaisia permutaatoita joissa Vihreä ovat ensimmäisenä listalla. Vastaavasti toiseksi todennäköisin luku (626) on suurin mahdollinen, ja samasta syystä todennäköinen. Joka tapauksessa on yli 30% todennäköisyys, että ehdokasnumeroni on jokin näistä kahdestakymmenestä todennäköisimmästä.
NRO p(%) Kumulat(%) 57 8.3 8.3 626 7.2 15.5 526 2.3 17.8 156 2.3 20.1 60 1.1 21.2 622 1.1 22.3 625 1.1 23.4 522 0.8 24.2 160 0.8 25.0 157 0.8 25.8 525 0.8 26.6 64 0.7 27.3 624 0.7 28.0 618 0.6 28.6 426 0.6 29.2 58 0.6 29.8 256 0.6 30.4 127 0.6 31.0 555 0.6 31.6 568 0.6 32.2
Taulukosta huomataan, että myös esimerkiksi numerot 60,64 ja 58 ovat melko todennäköisiä. Ne vastaavat tilannetta, jossa jokin pienpuolue kiilaa edelle.
Jos tarkastellaan ehdokasnumeron kahta viimeistä lukua, huomataan, että tietyt numerot ovat erityisen todennäköisiä.
Tilanne nähdään hieman selkeämmin jos käyrää siloitetaan sopivasti. Käytännössä ylivoimaisesti todennäköisimmät välit ovat noin 22-27 ja 54-64.
Viimeinen numero ei välttämättä ole erityisen mielenkiintoinen. Voidaan kuitenkin todeta että on yli 35% todennäköisyys, että viimeinen numero on on joko 6 tai 7.
On syytä huomata, että nämä laskelmat pätevät vain sillä ehdolla, että miltään listalta ei hylätä ketään ehdokasta. Sitä tapahtuu hyvin harvoin. Yhteenvetona voisin uskaltaa löydä vetoa seuraavasti:
- 1:3 että ehdokasnumeroni viimeinen luku on 6 tai 7
- 1:3 että ehdokasnumeroni viimeiset kaksi lukua ovat välillä 22-27 tai 54-64
- 1:3 että ehdokasnumeroni on jokin yllä olevan taulukon luvuista
- 1:7 että ehdokasnumeroni on 57 tai 626
- 1:13 että ehdokasnumeroni on 57
Mikä oli tämän laskuharjoituksen poliittinen viesti? Todennäköisesti ei mikään. Joskus ihmisen täytyy vain rentoutua.
Olen ehdolla kuntavaaleissa Turussa Vihreiden listalla. Vakavampia poliittisia kirjoituksia löydät täältä. Ehdokastietoni ja mm lahjoituslinkin löydät täältä.