Sovellan matematiikkaa alueeseen johon se ei varsinaisesti kuulu, eli liikennepakoihin.
Tervakoskella näyttäisi autoilevan sekopää, joka yrittää ajaa lasten yli suojatiellä (asiasta mm YLE 23.5). Vastaavia havaintoja on nyt alkanut tulla ympäri Suomea (Aamulehti 29.5.). Vesa Linja-aho esittää blogissaan aika hyvän hypoteesin.
- “Joko:
- liikkeellä on mielipuoli, joka kiertelee ympäri Suomea aina erilaisella autolla vaanimassa lapsia suojateillä
- Tervakoskella on tällainen mielipuoli, joka on saanut muutaman jäljittelijän
- Tai sitten oma teoriani (joka ei mitenkään poissulje sitä, etteivätkö yllä olevat voisi olla tosia): Tumpeloiden törmäileminen lapsiin suojatiellä on todella yleistä, mutta asia on nyt vasta noussut pinnalle.”
Tätä hypoteesia yritän nyt testata tarkemmin. Allaoleva lista on kerätty eri uutisvälineistä.
- La 12.5. Hämeenlinna, Turuntien silta (YLE)
- Ma 14.5. Tervakoski, Tervajoentie/Vähikkäläntie (YLE)
- Ma 21.5. Tervakoski, Tervajoentie/Vähikkäläntie (Helsingin Sanomat)
- Ti 22.5. Tervakoski, Tervajoentie/Vähikkäläntie (YLE)
- To 24.5. Karkkila (Helsingin Sanomat, Aamulehti)
- Pe 25.5. Alavus (YLE)
- Ma 28.5. Vantaa, Ylästö (Aamulehti)
Esitän hölmön tuntuisen kysymyksen: mikä on todennäköisyys, että tämä sarja olisi voinut sattua täysin sattumanvaraisesti?
Vastaaminen vaatii periaatteessa vain muutamaa lukua:
- M: kuinka monta suojatietä Suomessa on.
- T: kuinka monta kertaa päivässä Suomessa tapahtuu tällainen liikennepako.
- N: Kauanko tilannetta seurataan (esim vuoden seuranta-aika on N=365)
- n: Kuinka monta päivää pakojen välillä voi olla (esim viikko on n=7).
Muuttuja p=T/M kertoo todennäköisyyden että tietyssä risteyksessä tapahtuu tiettynä päivänä liikennepako. Otetaan tarkasteluajaksi kymmenen vuotta. Pyöristetään tarkasteluaika N 4,000 päiväksi ja “viikko” n kymmeneksi päiväksi. Pyöristämisillä muistutan tiukasti, että kyseessa todellakin on karkea arvio. Kahden desimaalin tarkkuudella olevat luvut ovat tyypillisesti hämäystä.
Lasku ei ole aivan triviaali. Oletetaan, että tietyssä risteyksessä on tapahtunut liikennepako. Todennäköisyys, että samassa risteyksessä tapahtuu uusi riippumaton pako on Poisson-jakautunut. Poisson-jakautunut todennäköisyys toiselle onnettomuudelle 10 päivän sisällä on J=10*p*exp(-10p). Todennäköisyys kolmannelle paolle heti tämän perään on J².
Tämä kertoo todennäköisyyden yhdelle risteykselle. Risteyksiä on kuitenkin todella paljon.
Todennäköisyys, että jossakin päin Suomea tapahtuu tuplaliikennepako, on
1-(1-J)^N, missä J=(10*T/M)*exp(-10*T/M) [Kaava 1]
Triplapakoa laskiessa J korvataan sen neliöllä.
Nyt tullaan kohtaan, jossa matematiikka loppuu ja maalaisjärki alkaa: kuinka monta suojatietä Suomessa on? Tarkemmin: kuinka monta tähän kysymykseen relevanttia risteystä Suomessa on? Relevantteja ovat risteykset, joista kulkee suuri määrä koululaisia.
Koululaisten tiheyskeskittymiä ovat etupäässä koulut. Tilastokeskuksen mukaan peruskouluja on Suomessa lähes kolme tuhatta. Käytännössä jokaista rakennusta voi lähestyä useamman suojatien kautta. Lähikoulussani selkeästi riskialttiita risteyksiä on seitsemän kappaletta. Tämä on melko uskottavan tuntuinen keskiarvo. Koulujen lähellä olisi siis kaikkiaan noin 20,000 riskiristeystä.
Vastaavia vaaranpaikkoja voivat olla esimerkiksi uimahallit ja urheilukentät. Hyvin karkeana arviona näitä olisi samaa luokkaa kuin kouluja. Riskiristeyksiä olisi siis Suomessa ehkä M=40,000.
Entä T, eli koko Suomessa tapahtuvien törttöilyjen määrä päivässä.? Taulukossa alla on laskettu todennäköisyyksiä eri T:n arvoille. Sarake P(pair) kertoo todennäköisyyden, että jossakin sattuu kaksi pakoa viikon sisällä. Jos T=1 (pakoja tapahtuu joka päivä), on yli 50% todennäköisyys että ennen pitkää jossakin risteyksessä tapahtuu kaksi peräkkäistä liikennepakoa jotka eivät liity toisiinsa.
T |
M |
n |
N |
P(pair) |
0.1 |
40000 |
10 |
4000 |
0.10 |
0.25 |
40000 |
10 |
4000 |
0.22 |
0.5 |
40000 |
10 |
4000 |
0.39 |
0.75 |
40000 |
10 |
4000 |
0.53 |
1 |
40000 |
10 |
4000 |
0.63 |
1.5 |
40000 |
10 |
4000 |
0.78 |
2 |
40000 |
10 |
4000 |
0.86 |
Triplapaon todennäköisyyttä en ole tähän edes merkinnyt; se on promillen kymmenyksiä. Käytännössä kolme peräkkäistä liikennepakoa ei siis voi enää olla sattumaa.
Karua kyllä, liikennepakojen määrä saattaa olla lähellä arvoa T=1. Listalla on kolme pakoa viidessä päivässä, ja vieläpä kaiken Tervakosken aiheuttaman kohun jälkeen. Todellakin: “Tumpeloiden törmäileminen lapsiin suojatiellä on todella yleistä, mutta asia on nyt vasta noussut pinnalle.“
Uusi asia laskuissa on se, että näillä oletuksilla kaksi liikennepakoa viikon välein samassa risteyksessä olisi täysin “luonnollinen” tapahtuma, josta ei voisi päätellä mitään erityistä. Jossain päin Suomea sellainen tapaus tapahtuu jossain vaiheessa.
Onko laskuissa pohjaa? Lähinnä risteysten määrässä on käsienheiluttelua, mutta vaikka todellinen määrä olisi puolitoistakertainen, se ei muuttaisi lopputulosta olennaisesti. (Jos määrä on pienempi kuin 40,000 niin johtopäätökset vahvistuvat).
Onko laskulla merkitystä? Kyllä: on hyvä muistaa, että silloin kun muuttujia on paljon, epäilyttävän näköiset asiat saattavat joskus olla puhdasta sattumaa. Olisi syytä arvioida todennäköisyyksiä edes karkeasti, ennen kuin tekee johtopäätöksiä. Tervakosken kolme yliajoa eivät varmasti ole sattumaa; sen sijaan kaksi yliajoa olisi tilastollisesti saattanut ollakin.
[Edit 1.6.2012: http://www.hs.fi/kotimaa/Poliisi+Liikennekulttuuri+suojateill%C3%A4+kehnoa/a1305572300983. Loukkaantumisia suojateillä tapahtuu käytännössä joka päivä, ja kuolemaan johtavia melkein yksi kuukaudessa. Siisi hyvinkin T=1. Ja kun nämä ovat vain poliisille menneet luvut, niin todellinen T voi olla paljonkin suurempi. Joka tapauksessa kaksi peräkkäistä loukkaantumista samalla suojatiellä on vahvasti todennäköistä, eikä kahdesta voi vetää vielä mitään johtopäätöksiä].
Like this:
Like Loading...