Vastapähkinä: Lewis Carrollin sumea kuulatehtävä

Terra Cognita-kirjankustantamo kääntää ja julkaisee klassista tiedekirjallisuutta suomeksi. (Kaupallinen huomautus: En omista firman osakkeita, mutta omistan firman kääntämiä kirjoja, ja toivon että mahdollisimman moni muukin omistaisi).  Kustantamo julkaisee viikoittain klassisia matemaattisia pähkinöitä.

Viime viikon pähkinä jäi kuitenkin vaivaamaan. Kyseessä on Lewis Carrollin Pillow-Problems –ongelmakirjan viides ongelma. Terra Cognita muotoilee sen näin:

Pussissa on yksi marmorikuula, joka voi olla joko musta tai valkoinen. Pussiin lisätään valkoinen marmorikuula, pussia sekoitetaan ja pussista nostetaan sokkona yksi kuula, joka osoittautuu valkoiseksi. Mikä on todennäköisyys, että pussiin jäänyt kuula on valkoinen?

TC:n vastaus löytyy tämän päivän pähkinän yhteydestä. Pitää laskea mahdolliset skenaariot. Merkitään pussissa olevaa kuulaa B:llä ja sisään laitettu valkoista kuulaa A:lla. Kuula B voi olla joko musta (merkitään BB) tai valkoinen (merkitään BW). Kuula A on joka tapauksessa valkoinen, joten se voidaan merkitä BW.

On siis neljä mahdollista skenaariota.

S1. Nostetaan AW, pussiin jää BW

S2. Nostetaan AW, pussiin jää BB

S3. Nostetaan BW, pussiin jää AW

S4. Nostetaan BB, pussiin jää AW.

Koska kuitenkin tiedetään, että ensimmäinen nostettu kuula on valkoinen, S4 ei voi pitää paikkaansa. Jäljelle jää kolme vaihtoehtoa, joista kahdessa (S1 ja S3) pussiin jäänyt kuula on valkoinen. On siis 2/3 todennäköisyys, että pussiin jäänyt kuula on valkoinen.

Mutta.

Uskoakseni vastaus on hieno, mutta väärä. Se on täsmälleen totta vain, jos kaikkien skenaarioiden todennäköisyys on yhtä suuri. Sitä ne eivät välttämättä ole. Tässä lasketaan itse asiassa ehdollisia todennäköisyyksiä.

P(S1) = P(A ensin)* P(B on valkoinen) = 0.5* P(BW)

P(S2)= P(A ensin)* P(B on musta) = 0.5* P(BB) = 0.5* (1-P(BW))

P(S3)= P(B ensin) * P(B on valkoinen) = 0.5* P(BW)

P(S4) = P(B ensin) * P(B on musta), mutta P(S4) tiedetään nollaksi

Tuntematon kuula on siis valkoinen todennäköisyydellä

P(XW)= (P(S1)+ P(S3)) / (P(S1)+P(S2)+P(S3)) = P(BW) / (0.5+0.5*P(BW)) = 2*P(BW) / (1+P(BW)).   [Kaava 1]

Jos B on yhtä suurella todennäköisyydellä musta kuin  valkoinen, P(BW)=0.5 ja P(XW) = 2/3 kuten yllä.

Missä on ongelma?

Tehtävänasettelun mukaan me emme kuitenkaan tiedä mitään B:n todennäköisyyksistä. Voimme ajatella asian vaikka niin, että kirjakauppias on valinnut B:n sokkona suuresta tynnyristä, jossa on vaikkapa tuhat kuulaa. Osa niistä on mustia, osa valkoisia. Kirjakauppias valitsee satunnaisesti, ja laittaa kuulan pussiin. Jos sattuisi käymään niin, että hän valitsikin mustan ja koehenkilö sattuu valitsemaan sen ensin, koe uusitaan ja kirjakauppias valitsee uuden kuulan. Koetta jatketaan kunnes nostettu kuula on valkoinen.

P(BW) riippuu silloin suoraan siitä, montako näistä kuulista on valkoisia. Jos valkoisia on 500, P(BW)=500/1000 = 1/2 ja P(XW)=2/3 kuten yllä.

Jos valkoisia onkin 900, P(BW)=900./1000 ja P(XW)= 95%. Itse asiassa kaikki kuulat voivat olla valkoisia, jolloin P(XW)=100%.

Jos valkoisia on vain yksi, P(BW)=1/1000 ja P(XW)=0.2%. Tällöin saattaa käydä niin, että koe joudutaan uusimaan useaan kertaan — jos uhri sattuu valitsemaan ensin B:n, se on lähes varmasti musta. Toisaalta hänellä on 50% todennäköisyys valita A ensin, joten kovin monta kertaa koetta ei jouduta uusimaan.

Itse asiassa koe toimii, vaikka tynnyrissä ei olisi yhtään valkoista kuulaa. Ennen pitkää koehenkilö valitsee A:n, ja koe päättyy. Tämä “ennen pitkää” voidaan itse asiassa laskea hyvinkin tarkkaan: todennäköisyys, että hän nostaisi B:n n kertaa peräkkäin, on 1-(0.5)^n. Koe päättyy siis 99.9% todennäköisyydellä viimeistään kymmenen noston jälkeen.  Pussiin jäävä kuula on silti aina musta, todennäköisyydellä 100%, armotta.

Tiedämmekö siis yhtään mitään?

Emmepä juuri. Yhden kokeen perusteella emme voi päätellä tynnyrin sisällöstä mitään, ja tynnyrin sisältö taas ratkaisee täysin sen, millä todennäköisyydellä pussiin jäänyt kuula on valkoinen. Kaavan 1 voi kyllä piirtää eri valkoisten kuulien osuuksilla.

PXWJakaumassa on mielenkiintoinen piirre: sen mediaani on tasan 2/3, joka on siis TC:n alkuperäinen ratkaisu. Sen keskiarvo on kuitenkin vain 0.61. Kumpikaan näistä luvuista ei kuitenkaan sinällään kerro meille juuri mitään. Elämme pimeydessä, sumeudessa ja epävarmuudessa.

Pimeyttä pystyisi vähentämään toistamalla koe useita kertoja, ja laskemalla kuinka usein pussista nostettu kuula on musta. Tätä kautta pystytään pikkuhiljaa arvioimaan, kuinka moni tynnyrin kuulista todennäköisesti on musta (jätän yksityiskohdat harjoitustehtäväksi).

Sumeutta ja epävarmuutta tämäkään ei nähdäkseni poista. Parhaassakin tapauksessa saatu todennäköisyys on vain tilastollisesti laskettu arvio. Pähkinälle ei siis ole olemassa tarkkaa ratkaisua.

Muita matemaattistyyppisiä kirjoituksia löytyy täältä: WeirdMath

 

5 thoughts on “Vastapähkinä: Lewis Carrollin sumea kuulatehtävä”

  1. Pussissa on joko punainen tai musta marmorikuula. Pussiin laitetaan valkoinen kuula ja sieltä poimitaan valkoinen kuula. Millä todennäköisyydellä pussissa on punainen kuula?

    1. Mielenkiintoinen variantti. Vastaus on yksinkertaisesti P(XR)=P(BR). Sitäkään ei siis voi määritellä yhdellä kokeella. Mutta jos koe toistetaan, P(BR) voidaan saadaan arvioitua paljon vähemmillä toistoilla kuin alkuperäisessä ongelmassa.

      1. Onkohan tämäntyyppisillä ongelmilla jotain yhteistä nimeä? Siis se, että tehtävän annossa unohdetaan jotain aika oleellista, esimerkiksi Monty Hallin vuohet:

        https://en.wikipedia.org/wiki/Monty_Hall_problem

        Ratkaisu on tietysti pitää ensin valittu ovi, auto on sen takana. Jos ensin valitsee vuohen, shown juontajan tehtävänä on avata ovi ja luovuttaa sinulle vuohi.

        1. Ilmeisesti yleisellä tasolla Carrollin tehtävä voisi olla esimerkki Bertrandin paradoksista. (https://en.wikipedia.org/wiki/Bertrand_paradox_%28probability%29).
          Tehtävää ei voi ratkaista, ellei randomointitapaa määritellä tarkemmin.

          Monty Hall taas on esimerkki Bertrandin laatikkoparadoksista (eri probleema, hankalasti melkein sama nimi).
          (https://en.wikipedia.org/wiki/Bertrand%27s_box_paradox).
          Tehtävä on ratkaistavissa vaikka tarkkaa randomointitapaa ei tunnettaisi.

          Yksi matemaatikko purkaa tätä tehtävää auki tässä ketjussa. Ilmeisesti, jos mitään muuta tietoa ei ole, voisi löytyä syvällisiä perusteluja olettaa että todennäköisin ratkaisu on se joka minimoi entropian, eli tässä tapauksessa P(BW)=0.5. En ole vielä täysin sisäistänyt tuota ajatusta, mutta kyllä siinä järkeä on. Tämä on syvällistä kamaa…

Comments are closed.