(toiminnot)

hwechtla-tl: Nettipäiväkirja 30.11.2013

Kierre.png

Mikä on WikiWiki?
nettipäiväkirja
koko wiki (etsi)
viime muutokset


Olen viime aikoina miettinyt paljon peliteoriaa, koska olen valmistellut peliteoria-aiheista tapaamista. Pelasin morsiameni kanssa kokeeksi seuraavaa peliä. Peli on normaalimuotoinen, eli pelaajat tekevät valintansa (A, B tai C) "yhtaikaa" eli tietämättä toistensa valintaa. Taulukko kertoo, kuinka paljon "pisteitä" kumpikin pelaaja saa. Pelissä ei ole tarkoitus saada enemmän pisteitä kuin kanssapelaaja, vaan mahdollisimman paljon pisteitä. Peli sisältää sekä yhteistyömahdollisuuksia (molempien pisteitä hyvin kartuttavia lopputuloksia) että hyökkäysmahdollisuuksia (lopputuloksia, joista tulee toiselle paljon ja toiselle vähän).

Panu    A               B               C
Henna
A       H+=2, P+=3      H+=9, P+=2      H+=7, P+=1
B       H+=1, P+=5      H+=7, P+=6      H+=8, P+=1
C       H+=0, P+=8      H+=4, P+=9      H+=6, P+=10

Yleisesti tarkasteltuna pelissä on 5 lopputulosta, jotka ovat parempia Panulle kuin Hennalle ja 4, jotka ovat parempia Hennalle kuin Panulle. A-valinnalla Panu voi varmistaa itselleen enemmän pisteitä kuin Henna. C-valinta ei kannata Hennalle koskaan eli on vahvasti dominoitu strategia. Jos molemmat pelaavat täysin satunnaisesti, Panun pisteiden odotusarvo on (3+2+1+5+6+1+8+9+10)/9 eli 5, ja Hennan pisteiden odotusarvo on (2+9+7+1+7+8+0+4+6)/9 eli 4,89.

Pelasimme kolme peräkkäistä kierrosta. Seuraavassa tulos:

Kierros Hennan valinta  Panun valinta   Hennan pisteet  Panun pisteet
1       B               B               7               6
2       A               B               9               2
3       B               B               7               6
                                        --              --
yhteensä                                23              14

Miksi tulos on näin paljon odotettua parempi Hennalle? Miksi tulos on kaiken kaikkiaan parempi, kuin voisi odottaa?

Tarkastellaanpa, mikä on pelin "optimistrategia". Kuten jo mainittiin, Hennan ei koskaan kannata valita vaihtoehtoa C. Jos Panu ottaa tämän huomioon, hänenkään ei koskaan kannata valita vaihtoehtoa C, koska se tuottaa huonosti Hennan vaihtoehdoilla A ja B, ja hyvin vain Hennan vaihtoehdolla C, jota Henna ei koskaan valitse. Panun kannattaa valita C vain, jos oletetaan, ettei Henna huomaa tai välitä, ettei hänen koskaan kannata valita C:tä.

Mutta asia ei lopu tähän. Jos Henna osaa järkeillä, ettei Panun koskaan kannata valita C:tä, niin Hennan ei koskaan kannata valita B:tä: riippumatta siitä, valitseeko Panu A:n vai B:n, Hennan tulos on parempi A:lla. Ja jos taas Henna joka tapauksessa valitsee A:n, niin ainoa, jolla Panu voi saada paremman tuloksen, on valita A. Toden totta, ainoa Nashin tasapainotila eli tilanne, jossa kumpikaan pelaaja ei voi valintaansa muuttamalla parantaa tulostaan, on se, jossa molemmat valitsevat A:n. Jos siis pelaajat olettavat toistensa olevan älykkäitä ja osaavan päätellä toistensa toimet, kolmen kierroksen pelin tulos on (A, A), (A, A), (A, A) eli Hennalle 6 pistettä ja Panulle 9 pistettä.

Tämä on esimerkki pelistä, jossa pelaajat pystyvät parantamaan pistemääräänsä sillä, etteivät oleta vastustajansa olevan liian fiksu. Mielenkiintoista kyllä, pelaajat pystyvät parantamaan näin sekä omaa että toisen pistemäärää: vaikka Henna hyötyy enemmän Panun B-valinnoista kuin Panu, silti Panun loppusaldo 14 pistettä on parempi kuin jos Henna pelaisi koko ajan A-valintaa ja paljon parempi kuin jos molemmat pelaisivat koko ajan A-valintaa. Ehkä Panu tietää tämän ja pelaa B-valintaa kädenojennuksena Hennalle, vaikka altistuu samalla hyväksikäytölle, jos Henna pelaa A:n. Tai ehkä Panu luottaa siihen, että Henna ei tajua, mitä siitä seuraa, ettei Panulle ole koskaan kannattavaa valita C:tä. Tai ehkä Henna luottaa siihen, ettei Panu ole ahne ja valitse yhden pisteen takia A:ta?

Tosimaailmassa ihmisten päättely perustuu fiilikseen siitä, miten muut saattaisivat pelata. Lisäksi ihmiset voivat puhua ja uhkailla toisiaan erilaisilla valinnoilla, ja ennen kaikkea erilaisilla tulevilla valinnoilla sen perusteella, miten pelaajat pelaavat tällä kierroksella. Hennan ja Panun spontaani yhteistyö ei ollut edes paras mahdollinen lopputulos: sopimalla yhteistyöstä A-valinnan uhalla pelaajat voisivat saada aikaan esim. pelin (B, B), (C, C), (B, B) jonka tulokset H=20, P=22 ovat paljon paremmat Panulle pienin kustannuksin Hennalle.


kommentoi (viimeksi muutettu 30.11.2013 14:03)