maanantai 5. huhtikuuta 2010

Bluffaaminen pokerissa

Bluffaaminen on olennainen osa pokeria, mutta se on tietenkin käytännössä paljon arkipäiväisempi konsepti kuin monien mielikuvissa. Elämää suuremmat bluffit, joissa pöytään laitetaan koko omaisuus ovat draaman kannalta herkullisia, mutta käytännön pelissä erittäin harvinaisia ja oikeastaan aika harhaanjohtava idea.

Ensinnäkin, oli pelin panostustyyppi mikä tahansa, (no-limit, pot-limit tai fixed limit), voittava pelaaja pelaa panostustasolla, joka ei ole liian iso pelikassalle. Bluffin tekeminen tai maksaminen ei saa olla koskaan kiinni siitä, että kyseessä on rahallisesti iso summa. Bluffi ei saa myöskään riskeerata liian suurta osaa pelikassasta.

Pelipöydässä dollarit ovat aina tässä mielessä vain pelimerkkejä. Kun isoimmissa peleissä lyödään viimeisellä kortilla 500000 euron bluffi, vastustaja ei voi miettiä, että mitä kaikkea tuolla rahalla saisi jos häviääkin rahan.  Pelaajan pitäisi vain miettiä, että mikä on eri vaihtoehtojen odotusarvo ja valita niistä paras. Samalla tavalla pennien panostuksilla pelaavien ei pidä miettiä päätöstä tehdessään, että "se on vain muutama sentti vaikka olisin väärässä". (Näin toki useat pelaajat pikkuisilla panostasoilla ajattelevat ja hyvät pelaajat osaavat käyttää sitä hyväkseen.)

Mutta ehkä vielä isompi harhakuva liittyy itse bluffaamiseen ja vastustajan tehtävään selvittää onko kyseessä nimenomaan bluffi. Ajatellaan, että pitää pystyä päättelemään lyönnin tehneen pelaajan ilmeestä ja kehonkielestä, että onko kyseessä bluffi vai ei. Tällaisellakin tiedolla on etenkin livepelaamisessa oma merkityksensä, mutta bluffaamisen ja bluffien kiinniottamisen kannalta on olennaisempaa millaisia käsiä vastustajalla voi tällaisessa tilanteessa olla ja että onko bluffin todennäköisyys suurempi kuin potin ja panostusten tarjoamat kertoimet. Vastustajan elekielen tunnistaminen on vain pieni lisäinformaatio varsinaiseen päättelyketjuun ja ylipäätään käytettävissä vain livepelitilanteissa. Nettipokerissa tällainen lisäinformaatio on miltei olematonta ja hyvin epäluotettavaa.

Jotta ymmärtäisimme paremmin mistä bluffaamisessa on kyse, ajatellaan yksinkertaista peliä, jossa pelaaja A sököttää pakotetusti ja pelaajalla B on tasan yksi "betsi" käytettävissään. Potin koko on esimerkiksi neljä euroa ja pelaajalla B on mahdollisuus panostaa yksi euro. Pelaajalla B on kädessään käsi joka joko voittaa (l. "nutsit") tai häviää varmasti (l. bluffi) potin. Pelaaja B:llä on nutsit tai bluffi yhtä suurella todennäköisyydellä. Pelaajalla A on käsi, joka voittaa pelaajan B bluffin ja häviää pelaajan B nutseille. Pelaaja A ei voi pelaajan B lyönnin jälkeen kuin maksaa tai kipata kätensä.

Pelaajan A sökötettyä pakotetusti pelaaja B voi joko sököttää perässä tai lyödä. Pelaaja B lyö tietysti kaikki nuts-kätensä, koska sillä voittaa aina potin ja jos pelaaja A sattuu maksamaan, niin pelaaja B voittaa neljän euron sijaan viisi euroa. Kysymys kuuluu, että mitä pelaaja B:n pitää tehdä bluffikädellänsä. Ensimmäinen vaihtoehto on, että pelaaja B lyö aina bluffikädellä. Vaihtoehto on siinä mielessä houkutteleva, että jos pelaaja A kippaa kätensä, niin pelaaja B voittaa euron panostuksella neljä euroa. Jos pelaaja A sattuisi tietämään, että pelaaja B bluffaa aina, niin hänen vastauksensa olisi tietysti maksaa aina. Puolet kerroista pelaaja A häviää yhden euron maksunsa, mutta puolilla kerroista pelaaja A voittaisi viiden euron potin. Jos pelaaja B vastaavasti tietäisi pelaaja A:n maksavan aina, niin hänen vastastrategiansa olisi tietysti olla bluffaamatta ollenkaan.

Voidaan siis ajatella, että kyseessä on jonkin sortin kissa-hiiri -leikki, jossa molemmat yrittävät arvuutella toistensa strategioita ja molemmat yrittävät pysyä yhden askeleen edellä. Tilannetta voidaan tarkastella myös siten, että keksitään pelaajille strategia, jossa vastustaja ei voi muuttaa strategiaansa siten, että sen odotusarvo kasvaisi. Voimme siis etsiä tilanteelle tasapainoisen strategian. Pelaaja B voi ruveta pelaamaan strategialla, jossa nuts- ja bluffikäden todennäköisyys on sopivassa tasapainossa. Bluffausfrekvenssi saadaan suhdeluvusta alpha, joka on 1 / (p + 1) missä p on potin koko. Jos bluffikäsien osuus nutsikäsistä (ts. bluffikäden todennäköisyys suhteessa nutsikäsiin) on tarkalleen alpha, niin vastustajan minkä tahansa strategian odotusarvo on parhaimmillaan tasan nolla. Vastaavasti pelaaja A voi ruveta kippaamaan bluffinkoppaajakäsiään (se ainoa käsi) vastaavalla alpha-frekvenssillä, jolloin pelaaja B:n strategian odotusarvo on maksimissaan nolla. (Tarkkaan ottaen pelaaja A maksaa todennäköisyydellä joka on (1 - alpha).)

(Tämän pelin tasapainoisen strategian laskivat kai ensimmäisenä John von Neumann ja Oskar Morgenstern. Voin olla väärässäkin.)

Tästä nähdään, että bluffien eräs tarkoitus on suojella arvolyöntejä (l. lyöntejä, jotka tienaavat rahaa, kun vastustaja maksaa lyönnin). Strategia, jossa ei ole bluffeja ollenkaan, häviää odotusarvossa, jos vastustaja osaa käyttää sitä hyväkseen. Bluffaaminen on siis välttämätön osa tasapainoista strategiaa. Bluffatessa ei siis välttämättä ajatella pelkästään sitä yksittäistä tilannetta vaan se on osa suurempaa strategiaa. Mikä tärkeämpää, vastustajalla ei ole mitään keinoa puolustautua bluffaamista vastaan. Jos bluffaaminen tapahtuu sopivalla todennäköisyydellä, niin vastustajan strategian odotusarvo voi olla parhaimillaankin vain nolla.

Toisin sanoen jos minulla on oikeassa pokerissa joku tapa varmistaa, että bluffaan edes lähelle oikealla frekvenssillä, niin en tarvitse bluffaamiseen mitään erityistä rohkeutta. Bluffikädellä lyöminen on silloin minulle yhtä luonnollista kuin lyöminen kädellä, joka ei voi hävitä. Sanotaan, että minulla on texas hold'em -kädessä paras mahdollinen käsi, vaikkapa ässäkorkea väri, viimeinen kortti on jaettu ja olen viimeisenä vuorossa. Tässä tilanteessa tietenkin panostan, koska joku voi maksaa huonommalla kädellä. Vastaavasti jos minulla on huonoin mahdollinen käsi, joka ei mitenkään voisi voittaa, niin panostaminen yhtä luonnollista kuin ässäkorkealla värillä. Voi tietysti odotusarvon kannalta joskus olla parempi vaihtoehto lyömättä sillä huonoimmalla mahdollisella kädellä. Mutta kuten yllä olevasta nähdään, vastustaja ei mitenkään käyttää hyväkseen tällaista bluffaamista.

Harva pelaaja ajattelee eksplisiittisesti tällä tavalla, mutta käytännössä samantyyppiseen ajatteluun perustuu suurin osa voittavasta pokerinpelaamisesta [1]. Hyvä pelaaja tunnistaa tilanteet ja pelaajat, jotka syystä tai toisesta bluffaavat (tai valuebetsaavat) liian vähän tai liian paljon. Mikä on liian paljon tai liian vähän palautuu lopulta peliteoriaan, mutta käytännössä hyvät pelaajat kehittävät itselleen intuitiivisen tuntuman missä tämä raja menee. Lisäksi pokeriyhteisö kokonaisuutena, erityisesti näin Internet-aikana, vie perusstrategiaa lähemmäksi peliteoreettisesti tasapainoista strategiaa. Esim. Texas Hold'emin tasapainoista strategiaa ei voida koneellisesti laskea, koska pelipuu on aivan liian suuri.

Lisää tästä kaikesta on Bill Chenin ja Jerrod Ankenmanin kirjassa Mathematics of Poker.

[1] Toinen voittava pelaaminen on sitten vastustajan "levelöimistä", jossa siis mennään kissa-hiiri-leikkiin, mutta onnistutaan olemaan vastustajaa aina askel edellä. Tällainen onnistuu tietysti vain tietynlaisia pelaajia vastaan.

Ei kommentteja: