Paholaisen Asianajaja: Ohjelma oppi bluffaamaan

16.6.07

Ohjelma oppi bluffaamaan

Tietokoneohjelmia on tehty myös pokerin pelaamiseen. Nämä "botit" ovat aiheuttaneet salaliittoteorioita online pokeripelaajien keskuudessa. Ne pelaajat jotka häviävät usein valittavat, että he häviävät pokerisivustoilla saalistaville pokeriboteille. Tosin bottien parissa toimiva Clement Sire sanoo, että kun ottaa huomioon bottien nykyisen tason, niin häviäjien pitäisi hävetä. Tämä johtuu siitä, että pokeribotit eivät osaa bluffata vakuuttavasti. "Tietokoneet on ohjelmoitu tuottamaan paras strategia, mutta bluffaus perustuu odottamattomiin, epäloogisiin toimintoihin," sanoo Evan Hurwitz, Witwatersrandin yliopistosta.
Tähän on tulossa muutos.

Samaisessa Witwatersrandin yliopistossa on kehitetty virtuaalipelaaja, joka on opettanut itselleen bluffaamisen jalon taidon lerpa nimisessä korttipelissä. Tämä tekoälybotti, nimeltään Aiden, perustuu neuroverkkoalgoritmiin jolla tavallisesti ennustetaan osakemarkkinoiden vaihteluja. Siihen ei ohjelmoitu lerpan pelisääntöjä. Tutkijat antoivat Aidenin pelata kolmea "tyhmää" virtuaalipelaajaa vastaan, jotka tekivät valintansa täysin sattumanvaraisesti. Aidenille jaettiin kortit, ja kerrottiin mitkä niistä voisi pelata sääntöjen mukaan jokaisella kädellä. Aluksi Aiden oli liian viisas. Se jätti ensimmäiset 40 kättä pelaamatta ja sitten kokeili yhtä kättä, häviten. Tämä oli niin suuri takaisku, että Aiden ei suostunut pelaamaan uudelleen.

Hurwitz vaihtoi taktiikkaa, pakottaen Aidenin pelaamaan ensimmäiset 200 kättä. Nyt Aiden alkoi päätellä pelin sääntöjä. Se otti oppimisparametreiksi omat korttinsa, vastustajan tekemiset ja voitto-häviö-historiansa. Tässä vaiheessa se ei vielä osannut bluffata.
Sitten tutkijat laittoivat Aidenin pelaamaan kolmea samalla tavalla koulutettua bottia vastaan. "Niille alkoi kehittyä omat persoonallisuudet - joko aggressiivinen tai säästäväinen - riippuen edellisistä onnistumisista," Hurwitz sanoo. Eräs aggressiivinen botti sai putkeen monta huonoa kättä ja luopui useasti. Tämä botti, Randy, vaihtoi yllättäen taktiikkaa ja alkoi pelaamaan vaikka sillä oli huonoja kortteja kädessä - se alkoi bluffaamaan. Aiden, varovaisempi pelaaja, vastasi luovuttamalla vaikka sillä oli suhteellisen vahva käsi.

"Tämä osoittaa, että tietokoneet voivat oppia tämän ihmisille luonteenomaisen käyttäytymisen," Philippe de Wilde Edinburghin yliopistosta sanoo. "Ne generoivat strategiansa pelistä, joka on erittäin ihmismäinen tapa oppia."

New Scientist, 2 june, 2007

16.6.07

Ohjelma oppi bluffaamaan

No comments:

Labels

Wanhat viestit