Gondolkodási módszerek 2.5 Versengés, vagy kooperáció Stratégiai játékok (csapdák, dilemmák)

Gondolkodási módszerek 2.5 Versengés, vagy kooperáció Stratégiai játékok (csapdák, dilemmák) Mindennapi játékainknak, a társadalmi csapdáknak több altípusa ismert. Ezek egymástól alapvetően különböző stratégiai helyzeteket fejeznek ki. A valós életben természetesen nincsenek ilyen jól körülhatárolt, vegytiszta szituációk, mint például a Fogolydilemma, mégis az alaphelyzetek és azok működési mechanizmusai segítenek a konkrét helyzetek megoldásaiban. A kínálatot sorba véve beszélhetünk kétszemélyes és többszemélyes vagy teljes és nem teljes információs játékokról. A játékelmélet ezen alapeszméket sok definícióval és komoly matematikai számítások segítségével építi fel. Stratégiák Egy játékos tiszta stratégiát játszik, ha valamilyen elv alapján dönti el, hogy milyen lépésekre szánja el magát, és ebből az elvből egy adott helyzetben mindig ugyanaz a lépés következik. Ilyen például a tízparancsolat normáihoz való ragaszkodás: a Ne ölj! erkölcsi felszólítás minden helyzetben egyértelmű követelményeket támaszt. Nem tiszta stratégiát választ például az a kosárlabdás, aki ugyanabban a szituációban az éppen akkori hangulata, megérzése szerint passzolja tovább a labdát. Kevert stratégiás játékmód esetében a játékos minden lépéslehetőséget egy általa előre meghatározott valószínűséggel választ, és e valószínűségek alapján hozza meg a döntését. A döntést a véletlen irányítja. Sem nem tiszta, sem nem kevert stratégia is létezik: aki például horoszkópot készít magának és aszerint dönti el, hogy melyik lépéslehetőséget választja, az sem nem tiszta, se nem kevert stratégiát követ. Azért nem játszik tiszta stratégiát, mert lehet, hogy jövőre ugyanabban a szituációban másként dönt, mint idén. Ugyanakkor stratégiája azért nem kevert, mert akkor a véletlen szeszélyei folytán bármelyik nap dönthetne másként, mint előző nap, miközben vele ez csak szilveszterkor fordulhat elő. Létezik egy optimális kevert stratégia, ahol a játszma résztvevőinek várható nyeresége a legnagyobb. A játékelméletben a kölcsönösen előnyös megoldásokat kooperatív megoldásoknak is nevezik. Minimax stratégia a legkisebb rossz elvének a követése. Ekkor a játékos úgy választja ki a legelőnyösebb stratégiáját, hogy megnézi, mennyi az egyes stratégiáknál a legkisebb nyereség, majd azt választja, ahol ez a minimális érték a legnagyobb. Hasonló elgondolás alapján dönt a másik fél is. Ezzel a stratégiával mindkét játékos a maximális veszteségét minimalizálja. A szemet szemért Tit-for-tat a siker stratégiája: az első lépésben kooperál, a második lépésben azt lépi, amit az ellenfél. Ez a stratégia stabil megoldás jelent a Fogolydilemmában, viszont katasztrofális a Dollárárverésben. Egyensúly Akkor mondjuk, hogy egy stratégiapáros Nash-egyensúlyban van, ha A játékos adott választása mellett B játékos döntése optimális, és B adott döntése esetén A döntése optimális. A döntés után mindenki felteheti magában a kérdést, hogy figyelembe véve a többiek döntését, szert tehettem volna-e nagyobb nyereségre, ha másképp cselekszem. Mindenki nemmel válaszol erre a kérdésre, ha egyensúlyi helyzet alakul ki. Bizonyos játékokban több Nash-egyensúly is létezik, pl. Nemek harca, és vannak olyan egyensúlyi helyzetek, amelyek nyilvánvalóan elfogadhatatlanok. 1

Alapjátszmák A kétszemélyes, egymenetes mindkét játékosnak csupán két lépéslehetősége van játékoknak 78 fajtája létezik. Ezek közül négy tekinthető csapdahelyzetnek. Ebből egyik a Fogolydilemma, aztán a Nemek harca, és a Vezérürü fantázianevű játék. Azoknak a kétszemélyes játszmáknak, ahol a játékosoknak már fejenként három választási lehetőségük van, sokkal több, közel kétmilliárd változata van. Ezek csapdahelyzeteit senki nem térképezte még fel, mivel nagyon valószínű, hogy megegyeznek a négy alapjátékéval. Többmenetes játékok: Gyáva nyúl (csapdahelyzet), Dollárárverés, Két benzinkutas. Többszemélyes játékok: Közlegelők problémája, Egymillió dolláros játék. Aszimmetrikus játékok (ha különböző a játékosok értékrendje): Salamon király dilemmája. Dollárárverés Az 1 dolláros játék során általában a 100 Ft kb. 340 Ft-ért kel el. De nem is a pontos összeg a lényeg, hanem a logika. Először a játékosok maximalizálni próbálják a nyereségüket, és ezért felüllicitálják egymást, majd mivel a másodiknak is fizetnie kell, ezért átbillennek a 100-as határon, és onnantól már a veszteséget próbálják minimalizálni. Természetesen ez nem megy/mehet a végtelenségig. A végén 100 Ft fölött már csak 2 játékos marad versenyben (másnak nem volna ésszerű beszállnia), és ők próbálják minimalizálni a veszteségüket, hiszen már túl sokat fektettek be ahhoz, hogy abbahagyják. Egymillió dolláros játék Ezt a játékot a Scientific American folyóirat hirdette meg az 1980- as évek elején. A játékosoknak két választási lehetősége van (ellentétben az előző játékkal, ahol 10+1 választásuk volt: vagy emelik a tétet 1 10 Ft-tal, vagy nem): vagy jelentkeznek a pályázatra, vagy nem. Az 1 millió dolláros játék végső soron egy több szereplőt magába foglaló, közös erőforrásért versengő helyzet modellje (mint pl. ahogy a nagyvárosi taxisok versengenek az utasokért, mint közös erőforrásért). Ilyen esetben egy-egy játékosnak nyilván bizonyos fokig célszerű mérlegelnie a többi játékost, illetve azt is, hogy ők mit gondolnak róla, és a többiekről. Ha például tudnánk, hogy rajtunk kívül senki sem fog jelentkezni, mert badarságnak tartja (mert úgy gondolják, hogy rajtuk kívül mindenki más jelentkezni fog, és ezért nem jelentkeznek), akkor nekünk nyilván célszerű volna jelentkezni. De mi van akkor, ha más is így gondolkodik? Az ilyen és ehhez hasonló helyzetek modellezésére dolgozta ki Neumann János és Oscar Morgenstern a játékelméletet. Kiindulási pontjuk főleg a közgazdaságtan volt, a vállalati versengés modellezése, és azon belül a helyes versenystratégia meghatározása. Mára azonban már szinte a legtöbb természettudományos területre (fizikába, biológiába, pszichológiába, matematikába, és természetesen a mesterséges intelligenciába is) beszivárgott ez az elgondolás. Fogolydilemma Kétszemélyes, egymenetes haszonjáték. Egy bűntény kapcsán két gyanúsítottat tartóztat le a rendőrség. Nem áll rendelkezésre elegendő bizonyíték a vádemeléshez, ezért elkülönítve előzetes letartóztatásba helyezik őket, és mindkettőjüknek ugyanazt a vádalkut ajánlják. A probléma lényege, hogy mindkét félnek két választási lehetősége van: vall vagy nem, és az eredmény függ a másik fél választásától. Az egyes döntések hasznossága (eredményessége) függ a másik fogoly döntésének hasznosságától. A hasznosság (eredményesség) mértéke megegyezik. Egyszer fordul elő, hogy az egyik fogolynak jobb, és egyszer, hogy a másiknak. 2

Ha az egyik vall, de a másik nem, akkor a vallomást tevő elmehet, míg a másik 10 évet kap. Ha egyik sem vall, akkor 2-2 évet kapnak. Ha mindketten vallanak, akkor 5-5 évet kapnak. Ez nem zéró összegű játék, a két fogoly egymással együttműködve tudja kialakítani a legjobb helyzetet. A nehézség: a játék megoldása, a domináns stratégiák melletti egyensúly az, hogy mindketten valljanak. Bármit is tesz a másik, a fogoly jobban jár, ha vall. Mégis mindketten jobban járnának, ha egyikük sem vallana. Irodalom: Mérő László Többszintes fogolydilemma http://www.matud.iif.hu/2009/09maj/03.htm Nemek harca Alaphelyzet: egy fiatal pár reggel összeveszik az esti programon: focimeccs vagy opera. A felek preferenciái: elsősorban együtt tölteni az estét, másodsorban az általa kedvelt helyen. A játéknak két egyensúlya van tiszta stratégiákkal (mindketten színházba mennek, illetve mindketten focimeccsre mennek). Létezik egy harmadik egyensúly is kevert stratégiákkal. Mindkettőjüknek van egy önző és egy önzetlen lehetősége. A fiú önző lehetősége az, hogy meccsre megy, önzetlen lehetősége, hogy az operába. A lánynál ugyanez a helyzet, csak fordítva. Ha mindketten önzetlenek egymással, akkor a lehető legrosszabb helyzet alakul ki, azaz a lány meccsre, a fiú operába megy (1+1 pont). Ha mindketten önző stratégiát folytatnak, külön-külön mennek el hazulról választott programjukra. De ez még mindig nem a legjobb helyzet egyikük számára sem (2+2 pont). Várhatóan akkor lesz az együttes nyereségük a legnagyobb, ha egyikük önző, míg a másik önzetlen stratégiát folytat. Vezérürü Vezérürü-játék például akkor keletkezik, ha két nagyon illedelmes ember tessékeli egymást előre az ajtóban. Ez a helyzet nagyon hasonlít a Nemek harcára, a különbség az, hogy a kölcsönös kooperáció (önzetlenség) itt nem a legrosszabb eredményre vezet és a kölcsönös versengés még rosszabb. A versengés az a stratégia, hogy ragaszkodunk ahhoz, hogy a másik menjen ki először, a kooperálás pedig az, hogy a másik megvetését vállalva elsőként megyünk ki. A legrosszabb helyzet a kölcsönös versengés, mert akkor egyikük sem jut át az ajtón és éhen halnak. Ennél jobb a kooperáció, mert akkor mindketten egyszerre átpréselik magukat az ajtón. A legnagyobb közös nyereség akkor alakul ki, ha az egyikük kooperál, a másik verseng, mivel akkor mindketten átjutnak az ajtón, csak a versengő játékos plusz nyereségként még meg is vetheti illetlen társát, aki pedig kooperált. 3

Gyáva nyúl (chicken run, csibefutam) A Gyáva nyúl játék az 50-es években Amerikában dívó tinédzserjátékról kapta nevét. A fiúk (lopott) autókkal, nagy sebességgel indultak el egymás felé egy szűk úton. Amelyikük kitért a másik elöl, a többiek gyáva nyúl -nak (angolul: chicken, azaz csirke) titulálták és mélyen megvetették. Itt az egyik számára az a legjobb, ha kitart, és a másik rántja félre a kormányt, azaz ő verseng és ellenfele kooperál. Ennél valamivel rosszabb, ha mindketten kitérnek, mert akkor életben maradnak, és egyikükre sem mondják, hogy gyáva nyúl. A legrosszabb helyzet a frontális ütközés, ennél mégis jobb gyáva nyúlnak lenni, de életben maradni. A játéknak 2 szimmetrikus Nash-egyensúlya van: (Gyáva, Bátor) és (Bátor, Gyáva). Emiatt a játékot vegyes motivációjúnak nevezik. Ez azért is probléma, mert ha a játékosok stratégiaválasztása nem koordinált (ha nem koordináljuk, hogy melyik Nash-egyensúly szerint játsszanak), akkor akár a legrosszabb eset is előállhat. Ekkor mindketten bátrak, és a történetben szereplő két autó összeütközik, és mindkét vezető életét veszti ez a legrosszabb lehetséges kimenetel (a vegyes motiváció eredménye). Ez tulajdonképpen egy sokmenetes játék, mivel mindkét sofőrnek minden pillanatban döntenie kell, hogy kooperál-e vagy tovább száguld. Az utolsó pillanatban mindketten, egymástól függetlenül, a másik döntésének ismerete nélkül hozzák meg saját döntésüket ekkor eldől a játszma. Az utolsó pillanatot megelőző hosszabb-rövidebb időben a játékosok még meggyőzhetik egymást hajthatatlanságukról, bátorságukról. Az ebből az előjátékból levonható következtetés sokat nyom a latba a végső döntésnél, az igazság pillanatában. Ha az egyik játékosnak sikerül meggyőzni a másikat tántoríthatatlanságáról, akkor a másik kénytelen lesz kitérni, hogy életben maradjon és elkerülje a legrosszabbat. Nehéz ezt a játékot racionálisan játszani. Hermann Kahn szerint a technikás játékos eleve hullarészegen száll be az autójába és nagyon látványosan iszik még egy slukkot, sötét szemüveget vesz fel, ezzel is mutatva ellenfelének, hogy nem sokat lát a dologból és eszében sincs feladni. Minél irracionálisabban játssza valaki ezt a játszmát, annál biztosabb, hogy győzni fog. Ebben a menetben az egyetlen esély a kölcsönös kooperációra az, ha mindkét fél teljesen világossá teszi az ellenfele előtt, hogy nem fog kooperálni. A történelem nem egy ilyen gyáva nyúl játszmát ismer. A második világháború előtt Chamberlain nem vállalta a háború kockázatát, és Hitler jó néhány játszmát nyert eleinte. Churcill ismerte fel a helyzet gyáva nyúl jellegét és kényszerítette ki Anglia hadba lépését. 1962-ben, a kubai rakétaválság idején Kennedy ezzel a játékelméleti stratégiával tette nyilvánvalóvá Hruscsov számára, hogy nem hajlandó a kompromisszumra. Sikerült elhitetnie az oroszokkal, hogy nem riad vissza a nukleáris háborútól sem. Végül a szovjetek rántották el a kormányt. A játékelmélet racionális döntésekkel foglalkozó tudományág. Paradox módon mégis éppen ez a diszciplína bizonyította be, hogy bizonyos esetekben éppen az irracionális cselekvés az egyetlen racionális stratégia. A közlegelő problémája A közlegelő tragédiája egy iskolapéldája a hasznosságfüggvények maximalizálásának. A példa tanulsága, hogy egy közösségben, attól függetlenül, hogy mindenki a saját hasznosságfüggvényét maximalizálja, ez még nem jelenti azt, hogy az együttes globális hasznosságfüggvény is maximalizálódik. Mivel a gazdák cselekvései hatással vannak egymásra, így ronthatják a globális hasznosságfüggvényt az egymásra hatás miatt. A közlegelő, mint erőforrás addig működik optimálisan, amíg minden felhasználó betartja a közös megegyezéssel megállapított szabályokat. Azonban ha egy szabályokat betartó szereplő döntési helyzetbe kerül, akkor számára bármely időpontban nyereségesebb a dezertálás, mint a szabályok betartása miközben a szabályokat betartó többi szereplő számára egyénenként csak mérsékelten (esetenként alig érzékelhetően) romlik a helyzet. Végső soron a szereplők azáltal, hogy a közvetlen érdekeiknek megfelelően cselekednek, saját maguknak ártanak. A közlegelő csapdahelyzet legismertebb gyakorlati példája a környezetvédelem, illetve a környezetszennyezés. 4

A közlegelők tragédiája egyfajta sokszereplős fogolydilemmának is tekinthető. A játékban csak akkor van Nashegyensúly, ha mindenki (pontosabban a 10 gazdából bármelyik 8) verseng (két tehenet legeltet). Az egyszereplős fogolydilemmához hasonlóan itt is olyan az egyensúlyi helyzet, hogy minden egyes rosszabbul jár, mint ha a kooperatív stratégiát (az egy tehén legeltetését) választották volna. Salamon király dilemmája (King Solomon s dilemma) Aszimmetrikus 2-szereplős játék, amely stratégiák átnevezésével sem tehető szimmetrikussá. Egy alkalommal két asszony keresi fel a bölcs királyt, hogy vitás ügyükben tegyen igazságot. Egy házban laktak, egyenlő korú gyermekeik voltak. Az egyik gyermeke éjjel meghalt és mindkettő magáénak vallotta az életben maradt gyermeket. Salamon lényegében azt mondta: Ha mindketten ragaszkodtok a gyermekhez, akkor kettéhasítom számotokra. Ha egyiketek lemond róla, úgy a másiknak ítélem. Ha mindketten lemondtok róla, úgy haragomban mindenkit kivégeztetek. (Ószövetség, Királyok I. könyve 3.16-3.28) A valóságban tehát a szereplők egy olyan játékot játszottak, ahol annak ítélik a gyermeket, aki lemond, ha a másik ragaszkodik. Ha mindkét játékos ragaszkodik, akkor nyilván továbbra is kettéhasítják a gyermeket. Továbbá, ha mindkettő lemond, akkor mindenkit kivégeznek (legrosszabb eset). A játékban egyik játékosnak sincs domináns stratégiája, nincs domináns egyensúly, a játék vegyes motivációjú, két aszimmetrikus Nash-egyensúllyal, melyek közül ráadásul az egyik egyensúly az egyik játékosnak jobb, míg a másiknak kevésbé. Ha mindkét játékos a számára nagyobb kifizetést biztosító egyensúly szerint játszana, akkor a (lemond, lemond) kimenetel állna elő, ami a legrosszabb. Tehát, ha a szereplők tudták volna, hogy Salamon valójában milyen módon rendeli hozzá a kimeneteleket az ő stratégia-kombinációikhoz, akkor igen nagy fejtörés után tudták volna csak meghozni döntésüket, és bizony annak eredménye nemigen lett volna megjósolható: a 4 lehetséges kimenetel bármelyike előállhatott volna. Szerencsére azonban Salamon egy megfelelő, ámde hamis modellt ültetett a játékosok fejébe, így azok az igazságosság jegyében cselekedtek. Salamon tehát végső soron egy olyan játékot konstruált a szereplők számára, amelyben mindkét szereplő kénytelen felfedni kilétét (indítékát). Ezek után pedig fogta magát, és egészen más kimeneteleket rendelt a cselekvés-kombinációkhoz, mint amiket előzetesen mondott, azaz nem a ragaszkodónak ítélte a gyermeket, hanem a lemondónak (előre tudva, hogy mik a szereplők preferenciái a kimenetelek fölött, és hogy milyen elv szerint döntenek: egyéni haszon várható értékének maximalizálása). A következő oldalon további érdekességeket olvashatunk a témáról: http://mialmanach.mit.bme.hu/eloadasanyagok/jatek_elmeleti_eloadas_sorozat_1-2 http://www.lottoxt.com/hu/archive/nem_minden_fenylik_ami_arany.html 5