V prvním dílu jsem nastínil princip tzv. her s nenulovým součtem. Jsou to takové hry, kde výhra jednoho neznamená nutně prohru druhého a vice versa. Slíbil jsem také popsat některé algoritmy pro řešení takovýchto úloh a právě těmi začnu.
Pro nalezení nejvhodnějšího algoritmu byly podmínky hry poněkud upraveny (na tzv. iterované dilema vězně):
Hráči byli simulováni počítačovými algoritmy. Každý se rozhodl zda SPOLUPRACOVAT nebo PODRAZIT. Pokud oba účastníci spolupracovali, dostali 7 bodů. Pokud oba podrazili, dostali po dvou bodech. Pokud jeden podrazil a druhý spolupracoval, „podrazák” získal 10 bodů a „slušňák” nic. Hrálo více účastníků předem neznámý počet kol a v každém kole sehrál každý s každým jednu partii. O výsledku rozhodoval konečný součet bodů. Hra tím dostala novou dimenzi — účastníci (zde počítačové algoritmy) si mohli pamatovat, jak se kdy kdo vůči nim zachoval a podle toho upravit své chování. A kdo zvítězil?
Algoritmy „křesťanské”, tj. vždy spolupracující, byly téměř okamžitě zničeny, pokud se mezi nimi ocitl jediný „podrazák”. Na druhou stranu nezvítězily ani algoritmy, které podrážely jak mohly. Nejúspěšnějším algoritmem se stal algoritmus
TFT filozofa A. Rappaporta, popsaný jednoduše:
Začni spoluprací a pak vždy zopakuj předchozí krok partnera. Tedy pokud partner spolupracuje, spolupracuj, pokud podrazil, podraž ho taky — jak ty mně, tak já tobě (už to začíná připomínat lidské chování, že?). Ukázalo se, že v prostředí s převahou algoritmů TFT nemají „podrazáci” šanci se prosadit, jsou izolovány a „hynou”. Tato strategie je úspěšná ale pouze tehdy, hraje-li se hra na více kol. Pokud předem víme, že hra bude mít jen jedno kolo a hráči se již nikdy nesetkají, je vždy výhodnější podrazit (o fungování tohoto pravidla se přesvědčují lidé v oblastech lásky i obchodních vztahů). Ale ruku na srdce — kdy opravdu na sto procent víme, že se už nikdy nepotkáme?
Strategie TFT svádí k domněnce, že je „evolučně stabilní” a vhodná k přežití, ale stejně stabilní je i vytrvalé podrazáctví. Navíc algoritmus TFT v prostředí plném podrazů brzy osamocen zahyne.
Problém je, pokud do hry zavedeme náhodný prvek „nedorozumění”, tedy že spolupráce může být chybně pochopena jako podraz. Pak se algoritmy TFT můžou dostat do série vzájemných podrazů, ze kterých již nevybřednou. Proto byl tento algoritmus různě modifikován, např.
TFTT — „Odpověz podrazem až na dva po sobě jdoucí podrazy protivníka” nebo na algoritmus, který občas „odpustil” a místo podrazu spolupracoval. Ale jako nejvýhodnější se v tomto případě ukázal jiný algoritmus, nazvaný Pavlov, který říká:
Neměň postup, jestliže tvůj protihráč spolupracuje, anebo jestliže se ti podaří podraz. Změň postup, jakmile ses stal obětí podrazu, anebo podrážíte-li oba.
Tyto teorie se nechají aplikovat i na společenské vědy a dozvíme se z nich mnoho o motivech chování, o tom proč jsou jedinci (či spíše jejich ega) schopny altruismu atd. Na druhou stranu — v těchto fiktivních situacích se jedná o společnosti, v nichž všichni mohou zcela svobodně sledovat ty nejprotichůdnější zájmy, omezováni pouze doporučeními absolutně nestranných pravidel. Teorie her ovšem „nereálnost svého světa” nijak nezastírá.
O teorii her a jejich aplikaci na lidské chování by se nechalo psát ještě dlouho, ovšem blog není nejvhodnější médium. Zájemce odkazuji např. na knihu
Keller, J.: Dvanáct omylů sociologie, Slon, Praha 1995, kap. Člověk pod rentgenem teorie her, na díla Nashe (ano, toho z filmu
čistá duše), Hofstadtera, Axelroda, na prameny o dilematu vězně, skvělý článek
sociobiologický exkurs — srovnávací etika a zdůvodnění etiky v sociobiologické a evoluční perspektivě a pro hračičky nabízím odkaz na
hry o spolupráci.