Дилемма заключенного в периодическом повторении

Дилемма заключенного в периодическом повторении

После объяснения все кажется таким банальным.

Доктор Ватсон – Шерлоку Холмсу

Если рассмотренная нами ранее ситуация – «за день до разрыва» прекрасно соответствовала дилемме заключенного, то рассматриваемая ситуация – «за год до разрыва» так же замечательно вписывается в периодически повторяющуюся дилемму заключенного.

Как мы говорили выше, любая стратегия состоит из непрерывного ряда повторяющихся ситуаций. В каждой такой ситуации партнеры вправе выбрать как сотрудничество, так и предательство. Учитывая, что игра ведется взакрытую, то варианты могут быть разные: например, один из партнеров может предать, а другой выбрать сотрудничество, могут оба выбрать сотрудничество или оба предать…

Основное отличие повторяющейся дилеммы от ранее рассмотренного варианта – то, что игроки имеют возможность обучаться и делать последующий шаг исходя из поступка партнера в прошлый раз. У игроков появляется возможность наказать друг друга за прошлое предательство. Понятное дело, что сделать это можно только с помощью соответствующего ответного предательства.

Нужно понимать, что предательством в реальных условиях будет являться любое деструктивное поведение, включающее ложь по отношению к партнеру.

Прежде чем приступить к описанию циклической дилеммы, хочу сказать, что приведенные модели используются вплоть до планирования стратегической обороны, и целые полки в библиотеках отведены описанию этой «простой» игры.

Роберт Аксельрод (профессор математики, доктор философских и политических наук), которого захватила простота парадокса заключенных, провел следующее исследование – он известил академических коллег со всего мира, и те в свою очередь предоставили соответствующие компьютерные программы с моделями стратегии поведения для участия в чемпионате. Каждая из программ соревновалась со всеми остальными плюс со своей копией.

Предоставленные программы отличались как сложностью, так и агрессивностью, завистливостью, способностью к прощению, злопамятностью, начальной враждебностью и т. д.

Целью эксперимента являлось выявление оптимальной стратегии поведения в условии циклического парадокса заключенных.

В результате Аксельрод выяснил, что в условиях, когда игра повторяется многократно, злые стратегии давали худшие результаты, чем стратегии сотрудничества.

Несмотря на то что в соревнованиях участвовали достаточно хитроумные стратегии, победу одержала стратегия, которая была проще всех других. К тому же она на первый взгляд казалась наименее хитрой.

Предоставлена она была известным психологом и специалистом по теории игр из Торонто, профессором Анатолем Рапопортом (Anatol Rapoport). Он назвал ее «Око за око» (Tit for Tat).

Эта стратегия всегда первым ходом выбирала «сотрудничать», а каждым следующим ходом она просто-напросто повторяла ход другого игрока.

Нетрудно понять, что «Око за око» всегда сотрудничает с позитивной стратегией, нацеленной на сотрудничество, и наказывает любую злую стратегию. При этом с первого хода неизвестно, какая стратегия ей попалась, поэтому первый раз она ходит позитивно и дает шанс для соответствующего ответа. Если перед «Око за око» злая стратегия, которая стремится воспользоваться добротой и предать в ответ, то следующим ходом последует ответное предательство. Злое поведение всегда наказывается, а на доброе программа всегда отвечает добром.

Характерно, что стратегия «Око за око», встречая злую стратегию, ведет себя как злая стратегия, а встречая добрую или копию себя самой, ведет себя как добрая стратегия.

Анализируя результаты своего исследования, Аксельрод определил качества, необходимые для оптимальной стратегии:

1.  Добрая Первое условие – стратегия должна быть «доброй», то есть не предавать до тех пор, пока не предаст оппонент. Почти все стратегии-лидеры были добрыми. Эгоистичная стратегия по эгоистическим причинам не будет первой «бить» соперника. Никаких эмоций – просто предавать невыгодно.

2.  Мстительная

При этом успешная стратегия не должна быть «простаком». Для этого она должна всегда мстить.

Пример стратегии «простака» – всегда сотрудничать. Это очень плохой выбор, поскольку «простаки» всегда проигрывают «подлым» стратегиям.

3.  Прощающая Нужно уметь прощать. Отомстив, следует вернуться к сотрудничеству, если оппонент не продолжает предавать. Это предотвращает бесконечное мщение друг другу и максимизирует выигрыш.

4.  Независтливая Обязательное качество – отсутствие зависти, то есть не пытаться набрать больше очков, чем оппонент (что в принципе невозможно для «доброй» стратегии, то есть добрая стратегия никогда не может набрать больше очков, чем оппонент).

Итак, подведем итог: наилучшая стратегия – это стратегия, изначально нацеленная на сотрудничество и не предающая первой. При этом она всегда наказывает предательство предательством, но после этого обязательно прощает, если, конечно, урок подействовал; кроме этого, она ни в коем случае не соревнуется с партнером по игре и не завидует ему.

Теперь попробуем применить то, что мы узнали, к рассматриваемой нами ситуации – «за год до разрыва».

Постараемся определить, какую из стратегий используют те пары, которые в итоге распались. Для этого сравним их поведение с идеальной стратегией.

1. Наилучшая стратегия не предает первая – учитывая, что циклические конфликтные ситуации с чего-то начались, то это правило было нарушено.

2. Хорошая стратегия должна всегда мстить. Учитывая, что партнеры в открытых конфликтных ситуациях с упоением отвечают ударом на удар, то этот пункт (с определенной оговоркой) соблюдается.

3.  Уметь прощать. После мести возвращаться к сотрудничеству. Выполняется частично. Сотрудничество продолжается вплоть до следующего конфликта, а конфликт равносилен предательству.

4.  Не соревноваться с партнером по игре и не завидовать ему. Не выполняется, поскольку самой распространенной темой для бытовых конфликтов является борьба внутри пары за власть, то есть за право единоличного принятия решений.

Итак, стратегия проигрыша может быть описана следующим образом:

1.  Предавать первым.

2.  Всегда мстить.

3.  Не прощать, как можно дольше помнить обиду.

4.  Завидовать партнеру. Спорить с ним. Бороться за власть в паре.

Как видишь, перед нами наполненная агрессией, злая, деструктивная программа. Теперь посмотрим, где она будет выигрывать.

Не надо быть семи пядей во лбу, чтобы понять, что идеальным партнером в этом случае будет программа «простак» (или лох, если хочешь), то есть та, которая будет:

1.  Не предавать ни при каких обстоятельствах.

2.  Никогда не мстить.

3.  Постоянно прощать.

4.  Не будет соревноваться.

Никого не напоминает? «…унижалась, и плакала, и возвращала, и не раз, потому что, когда чувствуешь, что человек отдаляется, будто рычажок какой-то срабатывает – просто на этом будто жизнь кончается… и ничего не можешь, ничего не понимаешь и думаешь: вернуть, только чтоб как прежде, чтоб вот эта тоска отпустила…»

Опыт показывает, что именно существование стратегий «простаков» создает благодатную почву для существования стратегий «предателей». Возникает эффект, когда беспричинное потакание ухудшает моральные качества.

Дело в том, что стратегия стратегией, а мы имеем дело с живым человеком, а в норме обычный человек не хочет лишнего дискомфорта, причем он особенно чувствителен к душевной боли. Как мы знаем, мужчины реагируют на боль особенно остро, и именно поэтому стратегия «Око за око», примененная в ситуации «за год до разрыва», поможет этого разрыва избежать.

Особенно эта стратегия актуальна в случае измен: если Твой партнер наперед и наверняка знает, что за его изменой последует адекватный ответ, поверь на слово: он очень сильно призадумается…

Универсальная стратегия поведения, аналогичная «Оку за око», более тысячи лет известна в Китае, она широко использовалась в принципах философии боевых искусств.

Стратегия правильного ответа:

Отвечать добром на добро – добро (плюс на плюс дает плюс);

Отвечать злом на зло – добро (минус на минус дает плюс);

Отвечать злом на добро – двойное зло (минус на плюс дает минус);

Отвечать добром на зло – двойное зло (плюс на минус дает минус).

Думаю, понятно, что «плюс на минус» не может дать двойной минус – «двойное зло» в данном случае – это преднамеренное усиление, призывающее задуматься того человека, который собирается отвечать добром на зло или злом на добро…

Впрочем, если математического удвоения не происходит, то психологически двойной вред от таких действий объясняется легко:

• «злом на добро»: порождает одно зло, то, которое несправедливо получит человек, и второе зло, то есть чувство вины, которое осознанно или неосознанно поселится в душе источника зла;

• «добром на зло»: как мы уже говорили, это прямое подстрекательство к продолжению злой стратегии, поэтому удвоение будет следующее – «простак» уже получил свою порцию зла, но, отвечая добром, он создает новое зло, которое в ближайшем времени, вне всякого сомнения, получит…

Как видите, многовековая история Китая, которая неразрывно связана с восточной философией, учит нас о том же, что и вполне современная разработка из теории игр – наибольшее зло возникает тогда, когда человек выбирает или стратегию подлости, или стратегию простака.

Как всегда, жизнь отличается от теории – если оглядеться, то можно увидеть достаточное количество подлых стратегий, которые чувствуют себя прекрасно, отвечая злом на добро. О чем это говорит? Только о наличии еще большего количества стратегий простаков…

Кстати, в теории игр программа, иногда ведущая себя как простак, показала достаточно хороший результат. Назвали ее «Око за око с прощением» – она случайным образом может выйти из цикла взаимного предательства. Ее отличие от «Око за око» в том, что в одном из актов возмездия (например, один из двадцати) программа необоснованно прощает предательство.

…меня оставил человек, который был для меня дороже целого мира. Оставил молча. Я умирала без него, но унижаться и просить его вернуться не стала. Не смогла… А когда в августе он объявился, правда, теперь не молча, а с множеством слов… о прощении… о любви… о многом… Я была благодарна своей гордости, потому что не унизилась перед ним тогда…

Алгоритм прописан так: «Око за око с прощением» один ход из двадцати видит с ошибкой, то есть оппонент ходит «предать», а программа видит его как «сотрудничать» и соответственно отвечает «сотрудничеством».

О чем это говорит? О том, что можно простить один раз из двадцати, но это совсем не значит, что нужно прощать все двадцать раз.

При этом полезно помнить, что предательство в жизни отличается от его аналога в компьютерной программе. Терпеть двадцать предательств – на мой взгляд, это чересчур, и одного раза вполне достаточно…

Тем не менее опыт показывает, что многие женщины предпочитают вести себя именно так, как программа «Око за око с прощением», но в своем варианте – они видят ходы своего партнера с ошибкой, то есть предпочитают не замечать его подлой стратегии поведения. Понятное дело, такое положение вещей вполне устраивает партнера и позволяет ему вести себя так и дальше. Нетрудно понять, что ответная стратегия – это опять-таки стратегия «простак», а она обречена на постоянный проигрыш.

Итак, пора подвести некие промежуточные итоги. Из всего сказанного нам понятно, что существуют «чистые» стратегии, которые в реальной жизни встречаются нечасто. Однако, зная их, довольно просто понять, в какую сторону развиваются Ваши отношения. Несмотря на то что чистые стратегии встречаются редко, их смешанные аналоги вполне жизнеспособны – поэтому, отбросив лишнее, всегда можно определить, к какой стратегии поведения Ты и Твой партнер склоняетесь больше.

Данный текст является ознакомительным фрагментом.