Дилемма заключённого: различия между версиями

[отпатрулированная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
Addbot (обсуждение | вклад)
м Интервики (всего 40) перенесены на Викиданные, d:q41693
Строка 88:
Аксельрод открыл, что если игра повторялась долго среди множества игроков, каждый с разными стратегиями, «жадные» стратегии давали плохие результаты в долгосрочном периоде, тогда как более «[[альтруизм|альтруистические]]» стратегии работали лучше, с точки зрения собственного интереса. Он использовал это, чтобы показать возможный механизм эволюции альтруистического поведения из механизмов, которые изначально чисто [[эгоизм|эгоистические]], через [[естественный отбор]].
 
Лучшей детерминистской стратегией оказалась '''«Око за око»''' ({{lang-en|Tit for Tat}}), которую разработал и выставил на чемпионат [[Рапопорт, Анатолий Борисович|Анатолий Рапопорт]]. Она была простейшей из всех участвовавших программ, состояла всего из 4 строк кода на языке [[Бейсик]]. Стратегия проста: сотрудничать на первой итерации игры, после этого игрок делает то же самое, что делал оппонент на предыдущем шаге. Чуть лучше работает стратегия '''«Око за око с прощением»'''. Когда оппонент предаёт, на следующем шаге игрок иногда, вне зависимости от предыдущего шага, сотрудничает с небольшой вероятностью (1-5 %). Это позволяет случайным образом выйти из цикла взаимного предательства. Она лучше всего работает, когда в игру вводится ''недопонимание'' — когда решение одного игрока сообщается другому с ошибкой.
 
Анализируя стратегии, набравшие лучшие результаты, Аксельрод назвал несколько условий, необходимых, чтобы стратегия получила высокий результат: