Обсуждение:Дилемма заключённого

Последнее сообщение: 3 месяца назад от 217.107.106.12 в теме «Критика»

Терминология?

править

"Рациональный агент" - это устоявшийся термин? Если нет, то лучше выразиться по-другому. Например, "рациональный игрок". (Здесь обыгрывается такое значение английского слова "agent", как "объект воздействия.) 85.141.230.42 09:51, 15 апреля 2009 (UTC)Ответить

Вообще-то, это устоявшийся термин. 178.120.28.91 21:05, 5 августа 2012 (UTC)Ответить

Снова о терминологии

править

"Каждый игрок держит 2 карты: на одной написано «сотрудничать», на другой — «предать»". "Предать" значит "свидетельствовать", но ведь и "сотрудничать" имеет очевидно то же значение, тк иначе это сговор и игра не имеет смысла.--Totalserg 15:59, 14 июня 2009 (UTC)Ответить

D > d > C > c

По-моему, должно быть D > C > d > c: иначе обеим предать выгоднее, чем обеим сотрудничать.--89.105.238.253 23:19, 26 июля 2009 (UTC)Ответить

хе хе, самая выигрышная стратегия было правильно замечено мщение, только вот делать его надо превентивно. Если агенты анонимны полностью то игра теряет смысл(можно выбрать чисто математическую максимальную составляющую и на протяжениии 1000 игр результат примерно будет у всех одинаков). Если агенты известны то агент образно умеющий приставлять нож к горлу или вставлять паяльник в анальное отвестие будет в выигрыше всегда.

Ссылка на источник даосской поговорки?

править

В переводе книги Лао Цзы "Дао дэ Цзин": Ян Хин-шун, "Древнекитайский философ Лао-Цзы и его учение", Москва, 1950 - в стихе 49 сказано:

Совершенномудрый не имеет постоянного сердца. Его сердце состоит из сердец народа. Добрым я делаю добро и недобрым также делаю добро. Таким образом и воспитывается добродетель. Искренним я верен и неискренним также верен. Таким образом и воспитывается искренность.
Совершенномудрый живет в мире спокойно и в своем сердце собирает мнения народа. Он смотрит на народ, как на своих детей.

Что в сути расходится с указанной в тексте статьи поговоркой. Хочется увидеть ссылку на источник (автора) поговорки.

92.126.65.254 14:23, 2 сентября 2010 (UTC) СергейОтветить

Удалил спорный параграф

править

В вариации, популярной у программистов и хакеров, каждый агент этой игры помнит предыдущие результаты (или имеет доступ к общественному мнению, «коллективной памяти»), и множество обменов повторяются длительное время.

Как отмечено выше, без памяти эта игра имеет мало смысла, она мало что объясняет в поведении систем и групп людей, кроме описания взаимодействий, которые не будут происходить. Сложностей вводится больше, чем можно ожидать. Программист (особенно специализирующийся на функциональном программировании) сразу поймёт значимость времени и состояния (памяти). Но и без написания программ можно предположить, как поведут себя агенты. Насколько велика память каждого агента? Какова стратегия каждого из них? Как агенты с разными стратегиями распределены и что определяет, кто с кем взаимодействует и в каком порядке?

Сложность создания какой-то многозначной модели может обескураживать, но она поднимает некоторые интересные и ценные технические и философские вопросы.

Проделана некоторая работа по моделированию этого. Разные программисты и математики утверждают, что стратегия «око за око» (см. ниже) — наилучшая общая стратегия, однако не было сделано серьёзных академических усилий, чтобы классифицировать разные типы и распределения обучающихся агентов с разными стратегиями.

О потенциале этой задачи свидетельствует тот факт, что в этой дискуссии ещё не упоминались возможность формировать коалиции и рядиться коллективно. А как насчёт агентов, которые бы за плату организовывали переговоры? Или агентов, которые бы накапливали информацию о самих сделках?

--Hazzik 16:21, 27 мая 2011 (UTC)Ответить

Общее с Эффектом безбилетника?

править

Есть такая штука, Эффект безбилетника — тоже про закономерность человеческого выбора в какой-то ситуации. Есть здесь категория, адекватная для сбора статей про подобные наблюдения? Может, создать? Как бы она могла называться? --Nashev 15:35, 25 апреля 2012 (UTC)Ответить

Может создать раздел "Отражение в культуре"?

править

У Горького например есть такая фраза:

Всякий человек хочет, чтобы сосед его совесть имел, да никому не выгодно иметь-то ее.

Может еще найдутся подобные высказывания классиков?--Михаил Ягих 12:48, 7 августа 2012 (UTC)Ответить

"Доказываем по индукции. Если оба сотрудничают на последнем ходу - выгодно предать"

править

Вроде по условию задачи было написано, что если оба сотрудничают, то это выгоднее, чем предать. Зачем же предавать тогда на последнем ходу ? 109.108.238.217 11:15, 28 октября 2012 (UTC)Ответить

Просто попытка получить выгоду, обманув соперника. И проигнорировав то, что в результате сопернику станет выгодно обмануть его на N-1 ходу.

Пояснение: вне зависимости от такой модификации стратегии, соперник, предавший на N-1 ходу получит D+d. Но, если этого не делать, а играть «око за око», то соперник, НЕ предавший на N-1 ходу получит C+C=2C>=D+d (в сумме за ходы N-1 и N). А если предавать на N ходу, то тот же соперник, НЕ предавший на N-1 ходу получит C+c<D+d.

Возможно, автор просто не понимает, что повторение хода соперника нужно, чтобы у него не было интереса предать ходом ранее.

Если можно, добавьте это к основному тексту статьи. 86.100.164.224 05:56, 16 января 2017 (UTC)Ответить

Повторяющаяся дилемма

править

Статья Око за око на Хабре каким-то боком может помочь этой статье здесь? --Nashev 18:41, 22 января 2013 (UTC)Ответить

Неверно назначенные наказания

править

Я считаю, что хотя и нет ошибок в задаче, но имеются явные ошибки в действия судьи (прокурора?), который назначал наказания явно из своей прихоти, а не руководствуясь правилами Уголовного кодекса. 1) Во-первых, если оба пленника: и A, и B — дают показания, то это скорее всего означает, что они соучастники. Соучастие является более тяжким преступлением, чем одиночное. Поэтому если оба дают показания, то срок должен быть увеличен: не 10 лет, а, скажем, 15. 2) Во-вторых, наказание в 6 месяцев, если оба узника хранят молчание — по сути высосано из пальца. На мой взгляд, в случае, если оба узника молчат, то при отсутствии иных доказательств вины они оба должны быть выпущены на волю. 89.149.96.128 23:57, 31 марта 2014 (UTC) 89.149.96.128 23:58, 31 марта 2014 (UTC)Ответить

Что за дикая отсебятина написана в разделе "Классическая дилемма заключённого"

править

Во-первых, что за странное вступление про "наказание за преступление в составе группы"? Нигде в классической формулировке Дилеммы Заключенного (в том числе здесь) ничего подобного не фигурирует, никакого отношения к Дилемме Заключенного не имеет и никогда не имело. Кто это сюда приплел и зачем?

Во-вторых, что за чушь про "лучше [...] получить по полгода, так как это уменьшит суммарный срок заключения". "Суммарный срок заключения"??? Для формирования Дилеммы Заключенного условие уменьшения "суммарного срока" не рассматривается - это нигде и никак не нужно. Более того, для формирования дилеммы критически необходимо, чтобы каждый игрок предпочитал действовать в личных целях, т.е. "суммарный срок заключения" никого из них не интересует по определению.

В-третьих, в английской версии страницы в качестве максимального срока наказания указано "3 года". Обратите внимание, что 3 меньше чем 4 (то есть суммарное 2+2). Это сделано специально (!) для того, чтобы подчеркнуть, что факт того, что "3 меньше чем 4" не играет никакой роли в Дилемме Заключенного. Здесь же какой-то "умник" наплел какой-то чуши, а затем, чтобы натянуть постановку Дилеммы на глобус своей чуши, еще и увеличил максимальный срок до 10 лет, т.е. кто-то упорно добивался, чтобы максимальный срок был больше 4. Сразу видно, что тот, кто корежил русскую страницу в соответствии со своими домыслами, совершенно не понимал сути Дилеммы Заключенного.

Calligrapher (обс.) 21:33, 4 марта 2024 (UTC)Ответить

Критика

править

В статье не хватает критики дилеммы как с точки зрения взятых с потолка чисел наград которые и приводят к нужным авторам дилеммы выводам, так и критики самой ситуации выбора, распиаренной и не имеющей применения в реальной жизни. Часть информации можете взять отсюда http://philsci-archive.pitt.edu/15389/1/PD2014-bookfinal.pdf или поискать в других источниках. С уважением, Пётр. 217.107.106.12 16:47, 16 марта 2024 (UTC)Ответить