Википедия:Кандидаты в избранные статьи/AlphaGo
Кандидат в избранные статьи |
---|
Правила обсуждения
|
Здесь находятся завершившиеся обсуждения. Просьба не вносить изменений.
Старался описать программу, впервые выигравшую у профессионала в го, так просто, как только возможно, но не проще. — Алексей Копылов 20:03, 10 октября 2016 (UTC)
Поддерживаю править
Комментарии править
- Преамбула должна быть ровно в два раза больше.--Victoria (обс) 08:04, 11 октября 2016 (UTC)
- Увеличил преамбулу. — Алексей Копылов 22:26, 26 октября 2016 (UTC)
- Огромное количество ошибок и опечаток. Только ли AlphaGo программа? Была бы она столь же сильна на другом оборудовании? AlphaGo — это он или она (в тексте есть и так и так)? — Manslay (обс) 09:19, 11 октября 2016 (UTC)
- Часть ошибок исправил, наверняка остались еще. Поставил шаблон.
- Александр исправил ошибки. Спасибо ему. — Алексей Копылов 20:29, 27 октября 2016 (UTC)
- AlphaGo - программа, не привязанная к конкретному оборудованию, но использующая специальный процессор, разработанный для машинного обучения. Добавил это в текст. Конечно на более слабом оборудовании она была бы слабее.
- В большинстве русскоязычных источников AlphaGo - она. Исправил, надеюсь ничего не пропустил. — Алексей Копылов 22:26, 26 октября 2016 (UTC)
- Часть ошибок исправил, наверняка остались еще. Поставил шаблон.
- Большинство современных программ (алгоритмов) реализующих логическую игру состоит из поиска по дереву ходов и оценки позиции. Как я понял из статьи, особенность Alpha Go, в основном, в новом подходе к оценке позиции. Перебор по дереву пока так и остался. Если это так то желательно указать на какую глубину считает программа (в случае шахматных программ глубину считают в полуходах).
- Программа разбирает разные ветви на разную глубину. Кроме того метод Монте-Карло для поиска в дереве - просматривает игру до конца. Так что сомневаюсь, что есть ответ на ваш вопрос. По крайне мере, мне не удалось его найти. — Алексей Копылов 02:17, 26 октября 2016 (UTC)
- Несколько странное оформление в разделе «Устройство Alpha Go» под заголовком «основной источник [ссылка]».
- Мне тоже не нравиться такое оформление, но оно, рекомендовано документацией к шаблону {{mainref}}. Там же предлагается другой способ, который бы я мог использовать: Шаблон:Mainref/doc#Применение с шаблоном Sfn. Но он мне кажется ещё хуже: кликая на ссылку в примечаниях, человек попадает не в список литературы, как обычно, а куда-то в середину статьи. А вы как считаете это надо оформить? — Алексей Копылов 02:17, 26 октября 2016 (UTC)
- Хотя, можно сделать и так. Если так нормально, то надо будет внести изменения в Шаблон:Mainref/doc. — Алексей Копылов 22:50, 26 октября 2016 (UTC)
- Мне тоже не нравиться такое оформление, но оно, рекомендовано документацией к шаблону {{mainref}}. Там же предлагается другой способ, который бы я мог использовать: Шаблон:Mainref/doc#Применение с шаблоном Sfn. Но он мне кажется ещё хуже: кликая на ссылку в примечаниях, человек попадает не в список литературы, как обычно, а куда-то в середину статьи. А вы как считаете это надо оформить? — Алексей Копылов 02:17, 26 октября 2016 (UTC)
- Этим AlphaGo отличается от таких программ, как Deep Blue, которая была разработана с одной целью — выиграть матч у Гарри Каспарова в шахматы — сомнительное утверждение и прямо в статье, насколько я вижу, не упоминается. Наоборот, в источнике написано AlphaGo follows in the footsteps of the chess-playing Deep Blue computer. Также я не уверен что Deep Blue разрабатывалась с именно такой целью.
- Но потом в источнике написано "The DeepMind program is very different from Deep Blue" и далее написано чем отличается. Про Deep Blue в том же источнике говориться: "Deep Blue was designed to achieve a single purpose: winning a chess game". Еще один источник, на который я ссылаюсь чуть ниже говорит: "Deep Blue was designed with the goal of beating Kasparov and Kasparov specially". Продублировал ссылку еще раз, чтобы не возникало вопросов. — Алексей Копылов 02:17, 26 октября 2016 (UTC)
- AlphaGo использует более быстрый, но менее точный вариант стратегической сети (rollout policy), который получает ответ за 2 мкс — зачем указывать время (в микросекундах?) ? Оно же зависит от аппаратной базы, на которой работает программа.
- Во-первых, чтобы показать порядок, во-вторых чтобы сравнить с медленной сетью. Чуть переписал, чтобы подчеркнуть это. А в-третьих во время игры и экспериментов программа работала на конкретной аппаратуре (параметры указаны в статье), поэтому вполне можно сказать сколько времени занимает разбор хода. — Алексей Копылов 02:17, 26 октября 2016 (UTC)
- признавались за ходы, осуществлявшие далеко идущую стратегию — стилистически не совсем удачно. - Saidaziz (обс) 04:30, 14 октября 2016 (UTC)
- Переписал: "Профессиональные игроки отмечали, что некоторые ходы AlphaGo, первоначально кажущиеся ошибочными, при более глубоком изучении оказывались стратеги важными" — Алексей Копылов 02:17, 26 октября 2016 (UTC)
- После прочтения появился ряд вопросов, в осоновном по стилистике, ну а где-то, может, просто мои придирки:
- Sarmodolin, спасибо за внимательное прочтение статьи и "придирки"! — Алексей Копылов 02:25, 4 ноября 2016 (UTC)
- В преамбуле: «большинство специалистов по искусственному интеллекту считали, что такая программа не будет создана в течение 5—10 лет» — каких лет?
- В подразделе «Матч AlphaGo — Ли Седоль» как-то мало связности.
- В «Возможные будущие матчи», хотя и понятно что во время матча с Ли Седолем, но может это явно указать.
- «До AlphaGo го являлось одной из немногих традиционных игр…», не нужна ли тут где-нибудь запятая или хотя бы слово появления/создания?
- Запятая, вроде бы не нужна, с слово создание вставил. — Алексей Копылов 03:04, 1 ноября 2016 (UTC)
- «Го гораздо более сложная игра, чем такие игры, как шахматы, из-за большего количества возможных позиций.» — тут указана одна игра, а «чем такие игры» подразумевает несколько.
- Хм. По-моему, конструкция "Такие Х, как У" требует множественного числа только от Х, но нет от У. Можно сказать: "такие планеты, как Земля". Я просто говорю, что го сложнее многих игр, которые похожи на шахматы. На gramota.ru есть примеры такого употребления. — Алексей Копылов 03:04, 1 ноября 2016 (UTC)
- «Во-первых, как правило, в го в каждой позиции существует больше разрешённых ходов, чем в шахматах. Кроме того, партия в го в среднем длится больше ходов. Это делает игру очень сложной для традиционных методов искусственного интеллекта, таких как альфа-бета-отсечение.» — может есть альтернатива этому логическому следованию предложений: Во-первых→Кроме того→Это делает?
- Не совсем понял, что было не так, но переписал. — Алексей Копылов 03:04, 1 ноября 2016 (UTC)
- Далее в разделе Значение в абзаце начинающемся с «Создание программы» есть пара предложений образующих такую конструкцию: «Большинство специалистов … считали … а многие считали … Даже после победы … многие специалисты считали …».
- Так лучше? — Алексей Копылов 03:04, 1 ноября 2016 (UTC)
- В разделе «Устройство AlphaGo» «Этим AlphaGo отличается от таких систем…», но там одна система Deep Blue.
- См. выше. — Алексей Копылов 03:04, 1 ноября 2016 (UTC)
- Далее по тексту идет дублирование про Каспарова: «Deep Blue — суперкомпьютера, который был разработан с одной целью — выиграть матч у Гарри Каспарова в шахматы», «Кроме того Deep Blue была специально настроена на игру против Каспарова».
- В следующем абзаце идет предложение «А именно, AlphaGo использует нейронные сети…», а за ним «Далее нейронная сеть была улучшена», как-то они не вяжутся вместе.
- Далее предложение «Одно лишь это позволило AlphaGo…», не подкреплено источником, а это не такой уж и тривиальный факт.
- Вообще-то источник указан в начале раздела (Основной источник), но я добавил ссылку на вторичный источник. — Алексей Копылов 03:04, 1 ноября 2016 (UTC)
- «на уровне лучших компьютерных программ того времени», это какого, старых-добрых две тысячи пятнадцатых XD?
- По-моему это и так понятно, но уточнил. — Алексей Копылов 03:04, 1 ноября 2016 (UTC)
- Следующее предложение «Кроме того, AlphaGo использует … используемую в лучших программах для игры в го …» опять это кроме того, кстати, тут есть запятая а у кроме того около Deep Blue не было, да и опять не тривиальное утверждение без источника.
- В разделе «Технологии, предшествующие AlphaGo», подраздел называется «Игры с полной информацией», но игры с полной информацией это термин самих игр, а не метод обхода дерева.
- Переименовал в "Общие подходы к играм с полной информацией" — Алексей Копылов 02:25, 4 ноября 2016 (UTC)
- Далее опять «таких … как» для одних шахмат в «Такой подход хорошо зарекомендовал себя в таких играх, как шахматы».
- см. выше — Алексей Копылов 02:25, 4 ноября 2016 (UTC)
- Подраздел «Глубинное обучение» относится к «Технологии, предшествующие AlphaGo», но использовалось ли глубинное обучение и свёрточные нейронные сети в го-программах до AlphaGo, как метод Монте-Карло?
- Нет, не использовались. Раздел «Технологии, предшествующие AlphaGo» - описывает существовавшие технологии, даже если они не использовались для го. — Алексей Копылов 02:25, 4 ноября 2016 (UTC)
- Информация про DeepMind и Atari 2600 в подразделе «Глубинное обучение» без источников.
- Добавил — Алексей Копылов 02:25, 4 ноября 2016 (UTC)
- В «Алгоритм AlphaGo» на «Представление позиции», тоже бы неплохо сноску дать, откуда 19*19*48 взялось.
- Раздел «Быстрая стратегическая сеть», опят «кроме того».
- В разделе «Поиск в дереве» одно из предложений начинается с «Интересно, что», не уверен что это выражение подходит.
- А в следующем предложении: «люди выбирают более разнообразные ходы, чем улучшенная сеть».
- Так лучше? — Алексей Копылов 02:25, 4 ноября 2016 (UTC)
- «Обозреватели охарактеризовали некоторые ошибки AlphaGo, приведшие к поражению в четвёртой партии, как типичные ошибки для программы, работающей на основе метода Монте-Карло — поисковой механизм пытается отсечь некоторые последовательности, не относящиеся к конкретной ситуации» — что-то мне тут не нравиться)), ну и еще «поисковой механизм» странно звучит. Sarmodolin (обс) 17:55, 29 октября 2016 (UTC)
- Вообще убрал вторую часть фразы. — Алексей Копылов 02:25, 4 ноября 2016 (UTC)
- Хорошо бы оформить ссылки по ВП:БИБГРАФ. --Q Valda 01:07, 5 ноября 2016 (UTC)
- Дооформил ссылки. Все ссылки оформлены шаблонами. Q Valda, если есть еще что-то, что нужно сделать, скажите. — Алексей Копылов 03:32, 11 ноября 2016 (UTC)
См.также Проект:Библиография/Библиографические ссылки#Библиографические ссылки на электронные ресурсы — в сносках название сетевого издания (и других изданий) пишется через двойную косую черту --Q Valda 07:19, 11 ноября 2016 (UTC)# Фамилия, имя (имена) и отчество автора пишутся курсивом. Фамилия пишется в начале. Между инициалами ставится пробел.
...- Фамилии поставил в начало. Остальное - надо менять шаблоны. — Алексей Копылов 15:33, 11 ноября 2016 (UTC)
- Дооформил ссылки. Все ссылки оформлены шаблонами. Q Valda, если есть еще что-то, что нужно сделать, скажите. — Алексей Копылов 03:32, 11 ноября 2016 (UTC)
- Решил было поприводить текст в порядок, но всё-таки споткнулся ещё на преамбуле:
- AlphaGo основана на общих алгоритмах машинного обучения и практически не использует особенности игры в го, а обучена играть практически «с нуля» — не слишком ли много здесь «практически»? Но даже не это бросается в глаза. Что значит «не использует особенности го»? И в чём эти особенности заключаются? А 30 миллионов позиций с сервера KGS — это обучение с нуля?— Manslay (обс.) 06:32, 8 ноября 2016 (UTC)
- Спасибо. Уточнил. — Алексей Копылов 02:07, 9 ноября 2016 (UTC)
- Таким образом её методы могут быть использованы... Какие такие «её методы»? Может быть, методы её разработки, первичного обучения, самообучения, организации данных, структуры нейросетей, особенности кода? Что конкретно имелось в виду? — Manslay (обс.) 06:32, 8 ноября 2016 (UTC)
- Уточнил: "методы машинного обучения". Почти что всё из выше перечисленного сюда относится. — Алексей Копылов 02:07, 9 ноября 2016 (UTC)
- AlphaGo основана на общих алгоритмах машинного обучения и практически не использует особенности игры в го, а обучена играть практически «с нуля» — не слишком ли много здесь «практически»? Но даже не это бросается в глаза. Что значит «не использует особенности го»? И в чём эти особенности заключаются? А 30 миллионов позиций с сервера KGS — это обучение с нуля?— Manslay (обс.) 06:32, 8 ноября 2016 (UTC)
- В разделе Общие подходы к играм с полной информацией: во втором абзаце сначала написано про оценочную функцию, а затем про ширину/глубину дерева. И ширина/глубина дерева выглядит как причина невозможности получить хорошую оценочную функцию (это так на самом деле?). В Silver et al., 2016 наоборот сначала написано про ширину/глубину дерева, а потом про оценочные функции, т.е. ширина/глубина дерева - причина необходимости использования функции. --Anton Khorev (обс.) 22:32, 13 ноября 2016 (UTC)
- На самом деле это не так. Переписал, чтобы так не выглядело. — Алексей Копылов 22:39, 14 ноября 2016 (UTC)
Итог править
Статью пришлось основательно вычитывать, но в остальном она требованиям соответствует. Несмотря на наличие основного источника, общее их количество велико. Статус присвоен. --Zanka (обс.) 01:30, 1 декабря 2016 (UTC)