Википедия:Заявки на статус бота/DelphiWikiRobot 2
вклад • правки • SUL • журналы • блокировать • лог блокировок • журнал изменения прав • присвоить флаг Ответственный ботовод/Botmaster: Участник:KPu3uC B Poccuu.
Цель/Purpose
правитьПрошу флаг для написанного мной робота. Пока робот только выполняет API запросы, необходимые для собирания статистики и разной информации, так как для участников с этим флагом существуют меньшие ограничения на их количество. После обретения и проверки функциональности, необходимой для непосредственного автоматизированного изменения содержимого страниц Википедии, будет сделан отдельный запрос на флаг. Пример запроса, выполняемого им, см. Википедия:Запросы к ботоводам#Список активно загружающих файлы. KPu3uC B Poccuu 12:06, 8 января 2012 (UTC)
Технические подробности/Technical details
правитьНаписан мной на Delphi, используется сильно переделанная обёртка для MediaWiki API из проекта Delphi JEDI. KPu3uC B Poccuu 12:06, 8 января 2012 (UTC)
Имеется флаг бота в других виках?/Already has a bot flag in other wikipedias?
правитьНет. KPu3uC B Poccuu 12:06, 8 января 2012 (UTC)
Обсуждение/Discussion
править- Каким образом были учтены те замечания/возражения, которые были высказаны участниками на Википедия:Заявки на статус бота/DelphiWikiRobot? --Obersachse 12:16, 8 января 2012 (UTC)
- Так называемые замечания касались правок личных страниц, которыми я заниматься не собираюсь, если Вы имели в виду это. Не понимаю, какие те замечания относятся к текущей заявке, где я чёрным по белому указал, что вносить правки роботом не собираюсь пока. KPu3uC B Poccuu 12:20, 8 января 2012 (UTC)
- Если флаг нужен исключительно для API запросов, то почему бы не выдать? Но бот не должен вносить никаких правок до повторной подачи заявки, а не «пока не собираюсь».--Сергей Александрович обс 15:30, 8 января 2012 (UTC)
- «После обретения и проверки функциональности, необходимой для непосредственного автоматизированного изменения содержимого страниц Википедии, будет сделан отдельный запрос на флаг». Во-вторых, бот будет делать правки в моём личном пространстве. Иначе способа его проверять на работоспособность с учётом того, что testwiki не работает, я не вижу. KPu3uC B Poccuu 15:41, 8 января 2012 (UTC)
- Вот тут http://botwiki.sno.cc/ можно поредактировать. По-моему это и замышлялось, как тестовый полигон для ботов. --Dnikitin 13:27, 12 марта 2012 (UTC)
- Отбой, Testwiki снова работает. KPu3uC B Poccuu 13:58, 12 марта 2012 (UTC)
- Вот тут http://botwiki.sno.cc/ можно поредактировать. По-моему это и замышлялось, как тестовый полигон для ботов. --Dnikitin 13:27, 12 марта 2012 (UTC)
- «После обретения и проверки функциональности, необходимой для непосредственного автоматизированного изменения содержимого страниц Википедии, будет сделан отдельный запрос на флаг». Во-вторых, бот будет делать правки в моём личном пространстве. Иначе способа его проверять на работоспособность с учётом того, что testwiki не работает, я не вижу. KPu3uC B Poccuu 15:41, 8 января 2012 (UTC)
- Если нужна только статистика, почему бы не скачать дамп и не работать с ним? И нагрузка на сервер меньше, и быстродействие быстрее (и флаг не нужен). Vlsergey 14:58, 12 января 2012 (UTC)
- MySQL не увлекаюсь, простите, скачивать и разбирать немаленькие дампы не имею желания, да и некоторые запросы требуют самых точных, последних данных. Неужели Википедия обвалится от выдачи мне этого флага? KPu3uC B Poccuu 15:11, 12 января 2012 (UTC)
- Приведите, пожалуйста, примеры запросов, для которых Вам не хватает стандартных API-лимитов. Напомню, ограничений на количество запросов нет, просто batch будет меньшего размера, и, соответственно, самих запросов немного больше. Мне хочется понять, зачем Вам флаг, сам по себе, или для чего-то реального. Vlsergey 15:23, 12 января 2012 (UTC)
- Да, я неверно выразился, не общее количество запросов ограничено, а именно количество элементов в ответе. Я желаю обрабатывать за раз наибольшее количество информации, так как ответы кеширую после разбора каждого пакета результатов, и тратить время на файловые операции затратно по времени, ну и просто непрерывное жужжание жесткого диска надоедает. И не «немного меньше», а, если мне не изменяет память, в 10 раз, разница огромна. KPu3uC B Poccuu 15:40, 12 января 2012 (UTC)
- С технической точки зрения приведённая Вами аргументация является смешной. Вам никто не запрещает сделать несколько запросов, сгруппировать их в один файл (даже в памяти), после чего обрабатывать. Кроме того, Вы не привели конкретные примеры задач и запросов, которые Вы обрабатываете. Кроме того, увеличение разрешённых лимитов приведёт к большей нагрузке на Вашу клиентскую систему. Vlsergey 18:06, 12 января 2012 (UTC)
- Усложнять систему, большая часть которой была написана не мной, и с которой я ещё не совсем освоился, по крайне мере пока не представляется возможной. Пример я привёл, читайте внимательно. Но другими своими планами могу поделиться и сейчас: это поиск перенаправлений в никуда, поиск перенаправлений из пространства шаблонов в другие, поиск подстраниц переименованных страниц. Что-то было ещё. KPu3uC B Poccuu 23:25, 12 января 2012 (UTC)
- Для таких задач нужно как-раз скачивать дамп. Однако и без дампа, если Вы не собираетесь получать списки и содержание ВСЕХ перенаправлений, то флаг бота не нужен. А если собираетесь — то лучше отправить Вас к разработчикам, пусть они Вам объяснят, почему так делать не нужно. Vlsergey 07:11, 13 января 2012 (UTC)
- en:Wikipedia:Don't worry about performance — как Ваши слова соотносятся с текстом на этой странице? Я уважаю правила использования ботов, так что от того, что не буду использовать дампы, но буду вместо этого использовать API на умеренной скорости сервера не обвалятся. KPu3uC B Poccuu 14:03, 28 января 2012 (UTC)
- Для таких задач нужно как-раз скачивать дамп. Однако и без дампа, если Вы не собираетесь получать списки и содержание ВСЕХ перенаправлений, то флаг бота не нужен. А если собираетесь — то лучше отправить Вас к разработчикам, пусть они Вам объяснят, почему так делать не нужно. Vlsergey 07:11, 13 января 2012 (UTC)
- Усложнять систему, большая часть которой была написана не мной, и с которой я ещё не совсем освоился, по крайне мере пока не представляется возможной. Пример я привёл, читайте внимательно. Но другими своими планами могу поделиться и сейчас: это поиск перенаправлений в никуда, поиск перенаправлений из пространства шаблонов в другие, поиск подстраниц переименованных страниц. Что-то было ещё. KPu3uC B Poccuu 23:25, 12 января 2012 (UTC)
- С технической точки зрения приведённая Вами аргументация является смешной. Вам никто не запрещает сделать несколько запросов, сгруппировать их в один файл (даже в памяти), после чего обрабатывать. Кроме того, Вы не привели конкретные примеры задач и запросов, которые Вы обрабатываете. Кроме того, увеличение разрешённых лимитов приведёт к большей нагрузке на Вашу клиентскую систему. Vlsergey 18:06, 12 января 2012 (UTC)
- Да, я неверно выразился, не общее количество запросов ограничено, а именно количество элементов в ответе. Я желаю обрабатывать за раз наибольшее количество информации, так как ответы кеширую после разбора каждого пакета результатов, и тратить время на файловые операции затратно по времени, ну и просто непрерывное жужжание жесткого диска надоедает. И не «немного меньше», а, если мне не изменяет память, в 10 раз, разница огромна. KPu3uC B Poccuu 15:40, 12 января 2012 (UTC)
- Насколько я знаю, без флагов администратора или бота невозможно получить выборку страниц по какому-то признаку (включения шаблона, попадание в категорию, WhatLinksHere и т.д.) размером более 25 000 страниц; в практике нередко нужно больше. Так что я не против выдачи флага даже для этого; не думаю, что проблемы от вышеописанного режима работы возникнут. MaxBioHazard 16:04, 12 января 2012 (UTC)
- Если это правда, то тем более, у меня почти все задуманные запросы на эту тему. KPu3uC B Poccuu 16:15, 12 января 2012 (UTC)
- Таких лимитов нет, либо они мне не известны. Что самое главное — эти лимиты неизвестны номинатору, то есть он в них ещё не «упёрся». Vlsergey 18:09, 12 января 2012 (UTC)
- А когда «упрусь», мне подать снова запрос и три дня ждать? KPu3uC B Poccuu 22:11, 12 января 2012 (UTC)
- Я сомневаюсь, что вы вообще их заметите при правильном написании бота. Я бы даже сказал, что в 90 % случаев замечание таких ограничений может служить своеобразным симптомом ошибок и недоработок в коде. Vlsergey 07:11, 13 января 2012 (UTC)
- А когда «упрусь», мне подать снова запрос и три дня ждать? KPu3uC B Poccuu 22:11, 12 января 2012 (UTC)
- Насколько я понял из Гугла, речь идёт об ограничении в 25 тыс. страниц в качестве результата, который может использовать AWB. Это скорее не ограничение, а защита от перегрузки серверов из-за неумелого использования AWB. В самой MediaWiki ограничения на количество результатов вообще нет (только ограничение на количество результатов в одном батче). Vlsergey 18:15, 12 января 2012 (UTC)
- См. mw:API:Query#Specifying titles, mw:API:Lists#Limits. В первом ограничение на количество указанных имён страниц, во втором на число элементов в ответе на каждый список. Если второе ещё как-то можно отбросить, если считать, что я обязан перерыть свой и чужой код, то первое нет, так как это ограничение я сегодня повстречал при попытке найти все переименованные страницы и их подстраницы, точнее, при запросе на получение информации об найденных мной переименованных страницах (размер, кто переименовал, куда, время, вернули ли её обратно), в котором я как раз передавал имена найденных страниц. KPu3uC B Poccuu 23:25, 12 января 2012 (UTC)
- Повторюсь, никто не мешает делать несколько запросов. Эти несколько запросов обязаны делать как боты, так и участники без ботов, просто у вторых их больше (зато возвращаемые порции меньше). Если Ваш код (а код Вашего бота считается Вашим, и Вы за него отвечаете, а не какой-то дяденька) не умеет делить запросы на куски и потом их объединять — Вы всё равно «упрётесь» в ограничения API, будет у Вас флаг бота или не будет. Vlsergey 07:11, 13 января 2012 (UTC)
- См. mw:API:Query#Specifying titles, mw:API:Lists#Limits. В первом ограничение на количество указанных имён страниц, во втором на число элементов в ответе на каждый список. Если второе ещё как-то можно отбросить, если считать, что я обязан перерыть свой и чужой код, то первое нет, так как это ограничение я сегодня повстречал при попытке найти все переименованные страницы и их подстраницы, точнее, при запросе на получение информации об найденных мной переименованных страницах (размер, кто переименовал, куда, время, вернули ли её обратно), в котором я как раз передавал имена найденных страниц. KPu3uC B Poccuu 23:25, 12 января 2012 (UTC)
- По какой причине заявитель не воспользуется стандартными фрейворками? Для каких задач требуется собственный фрейворк? Апрувить бота на основании самописного фрейворка это всегда риск для бюрократа. Заявитель должен иметь это ввиду и быть готов продемонстрировать вменяемость, высокую техническую подкованность и компетентность выше среднего. --Dnikitin 13:22, 12 марта 2012 (UTC)
- По той, что их надо изучать, надо изучать вдобавок другие языки программирования, я не могу быть уверен без хорошей документации в том, что знаю, как программа поведёт себя в той или иной ситуации, исправления какого-нибудь бага, возможно, придётся ждать месяцами, ну и недостаточно — для меня — контроля над роботом; последнее для меня критично, я хочу быть уверен, что на все сто процентов контролирую его работу и могу поменять малейшую деталь в ней. Зато при написании своего робота самим всех этих сложностей избежать. Если Вам интересно, то единственная причина, по которой я не делаю правок, это работа над гибким форматом правил для работы, по сути это скрипт на встроенном скриптовом языке, чтобы каждый раз незаморачиваться над перепрограммированием робота. KPu3uC B Poccuu 13:58, 12 марта 2012 (UTC)
- Ясно. В общем я задавался тем же вопросом, но потом решил, что в краудсорсинговом проекте нужно полагаться на мощь комьюнити и использовать «стандарт-дефакто» pywikipedia (хотя с питоном был не знаком). И с тех пор много раз хвалил себя, что сделал правильным выбор и не стал использовать бота на Java, на языке который мне ближе. Главная проблема с собственным фреймворком в том, что даже если вы будете контролировать и работать быстрее чем целое комьюни, то этого все равно недостаточно. Нужно убедить еще в этом окружающих (эту самую комьюнити), а это самое сложное. --Dnikitin 18:21, 12 марта 2012 (UTC)
- По той, что их надо изучать, надо изучать вдобавок другие языки программирования, я не могу быть уверен без хорошей документации в том, что знаю, как программа поведёт себя в той или иной ситуации, исправления какого-нибудь бага, возможно, придётся ждать месяцами, ну и недостаточно — для меня — контроля над роботом; последнее для меня критично, я хочу быть уверен, что на все сто процентов контролирую его работу и могу поменять малейшую деталь в ней. Зато при написании своего робота самим всех этих сложностей избежать. Если Вам интересно, то единственная причина, по которой я не делаю правок, это работа над гибким форматом правил для работы, по сути это скрипт на встроенном скриптовом языке, чтобы каждый раз незаморачиваться над перепрограммированием робота. KPu3uC B Poccuu 13:58, 12 марта 2012 (UTC)
Итог/Summary
правитьМногочисленные возражения и сомнения мне не позволяют присвоить флаг бота. --Obersachse 06:52, 17 марта 2012 (UTC)