Проект:Инкубатор/Форум/Обсуждение Инкубатора/Архив/2015/03

Здесь находятся завершившиеся обсуждения. Просьба не вносить изменений.
Здесь находятся завершившиеся обсуждения. Просьба не вносить изменений.

В ближайшее время я буду переделывать бота, который проверяет статьи (AJZBot (обс. · вклад · журналы · блокировки · фильтры)). Это нужно для того чтобы сделать бота «умнее» и исправить существующие недоработки. Новый бот может первое время работать неправильно. Я буду следить за ним, но могу что-то упустить, так что не зевайте. Если у кого-то есть пожелания/замечания по поводу работы бота, добавления новых его функций и удаления существующих, самое время их высказать. Пока будет работать старый бот. --AJZ 15:22, 20 марта 2015 (UTC)[ответить]

  • Спасибо за инфу. AJZBot (или иной?) чувствителен к регистру в названии основного шаблона (как минимум). Нужно было писать "В инкубаторе" ("В" заглавное, "и" маленькое), иначе шаблон не виделся и выставлялся повторно, что раздражало. Если это ещё не исправлено, то здорово бы было исправить. --NeoLexx 15:37, 20 марта 2015 (UTC)[ответить]


По поводу бота. Было бы здорово, если бы проверка была "эшелонированной", исходя из принципа "постепенного и последовательного обучения". Мы в свое время выделили примерно следующие этапы:

  1. Текст должен быть читаемый.
    Дается ссылка на Википедия:Шпаргалка. Шаблон "запроса проверки" со страницы заготовки снимается и заменяется на шаблон "проведенной автоматической проверки". Если нашлись ошибки на этой стадии, то бот останавливается и дальнейшую проверку не делает, пока это не будет исправлено. Хорошо, если на СО бот показывает строки, в которых нашлись ошибки (чтобы новичку было легче найти места, которые нужно исправить).
    Проверяются:
  2. Категории, интервики
    Дается ссылка на Проект:Инкубатор/Справочники и пособия/Как искать Категории и Проект:Инкубатор/Справочники и пособия/Как искать Интервики. Шаблон "запроса проверки" со страницы заготовки снимается. Если нашлись ошибки на этой стадии, то бот останавливается и дальнейшую проверку не делает, пока это не будет исправлено.
    • Категории - если вообще нет, то это считается "ошибкой", т.е. бот к 3-му шагу проверки не переходит. Если есть хотя бы одна категория - то это не ошибка, но "предупреждение" - бот идет дальше, но предлагает предлагает подобрать еще, чтобы получилось хотя бы 2-3 категории. Если есть 2 и больше - то нормально.
    • Интервики - должна быть либо интервика, либо шаблон "Интервика искалась, но не найдена" (этот шаблон заодно позволяет видеть, как новичок искал интервики, и давать ему подсказки как можно еще искать интервики, шаблон пока не разработан, но он имхо очень нужен для работы с новичками, а потом, думаю, пригодится и в ОП)
  3. Проверяется все остальное (карточки, стиль, и т.п.)
    Шаблон "запроса проверки" со страницы заготовки не снимается. Новичок уже освоил азы разметки, текст читаем, можно переходить к более углубленному обучению новичка. Бот делает полную проверку по всем параметрам.

Возможно, было бы хорошо, если бы бот работал "достаточно часто", чтобы новичок получал первичную проверку как можно быстрее. В идеале - вообще сканировать "поток правок по пр-ву Инкубатор" и смотреть появление там правки с запросом на проверку.. Это было бы вообще супер-здорово.. а так, наверное, хотя бы раз в 15 минут? Это важно, чтобы новичок не терял интерес в процессе работы и отклик на запрос получался бы как можно быстрее.

Еще, м.б. не затирать старые обсуждения на СО, а только добавлять их как новые секции с формате "год.месяц.день минуты:секунды"? Это чтобы проверяющие видели "динамику обучения новичка".

Это идеи из нашего прежнего опыта, которые тогда так и не успели реализовать. Samal 09:34, 27 марта 2015 (UTC)[ответить]

  • Давайте попробуем разобрать возможный алгоритм поэтапно:

1 этап

  • Объём статьи больше определённого минимума
  • Объём текста статьи больше определённого минимума (не учитывается содержимое шаблонов, заголовки, категории, интервики, <!-- скрытое содержимое-->)
  • Текст на русском, то есть соотношение символов русского алфавита к общему количеству символов минус служебные символы больше определённой величины
  • Количество открывающих {{ равно количеству закрывающих }}
  • Заголовки всех уровней корректны, т.е. соответствуют формату == Название раздела ==

Если все предыдущие условия выполнены, статья признаётся пригодной для 2 этапа проверки, в противном случае запрос снимается, новичку объясняется смысл проблемы.

2 этап

  • Теги br вне шаблонов не встречаются
  • Строки, не находящиеся внутри тега source, не начинаются с пробела
  • Слитые абзацы (не понял, что это такое, пример ситуацию не прояснил) не встречаются
  • Нет нумерованных списков (вреда в них не вижу)
  • Нет ссылок вида http://ru.wikipedia.org/ и им подобных типа http://ja.wikipedia.org/
  • Количество открывающих [[ равно количеству закрывающих ]]

Если все предыдущие условия выполнены, статья признаётся пригодной для 3 этапа проверки, в противном случае запрос снимается, новичку объясняется смысл проблемы, при наличии возможности указывается место ошибки, например абзац, где находится нумерованный список.

3 этап

Всё, что душа попросит, включая проверку категорий, шаблонов, __INDEX__ и ссылок. Смысл проблем тоже должен с адекватной степень подробности быть раскрыт. Запрос проверки не снимается. Принуждать вешать шаблон о том, что интервик нет не нужно, потому что в большинстве случаев их правда нет, а новичок и так перегружен новой для него информацией, не нужно перегружать его больше необходимого.--AJZ 17:30, 28 марта 2015 (UTC)[ответить]

  • В современных реалиях, я полагаю, про интервики вообще можно забыть и новичка не грузить этим, это уже не столь важно, все равно они добавляются на викидате, а не в статью, поэтому лучше не заморачиваться. Есть - хорошо, нет - ничего страшного, существование и качество статьи от этого не меняется. Dmitry89 (talk) 18:33, 28 марта 2015 (UTC)[ответить]
    • По поводу интервик - сам в сомнениях. С одной стороны - мы должны обучить новичка максимальному количеству базовых вещей (в т.ч. и интервикам). С другой стороны - да, действительно, часто интервик нету. Поэтому предлагаю пока определиться с более простыми и понятными вещами, а решение вопроса с интервиками вынести "на потом". Samal 20:31, 28 марта 2015 (UTC) PS. Вспомнил, почему еще мне интервики были важны, когда проверял новичков. 1. Наличие интервик (пусть косвенно, но все же) позволяло легче определиться со значимостью. 2. Обнаружение "переведенной статьи" (а таких в Инкубаторе бывало довольно много) давало возможность поговорить с новичком про "аттрибутирование заимствованных текстов" и указать на шаблон Проект:Инкубатор/Справочники и пособия/Шаблоны «Не переведено»#Переведённые статьи. Ну и, опять же, значимость определять гораздо легче. Особенно, если интервик много и в других разделах статьи существуют давно. Поэтому я пока все же за обучение интервикам в Инкубаторе на 2-3 этапах обучения, но надо послушать нынешних проверяющих и обсудить все за-против. Samal 20:42, 28 марта 2015 (UTC)[ответить]
      • С интервиками в Инкубаторе адЪ и жупелЪ ещё и потому (уже были обсуждения), что текущему движку Викидаты вообще до фонаря, откуда ссылка, лишь бы в *.wikipedia.org То есть можно создать в Инкубаторе любую заготовку любой тематики и прилинковать интервикой куда угодно, был бы ru слот был свободен. И плевать на __NOINDEX__. По мне так это был и остаётся лютый баг, решений так и нет (см. Интервики из Инкубатора недопустимы (?) --NeoLexx 12:03, 29 марта 2015 (UTC)[ответить]

Перечень процедур проверки

править
Процедура Этап Комментарии
Количество открывающих {{ не равно количеству закрывающих }} 1 Формально это относится к этапам 2-3, когда идет обучение шаблонам, но д.б. тут, т.к. иначе весь текст может перекосить.

И еще, бывает ли такая ошибка, как разрыв скобок пробелами, типа "{ {" или "} }"? Если бывает, то, видимо, сюда же.

Теги br встречаются вне шаблонов 1
Строки, не находящиеся внутри тега source, начинаются с пробела 1 В противном случае текст загоняется в полосу прокрутки, страница становится нечитаемой
Слитые абзацы 1 В тексте присутствуют одиночные переводы строк (enter) вместо вставки пустой строки (двойной enter)
Не все заголовки корректны, т.е. соответствуют формату == Название раздела == 1 или 2 Т.е. когда идет обучение разбиению на разделы
Количество открывающих [[ не равно количеству закрывающих ]] 1 или 2 Т.е. когда идет обучение ссылкам
Cоотношение количества символов русского алфавита к общему количеству символов минус служебные символы меньше определённой величины 1, 2 или 3 Текст (предположительно) на русском языке
Списки оформляются не с помощью * или #, в них используются enter или <br> 1 или 2 Не используются списки вида 1., 2. ...

Т.е. когда идет обучение спискам (если новичок их применяет в статье)

Есть ссылки вида http://ru.wikipedia.org/ или им подобные типа http://ja.wikipedia.org/ 2
Не используется буква ё там, где она нужна 2 или 3 Как это проверять?
* Можно так, как это делает гаджет-ёфикатор. А можно по дюжине тестовых строк, вроде "определен", "_учёный"
Есть подпись 2 или 3 --~~~~
* В статьях подпись не требуется. --Томасина 13:13, 29 марта 2015 (UTC)[ответить]
Объём статьи меньше определённого минимума 1, 2 или 3 1700 символов
Есть неуместные шаблоны 2 {{хорошая статья}}, {{user}} и т.д. Шаблоны молча удаляются, новичок предупреждается.
Объём текста статьи не достигает определённого минимума (не учитывается содержимое шаблонов, заголовки, категории, интервики, <!-- скрытое содержимое-->) 1, 2 или 3 1000 символов (< 150 / < 300 / < 1 000) знаков

Возможный текст сообщения от бота:

  • Размер текстовой части статьи составляет ..., что (< 150 / < 300 / < 1 000) знаков. Рекомендуем либо дополнить статью, либо обсудить оптимальные варианты с одним из помогающих Инкубатора. Подробнее см. Википедия:Минимальные требования.
Присутствуют скрытые блоки <!-- --> 2 или 3 Не учитываются подсказки из шаблонов-заготовок статей, например <!-- Начинайте писать ниже этой строки -->, они просто молча удаляются.

Скорее, даже 3 шаг, т.е. когда новичок вполне обучился - подсказки ему уже не нужны, можно удалять. На шагах 1, 2 - все же новичок еще сырой и подсказки могут быть ему нужны.

  • Дело в том, что некоторые помещают весь текст или параметры шаблонов-карточек в <!-- --> с закономерным результатом. Так что это лучше во 2 шаг, подсказки, согласен, нужно убирать на 3 шаге.
Количество открывающих [ не равно количеству закрывающих ] 2 или 3 Очень редко используются. Содержимое <source> проверять нет смысла.
Нет сносок и шаблона {{примечания}} 3
Нет ни одной категории 2 или 3
Все категории есть в списке неточных категорий 2 или 3 "Категория:Персоналии по алфавиту", "Категория:Компании", "Категория:Ныне живущие", "Категория:Наука", "Категория:Всё" и т.д.
В статье нет ни внешних ссылок, ни {{книга}}, ни {{статья}} 3 Я побоялась включать этот пункт, но в такой формулировке, пожалуй, соглашусь. --Томасина 13:08, 29 марта 2015 (UTC)[ответить]
Ссылки в основной массе ведут на форумы, youtube, facebook и т.д. 3 {{Airm/Есть бесполезные ссылки}}{{Airm/Много бесполезных ссылок}}, проверяется по списку сайтов
Есть шаблон-карточка "персона" 3 нужно заменить специализированным шаблоном (при возможности)
Есть "в Украине" 3 {{Airm/Украина}}
* Против, но аргументов, пожалуй, нет. --Томасина 13:08, 29 марта 2015 (UTC)[ответить]
Есть ссылки на интернет-магазины 3 Два вопроса: как узнать по ссылке магазин и что, если статья о магазине? --Томасина 13:08, 29 марта 2015 (UTC)[ответить]
Размер статьи больше определённого максимума 3 80000 символов (> 100 000 / > 50 000 / > 30 000) знаков
  • Нет смысла в ограничении максимального размера статьи.--Томасина 13:08, 29 марта 2015 (UTC)[ответить]
    • А как же ВП:РС?
      • Для 3-го этапа - данная проверка может быть полезной. Но не как "ошибка", а как "тема, которую следует обсудить с помогающими Инкубатора", т.к. понять "Возможные исключения" и прочие тонкости: что лучше "ужимать воду из статьи" или "делить статью на части" или "оставить как есть" - новичок имхо явно не сможет. Samal 14:00, 31 марта 2015 (UTC)[ответить]

Возможный текст сообщения:

  • Размер текстовой части статьи (> 100 000 / > 50 000 / > 30 000) знаков. Возможно, её следует ужать или разделить на две или более подстатей. Подробнее см. ВП:РС. Рекомендуем обсудить оптимальные варианты с одним из помогающих Инкубатора перед переносом статьи в основное пространство.
Предположительно, есть проблемы со стилем 3 Проверяется наличие слов и фраз из списка ненейтральных выражений. Практика показывает, что в этом вопросе бот ошибается редко.
Есть фразы, указывающих на территориальную принадлежность читателя 3 {{Airm/Привязка к государству}}
Есть фразы, становящихся ложными со временем 3 {{Airm/Привязка ко времени}}
Излишнее цитирование 2 Опыт показывает, что новички оформляют цитаты как угодно, но не с помощью {{начало цитаты}}{{конец цитаты|источник=}}, поэтому ожидать результативности от таких проверок не стоит.
После запятых и точек не всегда стоит пробельный символ или точка или цифра 2-3 Не проверяется содержимое тегов <source> и адреса сайтов.
Проверка на избыточное количество ссылок 2 или 3 Пример избыточной ссылочности: [1] - ссылка на Ливерпуль (футбольный клуб) встречается раз 10 и делает текст "излишне синим".

Вариант текста сообщения от бота:

Применение несуществующих шаблонов 2
Категории не в нижней части страницы 2

1-й этап проверки

править

Топик стал большим, поэтому сделал отдельный раздел.

Когда работал с новичками, то одним из "не сложных, но очень нудных" была работа с "не читаемыми тестами". Поэтому первый этап проверки - сделать текст читаемым. Пусть пока без разделов и без много чего еще, но хотя бы читаемым. Это обычно является самым начальным в освоении, самым базовым и сильно облегчает работу проверяющим (это даже не первый, а "нулевой" уровень знаний новичка, когда встречается совсем зелененький). Я бы отнес к этому этапу следующее:

1 этап

  • Количество открывающих {{ равно количеству закрывающих }} - Да, точно, это важно, иначе вся разметка слетает... хотя совсем новички не пользуются шаблонами.. но можно тут оставить, на 1 этапе, ибо это "разметка" и "читабельность текста" и без этого невозможен дальнейший корректный анализ текста
  • Теги br вне шаблонов не встречаются
  • Строки, не находящиеся внутри тега source, не начинаются с пробела
  • Слитые абзацы (не понял, что это такое, пример ситуацию не прояснил) не встречаются - вот, например: Инкубатор:Малинкович (с разделением на абзацы) и тот же самый текст, но без пустых строк - весь текст сливается в один монолит.. даже это читать сложно, а, бывает, новичок и 10-20-50 Кб текста так напишет, без разделения...
  • Нет нумерованных списков (вреда в них не вижу) Ну, можно вынести на некий "плуторный этап".. хотя все же оставил бы тут, чтобы новичок сразу понял, что "не надо ставить пустые строки, если идет список через * или #". По поводу "вреда" - задача Инкубатора обучить новичка всем базовым вещам... пользоваться или нет - он дальше сам решит, наша задача - обучить базовому инструментарию.

Если все предыдущие условия выполнены, статья признаётся пригодной для 2 этапа проверки, в противном случае запрос снимается, новичку объясняется смысл проблемы.

Потом перейдет на 2-3 этапы

  • Текст на русском, то есть соотношение символов русского алфавита к общему количеству символов минус служебные символы больше определённой величины Да, возможно, это важно.. хотя.. наверное, все же на 2-3 этап..
  • Объём статьи больше определённого минимума размер - что минимальный, что максимальный я бы вынес куда-нибудь на 2-3 этап обучения. Пусть для начала хотя бы основы разметки освоят...
  • Объём текста статьи больше определённого минимума (не учитывается содержимое шаблонов, заголовки, категории, интервики, <!-- скрытое содержимое-->)
  • Заголовки всех уровней корректны, т.е. соответствуют формату == Название раздела ==
  • Нет ссылок вида http://ru.wikipedia.org/ и им подобных типа http://ja.wikipedia.org/
  • Количество открывающих [[ равно количеству закрывающих ]]

Samal 21:42, 28 марта 2015 (UTC)[ответить]

PS. Я понял, почему у нас порядок проверки получился разный. Если работаю как патрулирующий - то, да, мне важно оценить размер статьи и т.п. Но если я обучаю новичка, то мне важно его именно обучить. Причем начать с самых простых вещей. А с плохо оформленным текстом - работать крайне тяжело (убегающие за экран строки, огромные массивы монолитного текста...). К тому же, если новичок начинает писать текст, то пусть с первых строк учится хотя бы базовым вещем. Иначе, получается, что он написал 2 строки текста (и не верно их оформил) - мы пишем "давай еще хотя бы 5 строк" - он их дописывает и тоже не верно оформляет.. потом ему все это переоформлять.. Гораздо лучше (и ему потом меньше переделывать), если он сразу начнет верно делать хотя бы простейшие базовые вещи. Samal 22:08, 28 марта 2015 (UTC)[ответить]

  • 1 Этап - это отсеивание статей, которые в принципе непригодны для проверки. Какой смысл обучать новичка разметке, если у него статья пустая? А если она на английском, а автор по-русски не говорит? (Такое бывает, надо, наверно, писать в таких случаях объяснять ситуацию по-английски.) Нужно сначала эти вопросы решить, потом перейти к основным проблемам разметки и оформления (2 этап), потом к оставшимся проблемам. --AJZ 09:31, 29 марта 2015 (UTC)[ответить]
  • В случае поэтапной проверки нужен бот, работающий часто. Сейчас бот запускается вручную с ноутбука, лучше бы его перенести на ресурс типа Wikimedia Labs, способный работать с Java. --AJZ 09:31, 29 марта 2015 (UTC)[ответить]
  • Коллеги, у нас вообще никак не обозначено наличие хоть каких-то источников. Вряд ли это для первого этапа, но уж на втором-то должно быть. --Томасина 09:26, 29 марта 2015 (UTC)[ответить]
    • И я позволю себе сделать заготовку итоговой таблички, а то по тексту трудно выуживать сухой остаток. --Томасина 09:29, 29 марта 2015 (UTC)[ответить]
      • Указал ряд планируемых и уже используемых функций, про источники там есть, указал возможные варианты распределения по этапам функций, о распределении которых пока нет согласия. --AJZ 11:44, 29 марта 2015 (UTC)[ответить]
        • Я так поняла, что коллега AJZ высказался по поводу имеющихся потенциально пригодных инструментов для проверки содержимого статей. Однако Инкубатор - особая среда, и не всё здесь годится. Повычёркиваю (с комментариями, конечно) неприменимое, с моей точки зрения. Прошу без обид, если коллеги со мной не согласны, не стесняйтесь снимать тэги. Думаю, с обсуждениями по пунктам обойдёмся форматом таблицы и отдельные разделы на каждый пункт создавать не надо? --Томасина 13:01, 29 марта 2015 (UTC)[ответить]
  • Мне не кажется, что при автопроверке должен сниматься запрос на проверку. Бот несёт лишь вспомогательную функцию, он не может заменить живого человека. Например, если перспективный новичок напишет неплохую статью, выбрав хорошие источники, выдержав правильный стиль, но запутается в открывающих и закрывающих скобках и бот будет "мариновать" его на первом этапе, то ему это может надоесть и он уйдёт. Другой пример: добросовестный новичок начал писать на заведомо незначимую тему. Если он потратит много времени на оформление статьи, которая будет удалена, это тоже снизит его мотивацию. Вообще, оформление вторично, его со временем осваивают почти все. Гораздо важнее научить правильно подбирать источники и писать соответствующий правилам текст. -- Алексей Ладынин 16:44, 29 марта 2015 (UTC)[ответить]
    • А ещё очень важно правильно подписываться. Мне трудно представить себе новичка, который может всё то, что Вы написали, но при этом пугается бота, обижается и уходит из-за невозможности исправить непарные скобки. Большинство из них всё-таки выходит на форум с традиционным вопросом «доколе?» --Томасина 16:55, 29 марта 2015 (UTC)[ответить]
      • Образованный и давно пользующийся Википедией человек обычно примерно представляет, как должен быть написан текст и какие источники нужно использовать. А вот в скобках и другой разметке он может поначалу запутаться. -- Алексей Ладынин 17:55, 29 марта 2015 (UTC)[ответить]

Пожелания приняты в обработку. --AJZ 10:54, 26 апреля 2015 (UTC)[ответить]

После итога

править

Коллеги, для того, чтобы позволить боту более конкретно сообщать новичкам об обнаруженных ошибках необходимо будет отказаться от шаблона {{airm}}. Все замечания боту нужно будет писать прямым текстом, т.е. вместо

{{airm|...}}

писать:

Статья прошла автоматическую проверку, обнаружены следующие проблемы:
 * ...
 * ...
 ...
 * ...
 Автоматическая проверка не может выявить все недостатки статьи, в частности те, которые связаны со [[Википедия:КЗ|значимостью]] и [[ВП:ПРОВ|проверяемостью]]. Возможно, впоследствии будут выявлены другие недостатки. Замечания имеют отношение только к версии статьи, имеющейся на момент публикации замечания. {{Я - бот}} {{{подпись|}}} | {{Статья из Инкубатора}} Здесь были написаны замечания, но раз статья не в инкубаторе, то они, скорее всего, не актуальны. --~~~~

Таким образом, объём страниц обсуждения увеличится. Есть возражения? --AJZ 19:21, 28 апреля 2015 (UTC)[ответить]

То есть всё это сообщение будет начинаться с {{#ifeq: {{NAMESPACE}} и заканчиваться фигурными скобками? NBS 22:30, 28 апреля 2015 (UTC)[ответить]
Нет конечно, оно будет начинаться и заканчиваться также, как обычные реплики участников. Подстановка шаблона производиться не будет, текст будет формироваться самим ботом. --AJZ 19:27, 29 апреля 2015 (UTC)[ответить]
Тогда у меня есть сомнения, что столь развёрнутые тексты, большей частью или полностью потерявшие актуальность, нужны на СО в основном пространстве. NBS 14:44, 30 апреля 2015 (UTC)[ответить]
  • Есть 4 варианта:
  1. ничего с ними не делать
  2. удалять вручную при переносе
  3. удалять ботом после переноса
  4. помечать как закрытое обсуждение или помещать их в сворачиваемый блок

--AJZ 07:00, 3 мая 2015 (UTC)[ответить]

По поводу увеличения объема СО - не вижу больших препятствий. Мы когда плотно беседовали с новичками - СО порой были весьма объемными. Я бы больше упирал на "удобство", "понятность" и т.п.. а объемы - это имхо дело не даже не десятое и не двадцатое, а где-то сотое.Если это не будут сотни Кб.. но это, как понимаю, не предполагается, значит все ОК. --Samal 13:24, 30 апреля 2015 (UTC)[ответить]
  • Возможно, имеет смысл при переносе статьи в ОП автоматически прятать под спойлер все разделы, инициированные ботом? А может быть, и вообще всё, что было написано на СО за время нахождения в Инкубаторе. --Томасина 15:53, 3 мая 2015 (UTC)[ответить]
    • Автоматически — инициированные ботом (я бы вообще это убирал); совсем уж всё лучше не прятать — например, на СО может быть обсуждение значимости, допустимых источников и т. п. между очень даже живыми участниками. NBS 18:25, 4 мая 2015 (UTC)[ответить]

Статистика статей Инкубатора

править
  • а_как_посмотреть_статистику-сколько_статей_создано_в_инкубаторе?--Saramag 16:09, 20 марта 2015 (UTC)[ответить]
    • Можно посмотреть Категория:Статьи проекта Инкубатор, но там не все, по причине, которую я вам объяснил чуть раньше. --AJZ 14:47, 21 марта 2015 (UTC)[ответить]
      • В последнее время подобная статистика не собиралась. Ранее в 2010-11 годах была сделана огромная работа, в которой пытались учесть все факторы (удаленные в Инкубаторе, перенесенные в ОП и удаленные, перенесенные в ОП и возвращенные, перенесенные из ОП на доработку, многократно удаленные на одном общем названии, и прочие тонкости), результаты этой работы в целом отражены на странице и подстраницах Проект:Инкубатор/Статистика (инструменты на тулсервере правда уже канули в лету), есть отчет за год существования Проект:Инкубатор/Инкубатору 1 год, и по выкладкам из баз данных на тулсервере (который канул в лету) Samal проводил некоторый анализ работы Инкубатора и строил различные графики за 2011 год - Проект:Инкубатор/Статистика 2011. На настоящий момент ситуация конечно могла уже существенно измениться. Возможно когда-нибудь попозже я попробую заняться этой темой на Лабсе и автоматизировать сбор статистики по базам данных, но когда у меня будет такая возможность не знаю. Dmitry89 (talk) 15:20, 21 марта 2015 (UTC)[ответить]
        • Теоретически, можно попробовать написать скрипт, который бы делал следующее:
          1. Запрос к логу/журналу переименований, где исходное пр-во ns=102 (Инкубатор), а пр-во назначения либо ns=0 (статьи), либо все пр-ва. И сохранял бы выборку во временную базу.
          2. Дальше можно показать либо весь список статей, либо группировать с разбивкой по годам, либо по месяцам, например, в виде таблички.
Это не даст автоматическую обработку более ранних статей, т.к. отдельное пр-во было создано только в 2011 году. Кроме того не будут учитываться разные тонкости и "сложные случаи", типа того, что описал выше Дмитрий. Но точность около 10%, думаю, вполне можно получить. Зато скрипт должен получиться довольно простой и для оценочных прикидок - вполне приемлемый. Samal 06:09, 24 марта 2015 (UTC)[ответить]