Обсуждение проекта:Качество/Анализ 2006
Последнее сообщение: 18 лет назад от Tassadar в теме «Просьба»
И как там успехи на ниве ботостроения и статейсчитания? Когда ожидается торжественный запуск первого в истории русской Википедии бота-счетовода?--Ctac (Стас Козловский) 08:33, 9 сентября 2006 (UTC)
- Проблемы: в БД Toolserver-а нет текста, сейчас выясняю у Юрика, выдержит ли его Query API и сервера получение текстов всех статей. Это всё определённо займёт ещё некоторое время. — Ed 10:41, 9 сентября 2006 (UTC)
- Тексты всех статей можно взять здесь. Там как раз сегодня дамп сделали. --Zserghei 10:56, 9 сентября 2006 (UTC)
- Я не йог качать такой объём при цене на трафик 2р/метр (не забывайте, я всё-таки студент, и расходы на трафик для меня весьма весомы). А на Toolserver-е с квотой 256 метров я эти архивы просто не распакую. — Ed 12:25, 9 сентября 2006 (UTC)
- Я могу запустить бота у себя, всё равно я периодически скачиваю последнюю версию дампа. --Zserghei 12:51, 9 сентября 2006 (UTC)
- Я написал на скорую руку скрипт, вычисляющий сколько в основном пространстве статей без редиректов, дат, годов, статей о числах, статей с менее 3 ссылками, статей длиной < 500 байт, и без шаблонов {{disambig}}", «{{vfd}}», «{{delete}}», «{{cleanup}}», «{{wikify}}», «{{POV}}», «{{орисс}}», «{{copyvio}}», «{{cleanup-rewrite}}», «{{бот}}». Для дампа от 7 августа получилось 57 397 полноценных статей. —Zserghei 21:35, 9 сентября 2006 (UTC)
- Классно! Но основная проблема — это огромное количество статей, созданных ботам, которые потом никто не редактировал — статьи о галактиках, о большинстве фильмов, метеоритах, сотовых телефонах, лекарствах, а также статьи из ЭСБЕ. Не на всех из них стоит шаблон «бот» --Ctac (Стас Козловский) 09:08, 10 сентября 2006 (UTC)
- Я написал на скорую руку скрипт, вычисляющий сколько в основном пространстве статей без редиректов, дат, годов, статей о числах, статей с менее 3 ссылками, статей длиной < 500 байт, и без шаблонов {{disambig}}", «{{vfd}}», «{{delete}}», «{{cleanup}}», «{{wikify}}», «{{POV}}», «{{орисс}}», «{{copyvio}}», «{{cleanup-rewrite}}», «{{бот}}». Для дампа от 7 августа получилось 57 397 полноценных статей. —Zserghei 21:35, 9 сентября 2006 (UTC)
- Я могу запустить бота у себя, всё равно я периодически скачиваю последнюю версию дампа. --Zserghei 12:51, 9 сентября 2006 (UTC)
- Я не йог качать такой объём при цене на трафик 2р/метр (не забывайте, я всё-таки студент, и расходы на трафик для меня весьма весомы). А на Toolserver-е с квотой 256 метров я эти архивы просто не распакую. — Ed 12:25, 9 сентября 2006 (UTC)
- Тексты всех статей можно взять здесь. Там как раз сегодня дамп сделали. --Zserghei 10:56, 9 сентября 2006 (UTC)
- Для дампа от 9 сентября получилось 62 901 статей. Теперь надо чётко выработать параметры, по которым анализировать статьи, и можно будет делать отчёт. —Zserghei 09:41, 10 сентября 2006 (UTC)
- Ура! Табличка просто супер!--Ctac (Стас Козловский) 21:27, 10 сентября 2006 (UTC)
Просьба
правитьКак видно у нас огромное количество некатегоризированных статей, но при этом имеющих разные пометки вроде стаба и поэтому отсутствующих на служебной странице. Нельзя ли на основе полученный статистики все эти статьи ботом сунуть в категорию Категория:Статьи без категорий или поставить на них какой-нибудь шаблон, который добавит их в эту категорию, чтобы потом можно было их все руками категоризировать? --Tassadar 10:52, 16 сентября 2006 (UTC)