Обсуждение Википедии:Размер статей

Активные обсуждения

30kПравить

    • Идот, посмотри, пожалуйста на историю правок этой статьи. Моя ли это идея про 30 kB? В голосовании по хорошим и избранным статьям я руководствовался значением в 50 kB. Более того, речь шла не об ограничении, а о критерии, который я лично рассматриваю как непоследний при голосовании за избранные статьи. Не более того. Mashiah 14:27, 6 апреля 2007 (UTC)
Критерия ограничения в 50кб в Википедии нет. Пока его нет, твои голоса Против ничего не значат, а лишь раздражают авторов статей, вложивших в них свой большой труд. Вот примут такое правило, тогда и апелируй к нему, голосуя против.--Soul Train 18:49, 6 апреля 2007 (UTC)
На странице голосования приводятся мнения, а не вердикты. Я ссылаюсь на данную страницу, поскольку она содержит существенные обоснования для разделения статей. Если бы это было правилом, голосование было бы излишним, и статья подлежала бы разделению без разговоров. Моё мнение такое, твоё другое. Необоснованной мою позицию назвать сложно. Mashiah 08:31, 7 апреля 2007 (UTC)

скажу как пользователь модемаПравить

при использования через модема, легче и удобнее скачать большую статью в 100k и читать её off-line, чем 20 статей по 5k+вес стандартной шапки с навигацией, причём из-за шапки в конченом итоге одна большая статья будет весить меньше чем 20 мелких статей (Idot 12:06, 6 апреля 2007 (UTC))

  • при использовании модема 20 мелких статей не только будут открываться медленнее (ая плачу именно за время), но и весить будут больше (из-за шапки с навигацией которая идёт довсеком к каждой статье) Idot 12:06, 6 апреля 2007 (UTC)
    • Верно, если нужно просмотреть все 20 статей, и неверно, если нужно скачать только одну. Mashiah 14:28, 6 апреля 2007 (UTC)
      • если эту одну нужную разбили 20 мелких, то для чтения в off-line придётся качать все 20 мелких :-( Idot 14:35, 6 апреля 2007 (UTC)
вот я сейчас читаю подряд все статьи про буддизм, написанные на ру-Вики. Приходится всё, что есть на главной странице портала, загружать, бешено возвращаясь туда-сюда, потом перехожу в автономный режим, сохраняю страницы, переношу в свой КПК и читаю. Если бы страниц бло меньше, для меня, как модемщика, было бы намного удобнее, но что делать... Так что уж лучше одна огромная стья, чем куча мелких, однозначно. А вот как раз для тех, у кого выделенка, и кто не имеет представления об автономном режиме, тому как раз могут быть более удобны множество страниц. Но, как аргументировали выше, это уже не будет статья, а просто какой-то набор ссылок.--Soul Train 18:46, 6 апреля 2007 (UTC) сказанно в Обсуждение Википедии:Кандидаты в хорошие статьи#скажу как пользователь модема
Я принимаю аргумент об удобстве для тебя, как для модемщика. Однако в числе обоснований, данных на странице, присутствуют и другие соображения. Mashiah 08:33, 7 апреля 2007 (UTC)
Были ведь высказаны и другие возражения в ответ на «другие соображения» и Вы с ними ознакомились, но так ничего и не ответили, кроме того, что перенесли обсуждение сюда. Перенесите сюда и возражения, ответьте на них, будем обсуждать дальше.EvgenyGenkin 08:59, 7 апреля 2007 (UTC)

реальный пример мелкой статьиПравить

Mashiah, встречное предложение выдвинуть Латы в хорошие (а лучше в избранные) статьи и посмотреть что будет (статья написанная мной и изначально запланированна как список перенаправлений на другие более подробные статьи) Idot 10:39, 6 апреля 2007 (UTC)

Ну, это, конечно, перебор. Очень похоже на дизамбиг. Всё-таки, какая-то общая информация о том, что известно о появлении этих доспехов и их модернизации со ссылками на приведённые статьи была бы очень полезна. Mashiah 14:23, 6 апреля 2007 (UTC)
будет в статье белый доспех, так как это самый первый тип латного доспеха (Idot 14:36, 6 апреля 2007 (UTC))
Значит в статье нужно будет так и написать, мол, первым видом латного доспеха были .... итд. То бишь, нужна обобщающая информация. Mashiah 14:41, 6 апреля 2007 (UTC)

Как узнавать размер статьиПравить

Хотелось бы увидеть здесь яснее и подробнее о том, как таки узнавать вики-размер статьи. Написано что-то про поиск, но честно говоря я ничего не понял. --Koryakov Yuri 14:02, 10 апреля 2007 (UTC)

Я поработал над разделом «Как находить длинные статьи», надеюсь так понятнее. — Alex Smotrov 14:37, 10 апреля 2007 (UTC)
включил в раздел "что включать в видимый текст" перевод с английского об определении размера видимого текста + характерный пример с Городами Австрии в "редкие исключения". И предлагаю поразмыслить над определениями - основное тело, видимый текст, мб основная часть как в англвики. словосочетание видимый текст более соответствует именно всему тексту, включая примечания.--Bopox 09:42, 26 апреля 2007 (UTC)
Вообще-то «сообщения о превышении лимита в 32кб» больше нет ни у нас, ни в enwiki, так что не стоит наверное об этом писать в первом абзаце первой секции ∴ Alex Smotrov 14:09, 26 апреля 2007 (UTC)
это изначально висело, я не добавлял, только переставил предложения местами. а сообщение о размере есть ведь, но я не знаю сколько - 100 кб может быть?--Bopox 14:19, 26 апреля 2007 (UTC)
Действительно, просто переставил... прошу прощения. А какие сообщения есть сейчас можно увидеть, заглянув в код MediaWiki:Longpagewarning и вызываемых оттуда шаблонов: если статья > 50, то «Возможно, имеет смысл разбить…», если страница обсуждения > 70, то «Возможно, следует переместить часть обсуждения в архив…» ∴ Alex Smotrov 14:35, 26 апреля 2007 (UTC)

Размер статей и UTF-8Править

Мне кажется, что уважаемые коллеги забывают одну существенную техническую деталь: в Википедии применяется кодировка UTF-8, которая отличается переменной длиной кодирования. Символы английского алфавита (ASCII 0-128) кодируются 1 байтом, символы кириллицы - двумя (максимальная длина кода - 8 байт). Поэтому нужно учитывать следующие факторы:

  • Для статей, в которых большая часть текста на английском размер в байтах и число символов (практически)совпадают. В статьях на русском, байтов примерно вдвое больше, чем знаков (очень легко убедится скопировав текст из окошка редактиривания и записав его как ASCII в Notepad-е). Очевидно, что в правилах взятых из ен-Вики речь идет именно о числе знаков.
  • Размер, который с недавнего времени показывают в истории правок - это размер в байтах.

Вывод: нужно внести соответствующие уточнения и разъяснения в проект правил. Если возражений не поступит я сделаю это завтра. Lev 17:19, 20 мая 2007 (UTC)

Коллеги не забывают эту деталь, и против уточнений, думаю, никто возражать не будет. В принципе, во всех местах нужно чётко указать, какой конкретно размер имеется в виду: html или вики кода, в знаках или байтах. Кстати, ещё один (по-моему не упомянутый) размер указан прямо в html внутри тега <!-- --> ∴ Alex Smotrov 21:16, 20 мая 2007 (UTC)

Странная фразаПравить

Недавно (в середине 2006 года) была обнаружена проблема с последней версией Mozilla Firefox

И какая, позвольте спросить, в 2006 году была последняя версия? --Ильич 21:57, 16 января 2008 (UTC)


Как находить длинные статьиПравить

В разделе под таким названием (1) повторяется инфа, изложенная выше, (2) рассказывается о том, как находить не длинные, а короткие статьи. В чем смысл? wulfson 14:41, 18 января 2008 (UTC)

Название разделаПравить

Sasha l полагает, что по-русски правильно будет назвать его "Читательские соображения" (надо полагать, чтобы в случае необходимости легче было перевести его на английский).

Я думаю, что приемлемым будет соответствующее содержанию раздела название "Статья с точки зрения читательского восприятия".

Каковы будут мнения?

wulfson 15:59, 18 января 2008 (UTC)

Длинновато. Может, что-нибудь вроде «Статья в читательском восприятии».--Alma Pater 19:49, 18 января 2008 (UTC)
Спорить не буду. wulfson 20:59, 18 января 2008 (UTC)

Порядок расчета размераПравить

Совершенно не понравился следующий раздел, но решил обсудить, прежде чем поправить:

Обособленные материалы, которые можно не учитывать как текст

  • разделы «Литература», «Библиография», «Примечания», «См. также», «Ссылки» и другие;
  • изображения, графики и диаграммы;
  • таблицы и списки;
  • внешние и внутренние ссылки;
  • вики- и HTML разметка, форматирование;
  • содержание и заголовки.
  1. Почему использована формулировка "можно не учитывать"? Это ведь не десяток байт разницы. Учитывая или не учитывая такие данные, можно получать размеры, отличающиеся в разы, что неизбежно повлечет споры в оценке размера статей.
  2. Изображения, графики и диаграммы - суть одно и то же, объединяемое словом "изображения".
  3. Что касается списков, то их лучше убрать. Если пункты списка представляют собой развернутый текст, то в этом отношении они мало чем отличаются от обычных абзацев и не должны вычленяться из основного тела статьи. Если же список представляет собой простое перечисление, то его объемом можно пренебречь, чтобы в данном случае не заниматься формалистикой в определении "развернутый - не развернутый".
  4. Внешние и внутренние ссылки. Внешние ссылки находятся в разделе "внешние ссылки", лишнее повторение. Внутренние ссылки из текста вычистить нельзя, так как это сам текст и есть.
  5. вики- и HTML разметка, форматирование - в видимом тексте всего этого нет, зачем о них упоминать?
  6. заголовки — тоже следует отнести к основному телу статьи.

С учетом вышесказанного, предлагаю данный подраздел изложить в следующей редакции:

Материалы, не учитываемые как текст:

  • содержание и шаблоны;
  • таблицы, изображения, галереи и подписи к ним;
  • справочные разделы: "Примечания", "Литература", "Внешние ссылки", "См. также" и аналогичные им;
  • категории и служебные отметки (дата последнего изменения, лицензия и т. п.).

Также следует убрать из текста правила такую условную категорию как "10 печатных страниц", иначе нужно расписывать, что подразумевается под печатной страницей (шрифт, кегль, поля, интервалы и так далее).

В общем, в старой версии правил порядок расчета как-то лучше разъяснялся, в этой версии многие моменты почему-то опустили. Например, из чтения этой версии сложно понять, что в расчет идет именно конечная откомпилированная страница, а не ее вики-код; что размер кода, показываемый в истории правок, слабо коррелирует с размером статьи и т. д. --DENker 22:02, 15 февраля 2008 (UTC)

Сама идеология правила была пересмотрена с изменением реалий. Технические параметры отошли на второй план. Уже нет тех браузеров со старыми ограничениями. На первом месте стоит удобство читателя, а оно определяется размером чистого текста статьи. Этот размер мало связан с байтами страницы. Тут 2 причины -- размеры шаблонов и таблиц, как вы правильно заметили могут вносить огромные поправки, а вторая: юникодное кодирование не равномерно. Поэтому чистый текст (если это нужно) следует считать буквально, однако делать это имеет смысл лишь в спорных случаях. (Например, для вычисления длины статьи Урарту я кинул в редактор текст страницы, пробежался по нему, удалив форматирование и таблицы, и глянул на счетчик числа символов. Процедура заняла у меня 10 минут). Надеюсь, что вам был полезен мой комментарий. EvgenyGenkin 22:14, 15 февраля 2008 (UTC)
Спасибо за комментарий, но я только не понял, зачем вы мне это объясняли :) я это и так знаю. Мне бы хотелось знать мнение по поводу поправок. --DENker 22:37, 15 февраля 2008 (UTC)
Я не возражаю по поводу поправок. EvgenyGenkin 18:17, 22 февраля 2008 (UTC)

СноскиПравить

Не понял, почему не отображаются. Поправил, но все равно не видно. Посмотрите кто-нибудь свежим взглядом. --DENker 18:56, 24 марта 2008 (UTC)

ПравилоПравить

Это же руководство, почему в начале стоит шаблон {{правило}}? --Dstary 02:41, 9 апреля 2008 (UTC)

ограничения на размерПравить

Скажите, почему такие огромные статьи считаются нормой в википедии (скорее не нормой, а ориентиром для стремления). Лично мое имхо, что они сильно завышены. Какой средний размер в других энциклопедиях? Кстати в английской версии страницы, тыс знаков - на 10 тыс больше. Т.е. ещё выше... --speakus 17:05, 23 апреля 2008 (UTC)

про 50 000 знаков и другие замечанияПравить

  1. нет возможности точно пересчитать знаки в байты - что значит нет возможности? Для конкретного текста это легко посчитать, для абстрактного текста это с небольшой погрешностью тоже не сложно посчитать.
  2. в связи с техническими особенностями кодирования символов разных алфавитов - каких ещё разных алфавитов? 99% видимого текста любой статьи Русской Википедии - это кириллица, о каких ещё алфавитах идёт речь?
  3. 50000 - Эти цифры про количество знаков мало чего дают, очень расплывчатый ориентир. Кто мне скажет, как таким ориентиром пользоваться? Я, как и большинство участников не имеет представления, как считать эти знаки, да ещё и только "видимый текст". Гаджета такого я не видел, сторонние средства для этого применять? Не сильно это критичный вопрос, чтобы считать с точностью до единиц. Никто здесь ничего не считает. Предлагаю добавить ещё одну колонку с нормальным ориентиром, указанным в килобайтах для полного размера средне-статистической статьи с источниками и шаблонами. ~Нирваньчик~ øβς 09:32, 16 ноября 2012 (UTC)
  • Там есть ссылка на Википедия:Работа с длинными статьями#Размер статей в байтах и количество знаков. --wanderer 10:24, 16 ноября 2012 (UTC)
  • Копируете текст (без примечаний и прочих служебных разделов), кидаете в MS Word - и смотрите статистику. Слов, знаков с пробелами и без таковых.--Pessimist 14:13, 16 ноября 2012 (UTC)
    • Действительно. Хороший способ, правда у меня нет MS Word, у меня Open Office, но он тоже отображает. Спасибо за совет. ~Нирваньчик~ øβς 14:55, 16 ноября 2012 (UTC)
  • 99% видимого текста любой статьи Русской Википедии - это кириллица, о каких ещё алфавитах идёт речь? - а при чём здесь видимый текст, когда считается объём кода ? Процентов 20-30 (и меняется в широких пределах) кода большинства статей составляют латинские символы, цифры, пробелы и ASCII-знаки препинания, которые в ЮТФ-8 кодируются одним байтом; кириллические символы - двумя, употребляющиеся в некоторых статьях символы крупных алфавитов типа японского - тремя. Поэтому нет точного коэффициента перевода размера в байтах в размер в символах. MaxBioHazard 15:10, 16 ноября 2012 (UTC)
Можно легко посчитать приблизительный, то бишь усреднённый коэффициент. Количество ASCII-символов будет варьироваться, по моему, в диапазоне 5-10% от всего текста, +-5% это не сильно большая разбежка, а в заголовке столбца можно указать, что число приблизительное. Зато оценить, насколько твоя статья большая, можно будет одним взглядом - открыть историю. ~Нирваньчик~ øβς 16:05, 16 ноября 2012 (UTC)
Вообще, я написал это возражение к тому, что фраза из Правил вызывает некоторое недоумение, говоря о "разных алфавитах". Но это лишь придирка, можно не придавать этому значение. Меня интересует чисто цифры, которые мало здесь кто соблюдает и считает, разбиение статьи делается хм.гм. как это сказать, по ощущению и по собственному предпочтению, т.е. на глаз. Если какой-то фрагмент слишком большой, его выделяют. Или наоборот, несколько кусков склеивают воедино. Эти цифры, они мне из-за этого кажутся бесполезными и почти не влияющими. Если указать размер в килобайтах для всей статьи, то это хотя бы дало ориентиры. Глянул и можно уже говорить, большая статья или нет. В данное же время я гляжу на размер статьи - 50Кб и не могу сказать сколько это. Ладно, ребята, я вижу всем здесь всё-равно. Я посчитаю эти числа для себя и буду пользоваться ими 1. ~Нирваньчик~ øβς 16:16, 16 ноября 2012 (UTC)
      • Количество ASCII-символов будет варьироваться, по моему, в диапазоне 5-10% от всего текста, +-5% это не сильно большая разбежка - в каком-нибудь списке лучших музыкальных альбомов за такой-то год, где названия и альбомов, и студий, и заголовки рефов будут записаны латиницей, а текста почти не будет, однобайтных символов может быть более 80%. MaxBioHazard 16:21, 16 ноября 2012 (UTC)
      • Соотношение текст/код будет сильно варьироваться от обеспеченности статьи тщательно оформленными сносками. В некоторых случаях это может увеличить объем в байтах процентов на 15-30. Сужу по своим качественным статьям. Pessimist 09:08, 17 ноября 2012 (UTC)
  • Ограничение размеров статей в принципе может подразумевать совершенно разные вещи: сокращение количества "человекочитаемого" текста, который измеряется в количестве знаков и сокращение объема данных передаваемых с сервера, который измеряется в байтах. Между этими двумя величинами безусловно существует корреляция, но достаточно сложная, например включение в текст картинок существенно влияет на это соотношение. Видимо необходимо определиться, что собственно мы хотим обсуждать и ограничивать. По мере развития интернет-инфраструктуры ограничения на количество данных становятся все менее и менее осмысленными, и на мой взгляд имеет смысл забыть о килобайтах вообще говорить исключительно о том, что хорошо для читателя в плане удобства пользования энциклопедией и восприятия написанного в статьях. --Lev 15:54, 17 ноября 2012 (UTC)
    • «По мере развития интернет-инфраструктуры» возникает и противоположное явление: всё больше читателей на мобильных устройствах, у которых свои ограничения - не столько по скорости, сколько по размеру экрана, куцым браузера и т.п. проблемам с макетом. И как совместить ежа c ужом возможности современных широких экранов с ограничениями айфонов и ко. - ? Retired electrician (talk) 21:43, 7 декабря 2012 (UTC)
      • Фонд думает, что как-то так. Но и у мобильных устройств растут размеры и резолюции экранов, и браузеры вполне себе приличные. Я сам вполне себе с телефона и смотрю полную версию и даже, если очень нужно делаю правки. --Lev 22:30, 7 декабря 2012 (UTC)

О размерах статейПравить

У меня возникло 2 вопроса о размерах статей. 1 Моя личная страница участника размером примерно в 33 968 байта. Надо принимать какие-то меры? 2 Влияют ли подстраницы на размер одной главной страницы? Король умник 1 (обс.) 04:17, 5 марта 2020 (UTC)

Вернуться к странице проекта «Размер статей».