Эта страница — эссе о Википедии |
Вкратце: Процесс вымирания ссылок может оставить информацию без источников, но есть способы ослабить его негативные последствия. Не удаляйте информацию только потому, что URL источника больше недоступен. |
Как и большинство крупных сайтов, Википедия страдает от вымирания ссылок (англ. link rot): ссылки на источники постепенно перестают работать (такие ссылки называются мёртвыми) или ведут на не соответствующие запросу веб-страницы, так как сайты, на которых они расположены, исчезают, меняют структуру, обновляют содержание. Это явление представляет некоторую угрозу правилам о проверяемости и о цитировании источников, которых придерживается Википедия.
Предотвращение вымирания ссылок требует гораздо меньше усилий, чем их восстановление или замена. Профилактические меры, таким образом, улучшают энциклопедию. В данном эссе изложены стратегии по предотвращению вымирания ссылок, прежде чем оно произойдёт.
Существует несколько способов профилактики, в том числе:
Редакторам статей рекомендуется добавлять архивную ссылку для каждой сноски, или, как минимум, выполнить саму архивацию URL источника[комм. 1], одновременно с добавлением или же обновлением источника.
Однако предотвратить вымирание ссылки можно не всегда. Данное руководство рассказывает, как можно смягчить ущерб от вымирания ссылок с помощью поиска существующих архивных версий источника или аналогичных материалов.
Не удаляйте сноску c источником только потому, что его URL более недоступен. Правило ВП:ПРОВ не требует, чтобы каждая сноска вела на доступный источник, да и вообще не говорит о доступности источника в Интернете.
За исключением ссылок в разделе «Ссылки», которые не используются для подтверждения какого-либо материала статьи, не удаляйте ссылку исключительно потому, что её адрес больше не работает. Существуют возможности и инструменты для восстановления и исправления мёртвых ссылок.
Как предотвратить появление мёртвых ссылок
правитьЕсть несколько способов предупредить появление мёртвых ссылок. Первый способ: при редактировании статьи добавлять ссылку на источник с дополнительными сведениями: заголовок материала, авторство, издателя и дату публикации, а не просто голый URL. Дополнительно можно указать дату последней проверки (|accessdate =
) веб-страницы. Если страница исчезнет, дополнительные сведения позволят будущему редактору или читателю Википедии найти альтернативный источник оригинального текста, в сети или в отпечатанном виде. Некоторые городские библиотеки также имеют подписки на цифровые базы данных или межбиблиотечные соглашения, что делает более легким получение и поиск труднодоступных источников. При наличии только мёртвого URL это вряд ли будет возможно.
При редактировании, если встретите голый URL в списке источников, добавьте к нему дополнительные сведения или, по крайней мере, обозначьте шаблоном {{голые ссылки}} (= потенциально мёртвая ссылка) для напоминания, что необходимо добавить дополнительные сведения об источнике.
Сервисы веб-архивирования
правитьВторой способ предотвратить смерть ссылки — это использовать службы веб-архивирования. Наиболее популярный сервис — это Wayback Machine, который автоматически сканирует и архивирует множество веб-страниц, а также имеет форму для ручного архивирования определённого URL-адреса[комм. 1]. Этот сервис собирает и сохраняет веб-страницы для использования в будущем, даже если исходная веб-страница перемещается, изменяется, удаляется или размещена на сайте с платным доступом. Веб-архивирование особенно важно при цитировании с нестабильных или склонных к изменениям веб-страниц, таких, как чувствительные ко времени новостные статьи или страницы, размещённые на сайте, не поддерживаемом организацией со стабильным финансированием. Если у вас есть URL для архивной версии веб-страницы, используйте параметры |archiveurl =
и |archivedate =
в используемом вами шаблоне для источников. Шаблон автоматически добавит заархивированную ссылку в примечания.
- Dubner, Stephen J. Wall Street Journal Paywall Sturdier Than Suspected . The New York Times Company (24 января 2008). Дата обращения: 28 октября 2009.
- Dubner, Stephen J. Wall Street Journal Paywall Sturdier Than Suspected . The New York Times Company (24 января 2008). Архивировано 15 августа 2011 года.
Тем не менее не все веб-страницы могут быть заархивированы. Веб-мастера и владельцы сайтов могут использовать стандарт исключений для роботов на своем сайте, чтобы отключить архивацию, или использовать сложный JavaScript, Flash или другой код, который не сможет быть легко скопирован. В этих случаях могут быть доступны альтернативные методы для сохранения данных.
Robots.txt
правитьПричуда в работе Wayback Machine в том, что архивные копии страниц иногда становятся недоступными, например, блог Freakonomics, ранее размещенный на freakonomics.blogs.nytimes.com
. Но затем эти URL-адреса были исключены из архивации с помощью файла robots.txt, который настроил себе New York Times. Это имело неблагоприятный эффект — ранее архивированный контент оказался недоступен. Но вновь внесенные изменения в robots.txt могут отобразить то, что уже скрыли предыдущие его изменения, поэтому не удаляйте архивный URL только потому, что архивный контент в настоящее время недоступен. К счастью, в приведённом примере не только можно найти содержание на новом сайте, который до сих пор открыт для архивирования, но и robots.txt сайта впоследствии был изменён, что разрешило архивацию, и поэтому старые архивы вновь отображаются (пример).
Альтернативные методы
правитьНекоторые шаблоны для источников имеют параметр |quote =
, который может быть использован для хранения текстовых цитат с исходного материала. Данный параметр может быть использован для хранения ограниченного количества текста из источника в шаблоне цитирования. Это особенно полезно для источников, которые не могут быть заархивированы сервисами веб-архивирования. Параметр также может обеспечить «страховку» при отключении или временной недоступности выбранного сервиса веб-архивирования.
- Dubner, Stephen J. Wall Street Journal Paywall Sturdier Than Suspected . The New York Times Company (24 января 2008). — «...the Wall Street Journal will not, as has been widely speculated, tear down its paywall entirely...». Архивировано 30 апреля 2008 года.
При использовании параметра |quote =
выбирайте наиболее краткий и соответствующий материал, который по возможности сохранит контекст самого примечания. Хранение полного текста с источника не согласуется с политикой защиты авторских прав, так что выбирайте только самые важные части текста, которые максимально поддерживают утверждения в статье Википедии.
Цитата также поможет в поиске других онлайн-версий источника, в том случае, если оригинал более недоступен.
В случае необходимости, материалы в общественном достоянии могут быть скопированы в Викитеку.
Восстановление мёртвых ссылок
правитьЕсть несколько способов попытаться восстановить мёртвую ссылку, они подробно описаны ниже.
Поиск по сайту
правитьЧасто веб-страницы просто перемещаются в связи с миграцией на новый сервер или в процессе общего обслуживания сайта. «Каталог сайта», «карта сайта» или какая-нибудь специфическая функция поиска по сайту могут помочь найти перемещённую страницу (та же страница и сайт, всё ещё доступна и можно найти через поисковики, только url или имя страницы изменились).
Сайт может блокировать отдачу страниц в определённые регионы (напр. us сайты), при этом открываясь из других регионов. Вновь настроенный https может быть сделан для адресов с/без www и старые адреса с www тогда показывают ошибку, но доступны без www.
Поисковая система
правитьЗапрос в поисковой системе с использованием заголовка страницы, возможно, с ограничением поиска по тому же сайту, также может помочь найти страницу. Используя дальнейшие примеры, поисковой запрос (например, в Google, Yahoo и др.) может выглядеть так:
site:freakonomics.blogs.nytimes.com/ "Wall Street Journal Paywall Sturdier Than Suspected"
site:nytimes.com/ "Wall Street Journal Paywall Sturdier Than Suspected"
"Wall Street Journal Paywall Sturdier Than Suspected"
Кроме того, часто плодотворен поиск по некоторым частям мёртвой ссылки с удаленной пунктуацией; например такой поиск через Google
приводит к странице, позволяющей исправить это. Также поиск по необычной или уникального вида части URL (например, просто имя файла, указанное в конце URL), часто бывает плодотворен.
Архивы Интернета
правитьПроверьте заархивированные версии страницы на сервисах архивирования. Если вы нашли архивную версию мёртвой ссылки, дважды убедитесь, что источник по-прежнему подтверждает текст статьи. Также неплохая идея — это ознакомиться с датой доступности источника (если она была указана, или поискать по истории, когда ссылка была добавлена), чтобы сравнить актуальность по времени архивной версии ссылки и версии, когда ссылка была добавлена.
Надёжными считаются следующие сервисы архивирования:
- Wayback Machine на http://archive.org/web/
- UK Government Web Archive[англ.] на http://webarchive.nationalarchives.gov.uk/
Также рекомендуется проверять наличие архивной копии страницы на сайтах:
- archive.today на http://archive.today
- WebCite на http://www.webcitation.org/query (работает с длительными перебоями)
Интерфейс Mementos позволяет осуществить поиск архивных версий некоторых страниц на сразу нескольких сервисах архивирования одним запросом с использованием протокола Memento[англ.]. К сожалению, интерфейс на веб-странице Mementos удаляет любые параметры, которые включены в URL. Если URL-адрес содержит «?», то он вряд ли будет работать должным образом при введении вручную, без изменений. При вводе URL в интерфейс Mementos вручную, наиболее распространённое изменение — необходимость изменить «?» на «%3F». Хотя только этого изменения не будет достаточно во всех случаях, в большинстве случаев работать оно будет. Букмарклет в таблице ниже позволяет правильно кодировать URL-адреса таким образом, чтобы поиск работал. Mementos выглядит, или, по крайней мере, будет очень удобным. Однако, если архивы не найдены на Mementos, это не должно быть для Вас истиной в последней инстанции. Mementos иногда не возвращает никаких результатов, даже если архивы существуют на сайтах, которые он обычно обрабатывает. Пример этого — попытка найти архивы страницы «Битва за Атлантику» в английской Википедии. На апрель 2014 года Archive.org сообщает, что в нём есть 63 или 64 копии этой страницы (https, http). В отчетах же Mementos 0 архивов (https и http). Mementos обычно находит архивы на Archive.org, но иногда он не показывает их даже тогда, когда они существуют. Если вы используете Mementos впервые, то не думайте, что архивов на самом деле не существует, если он сообщает, что их нет.
Когда доступны несколько архивов по различным датам, попробуйте использовать тот, который, скорее всего, сохранил в себе самое похожее содержание страницы, которую видел редактор, проставивший параметр |accessdate =
. Если этот параметр не задан, то можно выполнить поиск по истории изменений, чтобы определить дату, когда ссылка была добавлена в статью.
Просмотрите архив, чтобы убедиться, что он содержит достоверную информацию со страницы. Иногда архивы фактически содержат только подтверждение того факта, что ссылка умерла либо архивирование не удалось по другой причине. Если это так, попытайтесь использовать архив с другой датой[комм. 2]. Обычно следует выбирать даты ближе к тому времени, когда ссылка была размещена на странице Википедии, или ранее, она скорее всего покажет действительную информацию. Просмотрите также различные сайты веб-архивирования.
В ряде шаблонов для источников, архивные версии указываются с помощью параметров |archiveurl =
, |archivedate =
и |deadlink =
. Если проставлен параметр |deadlink = yes
, первичная ссылка автоматически заменяется на архивную. Это сохраняет исходный адрес ссылки источника.
Сайт-архиватор | Букмарклет |
---|---|
Archive.org | javascript:void(window.open('https://web.archive.org/web/*/'+location.href))
|
UKGWA | javascript:void(window.open('http://webarchive.nationalarchives.gov.uk/*/'+location.href))
|
WebCite (работает с перебоями) | javascript:void(window.open('http://www.webcitation.org/query.php?url='+location.href))
|
Wikiwix | javascript:void(window.open('http://archive.wikiwix.com/cache/?url='+location.href))
|
Интерфейс Mementos | javascript:void(window.open('http://www.webarchive.org.uk/mementos/search/'+encodeURIComponent(location.href)+'?referrer='+encodeURIComponent(document.referrer)))
|
Альтернативы мёртвой ссылке
правитьМожет случиться, что все попытки восстановить ссылку окажутся неудачными. В этом случае, рассмотрите возможность нахождения альтернативного источника, так, чтобы потеря оригинала не навредила проверяемости статьи. Альтернативные источники о широких темах, как правило, легко найти. Простой запрос в поисковой системе может помочь найти подходящую альтернативу, но будьте предельно осторожны, чтобы не процитировать зеркала и форки самой Википедии, которые бы нарушали Википедия:Проверяемость.
Иногда найти подходящий источник не представляется возможным или требует более обширных методов исследования, таких, как посещение библиотеки или использование базы данных на основе подписки. Если это так, попробуйте проконсультироваться с редакторами Википедии на страницах Проект:Библиотека или Википедия:Форум/Вопросы. Кроме того, можете попытаться наладить контакты с экспертами или же другими заинтересованными редакторами в соответствующих Вики-проектах.
Сохраняйте мёртвые ссылки
правитьНеработающий, неархивированный URL-источник по-прежнему может быть полезным. Мёртвая ссылка указывает на то, что в прошлом информация была (вероятно) не голословна, и ссылка может предоставить другому участнику, с бо́льшими ресурсами или опытом, достаточное количество информации, чтобы найти ссылку. Кроме того, ссылка может внезапно «воскреснуть из мёртвых». По мёртвой ссылке можно определить, была ли она процитирована в другом месте, или, например, можно связаться с лицом, ответственным за первоначальный источник. Например, можно обратиться на компьютерный факультет Йеля, если http://www.cs.yale.edu/~EliYale/Defense-in-Depth-PhD-thesis.pdf (недоступная ссылка) станет недоступной, умрёт. Шаблон {{dead link}}, если это возможно, вставляйте после мёртвого URL и непосредственно перед тегом </ref>
, оставив первоначальную ссылку нетронутой.
Простановка {{dead link}} автоматически категоризирует статью в категорию проекта Статьи с нерабочими ссылками, а также в определённые категории по месяцам на основе параметра |date =
. Не удаляйте URL-адрес только потому, что он в течение длительного времени был помечен шаблоном {{dead link}}.
Боты и автоматические инструменты
правитьВ настоящее время в разделе Википедии на русском языке работает InternetArchiveBot, сокращенно IABot, архивирующий мертвые ссылки.
Инструменты
править- Интерфейс управления IABot — иструмент, позволяющий архивировать ссылки на определённой странице с помощью IABot.
- LinkChecker — это инструмент с открытым исходным кодом, который может сканировать любой сайт на наличие сломанных ссылок, в том числе и Википедию.
Вымирание ссылок на Википедию на внешних сайтах
правитьВнешние сайты также восприимчивы к вымиранию ссылок. После переименования или удаления страниц, ссылки на страницы Википедии с других сайтов могут сломаться. В большинстве случаев переименования страницы на старой странице будет оставлен редирект — это не вызовет проблем. Но если страница была полностью удалена или узурпирована (то есть заменена другим содержимым), то ссылка вымрет на всех внешние сайтах, которые ссылались на неё.
Замена содержимого страницы на содержимое страницы значений все ещё может привести к вымиранию ссылки, но это менее вредно, поскольку страница значений является по существу типом мягкого перенаправления и в итоге позволит привести читателя к необходимой теме. Если страница узурпирована другой темой, которая имеет такое же название, можно разместить специальный шаблон в верхней части страницы со ссылкой, которая направит читателей к необходимому исходному содержанию, но уже на новой странице — это опять-таки является типом мягкого перенаправления, но менее очевидным. В этих случаях, читатели, которые приходят в Википедию благодаря внешней поломанной ссылке, должны быть в состоянии найти то, что они ищут, но таких ситуаций лучше избегать, из-за того что им приходится «проходить» через дополнительную страницу. Это потенциально создаёт плохое впечатление как о Википедии, так и о ссылающемся на неё сайте.
Невозможно сказать, сколько, если таковые имеются, внешних веб-страниц будет затронуто в результате перемещения или удаления страницы, но риск появления мёртвой ссылки, вероятно, будет самым большим при работе со старыми, статусными и популярными страницами. На самом деле, здесь мало что можно сделать; обслуживание внешних сайтов не входит в обязанности участников, в большинстве случаев из-за предела наших возможностей (хотя, если что-то может быть исправлено, было бы полезно сделать это). Тем не менее, это может быть хорошей практикой — думать о потенциальном воздействии на другие сайты, когда удаляются или перемещаются страницы Википедии, особенно если не останется перенаправления или шаблона значений. Если перемещение или удаление страницы, как ожидается, нанесет существенный ущерб, то это может быть одним из доводов для обсуждения на ВП:КПМ или ВП:КУ, хотя другие доводы могут иметь больший вес.
См. также
править- Википедия:Как заархивировать источники в статье? — инструкция по использованию сервиса Wayback Machine
- Using the Wayback Machine[англ.] — инструкция по использованию Wayback Machine на английском
- Список интернет-архивов в английской Википедии[англ.]
- Википедия:Голые ссылки — эссе
- Википедия:Ссылки на источники#Предотвращение и восстановление мёртвых ссылок — раздел руководства Википедии, по предотвращению и восстановлению мёртвых ссылок для источников
- Википедия:Шаблоны/Библиография — список библиографических шаблонов, шаблонов для источников
- Архивирование веб-сайтов
- Список кодов состояния HTTP
- Служебная:Поиск ссылок — поиск определённых ссылок по всем страницам Википедии
Примечания
править- ↑ 1 2 На странице https://archive.org/web/ следует ввести URL и нажать кнопку «Browse history». Если веб-страница по данному URL уже заархивирована, то в результате отобразится календарь со ссылками на архивные копии содержимого по этому URL. Если веб-страница по данному URL не существует, вместо этого отобразится надпись «Wayback Machine doesn’t have that page archived». Если веб-страница по данному URL существует, но ещё не заархивирована, то отобразится приглашение её заархивировать «This page is available on the web! Help make the Wayback Machine more complete! Save this url in the Wayback Machine». Текст приглашения не появляется, если доступ к странице ограничен для роботов или имеют место проблемы с соединением.
- ↑ В некоторых случаях архивная копия может дольше загружаться, нужно подождать. Также может помочь использование другого браузера или нажатие кнопки «обновить» (стандартно F5 для Microsoft Windows).
Ссылки
править- weblinkchecker.py — скрипт от Python Wikipedia Bot коллекционирует найденные сломанные ссылки.
- Internet Archive