Википедия:Вики-конференция 2009/Программа/Доклады/О миссии языковых разделов Википедии, отличных от английского

В настоящее время в Википедии имеется более 260 языковых разделов, из них 24 содержат более ста тысяч статей, а 81 — более тысячи.[1] При этом многие участники сообщества владеют несколькоми языками, что позволяет им читать и править статьи на разных языках. В этой статье поднимается вопрос, как разделить усилия, чтобы получить максимальную выгоду для всего проекта. Статья организована следующим образом. В первой секции мы хотим подчеркнуть исключительную важность английского сегмента Википедии. После этого обсуждается миссия остальных языковых сегментов на примере русскоязычной Википедии, и делаются выводы.

Роль англоязычной Википедии править

Общепризнанно, что английский язык в настоящее время является языком международного общения. Благодаря долгому мировому доминированию сначала Британии, затем США, язык превратился в lingua franca для бизнеса, политики, науки, образования и Интернета.[2] В частности, английский сегмент Википедии развит значительно сильнее остальных. При этом спрос на него превосходит предложение: всего 22% статей написаны на английском языке, в то время как английский субдомен получает 52% трафика.[1] Такая разница может объясняться тем, что лишь для сравнительно небольшого процента владеющих английским языком людей он является родным, и навыки владения им достаточны для чтения, но не для написания статей.

Английский раздел Википедии, на самом деле, — больше, чем просто один из разделов. Он играет ключевую роль. Как правило, если статья присутствует в каком-нибудь из других языковых разделов Википедии, она есть и в английском. Обратное, конечно, неверно. Этим пользуются многие интервики-боты. Интервики — это система связи между статьями об одном понятии в разных разделах Википедии. Для того чтобы, например, на русской странице появились ссылки на статьи на других языках, достаточно связать её с аналогичной статьёй в английской Википедии, а остальные ссылки скопируются оттуда. Таким образом, английская Википедия выступает в роли интервики-хаба.

В теории баз данных есть понятие целостности информации. Оно вводится для обеспечения непротиворечивости данных (consistency). Если база данных допускает противоречия, это плохая база, потому что информация теряется. Целостность информации проще всего поддерживать запретом её дублирования. В Википедии всё происходит наоборот: считается, что статья должна быть продублирована на всех языках. Продублирована — не обязательно переведена. Существует масса противников перевода статей, даже если они высокого качества, а автоматический перевод статей в Википедии запрещён. Действительно, каждый языковой раздел индивидуален: у аудитории могут быть различные взгляды на некоторые проблемы в зависимости от культуры. Им противопоставляют то, что Википедия должна нести объективное знание, которое не зависит от языка. Этот спор также касается другого аспекта: нужно ли вообще развивать языковые сегменты, или проще всем людям выучить английский язык? Этому вопросу посвящена следующая секция.

Миссия остальных сегментов править

Нужны ли другие языковые сегменты, или лучше направить все усилия на развитие английского сегмента? Люди, которые знают язык на уровне, который позволяет им читать статьи (это около половины пользователей), вполне могут их писать, поскольку исправить грамматические ошибки гораздо проще, и это могут быстро сделать носители языка. И это важно — дать понять этим людям, что их вклад нужен сообществу. Но при этом остальные сегменты тоже должны развиваться, но несколько в другом направлении. Можно выделить категории статей, которые должны быть написаны на определённых языках.

Первая категория — это статьи про понятия, характерные для определённой культуры. Например, вряд ли в английской Википедии нужны статьи про все населённые пункты России. Кто может заинтересоваться сибирской деревней с населением в тысячу человек? Вероятно, её жители и обитатели её окрестностей, которым интересны история деревни, демография и структура занятости населения. Поскольку русский язык — официальный язык в России и его повсеместно учат в школах, то целевая аудитория понимает по-русски. С другой стороны, очень маловероятно, что кто-то извне России заинтересуется этой маленькой деревней в сибирской глуши. Поскольку всё население России вряд ли будет владеть английским в ближайшее время, то получаем, что 100% целевой аудитории понимает по-русски, и есть смысл создать статью про неё только в русской Википедии. То же касается, например, небольших организаций, звёзд шоу-бизнеса и других сущностей, специфичных для данной местности или культуры.

Вторая категория статей — образовательные статьи. Нужно учитывать, что английский язык не является родным для большого количества людей, а это значит, что перед тем, как человек его выучит, пройдёт некоторое время. Поэтому, скажем, в русской Википедии, должны быть статьи, написанные простым, понятным языком, так чтобы их смогли понять подростки. Они не должны быть настолько глубокими, как статьи английской Википедии, потому что детям нет смысла объяснять многие вещи на формальном и подробном уровне. Например, математическая статья не должна рассказывать о сумме, как об операции, введённой для абелевых групп, достаточно описать свойства конечных сумм чисел. Когда же подростки выучат английский, они смогут ознакомиться со всем формализмом. Конечно, не всем подросткам будет достаточно поверхностного изложения, но таких — меньшинство. Вспомним, что Википедия — не единственный источник знаний, и они, скорее всего, найдут способы узнать больше. Кроме того, сейчас уровень многих научных статей русской Википедии низок, как бы их не оценивать: хоть как научно-популярные статьи, которые мы предлагаем использовать, хоть как формальные и глубинные. На самом деле, эта модель хорошо ложится на существующую структуру Википедии: Википедия на упрощённом английском языке[3] решает проблему для английского языка, где, вообще говоря, требуются оба типа статей.

Третья категория статей, необходимых всем языковым разделам — статьи о научных терминах. В современной науке абсолютное большинство статей пишутся на английском языке, также на нём делаются доклады на конференциях. Но при этом в локальных университетах лекции часто читаются на местных языках, а одноязычным коллективам учёных проще обсуждать проблемы их области на родном языке. Часто в разговоре русских учёных на русском языке встречаются английские термины (это, кстати, касается также программистов, экономистов и других категорий людей). И проблема часто не в отсутствии терминологии. Дело в том, что люди читают английские статьи, слушают английские доклады, и они не знают русских переводов терминов, даже если они существуют. Механизм интервики позволяет за один клик получать русское название интересующего термина. При этом размер таких статей может не быть большим. Часто достаточно только определения понятия, чтобы удостовериться, что под этим русским термином понимается то же, что и под английским. Примером может служить термин BRDF[4], который означает функцию, характеризующую отражательные свойства материала. В переводе книги "Зрение роботов" 1989 года[5] использовался термин ДФОС (двулучевая функция отражательной способности). Со временем перевод забылся, и в настоящее время русская терминология снова перешла в разряд "не сформировавшейся". Так вот, если из английской статьи будет существовать интервики-ссылка, такой проблемы не возникнет (в настоящее время в русской Википедии статьи про BRDF нет совсем).

Выводы править

В данной статье мы обращаем внимание на исключительную важность английской Википедии для вики-сообщества и мира в целом и призываем людей активнее участвовать в её улучшении, даже если их уровень владения английским языком не совершенен. Также мы выделили три категории статей, которые при этом должны обязательно присутствовать в национальных Википедиях: это (a) статьи, специфичные для данной культуры, (b) статьи, полезные для образования подростков, которые должны быть написаны с учётом такого предназначения и (c) статьи-определения для научных терминов. Эта точка зрения представляет собой некоторый радикальный взгляд на проблему. Мы не пытаемся навязать всему сообществу эту миссию, мы просто хотим обратить внимание на текущее положение дел и дать повод задуматься о будущем.

Литература править

  1. 1 2 en:Wikipedia#License_and_language_editions
  2. Crystal, David. English as a Global Language. — Cambridge : Cambridge University Press, 1997. — ISBN 0-521-53032-6.
  3. simple.wikipedia.org
  4. http://en.wikipedia.org/wiki/BRDF
  5. Хорн Б. К. П. Зрение роботов: Пер. с англ. — M.: — Мир, 1989. ISBN 5-03-000570-6

Ссылка на презентацию