Корпусная лингвистика: различия между версиями

[отпатрулированная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
Строка 55:
===Открытый корпус русского языка===
[[Файл:operncorpora_interface.png|thumb|Интерфейс системы разметки Открытого корпуса русского языка]]
Интерес представляет проект [http://opencorpora.ruorg открытого корпуса русского языка], который не только использует опубликованные под свободными лицензиями тексты, но и позволяет любому желающему принять участие в лингвистической разметке корпуса. Такая форма [[краудсорсинг | краудсорсинга]] стала возможной благодаря разбиению задачи разметки на небольшие задания, с которыми может справиться человек без специальной лингвистической подготовки.<ref name="opencorpora">{{статья|автор=Бочаров В.В., Грановский Д.В.|заглавие=Программное обеспечение для коллективной работы над морфологической разметкой корпуса|ссылка=http://opencorpora.org/doc/articles/2011_CorpusLing.pdf|язык=ru|издание=Труды международной конференции «Корпусная лингвистика – 2011»|место=Санкт-Петербург|издательство=СПб.: С.-Петербургский гос. университет, Филологический факультет|год=2011}}</ref> Корпус постоянно пополняется, все тексты и программное обеспечение, связанные с ним доступны под лицензиями [[GNU GPL|GNU GPL v2]] и [[CC-BY-SA]].
 
== См. также ==