Автоматическое получение размеченного корпуса: различия между версиями

[отпатрулированная версия][отпатрулированная версия]
Содержимое удалено Содержимое добавлено
исправлена опечатка
Строка 41:
* Также, с недавних пор проводятся исследования по изучению возможности использования Википедии для разрешения многозначностей, перечисленных на страницах значений многозначных слов<ref>Denis Turdakov, Pavel Velikhov. Semantic Relatedness Metric for Wikipedia Concepts Based on Link Analysis and its Application to Word Sense Disambiguation // SYRCoDIS.— 2008.</ref><ref>Турдаков Денис. Устранение лексической многозначности терминов Википедии на основе скрытой модели Маркова // XI Всероссийская научная конференция «Электронные библиотеки: перспективные методы и технологии, электронные коллекции».— 2009. [http://rcdl2009.krc.karelia.ru/doc/full_text/267_275_Section08-1.pdf зав (russian)]</ref>.
 
Однако, возможности, открывающиеся и предоставляемые интернетом, ещё не до конца исследованы. К примеру, малоизвестно как использовать лексическую информацию, полученную с помощью knowledge-based систем разрешения многозначности; и также непонятно каким образом получать из интернета [[битекст|параллельные корпусы]], хотя и эффективные алгоритмы для обработки таких корпусов уже существуюсуществуют. Следовательно, следует ждать в этой области ещё многих интересных результатов в ближайшем будущем.
 
== Примечания ==