Автоматическое получение размеченного корпуса: различия между версиями

[отпатрулированная версия][отпатрулированная версия]
Содержимое удалено Содержимое добавлено
→‎Итог: дополнение, перевод доделан до конца
более не распознаётся как изолированная статья, removed: {{изолированная статья|кольцо2}} с помощью AWB
Строка 1:
{{изолированная статья|кольцо2}}
Если методы [[обучение без учителя|обучения без учителя]] в [[Word-sense disambiguation|проблеме разрешения многозначности]] полагаются на неаннотированный (неразмеченный) [[корпус]], то [[обучение с учителем]] коренным образом зависят от размеченного корпуса тестов. Проблема получения достаточного количества знаний является одной из самых главных преград в реализации высокоэффективных алгоритмов [[обучение с учителем|обучения]]. Однако, если алгоритм реализуется не такими крупными с точки зрения ресурсов мероприятиями, как Senseval, а более мелкая, то в подобных случаях возможность получить качественно размеченный корпус не представляется возможным из-за огромных трудозатрат, которые необходимы для осуществления этого процесса вручную. Поэтому, перед исследователями, нуждающимися в подобных корпусах, встала задача получения размеченного корпуса автоматически.