Автоматическое получение размеченного корпуса: различия между версиями
[отпатрулированная версия] | [отпатрулированная версия] |
Содержимое удалено Содержимое добавлено
Soshial (обсуждение | вклад) →Итог: дополнение, перевод доделан до конца |
Structor (обсуждение | вклад) более не распознаётся как изолированная статья, removed: {{изолированная статья|кольцо2}} с помощью AWB |
||
Строка 1:
Если методы [[обучение без учителя|обучения без учителя]] в [[Word-sense disambiguation|проблеме разрешения многозначности]] полагаются на неаннотированный (неразмеченный) [[корпус]], то [[обучение с учителем]] коренным образом зависят от размеченного корпуса тестов. Проблема получения достаточного количества знаний является одной из самых главных преград в реализации высокоэффективных алгоритмов [[обучение с учителем|обучения]]. Однако, если алгоритм реализуется не такими крупными с точки зрения ресурсов мероприятиями, как Senseval, а более мелкая, то в подобных случаях возможность получить качественно размеченный корпус не представляется возможным из-за огромных трудозатрат, которые необходимы для осуществления этого процесса вручную. Поэтому, перед исследователями, нуждающимися в подобных корпусах, встала задача получения размеченного корпуса автоматически.
|