Инвертированный индекс: различия между версиями
[непроверенная версия] | [непроверенная версия] |
Содержимое удалено Содержимое добавлено
источники, дополнение, викификация, стилевые правки |
MBHbot (обсуждение | вклад) м c латинская |
||
Строка 8:
Опишем как решается задача нахождения документов в которых встречаются все слова из [[поисковый запрос|поискового запроса]]. При обработке однословного поискового запроса, ответ уже есть в инвертированном индексе — достаточно взять список, соответствующий слову из запроса. При обработке многословного запроса берутся списки, соответствующие каждому из слов запроса и пересекающиеся.
Обычно в [[
== Пример ==
Строка 30:
== Особенности применения в реальных поисковых системах ==
В списке вхождений слова в документы помимо id документов обычно также указываются факторы ([[TF-IDF]], бинарный фактор: «попало слово в заголовок или не попало», другие факторы), которые используются при ранжировании.
Индекс может строиться не по всем [[словоформа
[[
== См. также ==
|