Информационный поиск: различия между версиями

[непроверенная версия][отпатрулированная версия]
Содержимое удалено Содержимое добавлено
Нет описания правки
откатил орисс
Строка 1:
'''Информацио́нный по́иск''' ({{lang-en|Information retrieval}}), нахождение информации, выборка информации — процесс [[поиск]]а ''неструктурированной'' документальной [[информация|информации]], удовлетворяющей {{нп3|Информационная потребность|информационные потребности|en|Information needs}},{{sfn|Manning et al|2011|pp=23|name=Manning2011}} и [[наука]] об этом [[поиск]]е.
 
Приобрел выдающееся значение в связи с широчайшим распространением электронных средств коммуникации, сделавшим поиск информации обычным занятием всех пользователей. Предметом извлечения информации стало, тем самым, всё, что накоплено в культуре человечества на протяжении всей его истории. Неадекватность реакции на историю, предстающую таким образом, выражается в мифологизаторской редукции происходящего к своим так или иначе понимаемым «историческим корням», архетипам, скрытым в глубокой древности «истокам».
 
 
== История ==
Термин «informationинформационный retrievalпоиск» был впервые введён [[Кельвин Мур|Кельвином Муром]] в [[1948]] в его докторской диссертации, опубликован и употребляется в литературе с [[1950]].
 
Термин «information retrieval» был введён [[Кельвин Мур|Кельвином Муром]] в [[1948]] в его диссертации, опубликован и употребляется в литературе с [[1950]].
 
Сначала системы автоматизированного ИП, или [[поисковые системы|информационно-поисковые системы]] (ИПС), использовались лишь для {{стиль фразы 2|управления [[информационный взрыв|информационным взрывом]] в научной литературе}}. Многие [[университет]]ы и публичные [[библиотека|библиотеки]] стали использовать ИПС для обеспечения доступа к книгам, журналам и другим документам. Широкое распространение ИПС получили с появлением сети [[Интернет]]. У русскоязычных пользователей наибольшей<ref>[http://analyzethis.ru/?analyzer=from&lang=ru&location=ru Переходы - ANALYZETHIS.RU<!-- Заголовок добавлен ботом -->]</ref> популярностью пользуются [[поисковые системы]] [[Яндекс.Поиск|Яндекс]], [[Google (поисковая система)|Google]] и [[Поиск@Mail.Ru|Mail.Ru]].
Строка 22 ⟶ 18 :
 
== Виды поиска ==
 
[[Полнотекстовый поиск]] — поиск по всему содержимому документа. Пример полнотекстового поиска — любой интернет-поисковик, например [[Яndex|www.yandex.ru]], [[Google (поисковая система)|www.google.com]]. Как правило, полнотекстовый поиск для ускорения поиска использует предварительно построенные [[поисковый индекс|индексы]]. Наиболее распространенной технологией для индексов полнотекстового поиска являются [[инвертированный индекс|инвертированные индексы]].
 
Строка 32 ⟶ 27 :
 
=== Адресный поиск ===
 
Процесс поиска документов по чисто формальным признакам, указанным в запросе.<br />
Для осуществления нужны следующие условия:<br />
Строка 40 ⟶ 34 :
 
=== Семантический поиск ===
 
Процесс поиска документов по их [[Содержание (литература)|содержанию]].
 
Строка 56 ⟶ 49 :
 
=== Документальный поиск ===
 
Процесс поиска в хранилище информационно-поисковой системы [[первичный документ|первичных документов]] или в [[база данных|базе данных]] вторичных документов, соответствующих запросу пользователя.
 
Строка 64 ⟶ 56 :
 
=== Фактографический поиск ===
 
Процесс поиска фактов, соответствующих информационному запросу.<br />
К фактографическим данным относятся сведения, извлеченные из документов, как первичных, так и вторичных и получаемые непосредственно из источников их возникновения.
Строка 127 ⟶ 118 :
где <math>D_{rel}</math> — это множество релевантных документов в базе, а <math>D_{retr}</math> — множество документов, найденных системой.
 
=== Выпадение (falloutfall-out) ===
 
Выпадение характеризует вероятность нахождения нерелевантного ресурса и определяется, как отношение числа найденных нерелевантных документов к общему числу нерелевантных документов в базе: