Поиско́вая систе́ма или поиско́вый движо́к — алгоритмы и реализующая их совокупность компьютерных программ, предоставляющая пользователю возможность быстрого доступа к необходимой ему информации при помощи поиска в обширной коллекции доступных данных. Одно из наиболее известных применений поисковых систем — веб-сервисы для поиска текстовой или графической информации во Всемирной паутине. Существуют также системы, способные искать файлы на FTP-серверах, товары в интернет-магазинах, информацию в группах новостей Usenet.
Информационный язык — специализированный искусственный язык, используемый в различных системах обработки информации. От информационных языков следует отличать языки программирования, машинные языки и формализованные языки науки. Обычно различают:
- информационно-логический язык — язык для информационно-логических систем, в первую очередь — языки представления знаний и языки баз данных ;
- информационно-поисковый язык — знаковая система, предназначенная для описания основного смыслового содержания текстов (документов) или их частей, а также для выражения смыслового содержания информационных запросов с целью реализации информационного поиска. Примером информационно-поискового языка является язык библиографического описания, который служит средством идентификации текстов и используется в алфавитных каталогах, картотеках и библиографических указателях. В его составе — библиографические элементы. Другим примером информационно-поискового языка являются языки обращений к поисковым системам Yandex или Google.
Справочная система предназначена для получения пользователем максимально точной (релевантной) информации по интересующей его/её теме. Обычно выбор статьи происходит по иерархии разделов справки. Справочные системы часто комбинируются с поисковыми, где выборка релевантных статей определяется по заданным ключевым словам или частью предложения.
Поиско́вая оптимиза́ция — комплекс мероприятий по внутренней и внешней оптимизации для поднятия позиций сайта в результатах выдачи поисковых систем по определённым запросам пользователей, с целью увеличения сетевого трафика, потенциальных клиентов и последующей монетизации этого трафика. SEO может быть ориентировано на различные виды поиска, включая поиск информации, товаров, услуг, изображений, видеороликов, новостей, адресов, контактов и специфические отраслевые поисковые системы.
Информацио́нный по́иск — процесс поиска неструктурированной документальной информации, удовлетворяющей информационные потребности, и наука об этом поиске.
Страница результатов поиска или поисковая выдача — веб-страница, генерируемая поисковой системой в ответ на поисковый запрос пользователя.
TREC — серия конференций, сконцентрированных на исследовании различных областей информационного поиска и их задач. Конференция поддерживается NIST и ARDA, расположенных в США, начиная с 1992. Целью TREC является поддержка исследований сообщества информационного поиска с помощью предоставления инфраструктуры, необходимой для развития его технологий.
Извлечение информации — это задача автоматического извлечения (построения) структурированных данных из неструктурированных или слабоструктурированных машиночитаемых документов.
Поисковая машина — комплекс программ, предназначенный для поиска информации. Обычно является частью поисковой системы.
Библиографический указатель — общий термин для обозначения нескольких видов библиографических пособий, то есть списков опубликованных документов, объединённых каким-либо признаком и снабжённых вспомогательными индексами, облегчающими поиск и группировку материалов.
Релева́нтность в информационном поиске — соответствие интента, заложенного в запросе и выдачи в поисковой системе, полученной в результате этого запроса. Пользователь, который вводит запрос в поисковую систему ожидает, что результаты будут соответствовать намерению, которое он заложил в запросе, иными словами он получит релевантную выдачу.
Поисковая бомба — феномен функционирования поисковой системы, когда какой-нибудь запрос приводит к выдаче абсурдного или провокационного результата. Поисковые бомбы иногда являются случайной ошибкой поисковой системы, но многие из них, особенно связанные с острыми социальными и политическими конфликтами, провоцируются искусственно. Для этого используется техника поискового спама. Релевантность поисковой выдачи искажается из-за прописывания ссылок с ключевыми словами.
Web Mining — это использование методов интеллектуального анализа данных для автоматического обнаружения веб-документов и сервисов, извлечения информации из веб-ресурсов и выявления общих закономерностей в Интернете.
«Я́ндекс» — поисковая система, принадлежащая российской корпорации «Яндекс», основной продукт компании.
Ранжи́рование — сортировка сайтов в поисковой выдаче, применяемая в поисковых системах. Существует множество факторов для ранжирования, среди которых можно отметить рейтинг сайта, количество и качество внешних ссылок, релевантность текста к поисковому запросу, на основании которых поисковая система формирует список сайтов в поисковой выдаче. Алгоритм ранжирования того или иного поисковика меняется в процессе его функционирования.
Google Search Appliance — масштабируемое аппаратное решение, позволяющее организовать автономный внутрикорпоративный поиск по документам и информационным ресурсам компании в локальной сети.
AskNet — российская интеллектуальная метапоисковая система, первая вопросно-ответная система в Рунете. Вопросно-ответная поисковая система система AskNet предназначена для поиска текстовой информации по запросу пользователя на естественном языке. В настоящее время поиск ответов на вопросы пользователей поддерживается для русско- и (или) англоязычных запросов пользователей и текстов. Проект стартовал в 1999 году в ООО «Стокона». Вопросно-ответная поисковая система AskNet Search принимала участие и заняла первое место в тестах дорожки вопросно-ответного поиска конференции РОМИП в 2006 году.
Семантический поиск — способ и технология поиска информации, основанная на использовании контекстного (смыслового) значения запрашиваемых фраз, вместо словарных значений отдельных слов или выражений при поисковом запросе. Улучшение результатов поиска при обработке запросов достигается за счет более точной интерпретации поисковых намерений пользователя.
Релева́нтность в информационной науке и информационном поиске означает степень соответствия найденного документа или набора документов информационным нуждам пользователя.
Среднеобратный ранг (MRR) — статистическая оценка откликов процесса на запросы, упорядоченных по вероятности и правильности. Характеризует эффективность информационного поиска. Обратный ранг в данном случае означает обратное число номера (ранга) первого правильного ответа в списке откликов. Среднеобратный ранг определяется как среднее обратных рангов по всем запросам Q: