Поисковику Yandex 10 лет

На момент открытия робот (сетевой паук) успел обойти 5 000 серверов (около 4 Гб текстов). Уже в первой версии системы при индексировании проверялись на уникальность документов - это значит, что, если документ существует в нескольких кодировках и/или на нескольких зеркалах, в списке найденного он будет указан один раз (и, соответственно, один раз учтен в статистике).

Алгоритмы морфологического разбора, основанные на грамматическом словаре, умели нормализовать слова, то есть находить их начальную форму. Для неизвестных Яndex'у слов строится гипотетическая словарная статья, позволяющая обрабатывать (анализировать и синтезировать) такие слова аналогично известным.

Язык запросов (как и в других продуктах Яndex), помимо стандартных логических операторов (И, ИЛИ), включает оператор исключения (И НЕ), а также позволяет осуществлять поиск внутри абзаца, внутри документа, в заголовках и других полях, а также с указанием расстояния между словами. В дополнение к обычной практике Яndex - нормализации слов при индексации и поиске, реализован также запрос по точной словоформе. Язык запросов более подробно описан на странице http://yandex.ru/ya_detail.html.

Презентация поисковой машины Яndex-Web состоялась в четверг, 25 сентября 1997 года в 16.00 на выставке Softool.
Яндекс запустил платформу Промптхаб с идеями по применению и…
Яндекс представила онлайн‑платформу Промпт…
Родители смогут ограничить своим детям время просмотра Short…
Родители получили возможность вручную устанавливать лимит времени для просмотра YouTube Shorts в аккаунта…
Google разрешила переименовать почтовый ящик…
Компания Google анонсировала весьма крупное нововведение, связанное с фирменной электронной почтой Gmail.…
ИИ от Google теперь анализирует финансовый рынок и даёт сове…
Google продолжает неуклонно следовать своей стратегии внедрения искусственного интеллекта во все сервисы.…
Яндекс выяснил, с какими запросами россияне на новогодних ка…
В новогодние каникулы россияне заметно активнее использовали сервисы с искусственным интеллектом и чаще и…
Японские гиганты требуют от OpenAI прекратить их копирование…
Организация Content Overseas Distribution Association, представляющая интересы японских правообладателей,…
МегаОбзор
ЭЛ № ФС 77 - 68301. Выходные данные СМИ МегаОбзор
2006-2026
© MegaObzor