Поисковику Yandex 10 лет

На момент открытия робот (сетевой паук) успел обойти 5 000 серверов (около 4 Гб текстов). Уже в первой версии системы при индексировании проверялись на уникальность документов - это значит, что, если документ существует в нескольких кодировках и/или на нескольких зеркалах, в списке найденного он будет указан один раз (и, соответственно, один раз учтен в статистике).

Алгоритмы морфологического разбора, основанные на грамматическом словаре, умели нормализовать слова, то есть находить их начальную форму. Для неизвестных Яndex'у слов строится гипотетическая словарная статья, позволяющая обрабатывать (анализировать и синтезировать) такие слова аналогично известным.

Язык запросов (как и в других продуктах Яndex), помимо стандартных логических операторов (И, ИЛИ), включает оператор исключения (И НЕ), а также позволяет осуществлять поиск внутри абзаца, внутри документа, в заголовках и других полях, а также с указанием расстояния между словами. В дополнение к обычной практике Яndex - нормализации слов при индексации и поиске, реализован также запрос по точной словоформе. Язык запросов более подробно описан на странице http://yandex.ru/ya_detail.html.

Презентация поисковой машины Яndex-Web состоялась в четверг, 25 сентября 1997 года в 16.00 на выставке Softool.
Microsoft добавила ИИ в Блокнот в Windows 11…
Компания Microsoft тестирует функцию ИИ-обобщения информации текстового формата в «Блокноте». В обновлени…
OpenAI выпустила инструмент для ИИ-агентов…
Будущее искусственного интеллекта определённо связано с ИИ-агентами, и OpenAI делает шаг в этом направлен…
1Password добавила сортировку паролей по GPS…
Разработчики приложения 1Password представили новую функцию, которая упростит поиск логинов, паролей и ко…
Google Maps получила важную функцию для навигации…
Сервис Google Maps стал первым приложением, которое внедрило новую функцию Live Updates в Android 16 — те…
DuckDuckGo запускает продвинутые ИИ-ответы…
Компания DuckDuckGo, известная своей ориентацией на конфиденциальность, делает ставку на искусственный ин…
Patreon запускает систему стримов…
Сегодня платформа Patreon бросает вызов Twitch, запуская новую функцию, которая позволяет авторам проводи…
Википедия просит ИИ-ботов не нагружать серверы энциклопедии…
Руководство Wikimedia предпринимает шаги, чтобы отговорить разработчиков ИИ от безудержного сбора данных …
Amazon выпустит конкурента Starlink…
Компания Amazon готовится запустить первые спутники проекта Kuiper для конкуренции со Starlink — первая п…
МегаОбзор
ЭЛ № ФС 77 - 68301. Выходные данные СМИ МегаОбзор
2006-2025
© MegaObzor