Что должен знать о Яндексе каждый. Часть 1 - Mega Obzor

Что должен знать о Яндексе каждый. Часть 1

2006-03-07, Автор - Ленар Хайруллин; [5759]
Название самой популярной поисковой системы по русскоязычному Интернету, т.е. Яндекса, означает «Языковой index», а также имеет несколько других схожих трактовок, общий смысл которых выражается слоганом «Найдется все». Прогрессирующая конкуренция среди поисковых машин заставляет более предвзято относиться к подобным обещаниям, т.к. мало найти все, надо уметь найти самой главное. Однако поисковая система Яндекс довольно успешно с этим справляется, чем и оправдывает право называться сегодня самым посещаемым ресурсом Рунета.
Официально поисковая машина Яндекс была представлена в сентябре 1997 года и сразу же начала победное восхождение на вершины славы. Периодом наиболее бурного развития Яндекса был 1999 год, характеризующийся молниеносным увеличением Рунета как в объемах текстов, так и по количеству пользователей почти на порядок.

В конце 2002 года Яндекс вышел на самоокупаемость, т.е. достиг превышения доходов над расходами. В данный момент более 60% доходов Яндекс получает от контекстной рекламы и около 20% - за переходы пользователей в электронные магазины. Известность принесла не только славу, но и трудности, проявившиеся в очередях на покупку рекламных мест на портале.

Сегодня Яндекс – это крупнейший портал, предоставляющий кроме поискового сервиса и каталога большое количество разнообразных веб-служб: новости, энциклопедии, словари, каталоги товаров, бесплатную почту, хостинг, платежную систему и многое другое.

Ежедневно портал посещают около двух миллионов человек с учетом зарубежных гостей. При этом из всех российских пользователей, заходящих в Сеть в течение дня, в среднем около 75% посещают и сайт Яндекса.

За последние полгода Яндекс особенно усилил свои позиции, что отразилось в увеличении посещаемости примерно на 60% и достижении цифры в почти 10 млн. человек в месяц (около 80% приходят из Рунета). На данный момент Яндекс вдвое популярнее Рамблера и на столько же популярнее остальных поисковых систем русскоязычного Интернета вместе взятых. Поиск остается самой востребованной функцией портала, который обрабатывает в месяц около 150 млн. запросов.

Яндекс обладает наиболее полным и актуальным индексом страниц русскоязычного Интернета. Качественный поиск обеспечивается тщательной лингвистической и технической проработкой текстов. Алгоритм нечеткого поиска, а также качественный морфологический и синтаксический анализ позволяют Яндексу понимать запросы на естественном языке. Поэтому начинающие пользователи, чтобы не утруждать себя правилами использования служебных слов при построении поисковых запросов, могут их формулировать, например, так: «где арендовать офис в центре Минска». Средняя длина запроса на Яндексе примерно равна 2,8 слова, а в 1997 году она составляла 1,2 слова. Приведенные цифры отражают тенденцию повышения уровня владения интернет-пользователями возможностями информационного поиска.

Яндекс прекрасно понимает русский язык и может образовывать и понимать любые словоформы. Например, если введен запрос на слово «думать», то машина выдает результаты поиска также и по словам «думал», «подумавши» и даже «разум».

Паук Яндекса индексирует все документы в русскоязычной части Интернета, в том числе и в странах СНГ. Наши белорусские пользователи отдают подавляющее большинство запросов на поиск информации именно Яндексу, оставляя далеко позади местные поисковики. Для поиска по Байнету желательно установить в настройках поиска ограничение по региону (http://www.yandex.ru/regions.html).

Ежедневно Яндекс решает во благо пользователя такие же насущные проблемы, как и любой другой известный поисковик: корректного ранжирования, обновления и синхронизации индекса, работы с различными языками и кодировками, дублирующейся информации, поддержания свежести базы данных и т.д.

Размер индексной базы наряду с качеством поиска является одним из основных показателей, характеризующих поисковую систему. Примером тому служит молниеносный рост популярности таких машин как Google и Fast, который идет пропорционально развитию объема их индекса. Рост базы Яндекса кроме технических проблем, которые он успешно решает благодаря кластерной структуре (т.е. размещению индекса на нескольких серверах), сталкивается с необходимостью отсеивать повторяющиеся документы, происхождение которых многообразно. Один и тот же документ может быть представлен в различных кодировках и форматах, может содержать незначительные включения в виде даты публикации, рекламы или ремарок другого втора. Активному копированию и редактированию постоянно подвергаются новости, юридические документы, прайс-листы, статьи.

Поисковой машине не выгодно хранить дублированные документы в базе, а также засорять выдачу почти одинаковыми документами. Методика Яндекса по выявлению дубликатов постоянно совершенствуется. Ее необходимо учитывать, соблюдая такие правила. Если сайт имеет несколько зеркал, то первым индексацию в Яндексе должно пройти главное из них, т.к. часто остальные идентичные сайты игнорируются. Например, если на сайте размещаются перепечатанные с других ресурсов статьи, то, чтобы избежать попадания страницы в дубликат и исключения из результатов поиска, можно разбить текст статьи на несколько частей или использовать побольше побочного текста (ремарок редактора, перекрестных ссылок на материалы подобной тематики этого же сайта и т.д.). И наоборот, если ресурс продвигается за счет публикуемых на нем статей, чтобы после перепечатки на другие сайты статья не была идентифицирована Яндексом в качестве дубликата, не рекомендуется ставить с этой страницы ссылки на перепечатанные варианты, а, наоборот, со страниц-дублеров ссылаться на оригинал.

Яндекс как мощная поисковая система обходит Сеть за несколько дней. Однако по мере роста системы основная нагрузка ложится уже не на индексирующего робота, а на поиск и выдачу результатов. В ближайшее время планируется активное внедрение на Яндексе традиционных для многих систем с мировым именем технологий эшелонирования и прюнинга. Суть первой методики состоит в разделении индекса на две части: более релевантную и менее релевантную. Сначала поиск осуществляется в первой и, если результат не удовлетворяет количественно, поисковая машина обращается ко второй части индекса.

Технология прюнинга (от англ. pruning – отсечение, сокращение) позволяет динамически прекращать обработку запроса при накоплении достаточного количества релевантной информации. Эта технология значительно сокращает время поиска и нагрузку на поисковик, тем более, заведомо известно, что большинство пользователей при просмотре результатов поиска чаще всего не заходят далее третьей страницы результатов.

Главный критерий приема сайта Яндексом – это текст, написанный на русском языке. Поисковая система имеет достаточно быстрый поисковый робот, который позволяет при первичной индексации странице уже через 2-4 часа появляться в результатах поиска. Далее страница ставится системой в очередь на полную индексацию, после которой она иногда может пропасть из результатов поиска, если будет принята за спам, или из-за каких-либо технических проблем. Поэтому позицию страницы нужно отслеживать в течение нескольких дней, пока Яндекс проведет полную индексацию. Кроме того, список результатов, выдаваемых Яндексом, может меняться зависимости от загруженности серверов. После индексации главной страницы, остальные обычно включаются в индекс примерно через две недели.

Яндекс, обнаруживая новую или измененную страницу, индексирует ее, разбивая документ на элементы: текст, заголовок, подписи к картинкам, содержимое тега описания, текст ссылок и некоторые другие. При этом учитываются позиции слов, то есть их положение в документе или его элементе. Сам документ Яндекс не хранит, поэтому и создает очень компактный индекс. Робот регистрирует дату последнего обхода каждой страницы, дату ее изменения, присланную сервером, и дату внесения последних изменений в базу. Яндекс оптимизирует обход Сети таким образом, чтобы чаще посещать наиболее изменяемые ресурсы. Обычно переиндексация происходит раз в две-три недели. Изменения, внесенные в уже проиндексированные страницы, робот отслеживает самостоятельно при следующем заходе на сайт.

У робота Яндекса свой график деятельности и изменить его, например, как в других поисковиках, не представляется возможным, т.к. Яндекс игнорирует тег .

Чтобы выяснить, проиндексировал ли Яндекс сайт, необходимо на странице www.yandex.ru/addurl.html ввести в поле регистрационной формы адрес сайта и проанализировать результаты. Если будет выдано сообщение что «Ваш URL был только что внесен в нашу базу данных», это значит, что сайт будет проиндексирован в ближайшее время. Если получено сообщение «Ваш URL уже проиндексирован. Вы можете посмотреть, какие страницы вашего сайта проиндексированы в Яndex.Ru к настоящему времени», то, нажав на ссылку «проиндексированы в Яndex.Ru», можно получить весь список документов ресурса, которые были проработаны поисковиком. Если регистрируемый сайт пропал из результатов поиска (чаще всего по техническим причинам самой машины), можно воспользоваться описанным выше способом, чтобы убедиться, что сайт все-таки прописан в индексе. Обычно при этом выдается сообщение о том, что «Ваш URL уже известен роботу. Данный ресурс будет проиндексирован в ближайшее время».
Яндекс постоянно совершенствует поисковый механизм. Последние изменения оказались наиболее кардинальными и внесли новизну не только
в способ формирования результатов выдачи, но и значительно расширили возможности поиска. Чтобы составить о Яндексе полное впечатление, необходимо обязательным образом рассмотреть факторы, которые влияют на рассчитываемую поисковиком релевантность страниц введенному запросу. А об этом будет рассказано в следующей статье.

Автор: Татьяна Зуенок
Источник: WWW.THEWEB.ORG.RU

Комментарии:
Смартфон нового поколения Moto Z3...
Смартфон нового поколения Moto Z3Компания Moto выпустила в этом году модный смартфон. Весит будущий флагман 156 граммов и имеет размеры 1...
Компания Doogee анонсировала бюджетный ...
 Компания Doogee анонсировала бюджетный Производитель решил установить в этот недорогой девайс довольно мощную батарею на 4000 мАч. Это обеспечит...
Новинка Mi Max 3 ...
Новинка Mi Max 3 Компания Xiaomi выпустила уникальный и модный смартфон в этом году. Гаджет отличается экраном огромного р...
Samsung и его новая дорогая новинка ...
Samsung и его новая дорогая новинка Весит новинка 201 грамм при габаритах 161,9 x 76,4 x 8,8 мм. В наличии имеется симметричный порт USB-C и ...
Технические данные R15 Neo...
Технические данные R15 NeoОтдельного внимания заслуживает батарея, емкость которой составляет 4230 мАч. Также в наличии имеются ада...
UMIDIGI Z2 и UMIDIGI One стали дешевле п...
UMIDIGI Z2 и UMIDIGI One стали дешевле пСамый долгожданный флагманский смартфон UMIDIGI Z2 Pro наконец-то доступен. UMIDIGI Z2 Pro оснащен мощным...
XIAOMI MI A2 продолжает оставаться попул...
XIAOMI MI A2 продолжает оставаться популВ центре внимания июльский смартфон Xiaomi Mi A2, ключевой особенностью которой стала установка чистой оп...
ТОП-10 лучших игр для Android 2018 года...
ТОП-10 лучших игр для Android 2018 годаВ последние годы мобильные игры развиваются семимильными шагами. Производители смартфонов улучшают свои м...
Поделиться в социальных сетях:


Обзор Run Around. Что-то необычное...
Обзор Run Around. Что-то необычноеВ большинстве случаев казуальные игры выглядят достаточно скучно и однообразно, так как разработчики прос...
Предварительный обзор LG Q8 (2018). Недо...
Предварительный обзор LG Q8 (2018). НедоВ последнее время можно заметить большую популярность смартфонов среднего класса от популярных производит...
Предварительный обзор Samsung Galaxy Not...
Предварительный обзор Samsung Galaxy NotДо анонса было понятно, что корейская компания Samsung не планирует революцию на мобильном рынке, скорее ...
Предварительный обзор HyperX Pulsefire F...
Предварительный обзор HyperX Pulsefire FКомпания HyperX весьма успешно зашла на рынок игровой периферии — все мы помним легендарные Cloud II, кот...
Обзор PUSS!. Котики и всё такое...
Обзор PUSS!. Котики и всё такоеПрактически всегда инди-разработчики выпускают какие-то скучные проекты, которые не стоят внимания пользо...
Предварительный обзор ASUS Designo MZ27A...
Предварительный обзор ASUS Designo MZ27AСтоит отметить, что далеко не всем пользователям нужны крутые мониторы с невероятной графикой. Большинств...
Обзор mapstr. Отмечаем любимые бары...
Обзор mapstr. Отмечаем любимые барыВажно всегда иметь при себе карты на смартфоне, так как жизнь штука интересная и иногда забрасывает в так...
Xiaomi Mi Robot Vacuum Cleaner, Xiaomi R...
Xiaomi Mi Robot Vacuum Cleaner, Xiaomi RНа днях, компания Xiaomi провела ежегодную конференцию, где представила три новинки: флагманский смартфон...
Предварительный обзор Canon PowerShot SX...
Предварительный обзор Canon PowerShot SXВ последнее время большую популярность набирают фотоаппараты компактных размеров. Это довольно просто объ...
Обзор HashPhoto. Странный редактор...
Обзор HashPhoto. Странный редакторПриложения для редактирования фотографий пользуются большим спросом среди пользователей по вполне понятны...
Предварительный обзор Nokia 6.1 Plus. Не...
Предварительный обзор Nokia 6.1 Plus. НеДлительное время пользователи ждали релиза Nokia 6 для глобального рынка. Дело в том, что оригинальная мо...
Развитие World of Warships...
Развитие World of WarshipsКогда речь заходит о компании Wargaming, то геймеры сразу думают про World of Tanks. Франшиза про танки д...

МегаОбзорМегаОбзор
ЭЛ № ФС 77 - 68301. Выдано РоскомнадзоромМегаОбзор
MegaObzor в социальных сетях:
Яндекс.Метрика
2006-2018 © MegaObzor