Ученые Индии и Японии представили сегодня алгоритм определяющий степень продажности статьи (материала) на сайте. Данный способ позволяет отличить информативную страницу от страницы, сделанной для обмана пользователей сайта.
Основным разработчиком алгоритма является Такахиро Хаваши из университета Ниигаты.
По известным нам, данным метод основан на извлечении субъективно воспринимаемых выражений, расположенные на интернет странице. Далее система подсчитывает степень субъективности и выносит свое решение, выражает ли содержание страницы чье-то личное мнение или это такая маркетинговый обман.
Для теста было отобрано более 1300 станиц, которые разделились на следующие типы – кино, туризм, ресторан, товары. Данный алгоритм дал отличные результаты в отборе объективного материала по нужной теме. Результаты теста показали преимущество метода перед большинство поисковых машин.
Часто при покупке товара для потенциального покупателя важны не только лестные отзывы и статьи, но и негативные отзывы по товару и услуге. В данный же момент в поиске по товарам в поисковых системах мира и России большую часть первой десятки поисковой выдачи составляют маркетинговые статьи и странички магазинов.
Этот подход в будущем, вероятно, могут принять и известные поисковые системы – Яндекс, Google, Рамблер, Yahoo, Live. Мы считаем, что это поможет улучшить поисковую выдачу по коммерческим тематикам, и позволит поисковым машинам быть ближе к пользователям.