RSS-лента для любой веб-страницы

2006-08-07, Автор - Ленар Хайруллин; Продукт - RSS-; [3885]
Технология RSS становится все популярнее как у пользователей Интернета, так и у создателей сайтов. И это неудивительно - чтение новостей в RSS-формате способно сэкономить как трафик, так и время. Но далеко не всегда RSS-лента есть там, где она нужна. Предположим, что нам очень хотелось бы получать новости в RSS-формате с некоего сайта. Почему именно в RSS? Да потому, что таким образом мы читаем новости с двух или трех десятков сайтов и менять схему не хотелось бы. Но вот беда - тот самый сайт не имеет экспорта новостей в RSS (к слову сказать - не такая уж огромная редкость). Помочь нам могут интернет-сервисы, делающие из любой HTML-страницы ленту RSS.
Рассмотрим один из таких сервисов - Feed43.com.

Feed43 работает по простому принципу - сначала ищет на странице блоки по шаблону, определяемому пользователем, затем из этих блоков строит RSS-ленту. Попробуем разобраться детально, как это делается.

На Feed43 можно регистрироваться, а можно и работать без регистрации - что кому нравится. Стать зарегистрированным пользователем имеет смысл в том случае, если нужно создать несколько лент (в этом случае доступ к ним удобен со страницы My feeds). Еще зарегистрированный пользователь имеет возможность создавать и использовать платные ленты - они имеют такие преимущества перед бесплатными, как меньший период обновления, большие допустимый размер исходной страницы и число новостей в ленте и отсутствие в конце текста каждой новости строчки Delivered by Feed43 service, ставящейся в бесплатных лентах. Итак, регистрируемся и входим. Щелкаем по ссылке Create new feed и приступаем к созданию ленты.

Шаг первый. Указываем имя страницы и кодировку. Имя лучше указать как http://mydomain.ru/page.html, даже если зайти на эту страницу можно, набрав просто http://mydomain.ru, а кодировку, если содержимое страницы не на английском языке, указывать просто обязательно - иначе в ленте получим всякую ерунду. И получаем исходный код страницы.

Шаг второй. Указываем, что и где будем искать. Делается это на основе шаблонов, и некоторые их элементы заслуживают отдельного внимания:

  • {*} - воспринимается Feed43 как "что угодно";
  • {%} - воспринимается как блок, из которого строится лента, например заголовок или текст новости.

Для начала в поле Global Search Pattern указываем диапазон, в котором будут искаться новости. Можно указать просто {%} - тогда просматриваться будет вся страница, а можно, например, <body>{%}</body> - в этом случае поиск будет ограничен границами действия тега body.

Затем надо указать, какой фрагмент HTML-кода считать новостью. Разберем простой пример. Предположим, что заголовок новости у нас оформляется тегом <h1>, а текст новости - <div class="content">. Тогда шаблон новости в поле Item (repeatable) Search Pattern должен выглядеть следующим образом:

  • <h1>{%}</h1>{*}<div class="content">{%}</div>

Нажимаем кнопку Extract и смотрим в окне Clipped Data - что найдено на странице.

Нужно отметить, что заголовок каждой новости у нас определен как {%1}, а текст - как {%2}.

Шаг третий. Из найденных блоков собираем ленту. Заполняем поля Feed Title, Feed Link и Feed Description - это название, ссылка и описание ленты соответственно. Примечание здесь одно - согласно справке Feed43 в поле Feed Link надо указывать ссылку на исходную страницу, а не на саму ленту.

В поле Item Title Template вводим {%1} (строку заголовка вставляем без изменений), в Item Link Template - ссылку на исходную страницу (поскольку сама новость собственной ссылки не имеет), в Item Content Template - {%2} (текст новости вставляем также без изменений). В тексте новости (и только в нем) можно использовать HTML-теги, но стоит убедиться, что они будут нормально пониматься программами чтения RSS-ленты. Нажимаем Preview - и видим готовую ленту:

Под окном просмотра дается ссылка на ленту. Копируем ее, вставляем в RSS-агрегатор и читаем новости в привычном виде.

В заключение стоит отметить, что Feed43, конечно же, не единственный такой сервис. Можно найти, например, и FeedYes, и FeedFire, но они уже не дают возможность какой-либо настройки в бесплатном аккаунте - можно просто указать страницу, с которой брать новости. Если повезет - удастся сделать ленту на основе этой страницы, если нет - остается либо платить, чтобы иметь возможность детально настраивать процесс, либо искать другой сервис. Такой, как Feed43.


Автор:Алекс Звягин

Комментарии:
Последние комментарии на сайте:
Поделиться в социальных сетях:


Предварительный обзор Casio G’Z Eye. Нов...
Предварительный обзор Casio G’Z Eye. НовАнонс экшн-камеры Casio GZE-1 стал большой новостью на рынке - все знают, насколько компания надежная и н...
Предварительный обзор Rosewill Nebula GX...
Предварительный обзор Rosewill Nebula GXНовые игроки на рынке игровой периферии встречаются очень редко и обычно это какие-то китайские бренды, к...
Обзор The Journey Down: Chapter Two. Про...
Обзор The Journey Down: Chapter Two. ПроМы уже рассказали вам о первой части The Journey Down, которая попала нам в руки совсем недавно. Игра мен...
Wargaming перезапустили «World of Warpla...
Wargaming перезапустили «World of WarplaСерия проектов, посвященных Второй мировой войне от белорусской компании Wargaming еще изначально задумыв...
Предварительный обзор Huawei Honor Water...
Предварительный обзор Huawei Honor WaterНесмотря на то, что защита от влаги и пыли для большинства современных смартфонов это уже норма, а не как...
Обзор The Room. Давайте подумаем...
Обзор The Room. Давайте подумаемСкажу честно и открыто - игра The Room мне дико понравилась и дело даже не в том, что это крутая головоло...
Предварительный обзор ASUS VivoBook X207...
Предварительный обзор ASUS VivoBook X207В последнее время действительно интересных ноутбуков никто не показывает - компании привыкли демонстриров...
Обзор The Evil Within 2. Тревожно до дро...
Обзор The Evil Within 2. Тревожно до дроРазработчики игры The Evil Within 2 удачно подобрали время для релиза - на PC она вышла в пятницу 13 числ...
Предварительный обзор Vernee M5. Лучший ...
Предварительный обзор Vernee M5. Лучший В последнее время мы стали замечать, что грань между качеством устройств титанов рынка и менее больших пр...
Обзор ELEX. Шедевр не только для фанатов...
Обзор ELEX. Шедевр не только для фанатовНесмотря на то, что с проектами студии Piranha Bytes я знаком достаточно давно, назвать себя прямо ярым ф...
Предварительный обзор Google Pixelbook. ...
Предварительный обзор Google Pixelbook. Официальный анонс ноутбука Google Pixelbook произвел небольшой фурор в интернете, ведь пользователи дейст...
Предварительный обзор Xtrfy K3. Новая иг...
Предварительный обзор Xtrfy K3. Новая игШведская киберспортивная организация Ninjas in Pyjamas, которая была организована в 1999 году и сейчас яв...
МегаОбзор
МегаОбзор
MegaObzor в социальных сетях:
Яндекс.Метрика
2006-2017 © MegaObzor