RSS-костыли для сайтов-инвалидов
March 20th, 2007 • Без категории
Практически на каждом интересном мне сайте я был всего один раз. И ровно столько времени, сколько нужно было, чтобы сбросить оттуда всё полезное себе в Scrapbook и подписаться на обновления через RSS.
Каким должен быть правильный RSS-фид в моём понимании, можно увидеть, к примеру, на сайте 44100.com.
Во-первых, их там много. Новости, статьи, рецензии — для всего этого заведен отдельный RSS-поток. Можно подписаться только на то, что действительно интересно. Во-вторых, грамотно используются служебные поля, на которые большинство других сайтов просто забивают. В-третьих, всё это дело подробно описано на специальной странице. И более того, предварено коротенькой информашкой с ссылками на подробные описания механизма синдикации вообще.
А теперь осторожно. Сейчас будет крик души, ибо наболело.
Зайдём на сайт популярного журнала «Афиша». Что мы видим? А видим мы бардак. На сайте очень много рубрик, но все обновления тупо валятся в один единственный поток. Если мне интересно читать, скажем, только обзоры CD, в RSS я всё равно буду получать полный комплект, включая анонсы концертов, новости моды и прочую ерунду, которую прийдётся просто пролистывать в читалке, тихо при этом матерясь. К тому же сообщения очень часто дублируются. Каждый день в RSS «Афиши» валятся 10 – 20 обновлений, но полезных для меня там — от силы 2 – 3.
Как с этим бороться?
Способ №1. Page2rss
Из обзора этого сервиса на «Интернетных штучках»:
Сравнительно недавно появился сервис под названием Page to RSS, которое, кажется, довольно понятно описывает концепцию проекта: вставив в форму адрес сайта, вы получаете RSS-канал, обновляющийся при появлении каких-либо изменений на странице. Сервис изо дня в день мониторит заданную страницу, не оставляя вам шанса пропустить что-нибудь новое и тем самым исправляя ошибку отставших от жизни авторов.
Исправить «ошибку отставших от жизни авторов» мы можем очень просто: мониторить через Page2rss главные страницы нужных нам рубрик (например, CD). Теперь ничего лишнего в нашу читалку не попадёт.
Способ №2. Yahoo! Pipes
Более гибкое решение.
Yahoo! Pipes — это онлайн-сервис, который позволяет на лету редактировать потоки данных. С его помощью можно слить несколько RSS-фидов в один, сортировать и выбирать данные по любому признаку, применять к ним регулярные выражения и выдавать результат всех этих операций в виде опять же RSS или JSON. Очень мощный инструмент в руках того, кто в теме.
Создаётся новая «труба» при помощи визуального редактора. На скриншоте выше можно увидеть, как выглядит фильтр для книжных обзоров. Все мои фильтры для «Афиши» можно найти здесь.
Для себя остановился на втором варианте.