Главная Форум Wiki Почта Jabber Devel NIX-FILES
Материал из AltLUG Wiki
Перейти к: навигация, поиск

Websec

Автор: Лукас Нусбаум.
Оригинал: «websec: monitor websites for changes», 30 декабря 2006 г.
Перевод: Алексей Бешенов.

На множестсве сайтов еще нет RSS-каналов. Когда вам нужно следить за обновлениями таких ресурсов, приходится время от времени их посещать, либо использовать публичные сервисы вроде Feed 43 или RSSPect. Websec («веб-секретарь») автоматизирует постоянное посещение сайта: он обычно запускается в задаче cron и сравнивает содержимое страницы с тем, что было получено в предыдущий раз. Если что-то поменялось, страница с выделенными добавлениями будет выслана вам по электронной почте.

Это работает довольно хорошо, но есть ряд ограничений:

  • следить можно не за целым сайтом, а лишь за его отдельными страницами;
  • некоторый текст можно исключить из сравнения («страница создана за 0,2 секунды», текущая дата/время, и так далее), но у меня не вышло исключить выражения в несколько строк (из-за этого, например, нельзя следить за выдачей Google); см. ошибку №402113.

Я не нашел пакета, делающего то же самое, что и Websec, но вместо отправки писем создающего RSS-поток. Если кто-то хочет написать подобное, было бы возможно использовать повторно часть кода Websec.

Домашняя страница проекта расположена по адресу http://baruch.ev-en.org/proj/websec/.

Websec есть в нескольких стабильных версиях Debian и Ubuntu и не содержит серьезных ошибок.

Источник — «http://wiki.altlug.ru/Websec»
Личные инструменты