Фильтрующая RSS-читалка?
2008-08-21 02:31 pmКогда-то давно, когда я регулярно читал news-ы, мне сильно помогала функциональность adaptive scoring, встроенная в Gnus. На основании того, какие сообщения я прочитал, какие - убил, а какие - пометил как интересные или скопировал в архив, она выстраивала правила оценки новых сообщений, принимая во внимание содержимое subject-а и тела сообщения, адреса авторов и комментаторов и многое, многое другое.
В результате можно было за десять минут разделаться с newsgroup-ой с парой тысяч непрочитанных сообщений: примерно треть сразу отправлялась оценщиком "в утиль", до десятка тредов помечались как "интересные" -- их-то я и читал -- а если было время, то я читал и все остальные сообщения, отсортированные по степени "потенциальной интересности".
Сейчас я больше читаю всякие RSS-фиды, и с ними можно поступать таким же образом, при помощи rss2email. Решение работает, но у него есть очевидные минусы - нету тесной интеграции с браузеров, да и оценивание по нынешним временам можно сделать более модным способом.
Мне почему-то кажется, что изобретать свой велосипед в этой области бесполезно - все уже должно быть придумано до нас.
Итак, ищется читалка RSS, которая:
1)работает под Linux или кросс-платформенная/server-side
2)умеет оценивать item-ы из feed-ов. Наверное, на основании байесовского классификатора, по отдельным словам, парам слов, .... Ну, или чтобы к ней можно было прикрутить crm114 :)
3)ее можно учить, разделяя item-ы на интересные/неинтересные (ну, или разделяя более чем на две категории)
4)она умеет импортировать список фидов в OPML (это, наверное, все умеют, но лучше перестраховаться)
5)она умеет сама отрисовывать HTML, или имеет веб-морду.
Что посоветуете?
В результате можно было за десять минут разделаться с newsgroup-ой с парой тысяч непрочитанных сообщений: примерно треть сразу отправлялась оценщиком "в утиль", до десятка тредов помечались как "интересные" -- их-то я и читал -- а если было время, то я читал и все остальные сообщения, отсортированные по степени "потенциальной интересности".
Сейчас я больше читаю всякие RSS-фиды, и с ними можно поступать таким же образом, при помощи rss2email. Решение работает, но у него есть очевидные минусы - нету тесной интеграции с браузеров, да и оценивание по нынешним временам можно сделать более модным способом.
Мне почему-то кажется, что изобретать свой велосипед в этой области бесполезно - все уже должно быть придумано до нас.
Итак, ищется читалка RSS, которая:
1)работает под Linux или кросс-платформенная/server-side
2)умеет оценивать item-ы из feed-ов. Наверное, на основании байесовского классификатора, по отдельным словам, парам слов, .... Ну, или чтобы к ней можно было прикрутить crm114 :)
3)ее можно учить, разделяя item-ы на интересные/неинтересные (ну, или разделяя более чем на две категории)
4)она умеет импортировать список фидов в OPML (это, наверное, все умеют, но лучше перестраховаться)
5)она умеет сама отрисовывать HTML, или имеет веб-морду.
Что посоветуете?
(no subject)
Date: 2008-08-21 04:44 pm (UTC)(no subject)
Date: 2008-08-21 04:50 pm (UTC)/me еще rss2email немного патчил - http://github.com/darkk/rss2email - может будет полезным
(no subject)
Date: 2008-08-21 05:32 pm (UTC)