Фильтрующая RSS-читалка?
2008-08-21 02:31 pmКогда-то давно, когда я регулярно читал news-ы, мне сильно помогала функциональность adaptive scoring, встроенная в Gnus. На основании того, какие сообщения я прочитал, какие - убил, а какие - пометил как интересные или скопировал в архив, она выстраивала правила оценки новых сообщений, принимая во внимание содержимое subject-а и тела сообщения, адреса авторов и комментаторов и многое, многое другое.
В результате можно было за десять минут разделаться с newsgroup-ой с парой тысяч непрочитанных сообщений: примерно треть сразу отправлялась оценщиком "в утиль", до десятка тредов помечались как "интересные" -- их-то я и читал -- а если было время, то я читал и все остальные сообщения, отсортированные по степени "потенциальной интересности".
Сейчас я больше читаю всякие RSS-фиды, и с ними можно поступать таким же образом, при помощи rss2email. Решение работает, но у него есть очевидные минусы - нету тесной интеграции с браузеров, да и оценивание по нынешним временам можно сделать более модным способом.
Мне почему-то кажется, что изобретать свой велосипед в этой области бесполезно - все уже должно быть придумано до нас.
Итак, ищется читалка RSS, которая:
1)работает под Linux или кросс-платформенная/server-side
2)умеет оценивать item-ы из feed-ов. Наверное, на основании байесовского классификатора, по отдельным словам, парам слов, .... Ну, или чтобы к ней можно было прикрутить crm114 :)
3)ее можно учить, разделяя item-ы на интересные/неинтересные (ну, или разделяя более чем на две категории)
4)она умеет импортировать список фидов в OPML (это, наверное, все умеют, но лучше перестраховаться)
5)она умеет сама отрисовывать HTML, или имеет веб-морду.
Что посоветуете?
В результате можно было за десять минут разделаться с newsgroup-ой с парой тысяч непрочитанных сообщений: примерно треть сразу отправлялась оценщиком "в утиль", до десятка тредов помечались как "интересные" -- их-то я и читал -- а если было время, то я читал и все остальные сообщения, отсортированные по степени "потенциальной интересности".
Сейчас я больше читаю всякие RSS-фиды, и с ними можно поступать таким же образом, при помощи rss2email. Решение работает, но у него есть очевидные минусы - нету тесной интеграции с браузеров, да и оценивание по нынешним временам можно сделать более модным способом.
Мне почему-то кажется, что изобретать свой велосипед в этой области бесполезно - все уже должно быть придумано до нас.
Итак, ищется читалка RSS, которая:
1)работает под Linux или кросс-платформенная/server-side
2)умеет оценивать item-ы из feed-ов. Наверное, на основании байесовского классификатора, по отдельным словам, парам слов, .... Ну, или чтобы к ней можно было прикрутить crm114 :)
3)ее можно учить, разделяя item-ы на интересные/неинтересные (ну, или разделяя более чем на две категории)
4)она умеет импортировать список фидов в OPML (это, наверное, все умеют, но лучше перестраховаться)
5)она умеет сама отрисовывать HTML, или имеет веб-морду.
Что посоветуете?
(no subject)
Date: 2008-08-21 11:38 am (UTC)P.S. может начать опять пользоваться nnrss в гнусе? :-) Правда сервер-сайд более удобной получается
(no subject)
Date: 2008-08-21 11:41 am (UTC)(no subject)
Date: 2008-08-21 11:51 am (UTC)(no subject)
Date: 2008-08-21 12:03 pm (UTC)Чесно говоря не очень представляю, как можно было бы аутентично вписать в greader подобную функциональность. Он ведь попросту не умеет извлекать теги из сообщений, только накладывать свои ориентируясь по источнику ленты.
Другими словами, универсальным решением было бы вместо подписки на одну ленту, подписываться на три (the good, the bad and the usual) ленты исходящие из сортирующего feed-proxy. Что не выглядит удобным.
Да и не вполне ясно, как удобно оценивать сообщения, ибо javascript`ы ридерами обычно вырезаются, соответственно остаётся только дописывать к каждому сообщению ссылки (good/bad), на которые, скажем, сервер отвечает HTTP 204м статусом.
А изобретать велосипеды в работе с лентами ещё долго будет можно. Не так уж и много сей технологии лет.
(no subject)
Date: 2008-08-21 12:09 pm (UTC)p.s. сорри за правки, думал о другом совсем ;(
(no subject)
Date: 2008-08-21 12:11 pm (UTC)(no subject)
Date: 2008-08-21 12:23 pm (UTC)(no subject)
Date: 2008-08-21 12:24 pm (UTC)(no subject)
Date: 2008-08-21 12:41 pm (UTC)Re: Reply to your comment...
Date: 2008-08-21 12:42 pm (UTC)(no subject)
Date: 2008-08-21 01:07 pm (UTC)(no subject)
Date: 2008-08-21 02:01 pm (UTC)aiderss.com
feedly
(no subject)
Date: 2008-08-21 03:30 pm (UTC)(no subject)
Date: 2008-08-21 03:33 pm (UTC)В таком виде теряется смысл - зачем мне рейтинг новостей которые кто то посчитал популярными (для этого есть dig и delicious).
Я не туда посмотрел или так и планировалось?
(no subject)
Date: 2008-08-21 04:44 pm (UTC)(no subject)
Date: 2008-08-21 04:50 pm (UTC)/me еще rss2email немного патчил - http://github.com/darkk/rss2email - может будет полезным
(no subject)
Date: 2008-08-21 05:32 pm (UTC)(no subject)
Date: 2008-08-21 07:12 pm (UTC)(no subject)
Date: 2008-08-21 08:30 pm (UTC)(no subject)
Date: 2008-08-22 01:44 am (UTC)Делает фиды со страниц, у которых их нет.
http://users.livejournal.com/_nik_/12906.html
(no subject)
Date: 2008-08-22 08:02 am (UTC)(no subject)
Date: 2008-08-22 08:11 am (UTC)(no subject)
Date: 2008-08-22 10:49 am (UTC)> — о! это было бы то, что нужно
А чем регэксп лучше мышки? Какое use case представляется?
(no subject)
Date: 2008-08-22 01:26 pm (UTC)Гугля reactions
Date: 2008-08-22 01:27 pm (UTC)Гугл вот добавил фичу к блоггеру
http://bloggerindraft.blogspot.com/2008/08/new-feature-reactions.html
(no subject)
Date: 2008-08-22 01:55 pm (UTC)> Видно, что первые 5 новостей идут в одном виде, остальные — в другом.
> Соответственно, хотелось бы иметь возможность задать 2 (или N) вида
> регекспа, которые вырезали бы новости разного вида и сливали их в один
> общий rss. Другой пример, http://www.newsru.com — их стандартная rss
> перегружена и читать нет никакой возможности, но на главной странице
> вверху есть 4 самые важные новости. Самая важная — в одном формате, и
> еще 3 — в другом. Хотелось бы вырезать именно их и сливать в rss.
> 2) feed43.com позволяет не просто вырезать новости, но и указывать
> для каждой из них некие части — заголовок, текст, картинку, время
> и т.п. А потом из них формировать уже результирующую rss — очень
> удобно и гибко! Например, можно в выходном rss не показывать картинки
> к новости, что есть на исходной страничке.
Я подумаю, для чего бы подобное было бы полезно мне. Если придумаю, то как-нибудь реализую.
> 3) Персональный кабинет, что бы была возможность создавать приватные
> фиды и вести каталог своих фидов.
Возможно когда-нибудь сделаю и регистрацию с кабинетом. Пока же стараюсь иметь настолько простой сервис, на сколько это возможно.
> 4) Ну, до кучи — для простых юзеров — то, что у вас уже есть, но с
> возможностью указывать на страничке более одного блока новостей.
Более одного блока одной лентой это любопытно, да.
Вполне вероятно, что я это реализую, когда придумаю, как это наилучшим образом организовать.
> 5) Нотифицировать создателя фида, в случае смены дизайна исходной странички.
На данный момент если по указанному адресу ничего не найдено, сервис пытается найти элемент одним DOM уровнем выше. И так далее максимум до BODY. В принципе, пользователь вполне заметит изменение дизайна исходной странички по изменению выдачи.
Page2RSS
Date: 2008-08-22 06:00 pm (UTC)Пока в закрытом тестировании - сервис извлечения новостной ленты из любой веб страницы.
http://ivbeg.livejournal.com/139065.html#cutid1
(no subject)
Date: 2008-08-22 06:33 pm (UTC)А jscript/ajax туда, имхо, никак не сунешь :(
(no subject)
Date: 2008-08-22 06:34 pm (UTC)(no subject)
Date: 2008-08-22 06:35 pm (UTC)(no subject)
Date: 2008-08-22 06:37 pm (UTC)Впрочем, это я подтормаживаю. Никто не мешает взять любой general purpose классификатор (crm114, rainbow, dbacl) и с его помощью добавлять заголовки, по которым и будет сортироваться почта.
Re: Гугля reactions
Date: 2008-08-22 06:39 pm (UTC)(no subject)
Date: 2008-08-22 06:40 pm (UTC)В общем, если читалки не трогаем, в случае serverside таки нужен online.
(no subject)
Date: 2008-08-22 06:44 pm (UTC)(no subject)
Date: 2008-08-22 06:52 pm (UTC)хотя реально пока проблемы пролистать всякую хрень у меня нет, но иногда ностальгия про Gnus накатывает :)
Интересно чем твои поиски закончатся :)
(no subject)
Date: 2008-08-25 06:18 pm (UTC)Подумываю таки запихивать всю эту радость в IMAP, пока не делал и готовых решений не встречал
Статывка Дмитрий
(no subject)
Date: 2008-09-06 11:40 am (UTC)offtop: SMS с подменой номера
Date: 2008-09-13 08:40 pm (UTC)Что Вы думаете о недавнем скандале "помошник депутата против МТС" (см., например, тут http://ain.com.ua/archives/7806)? Можно ли определить подлинность сообщения по номеру SMS-центра, или его тоже можно подделать? Есть ли у операторов возможность фильтровать сообщения от "левых" центров?
(no subject)
Date: 2008-09-27 09:43 am (UTC)(no subject)
Date: 2008-10-30 08:59 am (UTC)(no subject)
Date: 2008-11-01 12:37 pm (UTC)(no subject)
Date: 2008-12-17 11:06 pm (UTC)Я, увы, не подскажу, т.к. windows пользуюсь редко.