dastapov: (Default)
[personal profile] dastapov
Когда-то давно, когда я регулярно читал news-ы, мне сильно помогала функциональность adaptive scoring, встроенная в Gnus. На основании того, какие сообщения я прочитал, какие - убил, а какие - пометил как интересные или скопировал в архив, она выстраивала правила оценки новых сообщений, принимая во внимание содержимое subject-а и тела сообщения, адреса авторов и комментаторов и многое, многое другое.

В результате можно было за десять минут разделаться с newsgroup-ой с парой тысяч непрочитанных сообщений: примерно треть сразу отправлялась оценщиком "в утиль", до десятка тредов помечались как "интересные" -- их-то я и читал -- а если было время, то я читал и все остальные сообщения, отсортированные по степени "потенциальной интересности".

Сейчас я больше читаю всякие RSS-фиды, и с ними можно поступать таким же образом, при помощи rss2email. Решение работает, но у него есть очевидные минусы - нету тесной интеграции с браузеров, да и оценивание по нынешним временам можно сделать более модным способом.

Мне почему-то кажется, что изобретать свой велосипед в этой области бесполезно - все уже должно быть придумано до нас.

Итак, ищется читалка RSS, которая:
1)работает под Linux или кросс-платформенная/server-side
2)умеет оценивать item-ы из feed-ов. Наверное, на основании байесовского классификатора, по отдельным словам, парам слов, .... Ну, или чтобы к ней можно было прикрутить crm114 :)
3)ее можно учить, разделяя item-ы на интересные/неинтересные (ну, или разделяя более чем на две категории)
4)она умеет импортировать список фидов в OPML (это, наверное, все умеют, но лучше перестраховаться)
5)она умеет сама отрисовывать HTML, или имеет веб-морду.

Что посоветуете?

(no subject)

Date: 2008-12-17 11:06 pm (UTC)
From: [identity profile] http://users.livejournal.com/_adept_/
Хм. Например, Gnus под windows? :)

Я, увы, не подскажу, т.к. windows пользуюсь редко.

Profile

dastapov: (Default)
Dmitry Astapov

May 2022

M T W T F S S
       1
2345678
9101112131415
161718 19202122
23242526272829
3031     

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags