给站点做了一个备用的 rss 订阅

最近站点的 RSS 被 cf waf 波及,导致时断时续,即使用了站内老哥的 deno 代理方案也是经常 403。

所以在本地写了一个定时任务,用脚本绕过 cf waf 获取 rss。
服务部署在 cf,给大家试用下。
我本人也在用这个方案,有问题一般会第一时间发现。其他佬有问题也可以反馈。

服务地址: https://linuxdorss.longpink.com/

如果有版权问题可以删掉。

  • 更新频率:10分钟
  • 提供全部 rss 和分类 rss(和站内的分类一样)
  • 没有提供 tag 类的 rss,因为 rss 原始文件没有 tag 标签,所以无法实现;如果通过逐个爬 tag rss 成本太高(tag 太多了)
  • rss 保留 24 小时内的内容(主要是为了避免爬取失败导致遗失部分内容,保留多一点内容可以保证 rss 阅读器下次继续拉取)

服务不一定稳定,建议和站点原始 rss 或者 deno 代理的方案一起订阅。

后续站点 rss 的 waf 问题解决后,可能也会移除这个服务。若移除会提前通知。

36 Likes

沒啥意義 deno還是能爬
主要不能爬的是等級貼

1 Like

我隐约记得用 worker 写爬虫过盾会被 cf 发邮件警告来着,当心封号啊

deno 能爬,就是经常 403,要隔一段时间才能爬成功(可能是切 IP 了)。所以更新不会那么及时。

我是本地爬,只是把 xml 文件部署到 worker 上。这种应该没事。

無等級爬那麼快幹嘛

freshrss可以通过cookie登录抓取,但是可能会有过不了盾的问题


用上了 oh yeah

盲猜這個未來會被防出去
畢竟
https://linux.do/c/resource/resource-lv2/84.rss
這類的是直接不能用了

个人喜好吧,交易分类的帖子希望及时一点,再搭配 apprise 进行通知。

1 Like

curl_cffi可以过盾,配合代理池,凑合用了

等级贴的初衷就是不被抓吧,用不了也是正常

这个,不太可能吧,freshrss通过cookie登录的,除非说本地拿不到cookie了。不过这么搞,cookie很容易失效,需要自己去维护,挺麻烦的

1 Like

感谢分享

1 Like

follow好像用不了呢?

2 Likes

感谢大佬!

这是什么工具 佬

只要不被墙就好说

我建议始皇rss域名和主要域名分开
省的规则影响了

1 Like

ttrss

1 Like

有佬知道folo怎么用这个吗

1 Like