就是普通的爬虫吧,每分钟查看一下帖子获取最新评论,和上次的评论比较下判断是否是新出现的。
1 个赞
想通过单纯的网络请求,
我试了get请求一个月全力打造,开源网站助您快速完成论文,集成 ChatGPT 实现真实文献引用
发现它是分页的,没法获取最新的
2 个赞
可以的,滚动获取下页评论时你没发现这个接口用的是用post_id来获取的吗,这样它就得知道有哪些post_id,查看源代码能发现在返回的html里面就包含了post_id,在
<discourse-assets-json>在这里</discourse-assets-json>
,
比如你发的这个帖子,有一段是这样的
stream\&quot;:[48195,48201,48218,48239,48240,48252,48258,48259,48498,48527,49023,49197,49202,49204,49327,49835,51433,55214,56370,56374,56383,56384,56386,56515,56519,56601,56610,58996,58999,67090,67119,67123,68801,68848,68899,68903,68956,95830,95899,96684,154908,156009,156479,171864,173315,179403,179428,179485,180872,180887,182950,186364,187119,187462,187999,188190,188583,190147,190153,190374,190799,190801,193176,193182,193188,193217,193277,199820,199867,199918,199985,200045,200137,200158,200236,201713,205998,206090,210098,210342,216261,216756,225420,225814,225853,225911,226561,227012,227074,228157,229357,230700,233515,234962,235163,235172,235173,235392,235551,235916,236332,236362,238568]
最后一个238568就是最新评论的id,用这个就能获取内容了。
给我转发推荐,star一下
2 个赞
这个不错,收藏了
2 个赞
我没找到,大佬求指点
50 个赞
view-source:https://linux.do/t/topic/13716
就在帖子的html源码里,搜stream第2个就是,爬虫的话就是两步,1获取html中的最新post_id,2根据post_id去接口请求内容
2 个赞
爱你哟
1 个赞
1 个赞
搜stream,后面中括号内的就是的
3 个赞
东西是好东西 ,不过好久不用知乎了。。
思路可以拓展一下?
2 个赞
直接查看源码不是查看渲染后的
view-source:https://linux.do/t/topic/13716
3 个赞
老板您说
2 个赞
好的,原来是这样
53 个赞
好东西!!
2 个赞
爱你哟
1 个赞
有意思的工具
1 个赞
好东西,可惜知乎已经不是以前的知乎了,没玩知乎了
2 个赞
1 个赞