佬佬们,爬虫怎么进阶啊?(比如那种字体加密,js加密)

上次爬一个网站,根本无从下手,还有无限debugger 程序过怎么过啊?

5 个赞

搞七捻三快问快答

可以用中间人改写脚本或者直接用下面这个:

  • The Firefox Debugger now includes a new feature: an option to disable the debugger; keyword on the current page. This feature is accessible via a new checkbox in the Breakpoints side panel labeled Pause on debugger statement, located next to the existing Pause on exceptions checkbox. By default, this option is enabled, meaning that the debugger statements are active unless manually disabled.

Screenshot showing new Pause on debugger statement option

3 个赞


直接点这个,再刷新页面就没了

2 个赞

初级爬虫(简单request)—>中级爬虫(页面简单js加密/指纹等)—>高级爬虫(AST/ob混淆/webpack等)—>资深爬虫(机器学习/验证码(滑块/图形/极验/瑞数等)/安卓/ios逆向/小程序等)---->顶级(玄学)

8 个赞

咋入门,我也想学

1 个赞

puppeteer模拟用户访问行为抓取数据。

爬虫,从入门到入狱

如果你想学逆向的话,有时间可以看下我的csdn博客,没空看就算了~

几年前写的关于逆向的案例,希望可以帮到你:

目前早已脱坑啦~~~

简单入门爬虫有什么教程吗?b站视频太杂了

建议沉下心多看看官方文档,文档里都有案例的。初级你只要掌握一些比如:requests的简单使用、解析库bs4/lxml、asyncio/aiohttp、并发/并行、queue等,能靠自己写一个简单的爬虫程序就是进步,后面在慢慢入手scrapy框架以及scrapy-redis或scrapy-kafka/rabbitmq等分布式,仅供参考。 :grinning:

1 个赞

爬虫大佬

继续

感谢大佬们。

好的,我去看看