各位佬怎么爬网站呀

wang1 · 2024 年8 月 10 日 21:37

各位佬，我会一点python ，爬虫完全是小白，有什么免费的插件或软件可以辅助爬一些常规网站，比如这些插件或软件可以获取部分网站的信息或python code，在这些信息或python code的基础上让gpt改改，就更完善一些，就可以爬了。任何意见或建议都非常感谢您感谢感谢

Eilgnaw · 2024 年8 月 10 日 21:50

如果是前后端分离的,就抓包用python直接请求
如果不是,就google搜索无头浏览器
如果遇到防爬就google搜索\论坛求助\放弃

gitibmchat2 · 2024 年8 月 10 日 22:12

佬您能具体说一下用python抓包怎么写或主要抓什么或推荐一本书或视频让我爬虫入门感谢感谢您

BL1ACH · 2024 年8 月 10 日 23:02

不懂帮顶

jiongjiong_JOJO · 2024 年8 月 10 日 23:39

抓包用F12，python就是个代码执行器

HelloWorld6 · 2024 年8 月 10 日 23:45

正则，bs4，xpath，selenium都可以啊

EDWINCHENC · 2024 年8 月 11 日 00:00

Python入门实践第一战不就是爬虫么，你是只学了基础语法？
你要爬虫那你就从基础的 requests 库学起，b站啥的找些视频，了解下http请求，爬一些简单的网站，先获取页面。
然后你需要获取元素，或者解析json，可以学一下beautifulsoup，以及lxml。
基本的爬虫原理就知道了。

sxjeru · 2024 年8 月 11 日 00:25

不使用代码，可以考虑八爪鱼采集器。

Defry · 2024 年8 月 11 日 01:12

Charles或Fiddler 抓包获取数据接口

AsherK · 2024 年8 月 11 日 01:45

如果想系统的学习爬虫，可以看崔大的这个：https://juejin.cn/post/7127190545172004878

Cai_Cai · 2024 年8 月 11 日 02:08

[quote=“sxjeru, post:8, topic:174830, full:true, username:sxjeru”]
不使用代码，可以考虑八爪鱼采集器。
[/quote]这个是否收费呀怎么突破收费呢

sxjeru · 2024 年8 月 11 日 02:19

有增值功能，免费的个人够用。

或者教育邮箱白嫖。

Cai_Cai · 2024 年8 月 11 日 02:21

[quote=“sxjeru, post:12, topic:174830, username:sxjeru”]
教育邮箱白嫖
[/quote]佬我有教育邮箱咋去白漂呀感谢感谢

handsome · 2024 年8 月 11 日 05:37

selenium呀

ls5658 · 2024 年8 月 11 日 05:48

各种各样的验证码怎么过呢，我感觉老难了

Heaven · 2024 年8 月 11 日 05:53

EasySpider

Entropy · 2024 年8 月 11 日 11:11

neo · 2024 年8 月 29 日 04:00

话题		回复	浏览量
各位佬求好用的爬虫插件，python模块等开发调优快问快答	2	326	2024 年9 月 23 日
各位佬什么插件或脚本或程序或软件支持指定网站搜索开发调优快问快答	14	295	2024 年8 月 29 日
好用的爬虫插件推荐（欢迎补充）资源荟萃	12	642	2024 年6 月 29 日
我不是盐神简单一爬开发调优 Python	28	900	2024 年8 月 28 日
佬们有没有可以训练爬虫技术的站呀开发调优快问快答	80	1838	2024 年9 月 8 日

各位佬 怎么爬网站呀