推荐一款简单快速上手的爬虫工具!

:sparkles: 概述

DrissionPage 是一个基于 python 的网页自动化工具。

它既能控制浏览器,也能收发数据包,还能把两者合而为一。

可兼顾浏览器自动化的便利性和 requests 的高效率。

它功能强大,内置无数人性化设计和便捷功能。

它的语法简洁而优雅,代码量少,对新手友好。


star fork

项目地址:gitee | github


最新版本:4.0.4.21

支持系统:Windows、Linux、Mac

python 版本:3.6 及以上

支持应用:Chromium 内核浏览器(如 Chrome、Edge),electron 应用


:light_bulb: 理念和含义

理念:简洁而强大!

Drission 是本库作者自创的单词,为 Driver 和 Session 的合体,因此 Drission 读作“拽神”。

Page 则表示本库用 POM 模式封装。


:sun: 特性

作者经过长期实践,踩过无数坑,总结出的经验全写到这个库里了。

:sparkler: 强大的自研内核

本库采用全自研的内核,内置了无数实用功能,对常用功能作了整合和优化,对比 selenium,有以下优点:

  • 无 webdriver 特征
  • 无需为不同版本的浏览器下载不同的驱动
  • 运行速度更快
  • 可以跨 iframe 查找元素,无需切入切出
  • 把 iframe 看作普通元素,获取后可直接在其中查找元素,逻辑更清晰
  • 可以同时操作浏览器中的多个标签页,即使标签页为非激活状态,无需切换
  • 可以直接读取浏览器缓存来保存图片,无需用 GUI 点击另存
  • 可以对整个网页截图,包括视口外的部分(90以上版本浏览器支持)
  • 可处理非open状态的 shadow-root

:sparkler: 亮点功能

除了以上优点,本库还内置了无数人性化设计。

  • 极简的语法规则。集成大量常用功能,代码更优雅
  • 定位元素更加容易,功能更强大稳定
  • 无处不在的等待和自动重试功能。使不稳定的网络变得易于控制,程序更稳定,编写更省心
  • 提供强大的下载工具。操作浏览器时也能享受快捷可靠的下载功能
  • 允许反复使用已经打开的浏览器。无需每次运行从头启动浏览器,调试超方便
  • 使用 ini 文件保存常用配置,自动调用,提供便捷的设置,远离繁杂的配置项
  • 内置 lxml 作为解析引擎,解析速度成几个数量级提升
  • 使用 POM 模式封装,可直接用于测试,便于扩展
  • 高度集成的便利功能,从每个细节中体现
  • 还有很多细节,这里不一一列举,欢迎实际使用中体验:D

搭配辅助工具soeasy啊

:white_check_mark: 辅助工具

:pushpin: 骚神工具库

提供各种辅助功能,如代码生成助手可用图形化的界面,通过简单的点击,自动生成用于 DrissionPage 启动浏览器的配置代码。

作者: 游龙([email protected]

网址: 骚神博客 - Drissionpage新手教学网站

66 Likes

试一下:drooling_face:

3 Likes

比selenium简单

3 Likes

mark

2 Likes

好东西

3 Likes

mark 斯国一呐

2 Likes

好多地方都在推这个。。。
这工具打开的浏览器有自动拦截网页请求,注入修改的功能嘛?
还是需要自己写js?

2 Likes

EasySpider

2 Likes

谢谢

2 Likes

用过,感觉挺麻烦的 :sweat_smile:

2 Likes

不错不错

2 Likes

名字不错,很拽很骚

2 Likes

Mark 一下

1 Like

好东西,之后试试

2 Likes

mark

1 Like

收藏了

2 Likes

这玩意好像还能过CF,不知道是不是真的

2 Likes

这倒是不知道 :sweat_smile:

2 Likes

有没有大佬出个使用反馈

2 Likes

试试

1 Like