很喜欢用抖音的表情包,虽然不怎么玩抖音,特别是这个表情:
简单登录网页看了一下,好像还挺简单,就直接写个了脚本给下载下来。
以下是爬取过程:
右键表情,打开开发者工具,看下有什么特征。
发现所有的表情都有链接,打开链接后发现可以看到表情,这就好办了,直接把整个表情页面的html保存下来,然后用正则表达式匹配,最后再下载到本地即可。说干就干:
import os
import re
import requests
html = ''
p = 'img.src="(.*?)".elementtiming'
result = re.findall(p, html)
# print('\n'.join(result))
# 下载result的每个图片
os.makedirs('images', exist_ok=True)
for r in result:
response = requests.get(r)
# 获取文件名:/和?之间的字符作为文件名
file_name = r.split('/')[-1].split('?')[0] + '.png'
with open('images/' + file_name, 'wb') as f:
f.write(response.content)
print('下载完成:', file_name)
由于没有仔细分析html那段存不存在个人隐私,就直接删掉了,需要使用的话,自己去粘贴进来。
运行后就下载到脚本同目录下的 images
里。
附上刚下载的表情文件,论坛能不能增加这组表情包。
images.zip (1.7 MB)