群佬们,我想请教一个AI+群控领域的问题

这几个字就不会是GPT了。

同有这个需求,我现在在尝试用GPT4V :pleading_face:

GPT4V纯属浪费。这种东西小模型又快又好,让GPT4教你训练模型就好了。

好嘞皇上

要点某个文本?OCR有坐标呀。当然最简单是做一个检测模型。直接走视觉检测就行。。。也不一定。如果UI改了点话检测可能也会出误差。。。要不还是问问你的目标应用有没有API吧。

用控件寻找点击

python 使用最简单的 控制点击 加上opencv的模糊识别 多放几张图片基本没啥大问题

1 个赞

感觉你们说的需求有点像Android自动化脚本的AI升级版。我觉得你们可以在Android机器人的基础上升级。

From #dev to 开发调优