这几个字就不会是GPT了。
同有这个需求,我现在在尝试用GPT4V
GPT4V纯属浪费。这种东西小模型又快又好,让GPT4教你训练模型就好了。
好嘞皇上
要点某个文本?OCR有坐标呀。当然最简单是做一个检测模型。直接走视觉检测就行。。。也不一定。如果UI改了点话检测可能也会出误差。。。要不还是问问你的目标应用有没有API吧。
用控件寻找点击
python 使用最简单的 控制点击 加上opencv的模糊识别 多放几张图片基本没啥大问题
1 个赞
感觉你们说的需求有点像Android自动化脚本的AI升级版。我觉得你们可以在Android机器人的基础上升级。
From #dev to 开发调优