这倒是给我拓展了个思路,不一定要用 gpt-4-vision-preview
去识别图片,机器性能够的话完全可以找开源的图片转文本模型去实现图片内容识别。
mark下
佬,是你有没有想过,gpt本身就不具联网功能,也不具备函数调用功能,我们都是通过插件实现的,我们只需要给他识别图片接口即可呀!如果用4.0这个模型的话,那意义就不大了,因为4.0本身就可以识别图片的,咱们做这个本身就是融入到大模型里面去的。
1 Like
主要一开始我没有识别图片的需求,对图片识别这块了解的比较少。下午抽空看了下一些开源的模型。图片识别效果也还行。用这个+gpt-3.5-turbo
应该能达到一个gpt-4-vision-preview-lite
程度。
官 key 就具备函数调用功能嘞
可以啊!佬,六啊!这么快搞定了,这个是怎么做到的呢!这个挺爽的。源码更新了吗
没呢,这用这东西要装一大堆依赖,带上模型估计要6,7个G, 在找轻量级的方案。
这么大
哦对,如果可以,加前缀跟艾特回复好一点
1 Like
感谢分享
群组默认需要@
mark
mark
1.0.1版本发布了,新支持当前时间FunctionCall插件、发送邮件FunctionCall插件
1.0.2版本发布,新支持/imagine命令使用DALL-E-3画图
说了要用小号,封了那没办法
1 Like
大佬,群组里面可以画画吗?
2 Likes
mark
群组目前还不行,要改下