Gemini-2.0-flash-exp:最适合日常使用的视觉识别大模型,包含实际测试结果

打不过我们国产AI :upside_down_face:

5 个赞

其实其他模型,比如gpt-4o,gpt-4o-mini,claude-3.5-sonnet也能识别对,gemini只在这点有一些问题,其他的方面,尤其是普通的图片,那效果杠杠的

6 个赞

一天1500,真的哭死,感谢佬的分享

4 个赞


其实感觉测这个不准,模型库中有原文,容易作弊

3 个赞

我嘞个七泽米亚啊!可惜chatnio上传图片base64格式不支持 l站的图片链接也无法识别

2 个赞

还是谷歌nb 连衣服的链接都搜到了


不止呢

楼主原来在reddit也有发帖子啊

金牛座-2.0 閃電擴展:根據我的個人測試,這是日常使用最佳的視覺模型 : r/OpenAI — gemini-2.0-flash-exp: The BEST vision model for daily-use, based on my personal testing : r/OpenAI (reddit.com)

6 个赞

求pot插件代码

1 个赞

请求内容过大,nginx的问题个,你传了文件还是传了过大的上下文?
client_max_body_size 20M;
往你nginx配置文件里塞一个这个,数值自己调
看看是api上游接口的nginx问题还是你的聊天面板的nginx问题

5 个赞

请问大佬接进去了吗?

2 个赞

大佬,有办法在newapi中接入gemini吗,一直提示失败

很遗憾没有,昨天研究半小时研究失败

pot官方的那个OCR插件是专门给OpenAI开发的,接Gemini改网址跟模型名字远远不够,应该还有别的,等今天晚上我再研究研究

好的 期待大佬的成果

参考这位的

是不是已经不让联网了,我打开联网按钮搜索提示已达到费率上限

准确来说是不让免费用户联网了

从现在开始你要是没有挂Visa卡,你就跟互联网绝缘了(就像我一样 :sob:

不过实时语音目前还能联网,不知道还能挺多久

1 个赞

你好 请问我打开grounding 为什么还可以用呀 模型是1206

不对啊,为什么我直接就可以添加上使用,我没有中转啥的

可能是我访问不到 API 接口吧, 我找 CF 中转了一下

因为2.0-flash收费了,你这个1206没有