Gemini-2.0-flash-exp:最适合日常使用的视觉识别大模型,包含实际测试结果

现在gemini-2.0-flash-exp推出,从命名上也能看出正式版已经不远了,到时候应该没啥大改动,因此这次测试应该是对gemini-2.0-flash最有效的一次

也别看我这敲字了,直接上结果

对于普通的图片


看起来前几个exp版本基本都是为flash做铺垫呢,这么一比1.5 pro简直没法看

对于其它厂商的,这次我就没必要测了,之前曾经试过

除了普通图片,日常使用的重中之重其实是文字OCR,测试表明提升也非常大


个人认为,这里面2.0 flash应该是最好的

如果涉及到英文的话,效果更佳


其中只识别错了两个字母(gin->gum),日常使用基本上没啥问题

甚至于我还测试了CAPTCHA


效果杠杠的

不过最后我要强调,为啥说2.0 flash是日常使用的最佳视觉模型呢?主要是价格和响应速度


一天免费1500次,4秒钟一次,要啥自行车
我已经在想办法把它接进去pot了,从今天开始我就用它OCR一切了

附上原图,欢迎大家亲自测试

七沢みあ


93 个赞

有网页可以直接用吗?我现在急用,在线等

3 个赞

https://aistudio.google.com/prompts/new_chat

右边选模型,如果联网的话记得把grounding打开

2 个赞

这个这么强嘛

5 个赞

感谢,立马用上。 :heart:

3 个赞

我直接填到 new-api 上咋不行呢?

status code 404: models/gemini-2.0-flash-exp is not found for API version v1, 
or is not supported for generateContent. 
Call ListModels to see the list of available models and their supported methods.
2 个赞

支持谷歌,干掉closeai

6 个赞

gemini的调用方式跟Openai的不太一样,你要是急着用可以用Cherry Studio,那边已经给你调好了

3 个赞

我这选的不就是 gemini 的 API 方式么?

1.5 俩都是正常的, 2.0 的加不上

这个地址下载不行,因为还没有发布呢,得从这里下载:Release v0.8.25 · kangfenmao/cherry-studio · GitHub

7 个赞

用了几次来生成echarts配置,几乎完美。每天还能免费用这么多次,我感动得要哭了。谷歌,牛逼。

5 个赞

这就触及到我的知识盲区了,不太懂

是不是new-api还没有更新,不支持最新的2.0 flash?

2 个赞

接口的模型,不都是自定义输入的么, 这个应该都是不处理直接转发的吧

1 个赞

API 是不是还不行:

2 个赞

https://gemini.google.com/ 似乎也支持了

2 个赞

应该可以吧,我用的cherry studio就是靠API调用的。看起来可能是API转发那的共同问题?

2 个赞

佬这个平台上使用也是免费吗? :tieba_024:

2 个赞

因为 V1 和 V1BETA 的问题

4 个赞

请问接进pot是什么意思?

2 个赞

pot是一个翻译软件,可以OCR之后再翻译

9 个赞