Gemini-2.0-flash-exp：最适合日常使用的视觉识别大模型，包含实际测试结果

Carlxlx · 2024 年12 月 12 日 05:28

现在gemini-2.0-flash-exp推出，从命名上也能看出正式版已经不远了，到时候应该没啥大改动，因此这次测试应该是对gemini-2.0-flash最有效的一次

也别看我这敲字了，直接上结果

对于普通的图片

看起来前几个exp版本基本都是为flash做铺垫呢，这么一比1.5 pro简直没法看

对于其它厂商的，这次我就没必要测了，之前曾经试过

除了普通图片，日常使用的重中之重其实是文字OCR，测试表明提升也非常大

个人认为，这里面2.0 flash应该是最好的

如果涉及到英文的话，效果更佳

其中只识别错了两个字母（gin->gum），日常使用基本上没啥问题

甚至于我还测试了CAPTCHA

效果杠杠的

不过最后我要强调，为啥说2.0 flash是日常使用的最佳视觉模型呢？主要是价格和响应速度

一天免费1500次，4秒钟一次，要啥自行车
我已经在想办法把它接进去pot了，从今天开始我就用它OCR一切了

附上原图，欢迎大家亲自测试

七沢みあ

dvf123 · 2024 年12 月 12 日 06:45

有网页可以直接用吗？我现在急用，在线等

Carlxlx · 2024 年12 月 12 日 06:46

https://aistudio.google.com/prompts/new_chat

右边选模型，如果联网的话记得把grounding打开

handsome · 2024 年12 月 12 日 06:51

这个这么强嘛

dvf123 · 2024 年12 月 12 日 06:56

感谢，立马用上。

user135 · 2024 年12 月 12 日 06:56

我直接填到 new-api 上咋不行呢?

status code 404: models/gemini-2.0-flash-exp is not found for API version v1, 
or is not supported for generateContent. 
Call ListModels to see the list of available models and their supported methods.

beary · 2024 年12 月 12 日 06:57

支持谷歌，干掉closeai

Carlxlx · 2024 年12 月 12 日 07:01

gemini的调用方式跟Openai的不太一样，你要是急着用可以用Cherry Studio，那边已经给你调好了

user135 · 2024 年12 月 12 日 07:02

我这选的不就是 gemini 的 API 方式么?

1.5 俩都是正常的, 2.0 的加不上

kangfenmao · 2024 年12 月 12 日 07:03

这个地址下载不行，因为还没有发布呢，得从这里下载：Release v0.8.25 · kangfenmao/cherry-studio · GitHub

dvf123 · 2024 年12 月 12 日 07:10

用了几次来生成echarts配置，几乎完美。每天还能免费用这么多次，我感动得要哭了。谷歌，牛逼。

Carlxlx · 2024 年12 月 12 日 07:10

这就触及到我的知识盲区了，不太懂

是不是new-api还没有更新，不支持最新的2.0 flash？

user135 · 2024 年12 月 12 日 07:11

接口的模型,不都是自定义输入的么, 这个应该都是不处理直接转发的吧

user34 · 2024 年12 月 12 日 07:12

API 是不是还不行：

CycleBai · 2024 年12 月 12 日 07:14

https://gemini.google.com/ 似乎也支持了

Carlxlx · 2024 年12 月 12 日 07:14

应该可以吧，我用的cherry studio就是靠API调用的。看起来可能是API转发那的共同问题？

Simons · 2024 年12 月 12 日 07:16

佬这个平台上使用也是免费吗？

user135 · 2024 年12 月 12 日 07:21

因为 V1 和 V1BETA 的问题

davy · 2024 年12 月 12 日 07:23

请问接进pot是什么意思？

Carlxlx · 2024 年12 月 12 日 07:24

pot是一个翻译软件，可以OCR之后再翻译

话题		回复	浏览量
支持一手 Google Gemini 搞七捻三人工智能	50	1886	2024 年12 月 18 日
OpenWebUI 简单使用 Gemini api（如：gemini-2.0-flash-exp）开发调优人工智能	31	1217	2024 年12 月 16 日
申请Gemini免费API搭配抱脸免费部署OpenWebUI系列教程资源荟萃 Gemini , HuggingFace , 人工智能 , OpenWebUI	71	1605	2024 年12 月 13 日
Gemini (AI studio)实在是太香了！资源荟萃纯水	75	5016	2024 年12 月 18 日
GLM-4v-Flash官方视觉模态API开放免费调用福利羊毛	21	594	2024 年12 月 16 日

Gemini-2.0-flash-exp：最适合日常使用的视觉识别大模型，包含实际测试结果

相关话题