事实证明,Gemini1.5Pro的识图能力最强,没有之一,本人实测

有图有真相

以上全部是使用官方API Key,官方网址直连,不经过任何中转得到的结果,不存在任何掺假可能

为了测这个我还特意往OpenAI充值10美刀,Claude充值5美刀,钱包在滴血 :sob:

识别文字的事已经被测试了无数遍了,这里就不发了,Gemini1.5Pro的特点就是手写体以及各种奇形怪状的都可以一定程度识别,相比较来讲国产大模型也就能识别个印刷体的中文跟英文

要不是Gemini1.5Pro免费额度太少,恨不得天天用它识图。回来整几个号轮询试试

207 个赞

太强了,佬:+1:
Gemini 1.5pro,太强了tieba_087

20 个赞

New api 多接几个就行了

6 个赞

Gemini的API额度确实太少了

20 个赞

NewAPI是权重分配,做不到轮询吧,想要保证对话额度还得用cf或者走服务器中转来轮询 :thinking:

3 个赞

Gemini 1.5 pro是不是要付费订阅的那个?

23 个赞

用API有免费额度,但是很少,每分钟只能用两次

1 个赞

就是多搞些账号申请api key,我自己搞了20个 :bili_040:

6 个赞

我勒个豆,这么有实力 :tieba_024:
我手里只有3个谷歌账号 :tieba_087:

37 个赞

:bili_040: 来,识图翻译翻译

4 个赞

我用手机直接注册不用手机号验证 :bili_004: 一次能搞好几个

12 个赞

看来是我节点的问题了,我手机注册还要验证手机号,不过好在国区+86号也能过:tieba_087: :tieba_087:

14 个赞

:tieba_087: :tieba_087: :tieba_087:

但是 GCP 的 3.5 Sonnet 又无了,降到 15K TPM 还不让用多模态了直接 429。


哦?小图还可以,确实是 TPM 的问题。

4 个赞

确实,多模态这块还得属 Gemini 1.5 Pro

4 个赞

这还少!你要怎样才算多,一天也能调用几千次呢!要是沉浸式翻译肯定顶不住,但是解决其他的日常用途还是轻轻松松的

11 个赞

还得是Gemini

14 个赞

Gemini 1.5 Pro识图确实是强啊!感觉gpt4o的识图现在变废了,可能是我感觉的问题

5 个赞

没准OpenAI给集体降智了,把算力拿去给o1

4 个赞

7 个赞

我又测试了一下,单纯调用API就是我那样的,从你这看应该是网页版内置的prompt比较有用

2 个赞