gemini 2.0 小战四级

今天朋友吐槽考四级的事情。完事我拿四级题目(卷二阅读选择题)测 gemini-2.0-flash-exp,识图确实很厉害,但是发现直接给图片让解答,总是不能完全拿满分


尝试给图片+正确答案让解析,甚至还会犯同样的错误(无视我给的正确答案,仍然有部分题目做错)


于是换了种方法,\boxed{先让它提取题目文本,再关掉上下文给纯文字做题},这回就满分了,看来图片 token 太多确实可能影响上下文智力表现?


当然温度参数什么的没有做更多的调整测评,只用了 nextchat 默认的 0.5,也许不同的温度也会影响做题表现

17 个赞

前排围观支持一下

谷歌这个新模型真是越用越感觉好用 我的主力ai已经从GPT到谷歌了

3 个赞

不错,打开了新思路

我记得好像 T=1 才是大模型的默认温度
我感觉倒是可以试试不同 temperature
也许做英语题需要随机性高一些(?)

最近也是日常用 gemini 越用越顺手 :bili_040:
图片真的太影响解析与答题正确率了,自己一些工科题目,要让它把题目还有解答,展开成一步一步解说。图片内容提取与题目详解要分开,但是佬友的关闭上下文,感觉更灵活。

1 个赞

gemini很强

1 个赞

不错不错。

大佬跟3.5比怎么样呢?

跟3.5能力比还是差点 尤其是代码 但是3.5量实在太少 权衡后我个人还是喜欢谷歌的

我刚尝试一下蛮不错。我不是编程的工程师。主要用来辅助读英文专业书。理解的很好。

能不能给我脑子装个接口来使用这些api啊tieba_087

一直都是这样的