今天朋友吐槽考四级的事情。完事我拿四级题目(卷二阅读选择题)测 gemini-2.0-flash-exp,识图确实很厉害,但是发现直接给图片让解答,总是不能完全拿满分
尝试给图片+正确答案让解析,甚至还会犯同样的错误(无视我给的正确答案,仍然有部分题目做错)
于是换了种方法,\boxed{先让它提取题目文本,再关掉上下文给纯文字做题},这回就满分了,看来图片 token 太多确实可能影响上下文智力表现?
当然温度参数什么的没有做更多的调整测评,只用了 nextchat 默认的 0.5,也许不同的温度也会影响做题表现
17 个赞
ftt001
(张大炮)
3
谷歌这个新模型真是越用越感觉好用 我的主力ai已经从GPT到谷歌了
3 个赞
我记得好像 T=1 才是大模型的默认温度
我感觉倒是可以试试不同 temperature
也许做英语题需要随机性高一些(?)
yoluyou
(阿芋露)
6
最近也是日常用 gemini 越用越顺手
图片真的太影响解析与答题正确率了,自己一些工科题目,要让它把题目还有解答,展开成一步一步解说。图片内容提取与题目详解要分开,但是佬友的关闭上下文,感觉更灵活。
1 个赞
ftt001
(张大炮)
10
跟3.5能力比还是差点 尤其是代码 但是3.5量实在太少 权衡后我个人还是喜欢谷歌的
我刚尝试一下蛮不错。我不是编程的工程师。主要用来辅助读英文专业书。理解的很好。