gemini 2.0 小战四级

zhong_little · 2024 年12 月 14 日 06:34

今天朋友吐槽考四级的事情。完事我拿四级题目（卷二阅读选择题）测 gemini-2.0-flash-exp，识图确实很厉害，但是发现直接给图片让解答，总是不能完全拿满分

尝试给图片+正确答案让解析，甚至还会犯同样的错误（无视我给的正确答案，仍然有部分题目做错）

于是换了种方法，\boxed{先让它提取题目文本，再关掉上下文给纯文字做题}，这回就满分了，看来图片 token 太多确实可能影响上下文智力表现？

当然温度参数什么的没有做更多的调整测评，只用了 nextchat 默认的 0.5，也许不同的温度也会影响做题表现

yangtb2024 · 2024 年12 月 14 日 06:35

前排围观支持一下

ftt001 · 2024 年12 月 14 日 06:56

谷歌这个新模型真是越用越感觉好用我的主力ai已经从GPT到谷歌了

RichardChou · 2024 年12 月 14 日 07:00

不错，打开了新思路

VrianCao · 2024 年12 月 14 日 07:04

我记得好像 T=1 才是大模型的默认温度
我感觉倒是可以试试不同 temperature
也许做英语题需要随机性高一些（？）

yoluyou · 2024 年12 月 14 日 07:31

最近也是日常用 gemini 越用越顺手
图片真的太影响解析与答题正确率了，自己一些工科题目，要让它把题目还有解答，展开成一步一步解说。图片内容提取与题目详解要分开，但是佬友的关闭上下文，感觉更灵活。

handsome · 2024 年12 月 14 日 07:45

gemini很强

pepechchor · 2024 年12 月 14 日 08:26

不错不错。

daguhe2024 · 2024 年12 月 14 日 09:31

大佬跟3.5比怎么样呢？

ftt001 · 2024 年12 月 14 日 09:36

跟3.5能力比还是差点尤其是代码但是3.5量实在太少权衡后我个人还是喜欢谷歌的

daguhe2024 · 2024 年12 月 14 日 09:57

我刚尝试一下蛮不错。我不是编程的工程师。主要用来辅助读英文专业书。理解的很好。

banlan · 2024 年12 月 14 日 11:46

能不能给我脑子装个接口来使用这些api啊

3.141592653 · 2024 年12 月 14 日 11:59

一直都是这样的

system · 2025 年1 月 13 日 11:59

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。

话题		回复	浏览量
用了几天gemini，发现数学和代码能力远不如o1模型。Google还需加油啊搞七捻三人工智能	27	870	2024 年11 月 25 日
Gemini 2.0 Flash thinking Exp 0121上线了前沿快讯人工智能	24	767	2025 年1 月 23 日
OAI前脚刚推出O1满血版，Gemini Exp 1206就来了前沿快讯 Gemini , 人工智能	54	2369	2024 年12 月 8 日
Gemini 2.0 Flash Thinking Experimental 01-21 发布 (1M 输入 65K 输出!) 前沿快讯人工智能	25	863	2025 年1 月 26 日
AI对话日常之gemini在线教学:以卵击石，如何大获全胜!【by Q_S-YM-B】搞七捻三人工智能	8	223	2025 年1 月 26 日