Gemini Exp 1114太强了！会之前只有O1才会的题目

F-droid · 2024 年11 月 17 日 18:14

推理过程和结果完全正确。OpenAI家的模型只有O1会，而GPT 3.5 和 GPT 4、GPT 4o在不借助外部工具的情况下结果都不正确，有兴趣的同学可以试试其他模型的表现。

rv192 · 2024 年11 月 17 日 19:41

试了下思维链提示词加持，Claude3.5 s和Gemini Pro 1.5，GLM4Plus，千问2.5 Math70b都顺利过关，千问偶尔会错(但他会列式解题)

所以其实没什么大不了的，这一波其实都是在用思维链加持而已

Cai_Cai · 2024 年11 月 17 日 21:27

佬思维链提示词指条路

Pinging · 2024 年11 月 17 日 22:56

17岁高中生那个？

F-droid · 2024 年11 月 17 日 23:35

哥们，你是没有注意到我给出的条件吗？为了测试模型的真实能力，我没有使用任何提示词。你用思维链提示词测试的结果与其他人的原生模型相比，公平吗？

Hardship2495 · 2024 年11 月 18 日 00:51

画独角兽还是不行
使用 ASCII 画一个独角兽

sage · 2024 年11 月 18 日 00:57

这个 app名字叫啥？

TY233 · 2024 年11 月 18 日 00:59

问他问题的时候让他think step by step。让他想慢点就是思维链

F-droid · 2024 年11 月 18 日 01:06

接口要自行用deno/vercel反代或者使用newapi中转，cloudflare workers不行

handsome · 2024 年11 月 18 日 01:28

这么强。疯狂使用！

voheep · 2024 年11 月 18 日 01:42

我直接把答案写提示词里

F-droid · 2024 年11 月 18 日 01:43

哈哈作弊都不打草稿

F-droid · 2024 年11 月 18 日 01:43

国内的大模型为了做对9.11和9.9比较问题，还真这样做了，我逆向KIMI的提示词时发现了，当时看到笑死了

gokyo · 2024 年11 月 18 日 01:47

太龌龊了，还增加了tokens

gsnqazwsx · 2024 年11 月 18 日 01:49

时刻关注它的发展

a3members · 2024 年11 月 18 日 01:50

这个gpt4o都能答对

liangdewofl · 2024 年11 月 18 日 02:29

gemini的app?

F-droid · 2024 年11 月 18 日 02:30

不是哦

liangdewofl · 2024 年11 月 18 日 02:42

android的app封装的google的实验模型是吧，iphone的有么？

F-droid · 2024 年11 月 18 日 02:44

站内一位大佬开源的Chatbot，跟谷歌没有任何关系，也不是为Gemini定制的

话题		回复	浏览量
Gemini-Exp-1114在arena上的分类排名前沿快讯人工智能	12	693	2024 年11 月 16 日
Gemini新模型：gemini-exp-1114 前沿快讯 ChatGPT , OpenAI , 人工智能	41	1559	2024 年11 月 17 日
gemini 1206 媲美o1 搞七捻三 OpenAI , Gemini , 人工智能	38	1493	2024 年12 月 7 日
Gemini很优秀，但是有点偏科搞七捻三人工智能	16	781	2024 年11 月 23 日
感觉Gemini在数学偏科，但是知识的广度不如GPT4o 搞七捻三人工智能	16	328	2024 年12 月 1 日

不过UI确实是有点像Gemini