Gemini Exp 1114太强了!会之前只有O1才会的题目

推理过程和结果完全正确。OpenAI家的模型只有O1会,而GPT 3.5 和 GPT 4、GPT 4o在不借助外部工具的情况下结果都不正确,有兴趣的同学可以试试其他模型的表现。

229 个赞

试了下思维链提示词加持,Claude3.5 s和Gemini Pro 1.5,GLM4Plus,千问2.5 Math70b都顺利过关,千问偶尔会错(但他会列式解题)

所以其实没什么大不了的,这一波其实都是在用思维链加持而已

2 个赞

佬 思维链提示词指条路

2 个赞

17岁高中生那个?

4 个赞

哥们,你是没有注意到我给出的条件吗?为了测试模型的真实能力,我没有使用任何提示词。你用思维链提示词测试的结果与其他人的原生模型相比,公平吗?

6 个赞

画独角兽还是不行tieba_001
使用 ASCII 画一个独角兽

1 个赞

这个 app名字叫啥?

1 个赞

问他问题的时候让他think step by step。让他想慢点就是思维链

2 个赞

接口要自行用deno/vercel反代或者使用newapi中转,cloudflare workers不行

4 个赞

这么强。疯狂使用!

3 个赞

我直接把答案写提示词里

1 个赞

哈哈:blush:作弊都不打草稿

4 个赞

国内的大模型为了做对9.11和9.9比较问题,还真这样做了,我逆向KIMI的提示词时发现了,当时看到笑死了:rofl:

太龌龊了,还增加了tokens

时刻关注它的发展

这个gpt4o都能答对

1 个赞

gemini的app?

不是哦:neutral_face:

1 个赞

android的app封装的google的实验模型是吧,iphone的有么?

4 个赞

站内一位大佬开源的Chatbot,跟谷歌没有任何关系,也不是为Gemini定制的

不过UI确实是有点像Gemini

2 个赞