推理过程和结果完全正确。OpenAI家的模型只有O1会,而GPT 3.5 和 GPT 4、GPT 4o在不借助外部工具的情况下结果都不正确,有兴趣的同学可以试试其他模型的表现。
229 个赞
试了下思维链提示词加持,Claude3.5 s和Gemini Pro 1.5,GLM4Plus,千问2.5 Math70b都顺利过关,千问偶尔会错(但他会列式解题)
所以其实没什么大不了的,这一波其实都是在用思维链加持而已
2 个赞
佬 思维链提示词指条路
2 个赞
17岁高中生那个?
4 个赞
哥们,你是没有注意到我给出的条件吗?为了测试模型的真实能力,我没有使用任何提示词。你用思维链提示词测试的结果与其他人的原生模型相比,公平吗?
6 个赞
画独角兽还是不行
使用 ASCII 画一个独角兽
1 个赞
这个 app名字叫啥?
1 个赞
问他问题的时候让他think step by step。让他想慢点就是思维链
2 个赞
接口要自行用deno/vercel反代或者使用newapi中转,cloudflare workers不行
4 个赞
这么强。疯狂使用!
3 个赞
我直接把答案写提示词里
1 个赞
哈哈作弊都不打草稿
4 个赞
国内的大模型为了做对9.11和9.9比较问题,还真这样做了,我逆向KIMI的提示词时发现了,当时看到笑死了
太龌龊了,还增加了tokens
时刻关注它的发展
gemini的app?
不是哦
1 个赞
android的app封装的google的实验模型是吧,iphone的有么?
4 个赞