发现一个很有意思的题目只有claude3.7和gpt4.5能答对,其他模型全军覆没

我觉得Gemini这个回答较好

1 个赞


我这边r1其实已经思考过这种可能性了,但是最后的回答是这样的

:laughing:

2 个赞

关联网试试,you的4.5很真,但是掺冰了 :laughing:

1 个赞

感觉差不多可以下结论了,只有4.5和3.7能做对,真不真这个问题验一下就知道 :rofl:

他这个联网开关还得去设置里关 :tieba_087:
不知道怎么想的

:scream::scream:害怕

不仅如此,还内置一大堆提示词,以前3.5上下文不够就是提示词的问题,最真的模型,最拉胯的体验tieba_087

1 个赞

这个解读有点意思

有点猎奇了……

还不显示思考 :sob:

4.5的回答,虽然断了,但是。。。

cursor答得出来

昨天在x上看到这个图了,但是没明白为什么人称从我变成我们了,看了楼上所有的回答,似乎只有一个“羊是小孩,小孩和我都死了,被送上火车”能稍微解释,但是把羊说成小孩感觉引申地有点过了。。。。
好奇啊,有佬解答一下吗

Claude3.5 3.7,4o 稳定回答。o3mini ,gemini 2 不稳定。国内的全军覆没

过度解读了属于是

3.7 不带 thinking 的都可以
gpt 官网的我一开始试过了 4 4o o3-mini-high 都不行,最后试了 4.5 也不行

1 个赞

我试了3.7 thinking也可以,在github copilot里面试的

我第一眼都没看懂。。

1 个赞

哈哈哈哈哈哈我也是


我也是普号