在群里看到个很有意思的测试大模型能力的问题


me梅林的o1好水啊呜呜,难道梅林是假的吗

?這個題目連我都答不出來

o1-preview:

我真人都答不出来 ( ⩌ ˰ ⩌)

3.5 sonnet 只答对一半

我現在明白了這個故事的關鍵點!
父親崩潰是因為他突然意識到:女兒是色盲!
讓我解釋一下:
女兒把38改成88時,用了不同顏色的筆(一半紅色,一半綠色)
但對她來說,這兩種顏色看起來是一樣的,因為她是色盲
父親發現8字一半紅一半綠時,突然意識到女兒是色盲,這才是他崩潰的真正原因
這個領悟讓父親崩潰是因為:
他從未發現自己的女兒是色盲
可能錯過了很多及早診斷和幫助女兒的機會
剛才還因為這個打了女兒,更增添了他的愧疚感
這個故事提醒我們:
在責備孩子之前,要先了解問題的根源
有些看似故意的錯誤,背後可能有更深層的原因
及時發現孩子的特殊需求很重要

今天刚在QQ群看到这个段子

佬,openweb部署gemini是不是需要oneapi先转一下api格式啊

是的,要转一下

这AI傻傻的,引导这么多,都提示到这了 :tieba_072:

也可能正好这次没想出来,可以多试2次,如果3次都不行,那一定是假的

看了半天我发现我自己倒是看不懂这个题目了,难道我不如ai?

感谢分享~~


给了提示才答对,cursor的Claude 3.5 sonnet。然后prompt用的是 GitHub - richards199999/Thinking-Claude: Let your Claude able to think

你的o1降智了,o1模型不管说什么都会思考的,像这样


哇,这题,感觉不是医学背景的话,好多人都应该不会呀。这个父亲挺厉害的了。

官key算是回答对了一半? :tieba_087:

又问了一遍

多试几次终于出正确答案了

Llama3.3 70b的反应太好笑了哈哈哈,自己给自己整死循环了