找到一个能鉴别gpt-4-turbo-2024-04-09这个模型的问题

K_Martin · 2024 年4 月 20 日 16:54

只有gpt-4-turbo-2024-04-09能百分百回答正确答案乙，其它模型要么完全答不对，要么答对机率不高，包括gpt-4-0125也很大机率答错：

甲、乙、丙、丁四个人各说了一句话，甲：“我没有吃饭。”乙：“我说的是真话。”丙：“乙在骗人。”丁：“如果甲说的是假话，则丙说的也是假话，如果甲说的是真话，则丙说的也是真话。”已知其中三人都是说的真话，只有一人说的假话，则说假话的是

一键复制版本：

甲、乙、丙、丁四个人各说了一句话，甲：“我没有吃饭。”乙：“我说的是真话。”丙：“乙在骗人。”丁：“如果甲说的是假话，则丙说的也是假话，如果甲说的是真话，则丙说的也是真话。”已知其中三人都是说的真话，只有一人说的假话，则说假话的是

jolyne_kojo · 2024 年4 月 20 日 17:01

K_Martin · 2024 年4 月 20 日 17:02

如果问三次都是答乙那基本上就是gpt-4-turbo-2024-04-09了

jolyne_kojo · 2024 年4 月 20 日 17:06

还要问三次呀，不过这种类型的方法会有新的吗

K_Martin · 2024 年4 月 20 日 17:07

因为gpt4系的模型都有概率答对，但只有gpt-4-turbo-2024-04-09这个模型百分之百答对

jolyne_kojo · 2024 年4 月 20 日 17:08

感觉gpt能力越来越强了

xxx_aaa · 2024 年4 月 20 日 17:10

Chatgpt 4:

综上，如果甲没有吃饭，丙说乙在骗人，丁的复合条件语句也成立，唯一的假话是乙说他说的是真话。因此，说假话的是乙。

zhuxiaohuo · 2024 年4 月 20 日 17:11

Mark明天试下

lueluelue · 2024 年4 月 20 日 17:17

牛！！
可以放到代码块里，这样一下子就复制啦

甲、乙、丙、丁四个人各说了一句话，甲：“我没有吃饭。”乙：“我说的是真话。”丙：“乙在骗人。”丁：“如果甲说的是假话，则丙说的也是假话，如果甲说的是真话，则丙说的也是真话。”已知其中三人都是说的真话，只有一人说的假话，则说假话的是

K_Martin · 2024 年4 月 20 日 17:22

好建议，加上了

nat · 2024 年4 月 20 日 17:31

Llama3也通过了

K_Martin · 2024 年4 月 20 日 17:37

llama3我试过，十次能碰对一次就不错了

V1an · 2024 年4 月 20 日 17:38

这傻逼0125浪费我token

K_Martin · 2024 年4 月 20 日 17:42

这不是真的0125吧，感觉像7b小模型一样，被绕进去了

V1an · 2024 年4 月 20 日 17:45

librechat调用官方api，没设置prompt

Lucky_Lau · 2024 年4 月 20 日 18:13

GLM-4能答对，而且思路相当简洁清晰，比gpt4的思路好

Lucky_Lau · 2024 年4 月 20 日 18:14

bbb · 2024 年4 月 20 日 18:18

(llm red team的free glm4回答的)

xdygxh · 2024 年4 月 20 日 18:35

gptgod的gpt4不是0409

a2401314 · 2024 年4 月 20 日 19:24

用的官方PLUS，第一次答甲，第二、三、四次答乙…

话题		回复	浏览量
实锤官网GPT4偷偷换模型人工智能 chatgpt , openai	59	3864	2024 年4 月 24 日
Perplexity的gpt4turbo也变笨了？！人工智能 chatgpt	36	1052	2024 年3 月 31 日
有没有能测试真假gpt4的提示词？快问快答 chatgpt	6	311	2024 年4 月 20 日
佬友们，怎么区分一些GPT4模型啊？快问快答 chatgpt	25	793	2024 年4 月 3 日
技巧：如何用一个提问区分Claude-3和GPT-4？人工智能	19	800	2024 年4 月 16 日