现在的GPT-4.1指令遵循这么差吗?

在测试Cherry Studio的MCP功能发现现在的gpt-4.1跟个人机一样,我已经在系统提示词里再三说明了调用工具,它好像那个弱智一样搁那自说自话,搁那里胡诌,真的给我气乐了
用的azure openai 的gpt-4.1

5 Likes

人家主打的是便宜,而不是“听话”。

2 Likes

这么拉跨?

1 Like

是的就是这么拉跨,
我测试联网搜索,提示词里已经强调了搜索,我问什么是MCP,它就是不去搜索,自己搁哪里胡扯
我测试高德地图的MCP,让他帮我规划一个行程,它就硬邹啊!
除非就是在对话中非常明明白白的指明我要你调用工具,写在系统提示词理都不带理你的

那还是用o4mini吧

保国公的grok-3是真的不错