佬们,听说claude 3.7调用MCP工具最丝滑,是因为MCP是a社原生的,训练集里包含了大量MCP工具?
请问其他还有调用好用的模型吗?我试了R1和2.5 pro,发现2.5 pro根本识别不出工具,R1调用的还凑合,还是不及3.7 sonnet。
佬们,听说claude 3.7调用MCP工具最丝滑,是因为MCP是a社原生的,训练集里包含了大量MCP工具?
请问其他还有调用好用的模型吗?我试了R1和2.5 pro,发现2.5 pro根本识别不出工具,R1调用的还凑合,还是不及3.7 sonnet。
豆包 seed 1.6
claude 4
佬,sonnet opus哪个更好用?
帮顶,我也好奇哪个模型MCP厉害
opus我没用过啊。
选择调用 MCP 最佳的就是 claude 系列
claude 调用的倾向(就是意图和频率) 比其他模型高 而且准确
帮顶,我也好奇哪个模型MCP厉害
claude 3.7,claude 4
deepseek 系列的function call 都不行
感觉gemini调用MCP也不是很行,但是评测说跟claude4差不多
这还用问吗
MCP规范
是谁打造的?
Anthropic
Claude
是谁家儿子?
Anthropic
亲儿子都不行谁家行?
至于其他 试试Qwen的
确实,无论是调用MCP积极性还是速度都是独一档。
我猜是预训练或后训练数据大量包括MCP工具调用,特调过了。
好处是调用MCP在编程场景下,能力大幅提升,
坏处是降低了自然语言处理的能力,导致其他跑分都不行。
总之,claude最深的护城河还是工具调用?
no 还有视觉理解上 也有能力偏向在
还有就是 代码场景 “精确”
视觉理解不是gemini一家独大吗
我指的是 设计理解
比如跟他头脑风暴时凭空起UI
其他的不太能比得上Claude
当然这有点点主观了
哦哦,这个确实,claude可能是前端特调了
我设置了deepwiki的mcp, 让gemini调用deepwiki去回答一个问题, 然后直接报过去1M限制, 不知道怎么回事, 可能问的问题太宽范啦