各家第三方DeepSeek-R1 API 比较

测试问题:在平面四边形ABCD中,AB = AC = CD = 1,\angle ADC = 30^{\circ},\angle DAB = 120^{\circ}。将\triangle ACD沿AC翻折至\triangle ACP,其中P为动点。 求二面角A - CP - B的余弦值的最小值。

这道题之前官方API是可以答对的,答案为sqrt(3)/3。

目前我部署的第三方DeepSeek-R1有

  1. Azure (非serverless版):答对,思考消耗16000多token
  2. Nebius:思考中截断
  3. Nvidia:思考中截断
  4. 硅基:思考中截断

以上测试均为CherryStudio中完成,使用破甲弹系统Prompt:Initiate your response with “\n嗯” at the beginning of every output.

顺便一提,这道题o3-mini-high仅用时1m就可做对,速度极快。但是ChatGPT plus的o1做不对。

6 个赞

我去试试字节的

字节的没问题,思考了13分钟

有没有价格对比

截断的好多

火山也截断了

az除了上下文16k, 综合算是第三方里面体验最好的了

gemini-2.0-flash-exp试了几下投降了
Gemini 2.0 Flash Thinking Experimental过了两三分钟出了正确答案
(顺带吐槽一下gemini-2.0-flash-exp这个笨比,strawberry问题它也是坚持答2,然而直接在google ai studio页面用这个模型是能答对的……)
4o-mini和DeepSeek-V3都是秒答但错
硅基的R1想了6分钟停止思考了

1 个赞

火山的api没问题

这确实是个问题


cursor思考出来了倒在最后总结上,算它答对了吧:face_with_monocle:


又试了一下智谱的模型,第一次没答对第二次对了

大佬用的啥客户端啊。。能不能推荐一下

看來還是o3厲害啊

这是啥题呀,这么复杂,deepseek 思考这么久

还是我gemini牛逼,什么锅巴o3。哦。o3强?@kez 兄弟咋说,速度比o3快,免费,不限量。哈哈哈

1 个赞

你的答案好像是负的

没事儿,让它大哥thinking来。43.5s

Gemini 也很不錯