这些第三方模型都缩水严重。同一个问题,azure和Nvidia通常只会快速思考7次的样子,而官方可以14多次。如果在提示词中加入「起码输出1000字的回复」,这样就可以倒逼这两个进行深度思考
1 个赞
字数限制是吧,r1有用吗
1 个赞
输出过长给你截断就老实了
用官方 api 的时候经常没思考完就超过最大单次输出 token,然后让他继续,他又开始思考,浪费钱。。
1 个赞
英伟达不截停,非极端复杂问题几乎不可能触发
那么,哪个第三方的好用?