硅基流动的R1严重缩水且截断!

因为 Siliconflow 上的 R1 的 8K max output tokens 是包含 CoT tokens 的,而官方是 32K + 8K (default 4K)


看我这个,API应该是本地部署的R1,前面还有很长的内容懒得截图了,回答完全牛头不对马嘴,我很伤心。

写作任务包含COT也很难超过2K。 但代码任务或者解题,往往能跑满8K。感觉是模型本身在写作任务上不足,而不是因为受到max token的限制。

az的 r1


本地部署的

咋部署的佬

牙膏倒吸,max token比以前还少

硅基的说明里面也不写清楚


硅基回答正确了哦现在