结论:数学能力不如蒸馏版的DeepSeek-R1-distill-llama-70b。
推荐使用 Lambda Chat的完整版本R1(长时间思考会中断)。
纳米的应该是自己部署的…小参数不是全参数版本的
4 Likes
app感觉也做得很一般,思考过程不能折叠
测一遍数学感觉数学能力不如蒸馏版的DeepSeek-R1-distill-llama-70b
所谓满血版是提示词“至少输出一万字”,被发现了现在又改回去了,模型不变
5 Likes
笑死我了,确实是奇虎的做事风格。
骚的没边
不如 Lambda Chat的完整版本R1,网页端也能用,虽然长时间思考会中断,但是没有360高速专线这么虚
这是32b的
这个怎么选模型来着
app端才能
觉得太贵了
我再试试DeepSeek-R1(偶尔岩机)