同样是R1的模型
这是硅基的答案:
这是hf的答案:
还没修好吗?
HF有R1?
interface调用的together
让子弹先飞一会先
啊?又改了?
我的硅基,推理了4067个token,答案居然也是笨
不是说硅基的修好了嘛
过年在家电脑都没开,一直玩
我也遇到了同样的问题,英伟达的也是截断
我认为这只是推理的能力有限,不能完全正确地回答这个问题,所以会时对时不对。
我这边调硅基思考了好多。。。但最后还是错了
不要复制粘贴,AI生成的内容要截图发
硅基直接晕了
中文NLP分词问题,简直是地狱级
输出到2k token后就特别容易停止,估计是模型在写作任务上,没针对长输出做过训练。