4 Likes
但是之前能跑R1的 H20 * 8, 现在跑0528,input token限制好低啊。只有1452. 感觉带不动了。
NB,仅次于Google和openai,如果卡足够多,估计更强
有点厉害 qwen3顿时就黯然失色了 不过qwen3还是省卡
可惜r1输出太慢了啊
本地部署的满血,现在有55token/s,之前好像是20-30。
就是慢了点。。
真的,阻止我使用DeepSeek的唯一原因就是慢。Google的TPU+Gemini是真的快啊。
1 Like
好强! 坐等新的评测出炉
看看过段时间的风评
1 Like
今天下午用了2块钱,输出速度太慢了,也啰嗦,用来改生产项目太拖延了
后面果断换回了 gemini
1 Like
+1,我现在除非实在没办法,不然主要还是用gemini/qwen3,或者豆包的1.5prothinking
实在有点太慢了
此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。