部署满血版R1最低需要什么配置?

显卡数量主要决定的是支持输入和输出的长度

这玩意民用U没几个支持吧?感觉挺新的…

了解了佬。谢谢

1 个赞

几百万不至于吧,但几十万要的

公司配的工作站用的Intel(R) Xeon(R) Gold 5218 CPU @ 2.30GHz也不支持

印象里FP16的话,应该至少要1.3T的显存?

满血的话,


想要流畅使用,需要这些

1 个赞

想问下佬,这个是什么网站

真正的满血版 R1,多人(不是很多人:joy:)生产环境的话 H200 * 8 或 (H20 * 8) * 2,大概 300 万吧,一个人自己玩的话不需要,不过,几万还是需要的:joy:

就是上面提到的 https://tools.thinkinai.xyz/#/server-calculator 检测网站

1 个赞

满足于能跑起来的话,内存得800G吧。

看负载压力,一个人用和100人用,一次100 token和一次1000 token肯定差别蛮大的。

请教一下,需要 (H20 * 8) * 2 的原因是什么?
96G 显存 × 8 = 768G 不是够了吗?

参考资料:

我理解的第二篇的结论:大概就是 8 * H200 跑 Deepseek V3(R1 是同规模的) 没有问题,但如果考虑多人同时使用的情况,要是想有比较好的体验,尤其生产环境还要考虑一定的冗余的情况,有些勉强。

H20 性能上虽然没有比 H200 打对折,但一组 8 * H20 就会更勉强了,所以就需要 2 组。

有佬友在 (A800 * 8) * 2 的设备上跑了

感谢,我来学习一下,
上午刚找DELL服了价,DELL那边报的也是两台

DELL 的报价还是比较靠谱的:smile:

本质还是算力—— 671B参数在fp8精度下的计算需要百万级别的机器, 这也是play的一环吗?
04BDEE0D