显卡数量主要决定的是支持输入和输出的长度
这玩意民用U没几个支持吧?感觉挺新的…
了解了佬。谢谢
1 个赞
几百万不至于吧,但几十万要的
公司配的工作站用的Intel(R) Xeon(R) Gold 5218 CPU @ 2.30GHz
也不支持
印象里FP16的话,应该至少要1.3T的显存?
想问下佬,这个是什么网站
真正的满血版 R1,多人(不是很多人)生产环境的话 H200 * 8 或 (H20 * 8) * 2,大概 300 万吧,一个人自己玩的话不需要,不过,几万还是需要的
就是上面提到的 https://tools.thinkinai.xyz/#/server-calculator 检测网站
1 个赞
满足于能跑起来的话,内存得800G吧。
看负载压力,一个人用和100人用,一次100 token和一次1000 token肯定差别蛮大的。
请教一下,需要 (H20 * 8) * 2 的原因是什么?
96G 显存 × 8 = 768G 不是够了吗?
参考资料:
我理解的第二篇的结论:大概就是 8 * H200 跑 Deepseek V3(R1 是同规模的) 没有问题,但如果考虑多人同时使用的情况,要是想有比较好的体验,尤其生产环境还要考虑一定的冗余的情况,有些勉强。
H20 性能上虽然没有比 H200 打对折,但一组 8 * H20 就会更勉强了,所以就需要 2 组。
有佬友在 (A800 * 8) * 2 的设备上跑了
感谢,我来学习一下,
上午刚找DELL服了价,DELL那边报的也是两台
DELL 的报价还是比较靠谱的
本质还是算力—— 671B参数在fp8精度下的计算需要百万级别的机器, 这也是play的一环吗?