参考资料:
我理解的第二篇的结论:大概就是 8 * H200 跑 Deepseek V3(R1 是同规模的) 没有问题,但如果考虑多人同时使用的情况,要是想有比较好的体验,尤其生产环境还要考虑一定的冗余的情况,有些勉强。
H20 性能上虽然没有比 H200 打对折,但一组 8 * H20 就会更勉强了,所以就需要 2 组。
有佬友在 (A800 * 8) * 2 的设备上跑了
参考资料:
我理解的第二篇的结论:大概就是 8 * H200 跑 Deepseek V3(R1 是同规模的) 没有问题,但如果考虑多人同时使用的情况,要是想有比较好的体验,尤其生产环境还要考虑一定的冗余的情况,有些勉强。
H20 性能上虽然没有比 H200 打对折,但一组 8 * H20 就会更勉强了,所以就需要 2 组。
有佬友在 (A800 * 8) * 2 的设备上跑了