三万八千八，DeepSeek带回家

Jobs · 2025 年3 月 18 日 02:12

模型的迭代跟部署工程的迭代是两码事。部署技术可以推广到所有模型上，二者并不冲突。
这个事情并不是没有意义的，可以看看业界实现，比如 exo labs 的研究。

superares · 2025 年3 月 18 日 04:18

exo lab 研究方向比这个靠谱

laikey.lau · 2025 年3 月 18 日 04:19

个人买有点贵了。公司买，Token又跟不上。。

tigerK · 2025 年3 月 18 日 04:25

部署qwq-32B 是不是性能会更好一些

Q：这套方案除了 DeepSeek-R1，是否也可以用于 DeepSeek-V3？

A：是的，这套方案也可用于 DeepSeek-V3。理论上参数量小于等于 DeepSeek-R1 规模的 MoE 模型都可以。

Jobs · 2025 年3 月 18 日 06:29

各有优缺点，exo 的基于 mac，相对来说成本更高。但是因为硬件统一，所以可靠性比较好。

momo521 · 2025 年3 月 18 日 06:36

个人部署综合成本还是不低

yhp666 · 2025 年3 月 18 日 06:42

我这纯CPU跑的ollama也有5tokens/秒呢啊，可这有什么意义吗？自娱自乐是可以的，但是不具备任何上生产环境的条件啊。

话题		回复	浏览量
【转载】不到 4 万元的 DeepSeek-R1-671B-Q8 部署方案前沿快讯人工智能	5	728	2025 年3 月 18 日
现在低成本部署 DeepSeek671b 量化 4 版本的效果如何？搞七捻三人工智能 , 快问快答	6	225	2025 年3 月 20 日
佬友们，求Deepseek显卡资源或一体机资源搞七捻三职场 , 纯水	33	285	2025 年3 月 13 日
【已解决】Deepseek的运作机制是什么搞七捻三 DeepSeek , 人工智能 , 快问快答 , 纯水	11	404	2025 年3 月 25 日
部署满血版R1最低需要什么配置？开发调优 ChatGPT , 人工智能 , 快问快答	35	887	2025 年3 月 13 日