【DeepSeek R1-671B全量运行!真正满血!仅需一张16G显存显卡! 人人都能拥有 671B Q4量化 Ktransformers架构 单卡4090运行】 DeepSeek R1-671B全量运行!真正满血!仅需一张16G显存显卡! 人人都能拥有 671B Q4量化 Ktransformers架构 单卡4090运行_哔哩哔哩_bilibili
这个感觉方案可以诶,大内存降低显存需求,视频上看速度和硅基免费版差不多,这样看来以后就会有更多便宜的R1可以用了吧
【DeepSeek R1-671B全量运行!真正满血!仅需一张16G显存显卡! 人人都能拥有 671B Q4量化 Ktransformers架构 单卡4090运行】 DeepSeek R1-671B全量运行!真正满血!仅需一张16G显存显卡! 人人都能拥有 671B Q4量化 Ktransformers架构 单卡4090运行_哔哩哔哩_bilibili
这个感觉方案可以诶,大内存降低显存需求,视频上看速度和硅基免费版差不多,这样看来以后就会有更多便宜的R1可以用了吧
“大”内存
真 大 内存
480GB的D5内存会比多买个卡更便宜吗?
没用,照这么说3060也能运行满血的,反正就往内存里放呗。
刚好在官网看了一眼,1T内存。。。
我下载了个14B可以用
所以其实还在紧密开发中吧~~
只有671B才能称作满血,所有其他的都是蒸馏其他模型,比如14B本质是Qwen2.5。所有这种标题党说能个人电脑运行满血deepseek的,看都不用看直接拉黑
便宜得多,一张64G D5 内存1000多,一张H100 20w
是的,看了下,预计还能提升性能
速度不一样吧,他这个推理速度还可以吧,感觉和我用硅基免费版差不多
ytb上有用虚拟内存,干到600g 也是可以的
虚拟内存就更慢了吧,虚拟内存不是内存不够把数据往硬盘里塞么
那是非常慢,0.09 tokens/s
看完官方文档可惜没环境论证
感觉这个对于想本地部署的企业来说是个好消息,如果能优化到15t/s的话。大多数企业不是很想把自己私有数据分享出去的。
这个很有意义,成本一下子低了N倍
是啊,但是这个只针对moe,或者说稀疏模型有用,r1激活参数才30多B