如题, R1-0528, Qwen3, Doubao1.6都很慢
感觉还是算力不够、、
算力啊 国产替代还有很长的路
算力不够指的是显卡总量上不够还是单个(套)机器上的显卡性能不够呢?
理论上说都有点缺呢ww
整体上缺显卡,缺算力强劲的显卡和解决方案,这是美国一直打压的后果.
我觉得既是硬件原因,也是国内大厂们在AI应用落地的推进策略上较为激进导致的。
供给层面上,海外大厂过去几年在算力层面上的资本开支比国内大厂多很多。国内是由于一直没出现很靠谱的模型加上老美打压,所以在硬件上投入不够。但是自从Deepseek的V3和R1开源,国内大厂们终于看到AI在国内大规模应用的希望,所以今年才开始加大投入。
需求方面,DS出圈之后国内普通民众开始第一次感受到AI的威力,类似前几年老美的GPT时刻。咱们中国的网民全球最多,国内大厂们普通的硬件积累面对爆发出来的海量需求,当然就顶不住了。加上各家大厂都快速在自家旗舰应用上落地AI功能,需求就更大了。落地进度我感觉比海外大厂都快,太卷了。
3 Likes
国外部署的就速度快
开了代理了 开玩笑的
策略问题吧,低价共享算力没有资源保障,所以速度就比较随机
外国人用中国的模型就会觉得很快。。。因为他们用的时候,咱们这边是半夜
1 Like
ds凌晨2.5折,刚好就是美国白天,美国人爽用
其实都差不多。。。。晚上八点后用Gemini,Claude也巨慢。。。老外在我们的半夜用deepseek也巨快,还发帖夸呢
哈哈,双向了
1 Like
硬件原因。控制变量,同一个开源模型,国外云平台可以做得很快
deepseek网页版还可以啊,反正比阅读速度快就行了吧。硬件是一个方面,最近也有人怀疑oai偶尔会把量化版拿来充数。
此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。