Groq、Sambanova和硅基流动该上满血版的DeepSeek V3和R1了！

sonygod · 2025 年1 月 27 日 10:04

GROQ 的卡真快，之前没有出4O-MINI 之类的模型的时候，它的速度就一绝红尘，试下它的R1,感觉不错，

yeahhe · 2025 年1 月 27 日 10:04

看来要补课了，好像就听过这个词

F-droid · 2025 年1 月 27 日 10:04

现在的问题是，它什么时候上六千亿参数的满血版

F-droid · 2025 年1 月 27 日 10:05

速度要比硅基流动快，给人一种思考不需要时间的感觉

bbb · 2025 年1 月 27 日 10:07

groq2是什么

F-droid · 2025 年1 月 27 日 10:08

打错字了

sonygod · 2025 年1 月 27 日 10:10

想都不要想，它从不上高参数的模型，它是推理速度卡，不是大显存卡

F-droid · 2025 年1 月 27 日 10:11

原来是卡的问题

yeahhe · 2025 年1 月 27 日 10:13

是这个？
1266 token每秒

F-droid · 2025 年1 月 27 日 10:14

对，这个速度真的是快得吓人了

F-droid · 2025 年1 月 27 日 10:15

看看它这次是否打破常规，DeepSeek开源的模型比llama真的是先进太多了

Caun · 2025 年1 月 27 日 10:17

想问问4090 24G大概能跑多少b的deepseek模型，老师刚给了一张4090

F-droid · 2025 年1 月 27 日 10:19

32b应该可以，70b应该跑不动

Caun · 2025 年1 月 27 日 10:20

好的谢谢(^^)

yeahhe · 2025 年1 月 27 日 10:29

DeepSeek的275 token每秒，也很快，做沉浸式翻译挺好

F-droid · 2025 年1 月 27 日 10:30

翻译的时候出现思考过程有点尴尬呀

F-droid · 2025 年1 月 27 日 10:30

要不写个东西直接过滤掉吧

F-droid · 2025 年1 月 27 日 10:31

你可以申请API，反代一下扔到Cherry Studio就不需要科学啦

yeahhe · 2025 年1 月 27 日 10:32

这个还是只能做低级任务，问答我还是用DeepSeek网页端和o1

F-droid · 2025 年1 月 27 日 10:33

你的硅基余额应该也不少吧

话题		回复	浏览量
DeepSeek最近经常挂，Groq的DeepSeek R1可以派上用场了前沿快讯 DeepSeek , 人工智能	48	1600	2025 年1 月 29 日
本地部署70b以上的满血版R1,大概需要什么配置电脑? 搞七捻三 DeepSeek , 人工智能 , 快问快答	29	1474	2025 年2 月 7 日
DeepSeek-R1 开源版来了！！前沿快讯 DeepSeek , 人工智能	51	2119	2025 年1 月 21 日
671b， deepseek-r1 一会跑起来试试，是不是有佬友已经爽过了搞七捻三纯水	51	2680	2025 年1 月 25 日
硅基流动到底有什么用？看大家讨论挺多的搞七捻三人工智能 , 快问快答	41	745	2025 年2 月 3 日