现在Deepseek服务器爆炸,转圈圈两分钟还不给我回应,正好发个贴问问
第一个,官网和官方API渠道,这两个用的都是满血模型吗?会不会为了省服务器,用了蒸馏的?
第二个,现在满世界都是Deepseek服务,各大API商也都陆续上新了。可以预料到会有大量不良商人用自己部署的7B甚至更差的蒸馏模型来冒充官方API,然后用比官方稍低一些的价格开卖。请问这个时候怎么去分辨是商人自己部署的蒸馏版,还是官方纯血版?
非常感谢
现在Deepseek服务器爆炸,转圈圈两分钟还不给我回应,正好发个贴问问
第一个,官网和官方API渠道,这两个用的都是满血模型吗?会不会为了省服务器,用了蒸馏的?
第二个,现在满世界都是Deepseek服务,各大API商也都陆续上新了。可以预料到会有大量不良商人用自己部署的7B甚至更差的蒸馏模型来冒充官方API,然后用比官方稍低一些的价格开卖。请问这个时候怎么去分辨是商人自己部署的蒸馏版,还是官方纯血版?
非常感谢
建议直接指定给官方人员
可以尝试用这个分辨?
先去用groq的 deepseek-r1-distill-llama-70b
,免费的。等待官网完全好了,再去用官方的R1。
现在官方的R1不稳定,还无法判断它解决自己问题的能力。
等恢复了,看看和70B比,回答有没有惊艳的感觉就知道了
蒸馏还是比较好分辨的,600多B 原版困难的是部署方式BF16、F8_E4M3 F32 3种原版。第二种最节约显存。毕竟是8位的。这3个分辨不了,然后还有量化那么多,老周的估计是F8的。节约资源。量化也有可能自己量化一个4位 6位 。更节约。F8_E4M3 F32 就看老周有没有H800了,A100用不了。
请问蒸馏怎么分辨啊?能详细说说不
不是,老哥,有免费的70B蒸馏 你去试试相同提问 多问几个不就知道了么。。。
要不看看思考长度
楼主知道了吗,教教我
groq 无法战胜的,搞了几个号连带以前的全被封了
听说:只能用一个号,轮询会封号
应该是,我用不同邮箱、github、谷歌授权登录获取账号,然后注册的ip还是不一样的,并且轮询的接口用官方+其他反代接口
结果还是全部扬了,连带以前(三个月前)的账号全军覆没
由此可见,groq不可战胜的
拼尽全力也无法战胜groq
轮询的时候是用完全分离的IP吗?
对的。。所以我才说拼尽全力也无法战胜
蒸馏的话 如果没有标注 还算是比较好分辨的
速度 包括 语言习惯差距不小
但是量化就不好说了 4b 8b 算力差距很大
回答虽然大体上方向会是对的 但细节可能会有不同 导致最终结果错误
hh 6
目前似乎只有官网和官方API是满血,其它都是蒸馏版本。
具体排查,论坛找个限定o1/r1能回答的问题,问一下就可以了。
官网间断性可用,API目前一直是不可用。但是服务监控上显示api比较稳定,可能是旧用户付费才能稳定体验?
app也是蒸馏的吗?
app也是官方版本
但是个人用着稳定性好像比网页差点,也可能是用app的时候运气差
这两不是一个级别