最好的致敬是学习:DeepSeek-R1 赏析

先贴来源:最好的致敬是学习:DeepSeek R1 赏析

强烈推荐看看,兴趣是最好的老师,相信你看了这个视频过后,你会更有兴趣去看看 DeepSeek 背后做的一些工作。

同时这个视频也能让网络上的一些谣言 不攻自破

  • 满血版 R1?
  • 600 万训练成本?
  • 偷偷藏卡了?
  • 本地部署?
  • 蒸馏?偷窃?

简易理解 R1 是怎么出来的:

最后贴一段话:

在巨大的创新面前,一切跳梁小丑都显得额外的滑稽。

噪音会随着时间逐渐消减,那几篇技术报告却会跨越这些喧嚣对这
个世界产生持续的影响。

这是真正的创造之美,让能体会到其美丽的人视为珍宝。

希望你也能感受到这种美好。

17 Likes

我也特别喜欢看ds事情

2 Likes

哈哈,我也是,前面论坛也有个帖子也看了:《Deepseek时刻》原创长文,深度分析Deepseek这几天在全球到底发生了什么(1月28日17点40更新)

可惜手机党很难体验舒服的满血ds

1 Like

火了之后,现在 API 太慢了,以前用着还是挺爽的

试试chatbox + 火山的api

API要用火山的吗

1 Like

实测火山引擎的R1,回复比较快,也基本没什么截断的情况

用着算是比较舒服的 :bili_106:

呃,这个简单理解还需要再简单一点。。。我还是没明白r1的推理特性是怎么出来的

火山链接能给一个吗佬友

火山唯一需要注意的是,使用接入点作为模型ID,在Cherry里要手动配置下。(在newapi里要重定向下显示的模型名)

可以看这里,站里佬友总结的很齐全了~ CherryStudio调用火山豆包、百度千帆、阿里百炼、腾讯云API

嘶。。。我去看看

这个是 Monica ai 讲的啊
不知道是公司的什么团队

:tieba_087:原来是这样子吗

我是在推上看到有人分享这个,感觉他们圈子人都认识,比如鸭哥,yushen 这些

大帅哥每天很早上论坛呢 :tieba_025:

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。