初探“小版本”更新后的R1:决定性的超长深度思考

今天 DeepSeek-R1 迎来了一次小版本更新

小吗?我怎么不觉得

上图

Pass@1 一遍过

1158秒的思考!接近20分钟!这是一个闻所未闻的时长,也是一个决定性的时长

在这样的超长思考下,我敢说R1可以解决相当一部分以前做不对的题,错误的概率和不稳定性应该也会降低


缺点呢?等不起啊等不起~

14 Likes

题源:区分题库T3

1 Like

这么长时间谁能等的了

1 Like

我这都25分钟了

我本来想引你第一篇帖子,说我比你长的,结果你反手来了一个25分钟 :tieba_087:

2 Likes

有利有弊,说实话,r1确实强,但是你愿意花一两分钟等o4mini还是十分钟二十分钟等r1呢?更别说r1还不支持ocr

4 Likes

我最新的记录是 24分钟52秒

不错不错

看到了看到了,本来想引用的是

看完你那个新纪录给我干哑火了

数学应该是有提升的

2 Likes

以前也有过超长思考,最开始的时候,然后服务器爆炸,再能用的时候就短了很多

能力提升了多少

1 Like

就测了一道题

还是想太多

这么长时间。。

太长了吧 这等得起么

时间不是重点,如果是一个字一个字的吐,吐一个小时都行,主要是看看思考内容的长度

2 Likes

image
春节那段时间确实有过

时长主要看吐字速度吧,如果速度上来了应该就好一些了

出R1这个更新,那R2岂不得至少还得等一个月了