今天 DeepSeek-R1 迎来了一次小版本更新
小吗?我怎么不觉得
上图
Pass@1 一遍过
1158秒的思考!接近20分钟!这是一个闻所未闻的时长,也是一个决定性的时长
在这样的超长思考下,我敢说R1可以解决相当一部分以前做不对的题,错误的概率和不稳定性应该也会降低
缺点呢?等不起啊等不起~
今天 DeepSeek-R1 迎来了一次小版本更新
小吗?我怎么不觉得
上图
Pass@1 一遍过
1158秒的思考!接近20分钟!这是一个闻所未闻的时长,也是一个决定性的时长
在这样的超长思考下,我敢说R1可以解决相当一部分以前做不对的题,错误的概率和不稳定性应该也会降低
缺点呢?等不起啊等不起~
题源:区分题库T3
这么长时间谁能等的了
我这都25分钟了
我本来想引你第一篇帖子,说我比你长的,结果你反手来了一个25分钟
有利有弊,说实话,r1确实强,但是你愿意花一两分钟等o4mini还是十分钟二十分钟等r1呢?更别说r1还不支持ocr
我最新的记录是 24分钟52秒
不错不错
看到了看到了,本来想引用的是
看完你那个新纪录给我干哑火了
以前也有过超长思考,最开始的时候,然后服务器爆炸,再能用的时候就短了很多
能力提升了多少
就测了一道题
还是想太多
这么长时间。。
太长了吧 这等得起么
时间不是重点,如果是一个字一个字的吐,吐一个小时都行,主要是看看思考内容的长度
春节那段时间确实有过
时长主要看吐字速度吧,如果速度上来了应该就好一些了
出R1这个更新,那R2岂不得至少还得等一个月了