[进化了，R1新版一次就对]deepseek深度思考反思一次就达到o1的程度

Myqwn2729 () 2025 年1 月 19 日 13:10 1

第一次没答对，但是非常接近，都是6000+，

第二次告诉他：“错误的”

直接反思打出了正确答案

4 个赞

Myqwn2729 () 2025 年1 月 19 日 13:11 2

从佬友的帖子看，现在深度思考可能已经是最新的 R1-preview

agromgt 2025 年1 月 19 日 13:13 3

佬友原题可以发一下吗？

Myqwn2729 () 2025 年1 月 19 日 13:14 4

1 个赞

Myqwn2729 () 2025 年1 月 19 日 13:15 5

问题2，只有o1能打出来

agromgt 2025 年1 月 19 日 13:17 6

这种计算量大的，其实gpt4o能用代码解释器完成。

Myqwn2729 () 2025 年1 月 19 日 13:22 7

那就没意思了，就是故意要考验纯token preditction在复杂数值计算的准确性

Myqwn2729 () 2025 年1 月 19 日 13:22 8

因为能不能答这个问题不重要，有没有能力理解和保持数值和逻辑约束比较重要

agromgt 2025 年1 月 19 日 13:25 9

嗯，同意，这些题目拿来测试不错。实际使用的时候考虑一下成本和自己的要求，代码解释器也是不错的选择。

1 个赞

Kio (Kio) 2025 年1 月 19 日 13:27 10

非常随缘，一次没对

1 个赞

handsome (大帅哥) 2025 年1 月 19 日 13:42 11

哇，挺好的

agromgt 2025 年1 月 20 日 11:15 12

deepseek r1今天已经可以一次性答对了！感觉很不错。

zu3 (z) 2025 年1 月 20 日 11:53 13

确实强，试了下第一个问题倒是还是答不出来

Myqwn2729 () 2025 年1 月 20 日 14:45 14

确实，今天更新了R1-preview之后，直接0-shot正确，牛逼啊

To1xuan 2025 年1 月 20 日 15:10 15

剛剛試了試，確實很猛

stevessr (Stevessr) 2025 年1 月 20 日 15:12 16

R1自我升级……

话题		回复	浏览量	活动
DeepSeek-R1区分题库测试结果：相比DeepSeek-R1-lite提升巨大开发调优人工智能	8	436	2025 年1 月 20 日
这道题只有DeepSeek R1会做！搞七捻三 DeepSeek , 人工智能	77	1320	2025 年1 月 22 日
DeepSeek R1 Lite Preview明显被夸大且表现不佳搞七捻三人工智能	13	1125	2025 年1 月 21 日
书接上文，Only DeepSeek can do! 搞七捻三 DeepSeek , 人工智能	19	765	2025 年1 月 22 日
DeepSeek官网貌似已经更新DeepSeek-R1-Preview 搞七捻三人工智能	17	547	2025 年1 月 20 日