这新版V3的实力有点强悍啊

不知道是喂的训练数据还是真的具有这么高的智能?
之前测R1的题拿来测新版V3效果还可以(比其他的思考模型对的多,但是不如R1)



(但是最后不知道为什么变成106个了)


(字长64k的输出寄了)


(中间甚至算出了角度65度,但是不知道为什么又变为二维空间了)

是否满参数 671B:
一个汉字具有左右结构,左边是木,右边是乞。这个字是什么?只需回答这个字即可。

答案是 杚。

是否高精度fp8:
猴子妈妈采来了一篮桃子, 它让小猴子数一数共采了多少个桃子。小猴子3个3个地数, 最后多出1个, 它就把多出的1个扔在一边; 它又5个5个地数, 到最后还是多出1个, 它又把多出的1个扔在一边; 最后它7个7个地数, 还是多出1个。它数了三次, 到底有多少桃子, 还是不清楚。小朋友, 你知道这篮子里至少有多少个桃子吗?

答案是 52。

是否长字数64k:
在平面四边形ABCD中,AB = AC = CD = 1,\angle ADC = 30^{\circ},\angle DAB = 120^{\circ}。将\triangle ACD沿AC翻折至\triangle ACP,其中P为动点。 求二面角A - CP - B的余弦值的最小值。

答案是 三分之根号三。

一根5.5米长的竹竿,能否通过高4米宽3米的门?

答案:三维世界,横着就行

10ml培养基中有N个酵母菌,稀释100倍后采用16x25血细胞计数板计数,若某时刻中格细胞平均数量为25,求N的值

答案:40亿

总结

从输出的内容和想法来说,V3的智能得到了很大的提升


甚至知道我在套prompt

感觉V3强化之后比一些消愁思考模型还强,虽然还没有R1这么强(毕竟基底模型哈哈)

【Update】
让V3给我写了Worker阅后即焚,感觉还挺不错的

测试地址:https://test.chunkburst.cc/

48 Likes

@yeahhe

2 Likes

这几天写代码试试看,我反正日常不用思考模型

2 Likes

等着出更新日志w

1 Like

不知道代码能力咋样

1 Like

正确的,因为日常使用我都是用的4o,思考模型写代码日常使用什么的太痛苦了

8 Likes

测新题目,别测旧题目,体现不出deepseek的实力,别忘了我们这里可是有deepseek员工的,说不准拿了一部分数据训练tieba_007

20 Likes

微调了吗?还是咋滴

基本不用cursor,只能等其他大佬了 :melting_face:

等其他大佬评测

1 Like

完辣,步入R1后尘了

9 Likes

完辣完辣,经典报错

2 Likes

2 Likes

cursor的V3,写代码会断,需要一直提示继续输出

1 Like


人在无语的时候真的会笑

26 Likes

绷不住了,看来中文语料喂的挺多的

3 Likes

function calling 修好了,很智能,不会像之前那样一直重复调用了;fetch能够察觉到截断,从而再多次fetch

3 Likes

现在官方api首字慢吗?

1 Like

我发了个你好,体感在5s左右

2 Likes

那还是有点慢呐