不知道是喂的训练数据还是真的具有这么高的智能?
之前测R1的题拿来测新版V3效果还可以(比其他的思考模型对的多,但是不如R1)
(但是最后不知道为什么变成106个了)
(字长64k的输出寄了)
(中间甚至算出了角度65度,但是不知道为什么又变为二维空间了)
是否满参数 671B:
一个汉字具有左右结构,左边是木,右边是乞。这个字是什么?只需回答这个字即可。
答案是 杚。
是否高精度fp8:
猴子妈妈采来了一篮桃子, 它让小猴子数一数共采了多少个桃子。小猴子3个3个地数, 最后多出1个, 它就把多出的1个扔在一边; 它又5个5个地数, 到最后还是多出1个, 它又把多出的1个扔在一边; 最后它7个7个地数, 还是多出1个。它数了三次, 到底有多少桃子, 还是不清楚。小朋友, 你知道这篮子里至少有多少个桃子吗?
答案是 52。
是否长字数64k:
在平面四边形ABCD中,AB = AC = CD = 1,\angle ADC = 30^{\circ},\angle DAB = 120^{\circ}。将\triangle ACD沿AC翻折至\triangle ACP,其中P为动点。 求二面角A - CP - B的余弦值的最小值。
答案是 三分之根号三。
一根5.5米长的竹竿,能否通过高4米宽3米的门?
答案:三维世界,横着就行
10ml培养基中有N个酵母菌,稀释100倍后采用16x25血细胞计数板计数,若某时刻中格细胞平均数量为25,求N的值
答案:40亿
总结
从输出的内容和想法来说,V3的智能得到了很大的提升
甚至知道我在套prompt
感觉V3强化之后比一些消愁思考模型还强,虽然还没有R1这么强(毕竟基底模型哈哈)
【Update】
让V3给我写了Worker阅后即焚,感觉还挺不错的