太假了,这看着是特调的
以前的表现还是可以的,现在就有点落后了。主要是虚假宣传,就让我对这个品牌的印象很差
我想起了以前智谱做的代码执行和直接拒绝输出,那是有体验真是…到现在能力也是一般,没有半点出彩
1 个赞
在哪能用
吹得这么离谱也能信,怕不是在测试集上训练的
1 个赞
价格看上去可以
openai把推理过程藏起来了,只展示有价值的部分。。。所以你看不到循环看不到大量的自我否定
可是,要质量达到了才能谈性价比啊
O1思考非常非常快 每一步有独特的标题 不像有自我否定(最初有思考过程预览)
从推理时间可以看出来的,同一个问题o1思考10几秒,DeepSeek-R1-Lite需要40多秒,足够说明问题啦哈哈哈
非常快那是降智了
o1-pro会思考几分钟的
我绝对不会向他提问数学题 所以绝对不会让他思考超过1分钟
多数情况下我观察到o1的思考就是:理解用户问题,然后遵循政策(他只是确认一下) 中间会告诉我何时在进行哪一部分的任务,比如我的问题是两个,他会有一部分回答第一个问题,有一部分回答第二个问题
每一部分的思考时间都差不多,1秒左右,o1刚出来的时候还没有降智风波