智谱zero，只是超过了o1p而已~

hasakey · 2025 年1 月 2 日 03:41

太假了，这看着是特调的

yeahhe · 2025 年1 月 2 日 03:48

以前的表现还是可以的，现在就有点落后了。主要是虚假宣传，就让我对这个品牌的印象很差

lbls888 · 2025 年1 月 2 日 16:10

我想起了以前智谱做的代码执行和直接拒绝输出，那是有体验真是…到现在能力也是一般，没有半点出彩

lueluelue · 2025 年1 月 2 日 20:58

在哪能用

PurpleSword · 2025 年1 月 2 日 21:03

吹得这么离谱也能信，怕不是在测试集上训练的

wwow · 2025 年1 月 2 日 22:37

价格看上去可以

jcc · 2025 年1 月 3 日 00:38

openai把推理过程藏起来了，只展示有价值的部分。。。所以你看不到循环看不到大量的自我否定

hwang · 2025 年1 月 3 日 01:04

可是，要质量达到了才能谈性价比啊

StellaFortuna · 2025 年1 月 3 日 01:12

O1思考非常非常快每一步有独特的标题不像有自我否定(最初有思考过程预览)

hunter666 · 2025 年1 月 3 日 01:20

从推理时间可以看出来的，同一个问题o1思考10几秒，DeepSeek-R1-Lite需要40多秒，足够说明问题啦哈哈哈

jcc · 2025 年1 月 3 日 03:28

非常快那是降智了

o1-pro会思考几分钟的

StellaFortuna · 2025 年1 月 3 日 05:52

我绝对不会向他提问数学题所以绝对不会让他思考超过1分钟
多数情况下我观察到o1的思考就是:理解用户问题，然后遵循政策(他只是确认一下) 中间会告诉我何时在进行哪一部分的任务，比如我的问题是两个，他会有一部分回答第一个问题，有一部分回答第二个问题
每一部分的思考时间都差不多，1秒左右，o1刚出来的时候还没有降智风波

话题		回复	浏览量
智谱zero宣传（超过o1 preview）和我的实际测试结果相差巨大，我的测试题库仅供参考开发调优人工智能	11	516	2025 年1 月 2 日
找了一道理科高考数学大题，o1模型能做出来。模型来挑战？开发调优 ChatGPT , OpenAI , 人工智能	58	935	2025 年1 月 8 日
一道小五奥数题，o1，Kimi数学版，豆包全军覆没，我懵了开发调优人工智能	64	1933	2025 年1 月 8 日
这道题有没有模型能作对。有没有佬试一下o1 pro 开发调优人工智能	75	506	2025 年1 月 8 日
【长期更新Wiki】语言模型区分题库：主要用来区分语言模型，也能测试逻辑能力文档共建人工智能	237	3310	2025 年1 月 8 日

智谱zero，只是超过了o1p而已~

相关话题