OpenAI o1模型,测试9.11 比 9.8

刚在 x 上看到的测评哈哈哈。

5 个赞

啊这 哈哈哈哈哈哈

1 个赞

思考了,但不知道思考了个啥:crazy_face:

1 个赞

这个问题还是不行啊

1 个赞

1 个赞

這個是草莓嗎?


是这样的

1 个赞

我的是正确的啊

1 个赞

20s…
感觉不如我的4o:


甚至不如我的4omini:

这个思考只能说太抽象了。