o1-preview和claude-3.5-sonnet哪个更好

o1是用来解决需要复杂推理的问题的吧,openai也说了不是用来替代4o的通用模型,也就是说对于没有需求的人,或者不涉及推理的问题,o1是没啥用的

2 Likes

o1-preview 提问的时候加个在数学上,就能答对。

加这个的话,Gemini 也能答对。(Opus、Cohere、Llama 加了还是寄)

1 Like

应该是不同产品维度。相信不久后claude,甚至国产那些大模型,都会出相似的竞品。

咋个配哦,自己配的吗?

1 Like

不是很懂,想知道在这个测试上两者差距在多少呢 :crazy_face:

1 Like

o1 还是强一点的,一些原创的算法题也能做对

2 Likes

珍惜一下还没降智的版本吧,不知道后面会不会降智

1 Like

Claude 需要用指定模型,增加 cache_control 参数,见 官方文档

DeepSeek 默认开启

4 Likes

WoOoOOoooW ,知道啦,谢谢!

价格差了5倍,模型质量有高过claude 3.5 5倍吗,我感觉连一成都没有,你说选谁?

2 Likes

蹲一下怎么配

3 Likes

我测试结果也是这样,打分的话preview 90(小bug更少) claude 80(能运行) mini 不及格

就是看平常是文字处理多还是需要用到推理,文字处理还是claude3.5sonnet舒服, 反应快


貌似是这个样子,但是我也不确定是不是调用的API

1 Like

你真好,谢谢啦。我是白痴,只会在第三方客户端填地址。 :joy: :joy: :joy:

claude 吧,o1刚刚测试了,前奏说明看上去很炫,但是结果没啥提升,还等着ai能帮我解决开发上的问题 :joy:

谢谢佬的解惑

说是o1正式版还没出,o1preview只是阉割版

等anthropic出对标o1的产品