说实话,没搞明白openai的思考系列模型。有人有通识文章讲讲他们的能力大概介于什么模型和什么模型之间吗?
o1-mini
o1
o1-preview
o1-pro
o3-mini
o3-mini-high
r1和他们比性能强弱呀?
平时没咋用过o系列的模型。想听听介绍。
说实话,没搞明白openai的思考系列模型。有人有通识文章讲讲他们的能力大概介于什么模型和什么模型之间吗?
o1-mini
o1
o1-preview
o1-pro
o3-mini
o3-mini-high
r1和他们比性能强弱呀?
平时没咋用过o系列的模型。想听听介绍。
综合来看的话是o1 pro>o1 >o3-mini-high >o3-mini >o1-mini
o3-mini-high 在STEM领域会略强于 o1
至于o1-preview,是划时代的一个模型,刚出的时候非常惊艳。但因为缺失多模态能力不好比较,现在也只有在api里能用到了
r1的综合水平和o1应该是相当的,但也是没有多模态
目前最强的是deep research,使用o3 full驱动
带mini就是知识库小相当于4o mini,没mini就是知识库大相当于4o
o1 pro相当于是多个o1合作解答
o3就是o1的第二代
o1 preview就是openai最开始和o1 mini一起放出来的思考模型,“智商”不如o1 mini
r1和o1比各有千秋
简单,看价格。。。
可以看看OpenAI自己给出的评测指标,值得注意的是 o 系列在数学、推理方面很强,但是 simpleqa 上却表现出显著短板,也就是在常规问题、世界知识方面是不如使用 4o 之类的模型的
o1pro应该是最强了
感谢热佬科普,这下懂了。
感谢热佬补充。大概了解了