一个中国古代常识引发的思考:o1-mini仅是gpt-4o-mini的升级版?

问题:披发左衽的意思是?
百度百科:https://baike.baidu.com/item/披发左衽/2308225

我测试了gpt-4o-mini, gpt-4o, o1-mini, o1-preview, claude-3-5-sonnet

模型回答分为两类:
1、gpt-4o-mini和o1-mini认为披发左衽是汉族的传统文化(实际是错误的)
2、gpt-4o,o1-preview和claude-3-5-sonnet认为是夷狄的传统(正确的)

这是否说明o1-mini可能是gpt-4o-mini的思考版(底层可能还是gpt-4o-mini那一套数据库)

20 个赞

放一个o1-mini和o1-preview的对比图,另外这个问题感觉也可以专门用来鉴定4o和4o-mini、o1-mini和o1-preview

4 个赞

是被降智了吧

2 个赞

并没有,我用的官方api,不是网页版的逆向

2 个赞

训练语料的问题吧

3 个赞

4o-mini 好像是 4o 的蒸馏版,o1-mini 不是 o1-preview 的蒸馏版,而是一个完善的模型,o1 满血版还没开放

4 个赞

一直觉得o1系列是否就是gpt4系列做了一些基于提示词的优化产生的。目前看的话gpt4o-mini可能跟o1-mini是一个语料库

2 个赞

可是openai的模型中,o1-mini和4o-mini对这个问题的回答却是一致的,答案与4o和preview正好相反

3 个赞

贴一张gpt4o-mini和gpt-4o的对比图

1 个赞

应该是,思维链模型是有一个基底模型的,只是用了RL的方法教会了基底模型试用思维链方式进行慢思考,o1mini应该基底模型就是4omini,o1应该就是4o了

2 个赞

训练的数据截止时间是高度吻合的

2 个赞

问题也会影响答案 :tieba_072:
用的4o

但是都不是很对

2 个赞

o1mini, 我不用。

2 个赞

其实回答得都对,披发左衽一指夷狄的传统,二指葬礼服饰(不过不知道是去世的人穿的还是服丧的人穿的)

1 个赞

正解,大佬牛!
不过感觉o1-mini既然被认为o1模型的一个正式版,而preview是预览版,反而是后者用的语料库质量好些

1 个赞

用大模型如烹小鲜,而我,不会做饭

2 个赞

pplx pro o1-mini没问题啊

2 个赞

是不是混了4o模型

1 个赞

也发我自己的一个典藏很久的问题,非常容易区分 4o-mini 和 4o:

「我自横刀向天笑」 的作者是谁

gpt-4o-mini

gpt-4o

4o-mini 稳定不会,而 4o能稳定输出正确答案。


刚刚我试了下 o1系列的,可以看到 o1-mini 也是不对的,o1-preview 则能对。我感觉应该是符合 @haly 佬友猜想的

o1-mini

o1-preview

5 个赞

是的,o1-mini作为正式版(虽然是mini),却不用好点的语料库!

跑个题,佬友的4o-mini回答里面说这个诗的作者是岳云鹏哈哈哈哈

1 个赞