(修改一下,之前不够严谨)4o的智商时好时坏

低配版的4,速度提升巨大,基本和3.5差不多了,还是多模态,就是注意力和指令遵守也下降了
价格刚好是turbo的一半,感觉是4已经没啥优化空间了

更新:
在没有“引导提示(prompt)”的情况下,经过大量测试发现,4o的回答质量不稳定,有时好有时差。在竞技场中,当“im-also-a-good-gpt2-chatbot”与4o同时匹配时,答对的模型时而互换

截图


这是我用的openrouter的api,4o和我在竞技场随到的"im-also-a-good-gpt2-chatbot"差不多
分别使用引导和无引导的prompt提问

截图



胡说八道


群友发的,没把我乐死,应该是套的3.5。套模型最喜欢用回答速度相似的模型来浑水摸鱼
上面这句是口胡,忽略

啊这,还以为是真的


官网上也是错的 :sweat_smile:

概率问题,有时候对,有时候错

确实,经过我大量测试,在没有prompt引导的情况下,回答质量时好时坏

至少快了

coze的gpt-4掺水了

总结

还打不过gpt4o

总结

我怀疑是oai把auto用上了,进一步减少免费用户4的用量

image

1 Like

没毛病啊,gpt4又不是gpt4-turbo

波动还是太大,正常还是用GPT4,不然被坑了都不知道