https://kpu.maisa.ai 推理题个人暂测表现弱于O1 强于其余(其余模型几乎是全错)
个人常测的区分O1与非推理模型的问题,答对了许多,包括过程,和O1 P 完全一模一样
我以为O1是套壳,但是经过提醒和进一步检测,
凉被子翻车了,
并且,我又测试了一个问题,也错了,可以确定不是O1或者同等水平
可能是选择性调用O1 P?
12 Likes
感谢分享
1 Like
感谢分享,刚刚测试了下,响应要四十多秒,不过能用就行
1 Like
为什么我测的是假的
啥问题都不行
啊?我测的问题,答对的,答错的,包括过程,和O1 P 完全一模一样啊?你直接
问一个推理题吧?
不过还是感谢分享啊,老友真热心
你可以试试这个 一根晾衣杆最多同时晾晒10床被子。每床被子晾干需要10分钟。那么晾晒25床被子最端需要多久时间?提示,允许多次轮换被子,轮换时间不计入中的晾晒时间。
你能说下你的问题吗? 我的问题回答完全是和O1 P 一模一样。
1 Like
就这个哦,真o1挺稳定的
好的,确实没对,我改标题了
我确实应该更谨慎一些,
测了一下,确实不太行
好像不能继续问问题,每次只能问一次
感谢你的分享。