免费推理模型网站(个人暂测弱于O1 强于其余)

https://kpu.maisa.ai 推理题个人暂测表现弱于O1 强于其余(其余模型几乎是全错)
个人常测的区分O1与非推理模型的问题,答对了许多,包括过程,和O1 P 完全一模一样
我以为O1是套壳,但是经过提醒和进一步检测,
凉被子翻车了,
并且,我又测试了一个问题,也错了,可以确定不是O1或者同等水平
可能是选择性调用O1 P?

12 Likes

感谢分享 :tieba_013: :tieba_013:

1 Like

感谢分享,刚刚测试了下,响应要四十多秒,不过能用就行

1 Like

为什么我测的是假的

啥问题都不行


尴尬,是不是题不行

啊?我测的问题,答对的,答错的,包括过程,和O1 P 完全一模一样啊?你直接
问一个推理题吧?

不过还是感谢分享啊,老友真热心

你可以试试这个 一根晾衣杆最多同时晾晒10床被子。每床被子晾干需要10分钟。那么晾晒25床被子最端需要多久时间?提示,允许多次轮换被子,轮换时间不计入中的晾晒时间。

你能说下你的问题吗? 我的问题回答完全是和O1 P 一模一样。

1 Like

就这个哦,真o1挺稳定的

感觉不一定是o1,或许是其他CoT 模型

好的,确实没对,我改标题了

我确实应该更谨慎一些,:joy:

测了一下,确实不太行


难绷

好像不能继续问问题,每次只能问一次

感谢你的分享。