【此帖已转移】语言模型区分题库:测试逻辑能力,区分语言模型。测试模型是否降智或阉割

gemini 1.5 pro可以免费用是吗?用Google AI Stduio吗?

2 Likes

所有Google的语言模型都能在ai studio免费用

1 Like

佬来帮忙测呗,一个人测题目还是很慢的

这个不错,收藏了,回头可以试试

1 Like

PixPin_2024-12-06_14-45-39
deepseek太勤奋了几分钟了还在想

1 Like

PixPin_2024-12-06_14-48-07
deepseek这反应真的哭笑不得,我只要给题目起一个名字,结果想了快5分钟的题目

好贴,收藏了

:bili_057: 大佬牛逼,对我来说有点超纲了!

1 Like

deepseek想的很多但是就是出错,感觉要走的路还是很长

1 Like

你看我的最新测试结果,第一题o1 preview错了,deepseek对了

好家伙居然好使了,刚出的第一天用了下算是不尽人意我去试试这个问题
三位智者 坐在一条长凳上。他们面朝同一个方向,一个挨着一个坐着,每人头上戴着一顶帽子。每位智者只能看到坐在自己前面的人的帽子,看不到自己和身后人的帽子。他们知道总共有5顶帽子,其中3顶是红色的,2顶是白色的。随机选择3项帽子给三位智者.

第一个人(坐在最前面,看不到任何人):"你能确定自己帽子的颜色吗?"他说不能。
然后问第二个人(能看到最前面那个人的帽子)同样的问题,他也说不能。
最后问第三个人(能看到前两个人的帽子),他说能确定。

请问:三个人戴的是什么颜色的帽子?

2 Likes

好使了,是不是偷偷更新了 :laughing: :laughing: :tieba_025:

哪一个模型?

就那个r1-lite

1 Like

看现在的测试结果,o1完整版还是赢了

qwq是最折磨人的,本来就慢,还想很长时间

1 Like

Claude, DeepSeek, Gemini, Google, #kimi添加#快问快答移除

4o居然靠提示词答对了
image

2 Likes

哦?有点东西,再试一次看看

1 Like

又不行了, 看来只是偶然

mark一下

2 Likes