怎样看AI是否降智了

用关键词吗.或者数学问题

100 个赞

主要是和刚出来的时候对比,看自己的主观感受吧

3 个赞

还是主观感受吧,比较明显的降智特征
例如注意力涣散,不要干的事对话了几轮忘球了。
例如重复输出,把以前对话说的话重复说。
claude跟gemini最近都降智很明显 :sob: 据说是在训练新模型 分给新模型的算力比较多

4 个赞

有一种说法是让他画猫,能画出来就说明还行

1 个赞

刚刚用论坛里的那个诗歌测试claude,全部都是胡说八道

那个诗歌名字是: 丁已二月成都纪乱竹枝词其四

其中有一句是: 忍把风筝放女娃

claude全程一本正经乱说

1 个赞

我用monica帮我算题,过程是对的,结果给我个乱七八糟的答案 :sweat_smile:

1 个赞

可以参考这个链接中的问题来分辨模型是否降智为mini 发现一个检验中转的4o 是否掺水的问题,大家可以试试

1 个赞

一个很好的问题:在中国,穿背带裤的篮球巨星是哪位?

降智的GPT可能会回答姚明、易建联、丹尼斯·罗德曼、邓肯·罗宾森、迈克尔·乔丹、沙奎尔·奥尼尔等;而大脑健全的GPT会直接回答出那三个字:

3 个赞

这几个图片是咋弄的呀

GPT的回复呀

1 个赞

md我回答詹姆斯

你的这个应该是联网搜索吧?

不能算gpt回答,没有参考性

GPT-4o的联网搜索也是特征

不搜索互联网真的只能回答其他人,你试试关闭互联网搜索

联网搜索了,任何一个ai都能回答蔡徐坤

如果大模型没有互联网搜索,那么这个题目大概率会答错,这已经不是降智的问题了。但我用思维链,豆包竟然猜到了


但连续重新提问几次,都是错误或者查无此人,第4次给出了准确的答案: