来聊一聊ChatGPT的降智表现吧

ChatGPT的降智并不是新鲜事,手段也更新了很多次了,确实把用户恶心的不行,许多用户早弃坑转投Claude等了,但是用来用去,个人还是觉得某些方面ChatGPT效果好一些,这里把我遇到的一些最新降智表现罗列一下。

降智原因太复杂了,就不讨论了。

更新一下:20250503
非降智情况下,符号,图表出现频率降低,但是分点回答时每一点之间仍然使用---进行分隔,降智情况下则不会。另外,非降智情况下回答在句中往往会出现加粗强调关键内容,而降智则一般不会。


20250416记录
以下情况均为网页使用,Plus账户,IP尚可的情况下观察到的GPT-4o模型的回答

可能有些有误的或者遗漏的,各位可以交流一下。

18 Likes

补充一下,普号的4o和Plus的4o效果一样。被降智的4o用不了新版画图,可以试着分辨逆向的是否降智

3 Likes

用Plus过期了的号,试了3次都是带图标和反问。然后又试了几次,会有没图标的回答,但是最后都会反问你具体需要。

然后试了几个镜像站,都回答不出带图标和反问的(但是镜像站的画图没降智) :sweat_smile:

2 Likes
  1. 普号未达到限制时的模型就是4o,未降智的4o就是上面的表现。
  2. 当然还是得看回答质量,图标这种不是次次都有,反问的也和你具体问题有点关系
  3. 镜像站的是否都是逆向,测试画图的时候不知道你是不是用的逆向的4o去问,然后是否确实使用新版画图生成,比如吉卜力风格是否成功
  4. 不过,我也只是根据我上面的测试和我的使用来总结的,有遇到了其他情况的可以贴出来看看
3 Likes

tools大法,dalle 3是降智,image_gen未降智。

但即使是image_gen,也有可能4o本身是降智的,因为回答时不带小表情,并且回答速度超级快,质量低

3 Likes

最简单的测试,你问4o,“你好啊”,它的回答会带图标,并且热情的反问你,这就是没降智的

5 Likes

镜像站吉卜力风格画出来是这样的,看起来应该是新版吧,没用过画图

1 Like

应该是新版

1 Like

这个确实,直接就是4omini的速度,风格和质量

1 Like

2个镜像站试了大概70次,只问这2问题。
基本上确定:带表情或图才能正确回答对比大小。(数字比大小没有表情似乎就会错)
2个案例的镜像站,几乎是全军覆没。

然后测试了API(oaipro的),几乎全对(20多次测试,我记得就第一次错了,记不清了)。
另外再说下4.1,试了几次也都是对的。

数字比大小似乎第一句话都是9.11大,但是后面会自己纠正。
如果是降智版就不会纠正。


1 Like

看来是有一定规律

我这个从来不蹦emoji,连画图都给我砍掉了(dalle都用不了),也会反问,知道9.9>9.11 :smiling_face_with_tear:

总结

api应该不会降智吧,20美刀一个月轻度使用不如api

也许安卓端是这样?我没在安卓端使用过。

api确实要稳妥一些

还有这个方法,我试了下,很多API和镜像站都是2023.10或2023.11,甚至还有镜像站是2021的(离谱)
佬,有试过吗?

1 Like

https://linux.do/t/topic/525730
我之前的一篇帖子,不知道能不能发挥参考作用

1 Like

试了下,正常的应该是2024年6月。

关于API,如果标了逆向,那应该就降智了,如果是中转,那我不太清楚了,也许跟你说的这个贴子一样。

我碰到降智的时候,它还是能自动联网的。

降智了质量确实差了很多。

你的帖子里的降智和不降智是开不同会话得到的吧?

一个会话,我测试的时候同一个会话出现降和不降的情况均出现过