用关键词吗.或者数学问题
5 个赞
主要是和刚出来的时候对比,看自己的主观感受吧
2 个赞
还是主观感受吧,比较明显的降智特征
例如注意力涣散,不要干的事对话了几轮忘球了。
例如重复输出,把以前对话说的话重复说。
claude跟gemini最近都降智很明显 据说是在训练新模型 分给新模型的算力比较多
3 个赞
有一种说法是让他画猫,能画出来就说明还行
1 个赞
刚刚用论坛里的那个诗歌测试claude,全部都是胡说八道
那个诗歌名字是: 丁已二月成都纪乱竹枝词其四
其中有一句是: 忍把风筝放女娃
claude全程一本正经乱说
1 个赞
我用monica帮我算题,过程是对的,结果给我个乱七八糟的答案
1 个赞
可以参考这个链接中的问题来分辨模型是否降智为mini 发现一个检验中转的4o 是否掺水的问题,大家可以试试
1 个赞