用关键词吗.或者数学问题
100 个赞
主要是和刚出来的时候对比,看自己的主观感受吧
3 个赞
还是主观感受吧,比较明显的降智特征
例如注意力涣散,不要干的事对话了几轮忘球了。
例如重复输出,把以前对话说的话重复说。
claude跟gemini最近都降智很明显 据说是在训练新模型 分给新模型的算力比较多
4 个赞
有一种说法是让他画猫,能画出来就说明还行
1 个赞
刚刚用论坛里的那个诗歌测试claude,全部都是胡说八道
那个诗歌名字是: 丁已二月成都纪乱竹枝词其四
其中有一句是: 忍把风筝放女娃
claude全程一本正经乱说
1 个赞
我用monica帮我算题,过程是对的,结果给我个乱七八糟的答案
1 个赞
可以参考这个链接中的问题来分辨模型是否降智为mini 发现一个检验中转的4o 是否掺水的问题,大家可以试试
1 个赞
3 个赞
这几个图片是咋弄的呀
GPT的回复呀
1 个赞
md我回答詹姆斯
你的这个应该是联网搜索吧?
不能算gpt回答,没有参考性
GPT-4o的联网搜索也是特征
不搜索互联网真的只能回答其他人,你试试关闭互联网搜索
联网搜索了,任何一个ai都能回答蔡徐坤