- GPT-4 在降智,结果就是 Sonnet 都崛起了……
- 最近因为有 API 的 Opus 但是捐给 sketu 了,就干脆试了试自己三天没登的 Claude 3 Sonnet.
- 分多个对话框提问,英语和中文提问各占一半。
- 虽说还有点问题比如经典鲁迅大战周树人还有番茄炒钢丝球。
- Tips: 钢丝球似乎情有可原,这家伙当成炒肉球了。虽然这家伙还是很笨,笨到认为钢丝球是云吞 / 馄饨。
- 经测试,两个问题在英文下都可以正常回答。
- 糖醋三合板问题中文竟然一遍过了,虽然还是有问题(指三合板为菜肴),不过情有可原,隔壁 GPT-4 直接说这个菜肴存在。
- 测
gpt-4-turbo-2024-04-09
的问题错了,正常。(正确答案是乙,两个回答都是甲)
- 综上所述,Sonnet 应对英语处理能力还不错,差不多可以匹敌 GPT-4 了,但语文有待提升。数学和编程还没测试。
- 话说隔壁 Opus 写小说那个是真的么
- 期待补充……