各模型情况汇总:
- o3-mini 与 o3-mini-high:均正确
,用时 1 分钟以内
- Grok3 Thinking:正确
,用时 156s
- Gemini-2.0-Flashing-Thinking:错误
,英文提示词可以稳定做出
- k1.5:正确
,用时 12 分钟(穷举法)
- 豆包:正确
(题海战术)感谢 @zhubaiwan-oozzxx
- DeepSeek-R1:正确
,用时 3 分钟,感谢 @Pomelo_neko
o3-mini API 表现异常!正在调查
各模型情况汇总:
o3-mini API 表现异常!正在调查