Qwen-Max-2025-01-25超越DeepSeek-V3

4 Likes

已经超越了吗

新模型也正常

相比deepseek还是太贵了

和RI比谁贵

这榜单认真的吗,为什么r1在gemini和gpt4o的下面

豆包1.5呢多少分

你跑新的了么
我记得每次你都会跑一下

你每次都是重新跑了
还是就跑个新模型

貌似上次更新是8月?

他们自己测试我看阿里跑的就是8月的



呃,测试经典的 sqrt3/3问题,没给出正确答案。

这三个已经是老将了 打不下来 尤其是4o
拥有霸榜魔法

看来真的只有 R1 之类带思考链的模型才可以。

比r1还贵

又贵又慢,感觉参数量是旧 GPT4 那个级别的,跟 deepseek v3 比不太合适。

1 Like

8月那个版本我跑了,总分的分数确实跟ds差不多