4 Likes
已经超越了吗
新模型也正常
相比deepseek还是太贵了
和RI比谁贵
这榜单认真的吗,为什么r1在gemini和gpt4o的下面
豆包1.5呢多少分
你跑新的了么
我记得每次你都会跑一下
你每次都是重新跑了
还是就跑个新模型
貌似上次更新是8月?
他们自己测试我看阿里跑的就是8月的
这三个已经是老将了 打不下来 尤其是4o
拥有霸榜魔法
看来真的只有 R1 之类带思考链的模型才可以。
比r1还贵
又贵又慢,感觉参数量是旧 GPT4 那个级别的,跟 deepseek v3 比不太合适。
1 Like
8月那个版本我跑了,总分的分数确实跟ds差不多