经常看到有佬提及,就去查了下, 官网看到这个得分排列,有点遗憾,这个真的这么厉害吗?
有没有佬可以分享下使用心得? 目前用得比较多的是gpt4o, 4o解决不了就claude3.5, 怎么这个比分看上去比gpt和claude还强?
经常看到有佬提及,就去查了下, 官网看到这个得分排列,有点遗憾,这个真的这么厉害吗?
有没有佬可以分享下使用心得? 目前用得比较多的是gpt4o, 4o解决不了就claude3.5, 怎么这个比分看上去比gpt和claude还强?
个人感觉好像比4o好点
sorry, 没试过就来水,它的回复提示是用v2.5
因为比的都是gpt他们的老模型了
确实跟o1还没比呢
是的,国内开源顶流没有之一,qwen glm都要排后面
是不是最强不知道,但真的是量大管饱
可以像claude使用汉语新解吗?
就拿api来说,除非你有渠道,比如openrouter,始皇的oaipro,或者aws之类的,能买到官方api,你永远也不知道中转站给你所谓的sonnet 3.5是个什么东西。也许今天给你的sonnet是官逆的,明天可能是4o mini冒充的,后天又变成haiku。我用的付费中转就这样啊,已经从昨天开始又不能用FC了,不知道被掺什么了。
deepseek的好处是,你能买到官方的。反正日常工作我都是用deepseek,需要图片识别的时候用ai studio.
看看就得了,可别信。
deepseek在国内算靠前的
自卖自夸,常规操作
综合使用下来(各种领域问题,多轮交流),感觉只有 oai 、克劳德是真正的 AI
其他感觉都是关键词匹配再加工
谢谢佬的分享。
目前用的是始皇的oai, 实在不行再挂梯子入克劳德官网。
所以目前想找多点平替来备用
只有多次对比才知道
真的很强的!
图里的榜单连 4o 都没有,更别说o1了,lmsys的前十claude 都只挤进去一个3.5s
当然ds不是说一无是处,至少已经是能摸到第一梯队边的了
全方位强不强不好说,就我的使用场景,体验还可以
比他强得比他贵,比他便宜的没他强
這…