没说,可能是两者之和?
plus和team又都是同样上线吗
openai太坑了
我猜oai可能已经逐步放弃team而转向enterprise的服务了
4 个赞
2 个赞
哈哈哈哈看来确实是被ds伤到了
有了R1,感觉已经对o系列没什么兴趣了,性价比太低了
刚测试,O3 MINI reason 编程达到飞跃式进步,接近claude 3.5 sonnet 的水平
4 个赞
o3 mini high 每周plus还是限额50
这模型的名字越来越长了
尽信书不如无书,你要实际测试,claude 系列一直在各种榜不上名次,但实际上是最强的
1 个赞
请问为什么claude系列在各大榜单不受待见呢
要手工引导,那些测试都是自动的
原来如此,没用过claude,一直看各榜单里claude不上不下的位置,和用户体验对claude的巨大好感,都让我感觉撕裂
价格倒是还行
1 个赞
并没有排不上名次, LiveBench 上 coding_completion 的细项中,claude-3-5-sonnet-20241022
现在还是仅次于 o3-mini-2025-01-31-high
的第二名。