是谁家的模型?
大概率是OpenAI的
证据1:问他是谁,他自己说OpenAI,但这不能100%确定是OpenAI,因为Deepseek早期问他也说自己是GPT,也有可能故意加的系统提示词混淆视听
证据2:佬友说:Function calling格式也像GPT
证据3:佬友“也不见得’说:有OpenAI祖传的分词器bug
参数
非推理模型,1m上下文,32k最大输出,65~130tps。
感觉比Llama-4靠谱
免费渠道
OpenRouter API
来源:OpenRouter
Lmarena
只能在提问时随机碰到,并不能在Direct chat里选,因为没正式上市,也看不到分数
收费渠道
暂无
评分
Aider评分
编码能力在非推理模型中排第三,低于3.7和DeepSeek3-0324,高于3.5和4o-0326
来源:Aider LLM Leaderboards | aider
OpenRouter API用量排行榜
虽然不是评分,但确是是真实用户的使用量,有人愿意用,才是好产品,可能比评分更真实,更难作假
OpenRouter4月6日总API总消耗量榜和编程消耗榜都是第一,90%消耗用于Cline和Roo code等编程IDE
当然新模型刚上线,对于消耗量来说,有尝鲜凑热闹的多消耗因素,但是同样也有“很多人不知道有这模型”的少消耗因素
过几天再观察,如果消耗量还是这么高,说明留得住客,质量不错
Lmarena评分
截止250407,还没出来,按照lmarena惯例,正式上市前不会放出评分的
LiveBench编程评分
截止250407,还没出来
FictionBench长上下文评分
还不错,上等水平,但远比不过2.5pro
来源:Fiction.live