印象中很久没有编程大模型发布了

grok是不是也不错?

OpenRouter首次推出代号为"Quasar Alpha"的隐秘模型。据官方介绍,这是来自某模型实验室的下一代长上下文基础模型的预发布版本,具有以下特点:

100万token上下文长度,能处理超长文本

专为代码优化,同时保持通用能力

完全免费使用

还真是啊,都是chat

专精的… :thinking:
是不是公共代码库训练到达了瓶颈?

进来看看 虽然会有某:llama:但是不出意外也一定意外了

因为现在我们都在卷这个几个方向,第一更强的基座LLM,第二omni model,第三赋能生活的垂直LLM,比如自动化PPT等等的

1 Like

还是有的:
open-r1/OlympicCoder-32B · Hugging Face
上个月才发的。

我去livecodebench看了看,第一是kimi?我觉得aider那个榜单更靠谱一点

gemini2.5p不是吗

一点声响都没有,现在发的新模型要是达不到某个尺寸的SOTA,水花儿都没有一个

是没有声响,但这个是Huggingface团队做的……

1 Like

基于qwen2.5 32b coder
微调的

现在都追求大而全 小而美不够用啊

是的……

1 Like

那这种很难有声响,而且微调上限还是挺受原始模式能力约束的

还真是,我也是使用了一段时间发现,推理模型又慢准确率还不一定高

主要是大而全能力比小而美还强,如果两个能力一样,才能有成本上的优势,现在来看甚至没一个能达到claude3.5的水平。。。google那个马上要发的那个不知道效果咋样

瓶颈了吧。如果一直爆发,那就是作弊啊

1 Like

推模适合写需求文档,所以cline拆成了plan和code两种模式

1 Like

所以磕编程垂直模型得不偿失啊 不然deepseek就不会合并coder模型了

谷歌是大厂有的烧 值得期待下 比2.5 pro便宜就划算

1 Like