阿里巴巴推出Qwen2.5-1M 支持100万Token上下文的开源模型，性能媲美GPT4o mini

synbio · 2025 年1 月 27 日 09:30

阿里巴巴推出Qwen2.5-1M

支持100万Token上下文的开源模型，性能媲美GPT4o mini

Qwen2.5-1M 在处理超长文本任务和短文本任务上都表现出了卓越的能力，尤其是在处理复杂的长上下文场景中，达到了开源模型的领先水平。

推理速度比传统方法快 3 到 7 倍，尤其在处理超长序列时表现优异。

推理阶段通过块状预填充（Chunked Prefill）技术，使显存需求减少 96.7%。

wwow · 2025 年1 月 27 日 09:32

进来看看阿里巴巴在折腾什么

Qiner · 2025 年1 月 27 日 09:32

坐等年后硅基上班更新，硅基余额好久没用过了。

CitizenScyu · 2025 年1 月 27 日 09:34

我硅基上面全用的免费模型，硅基看了都流泪

Miomiomm · 2025 年1 月 27 日 09:34

反应不知道快不快，支持高并发不，拿来当翻译备用

Stanford · 2025 年1 月 27 日 09:36

看到了个Qwen和deepseek 合并一起的

miaodi · 2025 年1 月 27 日 09:37

跑在移动端的？

Caltech · 2025 年1 月 27 日 09:52

最近新模型发布的好多

scg2017g · 2025 年1 月 27 日 10:09

也就是说qwen2.5 14b的模型和gpt4o mini性能接近。本地部署这样的模型并不难

handsome · 2025 年1 月 27 日 10:18

1M挺强的

stevessr · 2025 年1 月 27 日 10:19

站内好像上午发过了……

0x26e7d · 2025 年1 月 27 日 10:21

这么强的吗

alertsc · 2025 年1 月 27 日 10:53

这个好。大小也合适。

passerby · 2025 年1 月 27 日 10:59

话题		回复	浏览量
qwen团队新开源的1m上下文模型，感觉还可以啊搞七捻三人工智能	6	427	2025 年1 月 27 日
Qwen2.5-VL发布了，在多模态模型领域拿下13个开源冠军。开源终于有一款和 GPT4o和Claude3.5同样水平的多模态模型了。资源荟萃人工智能	7	398	2025 年1 月 28 日
MiniMax-01发布：400万上下文、4560亿参数MOE、全新模型架构、性能比肩GPT-4o、线性注意力机制… 前沿快讯人工智能 , 转载	36	1042	2025 年1 月 20 日
阿里刚刚开源了新模型：Qwen2.5-1M及其推理框架搞七捻三人工智能	13	349	2025 年1 月 27 日
阿里Qwen连夜发布了超大规模MoE模型：Qwen2.5-Max，性能超过了DeepSeek V3 资源荟萃人工智能	27	1107	2025 年1 月 29 日