阿里Qwen连夜发布了超大规模MoE模型：Qwen2.5-Max，性能超过了DeepSeek V3

synbio · 2025 年1 月 29 日 02:21

Qwen2.5-Max使用超过20万亿token的预训练数据

在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond测试中，超过了 DeepSeek V3

在基座模型中，Qwen2.5-Max 超过了 DeepSeek V3、Llama-3.1-405B、Qwen2.5-72B

可以Qwen Chat或API中使用，在Qwen Chat中直接与模型对话，或者使用 artifacts、搜索等功能

博客

Demo

omni · 2025 年1 月 29 日 02:22

大年30都不休息
国内的AI模型越来越好了

fengchris · 2025 年1 月 29 日 02:24

阿里有点东西

l516q · 2025 年1 月 29 日 02:26

千问以前的都是弱智，希望这个真能像说的这么好，最早研究的大厂，到现在拿不出像样的产品，挺丢人

tiga6367 · 2025 年1 月 29 日 02:27

v3是671B，好奇这个是多少B？

开源的？没有公开参数吗？

Lush · 2025 年1 月 29 日 02:29

希望是真的强，国内厂商支棱起来！

linduda · 2025 年1 月 29 日 02:29

这个是闭源的，估计要等qwen3出来才有像deepseek v3那样的超大MOE模

synbio · 2025 年1 月 29 日 02:36

cherry已经可以用了

wwow · 2025 年1 月 29 日 02:53

和ds哪个厉害

hqzh · 2025 年1 月 29 日 02:54

不开源炸不起水花

Yanan · 2025 年1 月 29 日 03:07

去年年底阿里云天天跟我打电话推销他们的的模型，还给各种优惠什么的，当时我就感觉阿里有点急哈哈

handsome · 2025 年1 月 29 日 03:10

还可以啊水平

bbb · 2025 年1 月 29 日 03:12

这不百度吗

To1xuan · 2025 年1 月 29 日 03:12

不錯，國内ai總是發展得更好了

wangbinio · 2025 年1 月 29 日 03:13

阿里那个写代码的好像不太行啊，各个地方的评分都不如fitten和codegeex

6512345 · 2025 年1 月 29 日 03:15

打起来！

Kevin525 · 2025 年1 月 29 日 03:23

有卷有進步！

Richard_Li · 2025 年1 月 29 日 03:27

什么情况我这个

bbb · 2025 年1 月 29 日 03:28

官方 API 吗

Richard_Li · 2025 年1 月 29 日 03:30

谢3b佬，用官方的api就好惹

话题		回复	浏览量
深度求索超级穿越时空搞七捻三树洞	17	138	2025 年1 月 27 日
还有啥羊毛AI厂可用薅吗搞七捻三纯水	21	543	2025 年1 月 30 日
241128 三花AI日报：阿里通义开源国产推理模型；GUI 自动化 Agent；OneDiffusion：多功能生图模型； OpenAI 的 Sora API 泄露事件回顾前沿快讯人工智能	11	601	2024 年12 月 18 日
DeepSeek-R1 开源版来了！！前沿快讯 DeepSeek , 人工智能	51	2113	2025 年1 月 21 日
阿里巴巴推出Qwen2.5-1M 支持100万Token上下文的开源模型，性能媲美GPT4o mini 前沿快讯人工智能	13	279	2025 年1 月 27 日