阿里巴巴开源1100亿参数Qwen1.5-110B模型，性能与Meta Llama3-70B相当

N.A.I.V.E · 2024 年4 月 28 日 00:54

该模型在基础能力评估中与 Meta-Llama3-70B 相媲美，在 Chat 评估中表现出色，包括 MT-Bench 和 AlpacaEval 2.0。

据介绍，Qwen1.5-110B 与其他 Qwen1.5 模型相似，采用了相同的 Transformer 解码器架构。它包含了分组查询注意力（GQA），在模型推理时更加高效。该模型支持 32K tokens 的上下文长度，同时它仍然是多语言的，支持英、中、法、西、德、俄、日、韩、越、阿等多种语言。

阿里 Qwen1.5-110B 模型与最近的 SOTA 语言模型 Meta-Llama3-70B 以及 Mixtral-8x22B 进行了比较，结果如下：

xie_reens · 2024 年4 月 28 日 03:09

试了下，对中文来说相当不错，比LLAMA3-70B要好

NINE · 2024 年4 月 28 日 03:35

速度很快啊

RichardChou · 2024 年4 月 28 日 03:37

最近用Qwen做日中翻译翻了几十万字，就日中翻译而言，称得上是第一。（除了Opus试过所有主流模型）

Myqwn2729 · 2024 年4 月 28 日 03:37

还不错。

keung · 2024 年4 月 28 日 05:43

比Qwen1.5-72B好多了

话题		回复	浏览量
Llama3来了，用Linux Ollama线下部署你自己的大模型羊驼人工智能 Llama-3	50	2325	2024 年4 月 26 日
[官方Demo直接免费用]中文感觉蛮厉害的阿里110B模型（我觉得比Llama3 70B厉害人工智能	9	395	2024 年4 月 30 日
Llama-Chinese API，每分钟可以嫖30次人工智能 Llama-3	21	600	2024 年5 月 10 日
前两天在论坛进行的模型对比实验，公布结果辣人工智能	4	448	2024 年4 月 5 日
Meta发布目前最好的开源模型Llama 3，据说达到了GPT-4级别，多模态功能在路上人工智能	28	839	2024 年4 月 19 日