llama3.1最近发布了,最大的405b,有佬友对这次发布模型的技术解读和模型能力解读吗?

rt,这次405b是真的太大了,根据meta的技术报告来看,效果很好。有佬友实测这次更新的效果吗?以及是否有相关的技术解读?
贴一个llama3.1技术报告的原文:Introducing Llama 3.1: Our most capable models to date
paper原文:The Llama 3 Herd of Models | Research - AI at Meta

补充一些原文内容吧,

  1. 和gpt模型的对比
    image


  2. 405b模型量化

  3. 偏好对齐(sft rso dpo)

  4. 社区功能支持

看起来确实效果不错的

这个没有什么内容,基本是把技术报告前面几条翻译了一下。

我光看了个标题 :joy:

感觉gpt4可能参数量比这个更多

From #develop:ai to 资源荟萃