rt,这次405b是真的太大了,根据meta的技术报告来看,效果很好。有佬友实测这次更新的效果吗?以及是否有相关的技术解读?
贴一个llama3.1技术报告的原文:Introducing Llama 3.1: Our most capable models to date
paper原文:The Llama 3 Herd of Models | Research - AI at Meta
补充一些原文内容吧,
-
和gpt模型的对比
-
405b模型量化
-
偏好对齐(sft rso dpo)
-
社区功能支持