LLAMA 3 405b 要来了, 性能并不乐观, 但开源太嗯了

kaldeqca · 2024 年7 月 22 日 03:32

应该是这周

目前关于的rumors:
405B parameters
支持vision (Embedding size 16384)
Vocab size 128256
118 layers
128K Context Token

Meta发出的性能图

MMLU
GPT 4o是 88.7
4 Turob是86.5
3.5 Sonnet也是 88.7
Gemini 1.5 Pro 是 85.9
也就是说这个LLAMA 405B比Gemini要差一些 (Instruct的那个不需要看, Instruct就是有审核了 )
当然了这个data是训练中的
与最后的结果可能不一样
反正这周就要发布了
开源模型肯定是很嗯的, 审核可以直接bypass 对roleplay和nsfw十分友好
再加上meta用facebook来训练模型, 对话能力也是很natural的那种

Ghidra · 2024 年7 月 22 日 03:44

wow

eros_face · 2024 年7 月 22 日 03:47

对nsfw的部分感兴趣，不知道到时候性价比如何

neteroster · 2024 年7 月 22 日 05:31

这都 4 月的 checkpoint 了…然后我不是很明白为什么不能拿 Instruct 比，你这里列的其他模型也是 Instruct 的数据啊（而且也有审查…），就因为有审查就非要拿 Base 比？这公平吗

handsome · 2024 年7 月 22 日 05:45

冲冲冲，打爆gpt，claude

PLA81 · 2024 年7 月 22 日 07:54

来了来了

0v0 · 2024 年7 月 22 日 08:13

Meta是否公开提到过405b模型的训练语料来自于Facebook呢？

Nico_Ding · 2024 年7 月 22 日 11:57

哈哈

neo · 2024 年8 月 29 日 06:05

From #develop:ai to 资源荟萃

话题		回复	浏览量
深入解读Llama 3.1 资源荟萃人工智能	12	868	2024 年8 月 29 日
llama3.1最近发布了，最大的405b，有佬友对这次发布模型的技术解读和模型能力解读吗？资源荟萃人工智能	6	733	2024 年8 月 29 日
性能超GPT-4o！Meta4050亿参数开源模型Llama3.1遭泄漏之【如何看待】搞七捻三 ChatGPT	2	302	2024 年7 月 24 日
Llama 3.2可用平台分享前沿快讯人工智能	13	613	2024 年10 月 11 日
真是个开源模型届好消息前沿快讯人工智能	5	745	2024 年11 月 25 日

LLAMA 3 405b 要来了, 性能并不乐观, 但开源太嗯了

相关话题