应该是这周
目前关于的rumors:
405B parameters
支持vision (Embedding size 16384)
Vocab size 128256
118 layers
128K Context Token
Meta发出的性能图
MMLU
GPT 4o是 88.7
4 Turob是86.5
3.5 Sonnet也是 88.7
Gemini 1.5 Pro 是 85.9
也就是说这个LLAMA 405B比Gemini要差一些 (Instruct的那个不需要看, Instruct就是有审核了 )
当然了这个data是训练中的
与最后的结果可能不一样
反正这周就要发布了
开源模型肯定是很嗯的, 审核可以直接bypass 对roleplay和nsfw十分友好
再加上meta用facebook来训练模型, 对话能力也是很natural的那种