独立测试机构:"Reflection Llama 3.1 70B 比 Meta的Llama 3.1 70B还要差,而不是更好"

独立评估结果
在我们独立的测试中,未能重现所宣称的评估结果。与 Meta 的llama 3.1 70B 相比,我们在Reflection llama 3.1 70B 上观察到的表现更差,并非更好。”

红迪上有人说reflection完全就是llama3,负责人matt称模型上传的权重出现了问题


额。。。都是借口,啥时候能干点狠的 :sweat_smile:

吹的真狠,还以为多好