“独立评估结果:
在我们独立的测试中,未能重现所宣称的评估结果。与 Meta 的llama 3.1 70B 相比,我们在Reflection llama 3.1 70B 上观察到的表现更差,并非更好。”
红迪上有人说reflection完全就是llama3,负责人matt称模型上传的权重出现了问题
“独立评估结果:
在我们独立的测试中,未能重现所宣称的评估结果。与 Meta 的llama 3.1 70B 相比,我们在Reflection llama 3.1 70B 上观察到的表现更差,并非更好。”
红迪上有人说reflection完全就是llama3,负责人matt称模型上传的权重出现了问题
额。。。都是借口,啥时候能干点狠的
吹的真狠,还以为多好