请看全文:量子位 (https://www.qbitai.com/2024/09/188032.html)
Reflection 70B 作为一款新兴开源大模型,凭借独特的自我反思技术在多项基准测试中超越了 GPT-4o 等顶级闭源模型。该模型采用 Reflection-Tuning 训练方法,能够在推理过程中检测并纠正错误,大幅提升了准确性。在 GSM8K 数学测试中,Reflection 70B 取得了 99.2% 的惊人成绩,引发业界热议。
请看全文:量子位 (https://www.qbitai.com/2024/09/188032.html)
Reflection 70B 作为一款新兴开源大模型,凭借独特的自我反思技术在多项基准测试中超越了 GPT-4o 等顶级闭源模型。该模型采用 Reflection-Tuning 训练方法,能够在推理过程中检测并纠正错误,大幅提升了准确性。在 GSM8K 数学测试中,Reflection 70B 取得了 99.2% 的惊人成绩,引发业界热议。
不知道好不好用
拭目以待,给openai上点压力也好
用不了啊
OPENAI怎么老是被人超越?
不太明白,我觉得你这张图应该贴在正文下面而不是评论区。
那么有什么代价呢(
上ollama,虽然弱一些
20240906 新增Reflection-Llama-3.1-70B模型支持 新增Reflection-Llama-3.1-70B模型支持,大家可以通过硅基流动统一登录 页面使用,Chat Completions 查看文档。 此模型实名认证后可以在上述两处使用。
巨辣鸡的一款模型,硅基已经上了
解决了幻觉问题吗
我用小说提示词在硅基 测试了这个模型,感觉有点不听指挥呀。
参数按照推荐的调整了吗?
是不是不支持中文,得微调吧
OpenAI:一直被模仿 一直被“超越”
Openrouter上已经可以直接调用或playground chat了,0.4$/Mtokens。感觉指令跟随很差,容易输出乱码。