开源大模型新王者:Reflection 70B 超越 GPT-4o,自我纠错能力惊人!

请看全文:量子位 (https://www.qbitai.com/2024/09/188032.html)

Reflection 70B 作为一款新兴开源大模型,凭借独特的自我反思技术在多项基准测试中超越了 GPT-4o 等顶级闭源模型。该模型采用 Reflection-Tuning 训练方法,能够在推理过程中检测并纠正错误,大幅提升了准确性。在 GSM8K 数学测试中,Reflection 70B 取得了 99.2% 的惊人成绩,引发业界热议。

17 Likes

3 Likes

playground暂时打不开,等能用了试试看

不知道好不好用

拭目以待,给openai上点压力也好

1 Like

:tieba_087: :tieba_087: 用不了啊

OPENAI怎么老是被人超越?

3 Likes

不太明白,我觉得你这张图应该贴在正文下面而不是评论区。

那么有什么代价呢(

上ollama,虽然弱一些

20240906 新增Reflection-Llama-3.1-70B模型支持 新增Reflection-Llama-3.1-70B模型支持,大家可以通过硅基流动统一登录 页面使用,Chat Completions 查看文档。 此模型实名认证后可以在上述两处使用。

1 Like

巨辣鸡的一款模型,硅基已经上了

解决了幻觉问题吗

我用小说提示词在硅基 测试了这个模型,感觉有点不听指挥呀。

参数按照推荐的调整了吗?

是不是不支持中文,得微调吧

OpenAI:一直被模仿 一直被“超越”

1 Like

Openrouter上已经可以直接调用playground chat了,0.4$/Mtokens。感觉指令跟随很差,容易输出乱码。