Openrouter 免费模型上新

MAI-DS-R1 现已加入 Openrouter free model 大礼包

模型页介绍:
MAI-DS-R1 是微软 AI 团队基于 DeepSeek-R1 开发的一种后期训练变体,旨在提高模型对之前被屏蔽话题的响应能力,同时增强其安全性。该模型建立在 DeepSeek-R1 的推理基础之上,整合了来自 Tulu-3 SFT 数据集的 11 万个示例以及内部精选的 35 万个多语言安全对齐样本。该模型在保持强大的推理、编程和问题解决能力的同时,解锁了 R1 版本中之前受限的广泛提示内容。

MAI-DS-R1 在减害基准测试中表现更佳,并在一般推理任务中保持有竞争力的结果。它在被屏蔽查询的满意度指标上优于 R1-1776,并降低了有害内容类别的信息泄露。该模型基于 Transformer MoE(专家混合)架构,适用于通用场景,但不适用于法律、医疗或自动驾驶等高风险领域。

33 Likes

有意思w

1 Like

就是安全审查变严格了? :smiling_face_with_tear:

2 Likes

看了下微软的技术文档,这个模型像是稍微解除了一些限制,但减少了有害内容输出率。人话就是能聊的话题更多了,但能说的坏话更少了。

原文翻译:MAI-DS-R1能够处理99.3%的敏感话题提示,比原版R1提升了两倍。这对于政治学术研究、社会问题、伦理道德研究等领域具有极大的帮助。同时,安全风险显著降低,比原版R1减少了50%。

6 Likes

能聊的话题更多了,但能说的坏话更少了。

3 Likes

这个好用吗

R1最大的问题,一个是对齐一个是幻觉

幻觉在后训练很难搞,对齐可以调

希望MS这波修复有效吧

2 Likes

实测可以锐评一些时事:joy:

现在可以讲一些在国内不正确,但在国外正确的话,同时不允许讲一些在国外不正确的话。

11 Likes

理论上来说,应该叫 审查方向变了w

8 Likes

那没意思

不知道效果咋样

效果就是还是很有党性:

6 Likes

幻觉率怎么样?

换英语输入试试



还可以

2 Likes

感谢分享


有点意思,为什么DeepSeek会拒绝回答这个问题

1 Like

想必在问时,问的人已经有答案了吧w
建议少发点这种的()

3 Likes

避开了所有敏感点, 是不是就是最大的反贼 :rofl:

1 Like