是什么原理???
20 Likes
R1容易多想,乱想
3 Likes
我觉得这俩写作水平差不多
3 Likes
r1写作给我感觉有点adhd。。。
2 Likes
r1容易想太多
2 Likes
因为 R1 没落了(其实是 R1 的幻觉率很高,就是很容易胡说八道)
3 Likes
R1没升级
1 Like
啥时候搞个R1.5,现在我都不喜欢用R1,V3真的用起来很顺手
1 Like
为什么喜欢用v3
跟手啊,只要你prompt写的足够合适,输出的内容还是可以的,R1把控不住,慢慢就偏离轨道了
R2快出了
1 Like
那这么说推理模型就不是一个很健全的模型
应该是推理部分占了很多token,感觉经常最后偷懒
1 Like
我觉得都不太行。。
主要是幻觉特高,喜欢瞎编,不适合专业内容写作。
如果本来就是无厘头题材,本身就发散的,那就无所谓。
站内有讨论过:
2 Likes
推理模型是专注于提升逻辑能力、处理复杂任务的
这种对逻辑能力的针对性提升是以牺牲其他能力、牺牲速度为代价的:
- 提升一方面自然就会导致其他方面下降:
比如有个模型非常擅长写代码,现在我们针对性地对它进行了大量的音乐训练,现在他很懂音乐了,你觉得它还能完全保持原本的代码能力吗?音乐的训练对它参数的修改让这些参数不再是面对代码场景最优的了。(这和人脑不一样,因为人脑学不同东西可能激活的是不同区域,相互之间干扰没有那么大。但是模型训练得整个网络一起改。这是个问题,所以需要发展MoE。)推理模型也是一样的,专注于把整个模型的参数都为了逻辑能力一个目的优化,这些参数应对其他场景就不一定有原本那样好了 - 逻辑好的训练资料在其他方面可能不好
- 推理能力和其他能力可能本来就是矛盾的:比如写诗,这是一个感性的事,如果一个擅长写诗的模型你逼它必须要用严格的逻辑思考一千字再写诗,还必须按照思考的逻辑来写,你觉得它写得好吗?这只是举个例子。有很多场景强制推理会阻碍它作答
- 还有就是想太多的问题。思考太多未必是好事,你高中考试的时候肯定对这个深有体会
所以说,推理模型在需要严密逻辑的复杂任务上表现很好,但是在不需要很强逻辑的其他任务上表现一般都不如同样规模的不思考的常规模型
3 Likes
不小心就写这么多字了,如果解答了你的疑问可以给个解决方案吗
1 Like
R1太癫了w
1 Like
觉得哪个行
没觉得合适,觉得都一般
1 Like