别人给我发的 很神奇 关于DS的语料污染

7 个赞

这不是语料污染,好像是后期用gpt生成的数据强化训练了。

2 个赞

那是啥玩意

求详细科普


大概意思是互相会强化学习用一下,去年抖音的api都被发现用来生产数据,被禁用了。

1 个赞

可以看一下微博
Transformer-周
这个科普

意思就是通过别人来训练自己?

是的,用openai的api生成数据,强化学习阶段用。

这么说的话他们CEO说的一些话也有道理

geimini说自己是文心一言,也是一样道理。

这玩意都在互相训练

严格来说,Openai规范协议确实是不能用来训练竞争模型,但是对于MIT协议的开源模型,是否适用,我就不懂了。


估计不太行

结合 o3 和 R1 的意见,自己总结了一下 :laughing:

谁把我举报了?请问下哪里违反了社区准则?

AI的数据归属权,尚且未知…

你发了什么

aigc需要截图
https://linux.do/faq