可能是之前没有类似的案例。这次ds让openai感受到了威胁,所以可能联合美国法务部门和国家安全部门展开调查,推动相关法案出台或提供判例。美国应该是想整ds一手的,不过目前确实是一团乱象互相抄互相爬。以后美国有公司抄国内模型或者爬国内资料也有案例反击。
要是蒸馏还能超过他很简单那国内这些大公司早就遥遥领先了
openai 训练的资料也不知道是怎么获得的呀。还有谷歌,不仅大规模收集用户信息,它的 books 也盗版了很多中文书。
就不提在其它国家的博物馆里看到的大量精美中国文物是怎么来的了,看的时候心情总是复杂的。还有更多秘密藏着不展出的。
openai的机器人每天都要来爬很多次我的博客,虽然robots.txt禁止了,但是还是来爬,现在直接禁止了它的ua,但是这些公司,都有伪装爬虫,根本分辨不出来,估计还是能被爬到