OpenAI:有证据表明 DeepSeek 使用了我们的模型进行训练

据彭博社报道,OpenAI 和微软正在调查 DeepSeek 是否通过 OpenAI 的 API 将 OpenAI 的 AI 模型整合到 DeepSeek 自有的模型中。消息人士称,微软的安全研究人员在 2024 年底发现,大量数据通过 OpenAI 开发者账户被导出,而这些账户被认为与 DeepSeek 有关联。

OpenAI 向《金融时报》表示,他们发现了 DeepSeek 使用“蒸馏”技术的证据。据IT之家了解,“蒸馏”是一种常见的开发手段,开发者通过从更大、更强大的模型中提取数据来训练自己的 AI 模型。这种技术能够以远低于 OpenAI 训练 GPT-4 所花费的 1 亿美元以上的成本,高效地训练出小型模型。尽管开发者可以通过 OpenAI 的 API 将其 AI 技术整合到自己的应用程序中,但利用输出数据来构建竞争模型则违反了 OpenAI 的服务条款。不过,OpenAI 并未透露其发现的具体证据细节。TheVerge 称,这充满了讽刺意味,毕竟 OpenAI 自身也曾通过大规模抓取网络上的文字信息(未经许可)来推动其 GPT 模型的发展。

OpenAI 在一份声明中表示:“我们深知,中国等国家的公司以及其他一些企业一直在试图蒸馏美国领先 AI 公司的模型。作为 AI 领域的领军者,我们采取了反制措施来保护我们的知识产权,这包括在发布模型时谨慎选择哪些前沿功能可以包含在内。我们相信,未来与美国政府密切合作,以防止对手和竞争对手窃取美国技术,保护最先进的模型,是至关重要的。” OpenAI:有证据表明 DeepSeek 使用了我们的模型进行训练 - IT之家

23 个赞

看看后面怎么发展了

1 个赞

纯纯诬蔑

3 个赞

这就有点 :clown_face:

4 个赞

最后OpenAI拿出了一包洗衣粉

12 个赞

OpenAI用了我的数据,但我没有证据。

3 个赞

“未透露”

1 个赞

蒸馏这个倒是有可能

21 个赞

不吹不黑来讲,我觉得这是意料之中的事情。但AI发展到现在,哪个模型哪个公司敢说自己完全遵照法律轨道运行的

3 个赞

不一定,我觉得用其它模型生成的数据训练是语言模型行业的常见现象

1 个赞

证据说话

ds是否蒸馏还不确定
oai非法爬虫早就实锤了吧

6 个赞

closeai纯小丑

100%蒸了吧,这不是常识吗?而且我怎么记得之前谁(某个大模型公司老板)说就是在蒸openai吗?


估计是蒸馏了

4 个赞

???好一个未透露

我觉得deepseek需要建立一个强大的法务部,就算蒸了也要减少损失

2 个赞

即使是违反美国法律,对于中国未出海的公司无能为力:tieba_087:

服务器用的华为云,怕你个:egg:

肯定是用了gpt和Claude 的啊