OpenAI:有证据表明 DeepSeek 使用了我们的模型进行训练

你的推理逻辑是什么

刚刚我看凤凰台新闻,看到OpenAI要联合什么部门收集证据准备控告ds,然后美国安全部门也呼吁民众要谨慎使用

怎么说都没用了,毕竟现在同性能deepseek吊打了closeai

2 个赞

嘶。。。是这样吗,难道是我误解了

这不是公开的秘密吗?我记得不少LLM的早期版本都会声称自己基于GPT或者是OpenAI开发的

1 个赞

这还有另一种可能:互联网上的数据里满是openai,从互联网上抓取数据训练出来的模型天生说自己是openai应该挺正常的

这种谣言一传十十传百

1 个赞

就是,小丑行为
打不过就开始污蔑

O1根本就不公开思考链,怎么训练?

还迷失在自己的世界里呢,全世界就你一个人行,使劲加价卖订阅套餐

说到维护公司形象,我倒是有一个有趣的旧闻 :yum:


1 个赞

如果就是为了维护版权所以自杀,我感觉有点不值。我觉得就是抑郁症

如果所有语言模型开发都要严格维护版权,那就都不用做了

1 个赞

你引用的文章里提供了两种说法,第二种恰恰就是现在正在讨论的情况,怎么就成“谣言”了?

  1. AI 公司获取数据的网络环境正被 “AI 垃圾” 充斥
  2. 开发者为了节约成本,倾向于从现有 AI 模型中 “蒸馏” 知识

openai未经许可拿别人的数据已经被实锤好几波了

ai业内潜规则了,谁不去做谁就输

谷歌就是一开始老实,所以落后了。。。然后数据策略改变之后,才追上来

我在想,如果是拿OpenAI的数据蒸馏的,那为什么很多性能超越了GPT呢?只能说明除了蒸馏以外还用了别的更好的技术,且蒸馏或许不是主要原因,要不然没有“蒸馏”的OpenAI自家模型表现的还没有“蒸馏”的DeepSeek好就有点扯了。

1 个赞

网上的各种数据早就被OpenAI污染了

谷歌也有这样的过去

模型Gemini被指无法正确生成白人历史图像,政治正确变「逆向歧视」,引发争议

现在gemini 的回应风格 有点claude 味儿

顶多是替代或者辅助一些人工标注

其实吧,就算外包找人工标注,标注的人也都偷着用各种ai,拦不住

1 个赞