为什么deepseek说自己是由OpenAI开发的一种先进的语言模型🤔

模型的核心是训练数据

但是,互联网公开的数据已经用完了

所以,靠ai合成的数据是新模型必须的,就看谁合成的数据更好,合成的效率更高了

就有点像 微调 这个感觉吧:joy:

训练数据的问题

原来是这样的

1 个赞

应该就是上面各个大佬分析的样子啦