从这篇文章看盘古模型有点问题

华为 Pangu 员工自曝:套壳、续训、洗水印

https://mp.weixin.qq.com/s/ad4THdupBMKg6ISHhmcwbg

8 Likes

这不就是GitHub上的那一篇吗,那一篇在技术上的可信度确实挺高的,但其他地方还是不好验证存疑

1 Like

哦,那没看过呢

1 Like

这公众号看上去像专门搞流量的:tieba_023:


华为那个还在各方博弈中,没想到github 也能当小作文平台

9 Likes

在某技术交流群看到有离职了的诺亚天少出来讲这个事情,感觉可信度很高啊,至少他说后半段对上了

2 Likes

少站队,先吃瓜,不带脑子只带情绪没啥意义

9 Likes

让子弹飞一会儿,不过我还是喜欢事实说话,这篇暂时无法验证并且 HonestAGI 那篇连引用都是错的,所以等人拿事实出来说话吧
ps: 现在的知乎、公众号、CSDN 怎么连一点版权意识都没有,转载请注明出处这不是常识吗?

4 Likes

蓝标公号全文转,出处都不注,这个公众号有点东西的:joy:

3 Likes

知乎高赞

2 Likes

国内版权多少年……

1 Like

一直都不怎么喜欢国内的几家,尤其是花,阿里2.5还好,glm一开始的4挺聪明的后面不知道怎么的降智了,豆包感觉语音可靠一些

这是个大瓜啊

只听,不评论,不是业内人士,说话付不了责任。

不开源就没这堆破事了,本来华为NPU作为国产GPU,在国产化背景下,硬件已经做到市场领先了,赚了不少钱,何必弄开源模型呢.

泉州晚报社有报道了:
https://mp.weixin.qq.com/s/b8ba2TZ3p-jBRTuQAtgRMQ

110B的那个续训我信,超大参数从头训练是很麻烦的.

但是HonestAGI说14B的那个我不信,以华为的GPU硬件配置,从零训练一个完整底模也就是1~2天的事情,犯不上抄袭,也没必要.

如果一定要说相似度很高,有可能中间引用了同一个中文数据集.

不是同一个吧?这是另一个GitHub仓库

华为自己也说过好像训练时采用了挺多开源中文数据集

稍微说的有点出入也很正常

祝华为 阿里早日倒闭