我们训练了一个特别的小模型

佬友们好!

这个事情源自前段时间 Telegram 群里的一次讨论,大概意思就是中外技术大佬的头像问题。其中提到了一个由来已久的论点:我国的技术大佬大多数都是二次元头像,二次元程度越深,技术越强。

但我却有不一样的角度:一想到TG群和L站都有大量的二次元头像,这个事情里有商机!如果我们向二次元头像征税,岂不是要赚的盆满钵满?

这本质上是个分类模型,我之前玩过 ResNet 的训练和推理,应该很容易实现。说干就干,我立刻掏出之前为识别 Arkose 验证码时训练的模型代码,开始爆改。随即下载了L站的所有头像,还到 GitHub 扫了一圈,开始为数据打标,分训练集、测试集、验证集。准备好这一切后,又去线上租了台 GPU 服务器进行训练。经过多轮训练、调试和优化,终于把 loss 压到了 0.1% 以下。

这个模型很棒,拿它在验证集上试了试,达到 100% 的识别率。我非常激动地把它接到了L站,心想这下成了!但结果还是出了点意外:因为低估了L站的流量,推理机器性能不足,导致了大量的 503 ,一度让L站的头像服务不可用(这就是为什么前两天明明图片可用,但头像不可用) :tieba_087:

不过办法总比困难多,我们立刻添加了更多的推理服务器资源,同时优化了缓存算法。在大量的优化之后,一切恢复了正常。现在这个服务工作的很好,通过观察推理日志,发现模型准确率也很高。只是 gif 头像因为要抽几帧检测,所以代价比 png 之类的要大。

所以,今天我们很荣幸地推出这个模型:acg-detector-1.0-250401,它可以非常高效且准确地识别一个头像是否是二次元头像!后期我们也将开放模型 onnx 文件下载,并且有将模型和数据集开源的计划。

但现在,先回到我们做这个模型的初衷,接下来首要的任务是:向二次元头像征税,完成一次伟大的商业模式探索。简而言之,如果你想要保留你心爱的二次元头像,你必须向L站按月缴纳二次元头像税,否则不予展示。

1129 Likes

一楼!!

11 Likes

0401的tag :tieba_067:

26 Likes

前排前排

3 Likes

向二次元头像征税 @chunkBurst 纳税吧

8 Likes

太强了!
…感觉不对
…幸好头像不完全是二次元w


不对,连文件大小都没展示,65也可以做到w

11 Likes

前排围观

1 Like

前排,始皇威武

1 Like

前排前排

不是,我们二次元怎么你了,要征税?!

80 Likes

真搞成了,大业可成!

1 Like

牛啊牛啊

2 Likes

所以我换了头像:dog_face:

70 Likes

前排围观

1 Like

太强了!

支持支持!

1 Like

不错不错

1 Like

先点赞,再评论

1 Like

对的对的

1 Like

何愁大业不举呢 始皇操作太骚了 前排围观

3 Likes