佬友们好!
这个事情源自前段时间 Telegram 群里的一次讨论,大概意思就是中外技术大佬的头像问题。其中提到了一个由来已久的论点:我国的技术大佬大多数都是二次元头像,二次元程度越深,技术越强。
但我却有不一样的角度:一想到TG群和L站都有大量的二次元头像,这个事情里有商机!如果我们向二次元头像征税,岂不是要赚的盆满钵满?
这本质上是个分类模型,我之前玩过 ResNet
的训练和推理,应该很容易实现。说干就干,我立刻掏出之前为识别 Arkose 验证码时训练的模型代码,开始爆改。随即下载了L站的所有头像,还到 GitHub 扫了一圈,开始为数据打标,分训练集、测试集、验证集。准备好这一切后,又去线上租了台 GPU 服务器进行训练。经过多轮训练、调试和优化,终于把 loss 压到了 0.1%
以下。
这个模型很棒,拿它在验证集上试了试,达到 100% 的识别率。我非常激动地把它接到了L站,心想这下成了!但结果还是出了点意外:因为低估了L站的流量,推理机器性能不足,导致了大量的 503 ,一度让L站的头像服务不可用(这就是为什么前两天明明图片可用,但头像不可用)
不过办法总比困难多,我们立刻添加了更多的推理服务器资源,同时优化了缓存算法。在大量的优化之后,一切恢复了正常。现在这个服务工作的很好,通过观察推理日志,发现模型准确率也很高。只是 gif 头像因为要抽几帧检测,所以代价比 png 之类的要大。
所以,今天我们很荣幸地推出这个模型:acg-detector-1.0-250401
,它可以非常高效且准确地识别一个头像是否是二次元头像!后期我们也将开放模型 onnx
文件下载,并且有将模型和数据集开源的计划。
但现在,先回到我们做这个模型的初衷,接下来首要的任务是:向二次元头像征税,完成一次伟大的商业模式探索。简而言之,如果你想要保留你心爱的二次元头像,你必须向L站按月缴纳二次元头像税
,否则不予展示。