如何训练AI人脸鉴别模型?求佬友指点!

佬友好!我是一个刚入门AI的小白,最近在学习怎么训练一个人脸鉴别真伪的模型。希望可以得到大佬们的一些帮助,特别是在模型选择、数据、和训练方法上的指点!以下是我的一些问题:

1. 我的目标

我想训练一个可以识别图片中人脸真伪的AI模型,比如给出5000张测试人脸图能正确分辨出伪造的人脸和真实人脸。这是我第一次尝试做这样的项目,目前我打算用 Python,框架是 TensorFlow 或 Keras

2. 遇到的问题

  • 数据集:我找到了一些小的公开人脸数据集,但感觉数据量不够多样,怕模型训练出来效果不好。大佬们有推荐的开源数据集吗?还有什么好办法来增强数据?
  • 模型选择:我现在看到有些预训练模型,比如 FaceNetVGG-Face,但不确定该选哪个。到底是自己从头搭建模型好,还是用这些预训练模型进行微调更好呢?
  • 模型训练:我是新手,不太会调参和优化。请问有没有一些简单的方法能帮助我把模型调好一点,至少不跑得太差?
  • 模型格式:我看到有 .h5.keras 两种保存格式,未来可能需要做个简单的 web 项目,哪个格式更好用呢?

3. 后续打算

我后面想把模型做成一个简单的 Web 应用,让用户上传图片来进行人脸真伪的验证。请问在部署模型和做前端时,有哪些容易上手的工具可以推荐呢?

打算Web端使用HTML、JavaScript、Css,前端界面ui和布局,可以参考哪些网站?


总之,希望能得到佬友的指点,不胜感激!如果有什么好的教程、文章或者项目推荐,拜托分享给我!谢谢啦!

并且做好会在linux.do进行开源分享

4 Likes

好,是个好方向 :tieba_001:

1 Like

好奇下
你的人脸哪里来的

你可以搜搜,有公开的数据集

学术领域在人脸鉴别方向有个 challenge,可以查看历届的主题、数据集和算法,要论文有论文,要数据有数据:

美图之后的图算真还是假?

看起来你想做的更像是 深度防伪检测(DeepFake Detection)而不是 面部防欺骗(Face Anti-Spoofing)

这里里面是这个领域的 SOTA 排行情况,有 paper 和对应实现代码(有的话),以及评测数据集可供参考:

比如这就是在 FakeAVCeleb 数据集上的排行榜:

你所需要做的就是选一个适合你的复现一下就行。看了一下,大部分是视频检测 还是 pytorch 实现,楼主慢慢看吧 :tieba_091:

2 Likes

很好的方向,可到我局推广

没人还会用 tf 训练了吧,和 torch 生态差太多了