诈尸级更新:AI 扒谱 - MT3:多任务多音轨音乐转录

啥是 MT3?

MT3 是一个多任务多音轨音乐转录模型,能够从原始音频中提取出不同乐器的音符信息,并将其转换为 MIDI 格式。
无论是钢琴、小提琴还是鼓点,MT3 都能精准地将它们分离并生成对应的乐谱。
这不仅大大降低了扒谱的门槛,还为音乐研究和教育提供了强有力的工具。

更新了啥?

有很长一段时间不能用,刚刚修复了代码
支持了新版的 Gradio,同时还优化界面

在哪用?

HuggingFace:MT3 - a Hugging Face Space by Hmjz100

Bug?

  1. 等待文件上传完成
    在运行程序前,请确保文件已完全上传并生成频谱图。如果在上传未完成时运行,可能会导致报错。
  2. 转换时长说明
    转换时间与文件大小密切相关。经测试,5分钟的音频文件大约需要 300 秒(5分钟)及以上完成转换,请耐心等待。
  3. 保持前台运行
    为避免因网络波动或其他异常导致的报错,建议在转换过程中保持程序在前台运行,不要切换到后台。
5 个赞

感谢分享~

1 个赞

模型本体没更新吧,我记得好像混音过就效果不太行

:lark_046: 是……所以只能 “仅供参考”