Adobe 发布 MultiFoley:创新视频配音技术
MultiFoley 是 Adobe 发布的一项专为视频配音的技术,支持通过文本、音频和视频进行多模态引导。
用户可以利用 MultiFoley 为无声视频添加声音,甚至创造出奇特的效果,例如让猫咪发出狮子的咆哮声。该模型还允许用户从音效库中选择参考音频或部分视频进行条件控制,从演示来看,效果非常出色。不过,目前仅提供了论文,似乎不会开源。
IC-Light V2-Vary:更强烈的照明变化体验
IC-Light V2-Vary 模型是 IC-Light V2 的平替版本,特别适用于需要更强烈照明变化的应用场景。虽然它在照明效果上更为强烈且变化多样,但细节处理上略逊于原版。你们可以在线试用一下 IC-Light V2-Vary
ConsisID:开源的角色一致性文生视频模型
ConsisID 是一个用于生成角色一致性视频的文生视频模型(IPT2V)。通过参考角色图片,该模型能够生成身份一致的视频。这个模型现已完全开源,包括数据集,并且提供了一个在线试用,你们可以玩玩看。