241204 三花 AI 日报:AI 线稿上色与自动分层技术;腾讯开源混元文生视频模型;高性能生图模型 Luma Photon;海螺发布 I2V-01-Live; 谷歌 Vertex AI 上线 Veo

Muse:专为 Ableton 打造的文生 MIDI AI

Muse 是一个专为 Ableton 设计的文生 MIDI AI,只需输入文本即可生成 MIDI 文件,支持自定义 Key、音阶、旋律、和弦和低音等。目前,Muse 仍处于早期测试阶段,如果你有兴趣体验,可以直接私信作者 Jake 获取邀请码。

腾讯开源 13B 混元文生视频模型

腾讯开源了 13B 参数的混元视频模型,其能力和效果媲美商业模型。

该模型支持艺术镜头、语音驱动、视频配音,并能轻松实现 LivePortrait 的表情驱动和类似 Animate Anyone 的动作驱动。你们可以在官网查看完整介绍,你可以在这里预约体验。

LumaAI 推出高性能生图模型 Luma Photon

LumaAI 正式发布了其全新生图模型:Luma Photon

官方尚未公布详细参数,但其基准测试表现已远超 Flux Pro 和最小的 Recraft V3(RedPanda)模型。值得注意的是,该模型目前仅支持通过网页 API 调用,生成一张 1080P 图片的成本约为 0.015 美元,相当于 1 毛多。

GianMattya 发布 AI 线稿上色与自动分层技术演示

GianMattya 大佬最近发布了一个 AI 线稿上色并自动分层的演示。首先,可以用 AI 生成一个线稿,然后利用这个工具可以完成上色,并自动分层背景、肤色、眼睛、头发等。目前大佬只放出了演示视频,有相关需求的可以关注下。

海螺发布 I2V-01-Live:多种艺术风格的视频模型

海螺AI 发布了I2V-01-Live,这是一个专注于多种艺术风格的视频模型,能够将 2D 插画角色图片生成为动态视频,使其能够说话、眨眼和移动。

谷歌 Vertex AI 上线 Veo 和 Imagen 3 模型 Private Preview

谷歌的 Veo视频生成模型和 Imagen 3 文生图模型现在在 Vertex AI 提供 private preview API。Veo 支持文生视频和图生视频,而 Imagen 3 将在下周向所有用户推出。不过,我没有找到 Vertex Veo 的入口,也没找到申请的地方,佬友们可以试试。

22 个赞

来哩来哩沙发

来了来了,我去 GCP 控制台看看


寄,也没找到入口,配额权限也没更新。

1 个赞

private preview 到底是什么哈哈哈

来了,每日看报

LLM的盡頭到了嗎? 近期都是文生視頻

来了,每日看报

近期是指今天吗 :pleading_face:

近期只有 QwQ、Gemini Experimental 1121

Text to Image Model Arena | Artificial Analysis
看来榜还没更新

Luma Photon排个队试试