241204 三花 AI 日报：AI 线稿上色与自动分层技术；腾讯开源混元文生视频模型；高性能生图模型 Luma Photon；海螺发布 I2V-01-Live；谷歌 Vertex AI 上线 Veo

ke_jun · 2024 年12 月 4 日 01:09

Muse 是一个专为 Ableton 设计的文生 MIDI AI，只需输入文本即可生成 MIDI 文件，支持自定义 Key、音阶、旋律、和弦和低音等。目前，Muse 仍处于早期测试阶段，如果你有兴趣体验，可以直接私信作者 Jake 获取邀请码。

腾讯开源了 13B 参数的混元视频模型，其能力和效果媲美商业模型。

该模型支持艺术镜头、语音驱动、视频配音，并能轻松实现 LivePortrait 的表情驱动和类似 Animate Anyone 的动作驱动。你们可以在官网查看完整介绍，你可以在这里预约体验。

LumaAI 正式发布了其全新生图模型：Luma Photon。

官方尚未公布详细参数，但其基准测试表现已远超 Flux Pro 和最小的 Recraft V3（RedPanda）模型。值得注意的是，该模型目前仅支持通过网页 API 调用，生成一张 1080P 图片的成本约为 0.015 美元，相当于 1 毛多。

GianMattya 大佬最近发布了一个 AI 线稿上色并自动分层的演示。首先，可以用 AI 生成一个线稿，然后利用这个工具可以完成上色，并自动分层背景、肤色、眼睛、头发等。目前大佬只放出了演示视频，有相关需求的可以关注下。

海螺AI 发布了I2V-01-Live，这是一个专注于多种艺术风格的视频模型，能够将 2D 插画角色图片生成为动态视频，使其能够说话、眨眼和移动。

谷歌的 Veo视频生成模型和 Imagen 3 文生图模型现在在 Vertex AI 提供 private preview API。Veo 支持文生视频和图生视频，而 Imagen 3 将在下周向所有用户推出。不过，我没有找到 Vertex Veo 的入口，也没找到申请的地方，佬友们可以试试。

qcts · 2024 年12 月 4 日 01:09

来哩来哩沙发

Qiner · 2024 年12 月 4 日 01:12

来了来了，我去 GCP 控制台看看

寄，也没找到入口，配额权限也没更新。

ke_jun · 2024 年12 月 4 日 01:26

private preview 到底是什么哈哈哈

handsome · 2024 年12 月 4 日 01:28

来了，每日看报

Kevin525 · 2024 年12 月 4 日 01:37

LLM的盡頭到了嗎？近期都是文生視頻

Dr.Mike · 2024 年12 月 4 日 02:41

来了，每日看报

ke_jun · 2024 年12 月 4 日 05:58

近期是指今天吗

Kevin525 · 2024 年12 月 4 日 06:37

近期只有 QwQ、Gemini Experimental 1121

carlpayne · 2024 年12 月 4 日 10:20

abelwang · 2024 年12 月 4 日 10:57

Luma Photon排个队试试

话题		回复	浏览量
250324 三花AI日报：RF-DETR 开源实时目标检测模型；LHM：快速将照片转换为动画；腾讯混元 T1 推理模型；字节 InfiniteYou 人物一致性技术；Wan 2.1 特效 LoRA 集合； Grok-2-Image 模型 API；前沿快讯人工智能	21	621	2025 年3 月 24 日
谷歌旗下模型 Veo 和 Imagen 3 上线Vertex AI 前沿快讯	0	178	2024 年12 月 4 日
241202 三花 AI 日报：纯浏览器 AI 生图； Viggle AI 梗图视频制作；Sana 文生图模型；瞬间年轻30岁；AI 驱动的高效带货视频生成技术前沿快讯人工智能	6	570	2024 年12 月 2 日
谷歌推出 Vertex AI Media Studio 文生视频套件：自动化包办画面渲染、旁白、配乐等前沿快讯 Google , 人工智能	0	126	2025 年4 月 10 日
241203 三花AI日报：月之暗面推出 Kimi 创作空间； 360 推出纳米搜索；字节即梦 AI 2.1 模型更新；Worldlabs 推出单图生成可交互 3D 世界 AI 系统前沿快讯人工智能	18	762	2024 年12 月 3 日

241204 三花 AI 日报：AI 线稿上色与自动分层技术；腾讯开源混元文生视频模型；高性能生图模型 Luma Photon；海螺发布 I2V-01-Live； 谷歌 Vertex AI 上线 Veo