Google的下一步：Gemini 和 Veo 模型结合起来，合并两个模型成为全新的全模态助手

PSP · 2025 年4 月 14 日 09:25

DeepMind CEO，表示：未来我们将把Gemini 和 Veo 模型结合起来，以构建一个更强大、多模态的 AI。Gemini 已经能够理解文本、图像和音频，而 Veo 则专注于生成和理解视频。合并这两个模型将使 Gemini 更接近成为现实世界中的数字助手。

新闻评论指出：这一举措反映了整个AI行业向“全模态”模型发展的趋势，这些模型可以处理所有类型的输入和输出。OpenAI 正在通过 ChatGPT 实现这一点，而亚马逊则在开发一个“任意到任意”的系统。谷歌通过利用 YouTube 的海量视频数据来训练 Veo，从而在视频领域获得了巨大的优势。

这种整合，标志着AI向不仅会说话或写作，而且能够处理更多任务的【通用AI】（AGI？）更进一步。

wwow · 2025 年4 月 14 日 09:34

我来看看

kingd · 2025 年4 月 14 日 10:37

好家伙，这是王炸啊

stevessr · 2025 年4 月 14 日 10:42

叠加量子芯片

elfmaid · 2025 年4 月 14 日 10:43

@snaily 大王狂喜

bbbjltql · 2025 年4 月 14 日 10:45

谷歌还是猛啊

Cimix · 2025 年4 月 14 日 10:45

那很强了，我已经等不及嗦Jay的了 @snaily

snaily · 2025 年4 月 14 日 10:48

谷歌太强了

话题		回复	浏览量
谷歌旗下模型 Veo 和 Imagen 3 上线Vertex AI 前沿快讯	0	178	2024 年12 月 4 日
谷歌推出 Vertex AI Media Studio 文生视频套件：自动化包办画面渲染、旁白、配乐等前沿快讯 Google , 人工智能	0	122	2025 年4 月 10 日
Google 的 veo 2 今天将普遍可用！前沿快讯人工智能	21	800	2025 年4 月 9 日
241120 三花 AI 日报: 马斯克预言 2026 年将实现通用人工智能；基于音乐的 AI 编舞；Perplexity 推出 AI 购物助手；SD3.5-Large-IP-Adapter；Suno 发布 V4 版本；谷歌 Gemini 推出了类似 ChatGPT 的记忆功能前沿快讯人工智能	13	1095	2024 年11 月 21 日
241204 三花 AI 日报：AI 线稿上色与自动分层技术；腾讯开源混元文生视频模型；高性能生图模型 Luma Photon；海螺发布 I2V-01-Live；谷歌 Vertex AI 上线 Veo 前沿快讯人工智能	10	612	2024 年12 月 4 日