Google的下一步:Gemini 和 Veo 模型结合起来,合并两个模型成为全新的全模态助手

DeepMind CEO,表示:未来我们将把Gemini 和 Veo 模型结合起来,以构建一个更强大、多模态的 AI。Gemini 已经能够理解文本、图像和音频,而 Veo 则专注于生成和理解视频。合并这两个模型将使 Gemini 更接近成为现实世界中的数字助手。

新闻评论指出:这一举措反映了整个AI行业向“全模态”模型发展的趋势,这些模型可以处理所有类型的输入和输出。OpenAI 正在通过 ChatGPT 实现这一点,而亚马逊则在开发一个“任意到任意”的系统。谷歌通过利用 YouTube 的海量视频数据来训练 Veo,从而在视频领域获得了巨大的优势。

这种整合,标志着AI向不仅会说话或写作,而且能够处理更多任务的 【通用AI】(AGI?)更进一步。

4 个赞

我来看看

好家伙,这是王炸啊

叠加量子芯片 :sob:

@snaily 大王狂喜 :tieba_087:

2 个赞

谷歌还是猛啊 :tieba_087:

1 个赞

那很强了,我已经等不及嗦Jay的 :cow_face: :cow_face:@snaily

4 个赞

谷歌太强了 :tieba_087:

1 个赞