241218 三花 AI 日报：谷歌推出 Veo2：顶级视频生成模型；谷歌 Imagen 3 升级：艺术风格与细节渲染全面增强；腾讯开源 BrushEdit：一体化图像编辑与修复技术；OpenAI 推出 o1 推理模型 API

ke_jun · 2024 年12 月 18 日 01:15

谷歌发布了 Veo2 视频模型，支持文生视频和图生视频。

该模型能够生成分辨率高达 4K 的视频，并能根据提示词完成相机控制，如广角镜头、POV 和无人机拍摄，更好地遵循物理效果。

从官方演示来看，效果非常出色，甚至优于 Sora。目前，还需要加入 VideoFX 的候补名单才有机会体验。

谷歌的 Imagen 3 模型再次升级，这次更新不仅支持更多艺术风格，还能更精准地遵循提示词，渲染出更加丰富的细节和纹理。

此次更新使其成为最强生图模型，基准测试表现甚至超越了 RecraftV3。谷歌在大模型、视频生成和图像生成领域正式全面领先，直接放大招，没有 12days。

BrushEdit 是腾讯开源的一体化图像编辑和修复技术，它利用多模态大语言模型和图像修复模型，实现了自由编辑和修复。

用户可以轻松移除对象、添加对象，进行背景编辑和对象替换。效果不错，还有个在线演示可以玩一下。

OpenAI 在 12Days 活动第 9 天正式发布了 o1 推理模型的 API，支持函数调用和结构化输出。现在 Realtime API 支持 WebRTC，并且价格有所降低。此外，还推出了一种全新的模型微调方法 Preference Fine-Tuning。

此外，还有价格更新和新的sdk发布，完整的细节可以看公告

shangguan · 2024 年12 月 18 日 01:42

今日已阅

handsome · 2024 年12 月 18 日 02:15

来了，看报

话题		回复	浏览量
241204 三花 AI 日报：AI 线稿上色与自动分层技术；腾讯开源混元文生视频模型；高性能生图模型 Luma Photon；海螺发布 I2V-01-Live；谷歌 Vertex AI 上线 Veo 前沿快讯人工智能	10	526	2024 年12 月 4 日
241217 三花 AI 日报：最强开源虚拟试穿模型；OpenAI 增强 ChatGPT 搜索功能；Midjourney 推出 Moodboards 功能；开源对象运动控制技术前沿快讯人工智能	5	421	2024 年12 月 18 日
241212 三花AI日报：谷歌推出 Gemini 2.0 Flash Experimental；谷歌发布多款 AI Agent 项目；开源的跳舞视频生成技术；OneDiffusion 正式开源；前沿快讯人工智能	16	597	2024 年12 月 13 日
241202 三花 AI 日报：纯浏览器 AI 生图； Viggle AI 梗图视频制作；Sana 文生图模型；瞬间年轻30岁；AI 驱动的高效带货视频生成技术前沿快讯人工智能	6	473	2024 年12 月 2 日
241121 三花AI日报：OpenAI 的 GPT-4o 模型重夺竞技场榜首；DeepSeek 推出全新推理模型 R1-Lite 预览版；谷歌推出专为教育研究微调的 AI 模型前沿快讯人工智能	9	726	2024 年11 月 21 日