谷歌推出 Veo2:顶级视频生成模型
视频:External Player - 哔哩哔哩嵌入式外链播放器
谷歌发布了 Veo2 视频模型,支持文生视频和图生视频。
该模型能够生成分辨率高达 4K 的视频,并能根据提示词完成相机控制,如广角镜头、POV 和无人机拍摄,更好地遵循物理效果。
从官方演示来看,效果非常出色,甚至优于 Sora。目前,还需要加入 VideoFX 的候补名单才有机会体验。
谷歌 Imagen 3 升级:艺术风格与细节渲染全面增强
谷歌的 Imagen 3 模型再次升级,这次更新不仅支持更多艺术风格,还能更精准地遵循提示词,渲染出更加丰富的细节和纹理。
此次更新使其成为最强生图模型,基准测试表现甚至超越了 RecraftV3。谷歌在大模型、视频生成和图像生成领域正式全面领先,直接放大招,没有 12days。
腾讯开源 BrushEdit:一体化图像编辑与修复技术
视频:External Player - 哔哩哔哩嵌入式外链播放器
BrushEdit 是腾讯开源的一体化图像编辑和修复技术,它利用多模态大语言模型和图像修复模型,实现了自由编辑和修复。
用户可以轻松移除对象、添加对象,进行背景编辑和对象替换。效果不错,还有个在线演示可以玩一下。
OpenAI 推出 o1 推理模型 API,支持 WebRTC 和全新微调方法
OpenAI 在 12Days 活动第 9 天正式发布了 o1 推理模型的 API,支持函数调用和结构化输出。现在 Realtime API 支持 WebRTC,并且价格有所降低。此外,还推出了一种全新的模型微调方法 Preference Fine-Tuning。
此外,还有价格更新和新的sdk发布,完整的细节可以看公告