OpenAI 为 ChatGPT 新增图片库管理功能
OpenAI ChatGPT 正式推出图片库管理功能,用户所有生成的 AI 图片都将自动归档于此。
该功能已同步上线 Web 端和移动端,终于不用再在聊天记录里找了。
谷歌推出 Gemini 文生视频 & Whisk 图生视频
谷歌在其旗下的 Gemini 和 Whisk 应用中引入了由 Veo2 驱动的视频生成功能,需要 Gemini Advanced 或 Google One AI Premium 订阅才能使用。
可以在 Gemini 中进行文生视频,在 Whisk 中进行图生视频,最高能生成 8 秒 720p 的视频。
Mogao 模型揭晓:字节 Seedream 3.0
昨日登顶 Artificial Analysis 榜首的 Mogo 模型现已揭晓,居然是字节跳动发布的 Seedream 3.0(即梦 3.0)模型。
该模型拥有业界领先的人像生成质感;目前最强的汉字排版能力;最高支持 2K 分辨率输出。
国内用户可以直接在即梦 AI 平台体验,国际用户则需要填写表单申请测试。
如果是开发者的话可以通过火山引擎接入该模型,目前定价为 0.2 元/张
智谱AI启动A股上市流程并开源三大模型
智谱AI 于 4 月 14 日在北京证监局正式办理上市辅导备案,目标是争取 2025 年内完成 A 股上市。
同时,智谱AI 还开源了 3 个模型:
-
GLM4 32B 0414:基础大模型,能力对标 DeepSeek V3
-
GLM Z1 32B 0414:专为推理任务优化的版本,对标 DeepSeek R1
-
GLM Z1 Rumination:针对 Agent 场景特别强化训练的专用模型
这些模型现已开源,佬们也可通过智谱新买的域名 z.ai 直接体验。
快手可灵 2.0 大师版发布
可灵 2.0 大师版视频生成模型正式发布,带来三大核心升级:
-
语义理解能力显著增强,响应更精准
-
动态画面质量全面提升,支持大幅运动场景
-
画面质感优化,连续画面更流畅自然
同步推出的可图 2.0 图片生成模型也迎来重要更新,新增局部重绘、智能扩图和风格转绘三大实用功能。
不过可灵 2.0 的价格有点问题,生成 5 秒视频就要 10 块钱(这可能是我的问题,不是它的问题)。